【2017-11-21 00:16:50 /robots.txt BUbiNG+(+http //law.di.unimi.it/BUbiNG.html)
2017-11-21 00:16:51 访问首页 BUbiNG+(+http //law.di.unimi.it/BUbiNG.html) 】
How to Stop BUbiNG
BUbiNG is a scalable, fully distributed crawler, currently under development and that supersedes UbiCrawler.
BUbiNG supports the Robot Exclusion Standard. if you want to exclude your site from being crawled by BUbiNG see The Web Robots Pages.
Briefly, you can put into the robots.txt file at the root of the web server you want to exclude from the crawling what follows:
User-agent: BUbiNGDisallow: /
Presently, BUbiNG honours changes to the robots.txt file (usually every hour), but does not obey to META tags for robot exclusion.
For any information, feel free to email law@di.unimi.it.
Come fermare BUbiNG
BUbiNG è un crawler scalabile, completamente distribuito, attualmente in corso di sviluppo e che sostituisce UbiCrawler.
BUbiNG aderisce al Robot Exclusion Standard. Se volete eslcudere il vostro sito dall'indicizzazione, consultate The Web Robots Pages.
Brevemente, potete mettere nel file robots.txt sotto la radice del web server che intendete escludere dall'indicizzazione quanto segue:
User-agent: BUbiNGDisallow: /
Al momento, BUbiNG onora i cambiamenti a robots.txt (di solito ogni ora), ma non rispetta i tag META del protocollo di esclusione.
Per richiedere informazioni inviate liberamente una email a law@di.unimi.it.
简而言之,你可以放入robots . txt文件在web服务器的根从爬行你想排除以下:
User-agent: BUbiNGDisallow: /
目前,小家伙荣誉的变化robots . txt文件(通常每小时),但不服从元机器人排除标签。
小家伙e联合国履带scalabile这些distribuito,attualmente corso di sviluppo e格瓦拉sostituisceUbiCrawler.
小家伙aderisce al机器人排除标准。Se volete eslcudere il成就sito野大白羊'indicizzazione,consultate网络机器人的页面.
Brevemente,potete mettere nel文件robots . txt不知la radice del web服务器切intendete escludere野大白羊'indicizzazione quanto segue:
User-agent: BUbiNGDisallow: /
纪念品,小家伙onora我cambiamentirobots . txt马(di solito ogni ora),非rispetta我标记元德尔protocollo di esclusione。
每richiedere informazioni inviate liberamente una的电子邮件law@di.unimi.it.
【2017-11-21 00:16:50 /robots.txt BUbiNG+(+http //law.di.unimi.it/BUbiNG.html)
2017-11-21 00:16:51 访问首页 BUbiNG+(+http //law.di.unimi.it/BUbiNG.html) 】
How to Stop BUbiNG
BUbiNG is a scalable, fully distributed crawler, currently under development and that supersedes UbiCrawler.
BUbiNG supports the Robot Exclusion Standard. if you want to exclude your site from being crawled by BUbiNG see The Web Robots Pages.
Briefly, you can put into the robots.txt file at the root of the web server you want to exclude from the crawling what follows:
User-agent: BUbiNGDisallow: /
Presently, BUbiNG honours changes to the robots.txt file (usually every hour), but does not obey to META tags for robot exclusion.
For any information, feel free to email law@di.unimi.it.
Come fermare BUbiNG
BUbiNG è un crawler scalabile, completamente distribuito, attualmente in corso di sviluppo e che sostituisce UbiCrawler.
BUbiNG aderisce al Robot Exclusion Standard. Se volete eslcudere il vostro sito dall'indicizzazione, consultate The Web Robots Pages.
Brevemente, potete mettere nel file robots.txt sotto la radice del web server che intendete escludere dall'indicizzazione quanto segue:
User-agent: BUbiNGDisallow: /
Al momento, BUbiNG onora i cambiamenti a robots.txt (di solito ogni ora), ma non rispetta i tag META del protocollo di esclusione.
Per richiedere informazioni inviate liberamente una email a law@di.unimi.it.
简而言之,你可以放入robots . txt文件在web服务器的根从爬行你想排除以下:
User-agent: BUbiNGDisallow: /
目前,小家伙荣誉的变化robots . txt文件(通常每小时),但不服从元机器人排除标签。
小家伙e联合国履带scalabile这些distribuito,attualmente corso di sviluppo e格瓦拉sostituisceUbiCrawler.
小家伙aderisce al机器人排除标准。Se volete eslcudere il成就sito野大白羊'indicizzazione,consultate网络机器人的页面.
Brevemente,potete mettere nel文件robots . txt不知la radice del web服务器切intendete escludere野大白羊'indicizzazione quanto segue:
User-agent: BUbiNGDisallow: /
纪念品,小家伙onora我cambiamentirobots . txt马(di solito ogni ora),非rispetta我标记元德尔protocollo di esclusione。
每richiedere informazioni inviate liberamente una的电子邮件law@di.unimi.it.