欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

BUbiNG+是什么蜘蛛?

您好,经核实分析,是站点*.zhengzhouyuhui.com访问异常,如图. 从日志中可以分析是蜘蛛BUbiNG (+http://law.di.unimi.it/BUbiNG.html) 大量访问造成,关于该蜘蛛可访问https://tieba.baidu.com/p/5464864693?red_tag=1534448945 了解.目前我司建议设置屏蔽该蜘蛛再观察,非常感谢您长期对我司的支持!



最近新站上线特别留意iis日志,发现一个奇怪的蜘蛛访问,名称是“BUbiNG+”。那么BUbiNG+究竟是怎样的蜘蛛呢?
【2017-11-21 00:16:50 /robots.txt 64.62.252.163 BUbiNG+(+http //law.di.unimi.it/BUbiNG.html) 
2017-11-21 00:16:51 访问首页 64.62.252.163 BUbiNG+(+http //law.di.unimi.it/BUbiNG.html) 】
这货居然访问了robots.txt文件,看来是个遵纪守法的好公民呀。
打开上面的网址一看:
How to Stop BUbiNG
BUbiNG is a scalable, fully distributed crawler, currently under development and that supersedes UbiCrawler.
BUbiNG supports the Robot Exclusion Standard. if you want to exclude your site from being crawled by BUbiNG see The Web Robots Pages.
Briefly, you can put into the robots.txt file at the root of the web server you want to exclude from the crawling what follows:
User-agent: BUbiNGDisallow: /
Presently, BUbiNG honours changes to the robots.txt file (usually every hour), but does not obey to META tags for robot exclusion.
For any information, feel free to email law@di.unimi.it.
Come fermare BUbiNG
BUbiNG è un crawler scalabile, completamente distribuito, attualmente in corso di sviluppo e che sostituisce UbiCrawler.
BUbiNG aderisce al Robot Exclusion Standard. Se volete eslcudere il vostro sito dall'indicizzazione, consultate The Web Robots Pages.
Brevemente, potete mettere nel file robots.txt sotto la radice del web server che intendete escludere dall'indicizzazione quanto segue:
User-agent: BUbiNGDisallow: /
Al momento, BUbiNG onora i cambiamenti a robots.txt (di solito ogni ora), ma non rispetta i tag META del protocollo di esclusione.
Per richiedere informazioni inviate liberamente una email a law@di.unimi.it.
翻译软件:
如何停止小家伙
小家伙是一个可伸缩的、完全分布式爬虫,目前正在开发和取代吗UbiCrawler.
小家伙支持机器人排除标准。如果你想排除从被小家伙爬你的网站看到的网络机器人的页面.
简而言之,你可以放入robots . txt文件在web服务器的根从爬行你想排除以下:
User-agent: BUbiNGDisallow: /

目前,小家伙荣誉的变化robots . txt文件(通常每小时),但不服从元机器人排除标签。
任何信息,随时邮件law@di.unimi.it.
来fermare小家伙
小家伙e联合国履带scalabile这些distribuito,attualmente corso di sviluppo e格瓦拉sostituisceUbiCrawler.
小家伙aderisce al机器人排除标准。Se volete eslcudere il成就sito野大白羊'indicizzazione,consultate网络机器人的页面.
Brevemente,potete mettere nel文件robots . txt不知la radice del web服务器切intendete escludere野大白羊'indicizzazione quanto segue:
User-agent: BUbiNGDisallow: /

纪念品,小家伙onora我cambiamentirobots . txt马(di solito ogni ora),非rispetta我标记元德尔protocollo di esclusione。
每richiedere informazioni inviate liberamente una的电子邮件law@di.unimi.it.


回复
举报|1楼2017-12-04 10:01
    2018-02-23 14:26 广告
    看来一下unimi这个网站,是意大利文的,真是奇葩了,有道居然无法翻译,而百度翻译做得很好


    举报|2楼2017-12-04 10:06
      原来主页是米兰大学Università degli Studi di MILANO


      举报|3楼2017-12-04 10:08
        baidu翻译:
        如何阻止对方
        形状是一个可扩展的、完全分布式的网络爬虫,目前正在开发中,取代ubicrawler。
        对方支持Robot的排除标准。 如果想排除你的网站被抓取对方 Web页面 机器人
        简而言之,你可以把robots.txt文件在你想排除 爬行以下Web服务器根目录:
        User-agent: BUbiNG 
        Disallow: /
        目前,荣誉的形状变化robots.txt文件文件 (通常每小时),但不服从元机器人排除标签。
        任何信息,请联系law@di.unimi.it
        来fermare形状
        形状联合国è履带scalabile,完全distribuito,目前在柯迪的开发 sostituisce车ubicrawler。
        形状aderisce铝Robot的排除标准我eslcudere。 se il vostro SITO dall'indicizzazione,网络机器人 页。
        Brevemente,就在其它文件robots.txt文件骑楼拉北德尔Web服务器 车intendete escludere dall'indicizzazione双币种继续:
        User-agent: BUbiNG
        Disallow: /
        Al momento,BUbiNG onora,我cambiamenti一robots.txt文件(二常规,ORA),马不我rispetta标签元德尔protocollo迪esclusione。
        每richiedere和inviate liberamente UNA的电子邮件law@di.unimi.it


        举报|4楼2017-12-04 10:30
          挽个尊吧
          我也发现了这个蜘蛛 国外的 看来没什么卵用 屏蔽了


          举报|5楼2017-12-07 16:06
            百度搜索也果然牛啊,居然BUbiNG找不到本贴


            举报|6楼2017-12-24 15:06

              屏蔽不了这货了,天天那里扫一个新闻页面。


              来自  https://tieba.baidu.com/p/5464864693?red_tag=1534448945


              普通分类: