最近一段时间发现124.115.0和124.115.4这两个IP段在网站上产生了大量流量,通过搜索引擎发现出现遇到这种问题的站长大有人在。
通过Apache的日志找到如下记录:
1 2 | 124.115.4.200 - - [26/Feb/2008:15:38:14 +0800] "GET /fh/space.php?3/myreplies&sid=RLSFXU HTTP/1.1" 200 - "http://www.zxlm.cn/fh/space.php?3/myreplies&sid=RLSFXU" "Sosospider+(+http://help.soso.com/webspider.htm)" 124.115.0.138 - - [26/Feb/2008:15:38:17 +0800] "GET /fh/space.php?3/myblogs&sid=dqC8p6 HTTP/1.1" 200 - "http://www.zxlm.cn/fh/space.php?3/myblogs&sid=dqC8p6" "Sosospider+(+http://help.soso.com/webspider.htm)" |
可以发现,这两个IP段其实是腾讯SOSO的蜘蛛,只不是它蜘蛛的身份是最近才加上去的:
"Sosospider+(+http://help.soso.com/webspider.htm)"
大家可以在robots.txt中添加了禁止“Sosospider”(首字母S大写,其余为小写)访问的规则。
不过在我的服务器上去没有发现Sosospider有访问robots.txt的记录,所以如果Soso的蜘蛛在你的网站产生了大量的流量,同时你又不在意Soso带来来的那点可怜的流量,那么就使用以下的办法彻底干掉这两个IP段吧:
封其IP的方法:
最简单的方法是从Apache里封(如果你是用Apache当服务器的话)。你既可以在httpd.conf配置文件里设置,又可以在.htaccess里设置。说明如下:
1. 在配置文件里设置:
打开httpd.conf编辑,将下列block如下编辑:
<Directory “/var/www/html”>
Options Indexes FollowSymLinks
AllowOverride None
Order allow,deny
Allow from all
Deny from 124.114.
Deny from 124.115.
</Directory>
2. .htaccess文件法
在网站根目录下建立或打开.htaccess文件,加入如下内容:
Order allow,deny
Allow from all
Deny from 124.114.
Deny from 124.115.
希望大家广为传播,将这段IP地址彻底废掉!
补足:鉴于大家反映上述方法封得太狠了,可将黑体字部分改为:
Order allow,deny
Allow from all
Deny from 124.115.0.
Deny from 124.115.4.















七月 17th, 2008 at 9:03 下午
[...] 唉!之前封锁了一批腾讯QQ的SOSO蜘蛛(在124.115.0和124.115.4这两个IP段关于124.115.0和124.115.4这两个IP段的说明)最近发现论坛上又来了一批这样的流氓蜘蛛。 [...]
三月 16th, 2009 at 2:11 下午
这几个蜘蛛实在太讨厌了!
七月 11th, 2009 at 12:15 下午
为什么大家不喜欢他呀,抓你的网站好呀,网民不是都用google的,soso现在与google合作的,所以还是不要限制的好!他会给你带来很多流量的!
七月 15th, 2009 at 8:04 下午
主要是抓取得太猛了,弄得整个网站动弹不得。
不得不封。
七月 17th, 2009 at 3:00 下午
一分钟几千页的速度抓取,简直是流氓