搜索底层分析蜘蛛爬行

admin 2018年2月28日14:26:14SEO基础评论420阅读模式

分析日志真假百度(谷歌)蜘蛛如何识别?假蜘蛛的危害有哪些?我们的SEO优化人员在分析网站日志的时候一定有遇到,网站看似很多百度蜘蛛的ip来访,其实这其中有一部分是假的无效搜索引擎蜘蛛ip,而这些假蜘蛛并不友善,可能对网站造成影响,更容易混淆视听,让您分析蜘蛛抓取情况时误导你,所以分析日志我们要能够正确的识别百度(谷歌)真假蜘蛛

搜索底层分析蜘蛛爬行

两种方法轻松识别百度真假蜘蛛

一、看长相识别

当我们看的多了有经验了也就能一眼看出哪些是真的百度蜘蛛IP

百度官方真假蜘蛛文档是这样记录:

新版移动ua:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

PC ua:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

所以根据百度的说法,不是长这个样子的就都是假的了,统统拉出去,比如就有一个这样的百度假蜘蛛。

假蜘蛛:

Baiduspider+(+http://www.baidu.com/search/spider.htm)

二、通过DOS命令查询

我们通过dos命令来查看,我们来找两个IP段220.181.108.140和117.28.255.37,

开始—运行—输入 cmd ,用命令nslookup +ip 看截图:

如果是真的IP段:

搜索底层分析蜘蛛爬行

如何分辨真假百度搜索引擎蜘蛛IP

假的:

搜索底层分析蜘蛛爬行

如何分辨真假百度搜索引擎蜘蛛IP

注意:只要是百度的IP段,代码中会有出现:name:baiduspider,如果没有出现,那就不是真的百度IP

PS:谷歌是一样的:会出现googlebot 其他一样

百度(谷歌)假蜘蛛有什么危害?

1、占用网站带宽,导致网站流量上升,增加额外开销;

2、在有限带宽的前提下,阻碍了正常蜘蛛的抓取,误导了我们在对网站开展SEO工作时的思路;

3、部分伪装成假蜘蛛的采集工具剽窃了我们的工作;

4..假冒蜘蛛不能抓取内容,不能形成建库收录,所以影响不是很大。

PS:假冒蜘蛛存在着一些危害,总的来说都在可控范围类,所以一旦发现假蜘蛛访问与抓取,可以暂时不用屏蔽,可以先观察百度站长的网站抓取是否正常,然后看具体的带来的危害,比如是否长时间出现此类假冒蜘蛛。观察一段时间后如果没问题就不用理会,如果有影响就用robots协议屏蔽掉此ip段的假冒蜘蛛,不过需要注意的是在屏蔽的时候不要屏蔽错误。

以上就是为大家分享的如何识别百度和谷歌真假蜘蛛的方法以及假蜘蛛的危害。大家记住,假蜘蛛的存在不一定对网站有影响,更重要的是你要知道哪些是假蜘蛛,别被误导。除以上两种识别方法外,在线百度一下蜘蛛真伪查询工具(输入需要查询ip)就能知道是否为真的百度蜘蛛。

weinxin
清风
这是我的微信扫一扫
admin
  • 本文由 发表于 2018年2月28日14:26:14
  • 转载请注明:http://liqing-seo.com/souszhizhupaxing/
一站式家庭装修解决方案 SEO基础

一站式家庭装修解决方案

整体家居是顺应时代要求而推出的,一种科学、先进和全面的装修理念和方式。它用整体的概念来审视装修每一个环节的协调性。它要求设计更为全面、周到;施工更为快捷环保;配饰成品采购更集中迅速。它是个方便装修消费...
优质信息才能自然排名 SEO基础

优质信息才能自然排名

  随着互联网的发展,海量的信息内容爆发式增长。为了找到自己需要的内容,我们自然会借助搜索引擎,而搜索引擎也不会将所有的内容都呈现给用户,也没任何意义,只需将优质信息内容排列在前面即可,这就...
广告也精彩
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定