百度站长平台“抓取诊断”工具出错,严重怀疑其Alpha版

2014年03月19日 17:48 by:老修

2014年3月11日百度在站长平台推出了“抓取诊断”工具,来看一下关于百度官方对抓取诊断工具的定义:

一、什么是抓取诊断工具?

抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容,和预期是否一致。

每个站点每月可使用300次,抓取结果只展现百度蜘蛛可见的前200KB内容。

二、抓取诊断工具能做什么?

1)诊断抓取内容是否符合预期,譬如很多商品详情页面,价格信息是通过JavaScript输出的,对百度蜘蛛不友好,价格信息较难在搜索中应用。问题修正后,可用诊断工具再次抓取检验。

2)诊断网页是否被加了黒链、隐藏文本。网站如果被黑,可能被加上隐藏的链接,这些链可能只在百度抓取时才出现,需要用此抓取工具诊断。

3)检查网站与百度的连接是否畅通,若是IP信息不一致,可以报错通知百度更新IP。

4)如果网站有新页面或页面内容有更新,百度蜘蛛较长时间没来访问,可以通过此工具邀请它快速来抓取。

实测抓取诊断工具

17日测试抓取诊断工具测试的状态一直是“抓取中”好几天一直是这个状态;

百度抓取诊断工具

18日再测有时成功有时还是“抓取中”

百度站长“抓取诊断”工具

19日再测:

日本vps主机:开始抓取不成功了,别紧张再看别的主机。

百度站长“抓取诊断”工具 实测

美国vps主机:也开始抓取不成功了

百度站长“抓取诊断”工具 实测 

万网北京linux云主机:也抓取不成功

百度站长“抓取诊断”工具 实测 

那么抓取诊断工具提示抓取不成功是否就代表百度蜘蛛无法抓取到我们的网页了呢? 搜一下我上一篇刚发布的文章测试:

先看中文发的文章 可圈可点的2014“新版QQ”截图功能 发布时间是(2014-03-19 12:50:30)刚好和我上面截图的抓取成功的时间相近,百度“秒收”。

百度“秒收”截图

再看这篇文章:php 设置.htaccess限制不友好IP访问的方法 (2014-03-19 15:49:26), 刚好是百度抓取诊断工具提示抓取错误的时间段,但是我们从百度结果里能搜到说明还是抓取成功了。

百度快照截图  

总结:

百度抓取诊断工具仅仅是个参考,老修通过4台不同配置不同程序不同地点的服务器测试说明:抓取诊断工具出现错误提示肯定不是网站问题应该是抓取诊断工具本身出错,抓取诊断工具充其量也只是alpha版。