两个半小时内被百度爬行带收录和半个月都不收录的区别 - 小欧 - DonewsBlog

来源:百度文库 编辑:神马文学网 时间:2024/04/29 05:10:49

之前总是听到SEO界中的大佬们说,百度的爬行与收录之间存在很大的变动因素(关系),说是什么要经过三种时期(分别是初试期、稳定期、成熟期),如若不是亲自体验,小欧真的不敢验证此言的真伪,因为大家都是搞SEO的,每个人的体会经验不同,当然会得到不同的结论。

今天小欧要推翻的就是这种狗屁不通误人子弟的爬行收录理论,百度照样可以在最快最短的时间内从你的网站上找到自己最想到的东东。而且是在短短的2个半小时内,就被百度连爬行带收录。

13号的中午15:30,小欧在公司的网站上发表一篇名为“百度被黑,谷歌被吓,2012真的要来吗?(http://www.cnprnet.com/html/wangluotuishou/2010/0113/Wangluo_2012.html)”的帖子,(不信的朋友可以点进去瞧瞧)。直到2个半小时后,百度就已经为此文链接加入它们的数据库(也就是收录),不信的朋友,下面是我们网站的日志分析,请看截图中的第10个。


图片1

看到这里,小欧看到在12月21号发表的那篇名为“央视称,网络推手变成了“网络黑社会"?(http://www.cnprnet.com/html/wangluotuishou/2009/1221/Wangluo-Heishehui.html)”,的帖子(截图第12个),不禁一惊,为什么这篇帖子爬行过了,但没有被收录呢?而且是在上个月发表的,它们两个的返回状态码都是200,也就是说,百度蜘蛛都认为此两帖的爬行是成功的,那为什么第一帖在两个半时内收录,第二帖在半个月内都收录不了呢?

继续解析~~~

如果我们打开这两篇帖子看内容,就不难发现其中的奥秘,先看第一帖“百度被黑,谷歌被吓,2012真的要来吗?”小欧再发一张截图上来:


第一贴词频图片

再看第二帖“央视称,网络推手变成了“网络黑社会"?”的内容,截图如下:


第二贴词频图片

从以上两张截图中,我们可以很明显的看出,百度之所以能在两个半小时之内爬行并收录的玄机在哪里。那就是词与词之间的切合度,也有人说是声噪比,不管它怎么叫,反正都是一个概念,这让我们就想起了百度在给站长指南中说的“网页之间的链接类型,除了站点内部的页面链接之外,还有不同网站之间的互相链接。因此,某些网页即便通过您的网站内部链接无法访问到,但是,如果别人的网站上有指向这些页面的链接,那么这些页面还是会被搜索引擎所收录。”

这句话说明了百度在一定程度是注重外链的,但是,对于一个刚刚上线两个半小时的页面不可能有什么外部链接的建设,所以,我们只能排除外部链接的因素。

当然,百度为了提高用户的体验度而降低外链的权重和比重,是可以理解的,但蜘蛛毕竟是蜘蛛,它只能通过表面的文字来判断,隐藏语义中的玄机并未觉察到,我们这两个帖子就是最好的证明。