
百度site现象一直都很诡异,常常让站长们觉得莫名其妙。今天我们根据百度站长俱乐部里的相关讨论来对些理解进行深入的分析和解读:
一:网站用site: 查询,只有首页收录的问题
Lee的回答如下:
1,新站点,具体内容还没来得及抓取和索引。
2,老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。
后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。呵呵。
二:用site语法查询之后,网站首页不在第一位是否被降权的问题。
LEE的回答如下:
site语法查询的检索结果,更多情况下类似随机的排序,除了说明这些网页已经被收录以外,不能说明任何问题。
三:site:www.gushilong.cn的结果要比 site:www.gushilong.cn+关键词 的结果少很多。site: www.gushilong.cn+关键词 的结果,有参与到搜索结果的排序中来吗?
LEE回答如下:
第一个问题,正是体现了百度site搜索时计算结果数的不准确,完全是反常识的。
第二个问题,site本意起到限定作用,那么“abc site:www.gushilong.cn”的意思,即是“在www.gushilong.cn的限定集内,abc搜索结果按权值高低的正常排序”。
关于百度site语法,LEE的感言如下:
道大多数站长,会使用不带关键词的site语法来进行收录量观察。这是一种方法,但很不准确。
site语法设定的初衷,其实是期望用户可以设定约束搜索范围,实现更加精准的搜索。这同intitle,inurl,本质上是相同的。而在这些高级语法下的结果数,和常规搜索一样,都是“估值”,而非精确值。因此,很有可能site下的“结果数”减少了,实际被索引数却可能增加了。
更加精确的方法是什么呢?
1,对来自搜索引擎的流量进行监控。这是最直接和本质的。如果流量没有大的波动,而site下的数值发生巨大波动,这只能说明site搜索结果数的不精确性。
2,对站内url进行抽样监控。有些url已经被搜索引擎收录了,那么取出一个集合,作为收录状态监控集;每天的新url尚未被收录,也可以对其进行索引状态的监控。脚本是很容易写的,这种基于抽样的评估也是很有效的。
3,由搜索引擎提供的统计工具。我们是否应该提供类似统计工具,目前还在评估中。
【全文完】此稿件DOC下载:
百度site降权的常见现象分析.doc