当前位置:博客首页 > SEO > 正文

百度搜索算法中的粗排与精排

作者: Jarvan 分类: SEO 发布时间: 2019-06-20 13:18 百度已收录

本文是对Zero发表与知乎专栏文章的要点摘录:

原文地址:
https://zhuanlan.zhihu.com/p/69825651

一句话概括搜索引擎的排序规则:

在最短的时间内,让尽高比例的用户找到符合他需求的内容

举例:
此处,为了方便理解,让我假设个情境。用户搜索「火影忍者」这个词,互联网上总共就三个相关网页。同时,假设百度总共只展示3条搜索结果,那么这三个网页同时展现了,分别的点击率如下:

  1. 火影忍者 动画a CTR: 50%
  2. 火影忍者 动画b CTR: 30%
  3. 火影忍者 漫画 CTR: 20%

假设总共只展示1条搜索结果呢?上面三个网页之中,无疑会展现1号网页。

但如果总共展现2条搜索结果?有意思的事情发生了,显而易见应该展现的是1、3号网页,这样才能满足不同用户的不同需求,达到整体点击率的最大化。

假设总共只展示1条搜索结果呢?上面三个网页之中,无疑会展现1号网页。

但如果总共展现2条搜索结果?有意思的事情发生了,显而易见应该展现的是1、3号网页,这样才能满足不同用户的不同需求,达到整体点击率的最大化。

搜索结果首页的10条搜索结果里面,展示的细分需求越全面越好

拿这些后续搜索词和具体排名去对照来看,发现果不其然,后续搜索词的比例排第几,它对应的网页基本也排在第几

偶尔稍微存在一两名的偏差,再大些也不奇怪,因为存在「满意点击率」这个特殊的最后置排序调整规则,此处不展开。

粗排,是搜索引擎从数以亿计的互联网页面去找到主词对应的top n个页面。粗排取的页面数量是760,根据我观察下来的粗略分析,有可能确实是这样的。

精排,是搜索引擎从top n个页面里面,再进一步的计算更复杂的规则,其中就包括了后续搜索需求这个问题(但远不止是)。

对于存在后续词效应的主词,其对应搜索结果页面的排名只有两种状态:在第一页、在后面任意位置。并不存在第一页排名下降后顺位挤到第二页的情况。

发表评论