【P1】
【P2】
【P3】
【P4】
【P5】
【P6】
【P7】
【P8】
【P9】
【P10】
【P11】
【P12】
【P13】
【P14】
【P15】
【P16】
百度网页搜索质量白皮书介绍
搜索引擎的使命是提供给用户能满足其需求、高质量的内容,百度搜索引擎会根据网页的质量情况对其排序进行调整。
高质量网页会获得更多展现的机会,质量较低的网页会减少展现机会,甚至不予收录。
对每一个网页,百度搜索引擎会从以下三个维度综合考虑给出一个质量打分:
●内容质量
●浏览体验
●可访问性 衡量网页质量的维度——内容质量
网页主体内容是网页的价值所在,百度主要从以下角度评价网页内容质量:
内容制作成本高低;内容是否有效、完整丰富;是否原创;信息是否真实有效;是否权威或投入较多专业的知识和经验;是否存在作弊行为
内容质量高:
内容质量高的网页,花费了较多时间和精力编辑,倾注了大量经验和专业知识,内容清晰、有效、完整且丰富。例如:
√专业医疗网站发布的内容丰富的医疗专题页面;
√资深工程师发布的完整解决某个技术问题的专业文章;
√专业视频网站上,播放清晰流畅的正版影视全集;
√专业B2C网站上,完整有效的商品购买页;
√权威新闻站原创或经过编辑整理的热点新闻报道;
√经过网友认真编辑,内容丰富的百科词条。
内容满意度中:
能满足用户需求,但未花费较多时间和精力编辑,不能体现出经验和专业知识的完整网页。例如:
√贴吧里一个普通的帖子;
√一个普通的百度知道问答结果;
√没有进行任何编辑,直接转载其它网站的新闻;
√无版权信息的普通电影播放页。
主体内容信息量较少或已失效,只能起参考作用:
主体内容容信息量较少,或无任何有效信息。例如:
√论坛中缺少有价值信息的“水帖”;
√商品、团购等已下架、无货;
√招聘、交易类信息过期;
√页面上有明显的过期标记(下架、售完、过期时间等)
无有效内容,完全不能满足用户需求:
未经认真编辑整理、粗制滥造或从别处采集的内容。主要表现是:主体内容空洞或不能支撑页面主题,不能满足用户主要需求。例如:
√问答页有问无答,或回答完全不能解决问题;
√内容空短:有很少量的问题,不能支撑页面的主要意图;
√站内搜索结果页,但没有给出相关信息;
√各类作弊网页
衡量网页质量的维度——浏览体验
用户希望看到干净、且易阅读的内容,排版混乱、广告过多影响用户的阅读体验。影响用户阅读体验的网页,会被降低展现的几率。
浏览体验的好坏主要受内容排版、广告这两个因素的影响。
浏览体验好
排版合理,浏览顺畅,广告不影响阅读;主要内容突出、明确。一般具有以下特征:
√排版合理,版式美观,易于阅读和浏览;
√用户需要的内容占据网页最重要位置;
√能够通过页面标签或页面布局十分清楚地区分出哪些是广告;
√广告不抢占主体内容位置,不妨碍用户对主要信息内容的获取。
浏览体验差
页面布局和广告影响了用户对主体内容的获取。包括但不仅限于以下情况:
√排版布局差,例如:
正文内容不换行或不分段,阅读困难;
字体和背景颜色相近,内容辨别困难;
页面布局不合理,页面首屏看不到任何有价值的主体内容
√广告影响阅读体验,例如:
弹窗广告;
广告与内容混淆,不容易区分;
广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容;
影响阅读的浮动广告过多
衡量网页质量的维度——可访问性
用户希望快速地获取到需要的信息,百度搜索引擎尽可能为用户提供能一次性直接获取所有信息的内容。
不能直接获取到主体内容的网页,会被降低展现的几率。
百度会从资源有效性、主体资源可浏览性等方面判断网页的可访问性。
可正常访问的网页
无权限限制,能直接访问所有主体内容的网页
死链&主体资源失效
死链无法提供任何有价值的内容,我们希望网站中的死链,都第一时间通知搜索引擎
√404、403、503等页面
√程序代码报错页面
√打开后提示内容被删除,或因内容已不存在而跳转到首页
√资源下载页上的下载链接不存在或资源失效
√视频播放页视频无效或不存在,无法播放
网页信息主体部分需要权限或需要安装冷门插件
网页主体内容需要权限,提高用户获取信息的成本,百度会降低对其的评价
√论坛附件下载需要权限
√文档全文查看需要权限
√需要安装冷门插件才能正确访问
百度站长平台——完整联系方式,获得消息提醒
消息提醒五大功能:
●外链建设异常提醒
●内容建设异常提醒
●网站被黑提醒
●抓取异常提醒
●新闻源异常提醒
|