百度是如何判定网站是否值得抓取与收录的

一个网站有良好的浏览体验,那么对用户来说是非常有益的,百度也会认为这样的网站是有更好的收录价值的。良好的浏览体验是指: ​网站具有清晰的层次结构。为用户提供包含指向网站重要部分的链接的站点地图和导航。使用户能够清晰、简单的浏览网站,快速的找到其所要的信息。

案例详情

第一方面: 网站有良好的浏览体验
      一个网站有良好的浏览体验,那么对用户来说是非常有益的,百度也会认为这样的网站是有更好的收录价值的。良好的浏览体验是指:
      网站具有清晰的层次结构。为用户提供包含指向网站重要部分的链接的站点地图和导航。使用户能够清晰、简单的浏览网站,快速的找到其所要的信息。
      网站有良好的性能:包括浏览速度和兼容性。
      网站速度快可以提高用户满意度,还可改善网页的整体质量(尤其对于互联网连接速度慢的用户)。确保网站的内容在不同的浏览器中均能正确显示,防止某些用户不能正常访问。网站的广告不干扰用户的正常访问。广告是网站的重要收入来源,网站包含广告是非常合理的现象,但是如果广告过多会影响了用户的浏览;或者网站有太多不相关的弹窗、飘窗广告都可能会使用户反感。
      百度的目标是向用户提供相关度最高的搜索结果以及最佳用户体验,如果广告对用户体验造成伤害,那么这样的站点是百度抓取时需要减少的。
合理设置网站的权限。
      网站的注册访问等权限可以增加网站的注册用户、保证网站的内容质量,但过多的权限设置可能会使新用户失去耐性,给用户带来不好的体验。从百度来说希望减少提供对用户来说信息获取成本太高的网页。
      第二方面:网站创造高品质的内容,能为用户提供独特的价值
      百度作为搜索引擎,最终的目的是满足用户的搜索需求,所以要求网站内容首先能满足用户的需求,现今互联网上充斥了大量同质的内容,在同样能满足用户需求的前提下,如果您网站提供的内容是独一无二的或者是具有一定独特价值的,那么百度会更希望收录您的网站。
温馨提示:百度希望收录这样的网站:
      网站能满足一定用户的需求。网站信息丰富,网页文字能清晰、准确地表述要传达的内容。有一定原创性或独特价值。
      相反的,很多网站内容是“一般或低质”的,甚至某些网站利用欺骗手段来获取更好的收录或排名,下面列举一些常见的情况,虽然无法对各种情况一一列 举。但请不要抱有侥幸心理,百度有完善的技术支持发现并处理这些行为。请不要为搜索引擎创造内容。
      某些网站在设计时不是从用户角度出发考虑的,而是为了从搜索引擎骗取更多 的流量。比如提交给搜索引擎一种内容而显示给用户另一种。这些行为包括但 不仅限于:在网页中加入隐藏文字或隐藏链接;在网页中加入与网页内容不相关的关键词;具有欺骗性跳转或重定向;专门针对搜索引擎制作桥页;针对搜索引擎利用程序生成的内容。请不要创建多个包含大量重复内容的网页、子域或域。
      百度会尽量收录提供不同信息的网页,如果您的网站包含了大量重复的内容, 那么搜索引擎会减少相同内容的收录,同时认为该网站提供的内容价值偏低。
      当然如果网站上相同的内容是通过不同形式展现(如论坛的简版页面、打印页),可以使用robots.txt禁止spider抓取网站不想向用户展现的形式,这也有 助于节省带宽。
      请不要制作欺诈性或安装有病毒、特洛伊木马或其他有害软件的网页。谨慎加入频道共建、内容联盟等不能产生或很少产生原创内容的计划,除非网站能为内容联盟创造原创的内容。
第三方面:网站提供的内容得到了用户、站长的认可和支持
     一个网站上的内容如果得到了用户和站长的认可,那么对百度来说也是非常值得收录的。百度会通过分析真实用户的搜索行为、访问行为、网站之间的关系等综合给一个网站的认可度的评价。但是值得说明的是,这种认可必须是建立在网站为用户提供了优质内容的基础上,是真实、有效的。下面仅以网站之间的关系为例,来说明百度是如何看待其他站长对您网站的认可的:通常网站之间的链接可帮助百度的抓取工具找到您的网站,并提高您的网站的认可度。百度将从网页A至网页B的链接解释为网页A向网页B的投票。通过网页投票表决可以体现网页本身的“认可度”更具分量,并且有助于提高其他网页的“认可度”。链接的数量、质量以及相关性都会影响到“认可度”的计算。