快捷搜索:   服务器  PHP  安全  IIS  linux 安全

说说百度如何处理重复站点和网页

由于现在的互联网转载、复制的现象较明显,有的甚至是完全模仿某网站的页面自己再搞一个分站点。

  这里不说采集这种无前途的方式百 度对这种页面是如何处理的?

  现在看到的一些结果是原本运营了不短时间的网站,随着这个竞争网站模仿页面的收录,自己的页面排名逐渐下 降。

  无论现在怎么申明原创 实际上 据我们观察 百度不仅仅是看时间 还看发布网站的权重 以及指向这篇文章url的反向链接 实际上 要判断一篇文章转载和复制是非常容易我想应该不难 比如说 看这种文章在互联网上出现的时间 搜集各个站点发布文章的时间 对比一下 这样就很容易分清楚个 1 2 3 4 知道哪个应该获得对应的最高权重~ 但是怎么解决站长刻意修改时间 或者说 这种文章先发布 但是网站权重太低了 新站 没来得及被百度蜘蛛抓取 而 复制他的老站 高权重的站 确优先被抓取 站在百度的角度 他是第一时间发布 这样也会造成 楼主说的这种矛盾情况 。

  

百度

 

  百度是否可以这样: 我在互联网上抓取到的第一篇文章 我先给他这篇文章一个 比较低一点的分数a 然后在百度抓取页面的最慢时间范围b (比如说对新站收录是一个月)之后 ,如果时间排序还是第一 那么就是完全原创 给予然后进行2次叠加权值c (c大于a)如果此文章非原创 那么a小于c 肯定在原创文章排名之后 如果是原创 那么a+c 也肯定足够排名前面~ 这样我想可以解决一部分问题 ! 当然鉴于搜索引擎所面对的用户的复杂性和针对其余算法的兼容性来说 可能没我想的那么单纯~ 不过我们还是希望百度 确切的让我们相信内容为王 让一些辛辛苦苦原创更新的站长 不至于面临“被模仿”的尴尬~ 而不是告诉我们内容为王。

  我个人感觉”内容为王”的”内容”不能局限在狭义上的一篇文章正文相关文章调用,网站访问速度,网站整体的用户体验等等很多方面的东西都是包含 在”内容”中的而为什么有些朋友自己网站的原创文章排名不如那些转载的网站,可以就是乎略了这一点不过话说回来,百度现在对无权重小站新站出于信任不足, 偏重把老站大站排在前面这点很不好打击了小站的积极性,希望百度的人能考虑考虑改变下算法关于robin大哥的 我也考虑过 我做优化一直遵循tag 相关 最新 最热 推荐 这样的整体页面布局 而不是单看正文 主要是关于原创文章算法这块 我后来更倾向于: 算法是按照正文来计算的这的确是个显著的问题。这表明我们在这方面的策略上有极大改进空间。这类积重的问题,非一朝一夕能搞定,需要伤筋动骨的动动手术才 行。所以请大家耐心。

  另 外需要说明的是,搜索引擎的排序出发点,是用户的搜索体验。虽然说,很多时候尊重原创和用户体验是一致的。但是,毕竟也有一些case,转载的体验会比原 创更好。这时候原创者的排序未必会高于转载者。但无论如何,原创者的应该以另外一种方式被肯定,而不是简单的被聚合掉。

  说得没错!我认为转载的体验可以比原创好 搜索引擎的排名确实应该从用户搜索体验出发 但是你要考虑到内容的原始提供者的积极性问题~ 目前n多行业 n多站 基本多是这里抄一点 那里抄一点 稍微好点的 看过一点seo书 的 就修改一下~ 如你所说 我觉得从深层一点来说 无论怎样 原创都应该得到鼓励和最高权值的认可~ 毕竟中国国情就是这样 转载而不会给你留链接

  本文出自ceo风向标 转载请注明出自http://www.ceologo.com/seo/381.html

顶(0)
踩(0)

您可能还会对下面的文章感兴趣:

最新评论