读了一下Google关于Blog Search的Patent。总结一下Google是如何评价Blog的重要性的。


正面的指标:



  1. 订阅数:查看blog在各个RSS定制服务中的被订制的数量。被订制的越多,blog越重要。但同时要尽量避免"订制Spam"(Spamers通过订制自己的博客来提升其质量)。避免的方法包括验证订制人的ID和IP。

  2. 搜索点击数:查看blog作为搜索结果时被点击的次数。当一个blog同时和其他一些blog作为搜索结果而又被用户点击时,Google会认为这个blog比较引人关注也因此比较重要。

  3. Blogroll链接数:很多blog都有自己的blogroll。blogroll包含一些对外的链接(很多都是blog)。包含指向一个blog的链接的blogroll越多,该blog就越重要。

  4. 来自高质量的blogroll的链接:高质量的blogroll的链接大多都指向著名的或值得信任的blog。

  5. 来自高质量的blog的blogroll的链接:这里的假定是著名的或值得信任的blogger很少会放链接连向spam blog。

  6. 有Tag:有Tag表明作者对文章比较认真负责,呵呵。

  7. 来自邮件和聊天记录的链接:看来Google也会通过Gmail和GTalk来修正blog的重要度。

  8. PageRank:PageRank越高对应的blog也就越重要。考虑到blog的更新比较频繁,最新的blog post可能还没有PR。这时可以用对应的blog的PR来代替。


 负面的指标:



  1. 更新频率:更新过于频繁或非常有规律的博客会被认为是在spam。因此会被降低重要性。

  2. feed内容和blog内容的不一致:考虑到spammer可能会为了提升自己的排序而把有价值的内容放到feed里面,同时在博客内容里面放一些指向不相关内容的广告链接。为了惩罚这种情况,对于feed内容和blog内容不一致的情况,要降低blog的重要性。

  3. 重复内容:有些spammer为了让某些内容能够多次长时间的出现在feed里面,会重复发布同样的内容。这样的情况会被惩罚。

  4. 用词不当:Google会收集一些spam的文章,做一些词频的统计分析(比如提取bi-gram或tri-gram)。一旦发现某个博客含有过多的spam的词汇,就会降低其重要性。

  5. 博文长度分布:一些spammer会用机器自动产生和发布一些内容长度相同或类似的文章。Google会统计文章的长度分布。对文章长度分布过于均匀的,会降低其重要性。

  6. 链接:有些spammer会在一篇文章或一个博客中插入多个指向同一网页的链接以增加该网页的PageRank。为了惩罚这种情况,Google会降低该文章或博客的重要性。

  7. 广告:如果一个博客含有过多的广告,它的重要性会降低。另外,一般博
    客会包括三方面的内容:最近发表的文章;blogroll和metadata(比如博主的信息)。通常广告会放在blogroll或metadata部
    分。对于放在文章部分的广告,Google会予以惩罚。



[更多查看原文]

点评 Trackback 收藏它 拍它!
挖上一个精彩
挖客给您推荐更多精彩!
挖下一个精彩

这些挖友臭味相投 · · · · · ·


挖友说 · · · · · ·

 

匿名评论
(尊重网上道德,承担一切因您的行为而直接或间接导致的法律责任)

 

 
合作伙伴:   刷刷   煎蛋   动态网站制作指南   265上网导航   新新web2.0   9Fav就喜欢网   Linux桌面中文网   DigiArt   我爱水煮鱼   奇趣发现   IB资讯   天涯海阁
  乐婴网   cngadget   有意思吧   软件一千零一页  DiggLife  设计|生活|发现新鲜   掘客巴士  17Fav  掘图志   桑林志   91新鲜网   精灵的天下