整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:(010) 8588 8564

Hilltop算法

Hilltop算法是由Krishna Baharat在200(!年左右所研究的,于2001年申请了专利,并 且把专利授权给Google使用,后来Krishna Baharat本人也加入了Google. Hilltop算法可以简单理解为与主题相关的PR值.传统PR值与特定关键词或主题没 有关联,只计算链接关系。这就有可能出现某种漏洞。比如一个PR值极高的关于环保内 容的大学页面,上面有一个链接连向一个儿童用品网站。这个链接出现的原因可能仅仅是 因为这个大学页面维护人是个教授.他太太在那个卖儿童用品的公司工作.这种与主脱无 关、却有着极高PR值的链接,有可能使一些网站获得很好的排名,但其实相关性并不高。 Hilltop算法就尝试矫正这种可能出现的疏漏.Hilltop算法同样是计算链接关系,不过Hilltop算法是由Krishna Baharat在200(!年左右所研究的,于2001年申请了专利,并 且把专利授权给Google使用,后来Krishna Baharat本人也加入了Google. Hilltop算法可以简单理解为与主题相关的PR值.传统PR值与特定关键词或主题没 有关联,只计算链接关系。这就有可能出现某种漏洞。比如一个PR值极高的关于环保内 容的大学页面,上面有一个链接连向一个儿童用品网站。这个链接出现的原因可能仅仅是 因为这个大学页面维护人是个教授.他太太在那个卖儿童用品的公司工作.这种与主脱无 关、却有着极高PR值的链接,有可能使一些网站获得很好的排名,但其实相关性并不高。 Hilltop算法就尝试矫正这种可能出现的疏漏.Hilltop算法同样是计算链接关系,不过 它更关注来自主题相关页面的链接权重。在Hilltop算法中把这种主题相关页面称为专家文 件。显然.针对不同主鹿或搜索词有不同的专家文件。 根据Hilltop算法.用户搜索关键词后.Google先按正常排名算法找到一系列相关页 面并排名,然后计算这些页面有多少来自专家文件的、与主压相关的链接.来自专家文件 的链接越多,页面的排名分值越高.按Hilltop算法的初构想.一个页面至少要有两个来 自专家文件的链接,才能返回一定的Hilltop值,不然返回的Hilltop值将为零. 根据专家文件链接计算的分值被称为LocalRank.排名程序根据LocalRank值,对原 本传统排名算法计算的排名做重新调整,给出后排名。这就是前面讨论的搜索引擎排名 阶段后的过滤和调整步骤. Hilltop算法初写论文和申请专利时对专家文件的选择有不同描述。在初的研究 中.Krishna Baharat把专家文件定义为包含特定主甩内容,并且有比较多导出链接到第三 方网站的页面.这有点类似于HITS算法中的枢纽页面。专家文件链接指向的页面与专家 文件本身应该没有关联.这种关联指的是来自同一个主域名下的子域名,来自相同或相似 IP地址的页面等。常见的专家文件经常来自于学校、政府及行业组织网站. 在初的Hilltop算法中,专家文件是预先挑选的.搜索引攀可以根据常见的搜索词. 预先计算出一套专家文件,用户搜索时.排名算法从事先计算的专家文件集合中选出与搜 索词相关的专家文件子集.再从这个子集中的链接计算LocalRank值. 不过在2001年所申请的专利中.Krishna Baharat描述了另外一个挑选专家文件的方 法。专家文件并不预先选择。用户搜索特定查询词后.搜索引攀按传统算法挑出一系列初 始相关页面,这些页面就是专家文件.Hilltop算法在这个页面集合中再次计算哪些网页有 来自于集合中其他页面的链接,赋予比较高的LocalRank值。由于传统算法得到的页面集 合已经具备了相关性。这些页面再提供链接给某一个特定页面。这些链接的权重自然应该 很高。这种挑选专家文件的方法是实时进行的。 通常认为Hilltop算法对2003年底的佛罗里达更新有重大影响。不过Hilltop算法是否 真的已经被融入进Googl。排名算法中,没有人能够确定。Googic从来没有承认、也没有 否认自己的排名算法中是否使用了某项专利.不过从排名结果观察及招揽Krishna Baharat 至魔下等迹象看,Hilltop算法的思想得到了Googl。的极大重视。