不少人都知道Google的搜索排名算法使用200多个因素,但具体是什么呢?
除了Google的核心算法工程师,几乎没有人知道完整真相。
而所谓的SEO技术,很多时候是分析、测试搜索获得的简单结论,有些优化方向是明确的,比如良好的用户体验、优质内容带来的用户行为变化对SEO的影响;而有些优化方向只能靠猜测。
由于搜索流量的巨大价值,很多企业懂得以网站,利用算法漏洞去做SEO,以长期获得更多的流量。
俗话说:“道高一尺魔高一丈”,各大SEO站长技术与搜索引擎之间的不断博弈,让搜索算法也不断迭代更新。
除了博弈带来的算法变化,新媒体和技术的诞生也让搜索引擎的算法不断进化,比如Twitter、Facebook等社交媒体对搜索的影响。
比如这几年Google发布了熊猫算法、企鹅算法、猫头鹰算法各个版本,百度也发布了石榴、绿萝、冰桶等算法。
每个大的搜索算法迭代都有核心目的和互联网环境变化的影响。
都说“读史可以鉴今”,那我们一起研究下Google使用过的排名因素(很多现在依然有效),希望能窥探今后搜索引擎演化的端倪。
以下一共有205条排名因素,有些已被证实,有些有争议,有些依然只是猜测。
反向链接因素
80、链接的域名年龄
老域名的反向链接可能比新域名作用更大。
81、链接的域名数量
引用域名数量是Google算法中最重要的排名因素之一,如下图所示(Moz数据,横坐标是排名),链接域名数量越多排名越高。(请注意:图中也告诉我们链接数是有阈值的,在没有突破阈值前,有可能链接域名越多,排名反而会下降)
82、独立C类IP的链接数
来自不同C类IP(Class-C)数量越多,说明链接广泛性越好。
81、链接页数
链接页面的总数很重要, 即使部分都来自同一个域名,这也对排名有帮助。
84、Alt标签(用于图像链接)
Alt文本可以说是图像的”锚文本“。
85、来自.edu或.gov类域名链接
虽然Google的Matt Cutts说不会做区别对待。但是,这并不妨碍广大SEOer认为Google对.gov和.edu域名的权重算法中有特殊的地方,也就说大家认为来自教育机构和政府网站的链接价值更大。
86、链接页面的权重
反向链接的页面权重(PageRank)是非常重要的排名因素。
87、链接域名的权重
同等页面权重下,域名权重越高越好(PR3站点的PR2页面权重小于PR8网站的PR2页面)。
88、来自竞争对手的链接
如果你能获得关键词搜索结果中其他网站的反向链接,则对于关键词排名特别有价值。
89、社会化网站引用页面
被社会化(设计)网站引用可能会影响链接的价值,被引用的越多越好。
90、来自垃圾网站的链接
来自垃圾网站的链接可能会伤害网站排名。
91、用户帖子引用
虽然让用户发布引用链接是白帽SEO的一部分,但如果链接来自签名或简介部分,价值可能不如页面内容里的相关链接,尽量能让用户帖子内容里加链接。
92、来自网站首页的链接
来自网站首页的链接权重比内页的要高很多。
93、Nofollow链接
SEO中最有争议的话题之一。Google的官方话是:“一般来说,我们不跟随他们。”
这表明他们至少在某些特定情况下会Follow,拥有一定百分比的nofollow链接可用于区分自然与非自然的链接。
94、链接类型的多样性
如果链接都来自某单一来源,比如论坛个人资料和博客评论页面,这明显不自然,会容易识别为垃圾链接。而来自不同来源的链接则是自然链接的标志。
95、赞助链接
像“合作伙伴”、“赞助商链接”这样的词语可能会降低其附近链接的价值。
96、内容相关链接
页面内容中的链接权(语境链接)重比空白页面(不一定空,比如单独的友情链接页)或其他非价值页面的链接权重更高。
一个”语境链接“的好例子:guestographics的反向链接。
97、过多301重定向页面
根据Google网站管理员帮助视频,过多301重定向链接会稀释部分(甚至全部)PR 。
98、反向链接锚文本
如Google原始算法中说:“首先,锚文本通常能提供比页面本身更准确的网页描述。”
锚文本的重要性虽然降低了(可能被Spam利用),但它仍然发送强烈的相关信号。
99、内部链接锚文本
内部链接锚文本是另一个相关性的信号,虽然可能与反向链接的锚文本权重不同。
100、链接标题
链接标题(当悬停在链接上时出现的文本)也用作弱相关信号。
101、引荐域的国家/地区
从国家/地区的顶级域名(.de,.cn,.http://co.uk)获取链接可能会帮助网站在该国家排名更好。
102、内容中的链接位置
在内容开头的链接比内容结尾的链接权重高。
103、页面中的链接位置
通常,在页面主体内容中添加的链接比页面底部或侧边栏中的链接权重更高。
104、链接域相关性
来自类似主题的利基站点(垂直网站)链接比来自完全不相关网站的链接更强大。有效的SEO策略依然着重于获得相关链接。
105、页面级相关性
Hilltop算法指出,与页面内容紧密相关的链接权重比不相关页面链接权重更高。
106、链接周围文字代表的情绪
Google可能已经可以根据链接周围文本识别出情绪,分析出链接是推荐还是负面批评引用。
107、标题中的关键词
Google对页面标题中包含对应关键字的链接给予更多权重(“专家链接到专家”,类似于专家间的互相推荐,可信度更高)。
108、正链接速度
链接增加速度(反向链接增加速度快于减少速度)的网站通常会得到搜索结果排名提升。
109、负链接速度
链接减少速度(反向链接减少速度快于增加速度))可以显著降低排名,因为它是流行度下降的信号。
110、专业主题链接
Aaron Wall声称,从专业的相关主题页面获取的的链接会给予更高的权重。
111、权威网站链接
从公认的行业权威网站获得的链接比小的专题网站获得好处多。
112、维基百科的引用链接
虽然添加有nofollow标签,但很多人认为,从维基百科获取链接可以让你的网站在搜索引擎眼中增添一点信任和权威。
国内可以增加一些来自百度百科和互动百科的引用。
113、链接附近相关文本
在反向链接周围出现的文本有助于告诉Google你的页面主题。
114、反向链接添加时间
根据Google专利,以前添加的链接比新加的反向链接具有更多的权重。
115、真实网站链接与垃圾博客链接
Google给“真实网站”的链接权重比垃圾博客链接高。Google可能会使用品牌和用户互动信号来区分两者。
116、自然链接
拥有“自然链接”的网站将排名高,而且排名更稳定持久。
117、互惠链接
Google指出“过度链接交换”是一种作弊,需要避免。
118、用户生成的内容链接
Google能够识别用户生成(UGC)的链接与实际的网站所有者添加的链接。
例如:Google知道来自Wordpress官方博客上的链接与用户创建的wordpress博客http://joesblog.wordpress.com链接是非常不同的。
119、来自301跳转的链接
经过301重定向的链接与直接链接相比可能会损失一点点权重,然而Google的Matt Cutts说:301链接类似于直接链接。
120、http://Schema.org微格式
支持Schema微格式的页面可以在Google的搜索结果中出现,从而直接提升搜索结果页的点击率这是不争的事实。
121、DMOZ收录
许多人认为,Google会给被http://DMOZ.com收录的网站更多的信任和权重。
122、链接网站的可信度(TrustRank)
网站的可信度也可以传递,如果很多可信度高的网站指向到你网站,对排名有好处。
123、页面的出站链接数量
页面的PageRank是有限的,导出链接多的页面比导出少的效果差。
124、来自论坛的链接
由于大量作弊,Google可能会大大降低论坛中链接的权重。
125、链接页面的字数
1000字帖子中的链接比25个字帖中的链接更有价值。
126、链接页面的内容质量
拼写错误多,语句不通内容里的链接价值不如专业包含多媒体内容里的链接。
127、全站链接
Matt Cutts已经确认,全站链接被“压缩”识别为单个链接。
用户互动
128、搜索关键词的页面点击率
搜索结果中点击率高的页面可能会获得该特定关键字的排名提升。百度算法也是这样,这就是各种“网页快排”技术的理论基础。
129、所有搜索关键词的页面点击率
所有关键字的网页(或网站)的点击率都是基于人的交互信号,一般都是点击率越高越好。
一定要重视优化SERP(搜索结果页),其中页面标题、配图、图标,都是SEO改进的点,以便提升用户的点击率。130、跳出率
并不是所有SEOer都认同跳出率这个排名因素,但Google很可能会把广大用户作为页面质量测试人员(快速跳出说明页面质量差)。
131、直接流量
已经确认Google使用Google Chrome的数据来确定人们是否访问网站(以及访问频率)。拥有大量直接流量的网站可能比直接流量少的网站质量更高。
132、重复流量
Google还可以知道用户是否再次访问这个页面或网站,Google可能会提高再次访问多的网站排名。
133、被阻止的网站
虽然Google已经在Chrome中停止了这项功能。然而,Google熊猫2.0算法仍然用这个数据作为质量信号。
134、Chrome书签
我们知道Google收集Chrome浏览器使用情况数据。被用户加入Chrome书签的页面可能会提升排名。
135、Google工具栏数据
Danny Goodwin报道Google使用工具栏数据作为排名信号。但是,除了检测页面加载速度和恶意软件之外,不知道Google还从工具栏收集什么数据。
136、评论数
拥有大量评论的页面是交互好、内容质量高的表现。
137、停留时间
Google非常注意“停留时间”:Google搜索过来的人在你的页面停留了多长时间。
可能是”长点击(点击页面后停留时间长)“,也可能是”短点击(点击页面后停留时间短)“
如果人们花费大量时间在你的网站上,Google会认为网站质量很好。