搜索引擎的工作原理是使用网络爬虫从一个页面到另一个页面的链接来查找要添加到搜索索引的新网页。当您在使用搜索引擎进行搜索时,搜索引擎将把相关结果将从索引中提取相关网页,并使用算法对这些网页进行排名。如果您想在搜索引擎中网页排名更靠前,并获得网站的流量,您需要对搜索引擎如何查找、索引和排名内容的底层逻辑有一个基本的了解。本文将对搜索引擎的工作原理进行简要说明。
第1章—-搜索引擎基础知识
什么是搜索引擎?
搜索引擎是查找与用户搜索查询匹配的网页内容并进行排名的工具。每个搜索引擎由两个主要部分组成:
搜索索引:有关网页信息的数字信息库。
搜索算法:从搜索索引中对匹配结果进行排名的程序。
全球较大的搜索引擎包括Google、Bing和DuckDuckGo等。
搜索引擎的目的是什么?
一般而言,用户更喜欢能够提供精准搜索结果的搜索引擎,因此为了占取更多的市场份额,每个搜索引擎都旨在为用户提供最佳、最相关的结果。
搜索引擎的盈利模式:
搜索引擎有两种类型的搜索排名机制:
自然排名:搜索引擎算法生成的排名,自然排名无法购买,完全由网站质量、网站内容决定,排名一般较为稳定。
广告商的付费排名:顾名思义,你可以直接购买排名-即付费广告营销,您可以在短期内获得较高排名,但一定停止续费,排名无法保证。
每当有人点击付费搜索结果时,广告商都会向搜索引擎付费,这被称为按点击付费(PPC)广告—-这也是搜索引擎将市场份额看得很重要的原因,对于搜索引擎而言,更多的用户意味着更多的广告点击和更多的收入。
为何提高网站排名如此重要?
了解搜索引擎如何查找、索引和排名内容,将帮助您在相关和流行关键字的自然搜索结果中提高网站排名。如果您能在这些查询中排名靠前,您将获得更多点击量和内容的自然流量。
谁是全世界最受欢迎的搜索引擎?
谷歌:它拥有92%的市场份额。
谷歌是大多数搜索引擎优化专业人士和网站所有者最重视的搜索引擎,因为它可能比任何其他搜索引擎获得更多的流量。
第2章—-搜索引擎如何构建索引
大多数知名搜索引擎,如谷歌和必应,其搜索索引中有数万亿页。因此,在我们讨论排名算法之前,让我们更深入地了解用于构建和维护Web索引的机制。
以下是基本流程:
让我们一步一步地分解:
URL
爬虫
处理和渲染
索引
注:本流程特别适用于谷歌,但对于必应等其他网络搜索引擎来说可能比较相似。同时还有一些其他类型的搜索引擎,如亚马逊、YouTube和维基百科,只显示其网站的结果。
第1步:URL
URL一般指统一资源定位系统。 统一资源定位系统(uniform resource locator;URL)是因特网的万维网服务程序上用于指定信息位置的表示方法。
一切都以已知的URL列表开始:谷歌通过一些方法发现这些网站,最常见的三个方法是:
①从反向链接
谷歌已经有一个包含数万亿个网页的索引。如果有人从其中一个网页添加到您的一个页面的链接,他们可以从那里找到它。
②来自网站地图
网站地图列出了您网站上的所有重要页面。如果您将网站地图提交给谷歌,这可能会帮助他们更快地发现您的网站。
③来自URL提交
谷歌还允许通过谷歌搜索控制台提交单个URL。
第2步:爬虫
爬虫是一个名为蜘蛛的计算机机器人访问和下载发现网页。需要注意的是,谷歌并不总是按照发现页面的顺序抓取页面。谷歌根据几个因素对URL进行排名,包括:
①URL的页面权重
②URL 更改的频率
如果您有一个大型网站,搜索引擎可能需要一段时间才能完全抓取它。
第3步:处理
谷歌努力从抓取页面中理解和提取关键信息。但谷歌并未公布其中的处理具体方法,但对我们来说,重要的部分是提取链接和存储内容以进行索引–谷歌必须渲染页面才能完全处理它们,这是谷歌运行页面代码以进行用户画像的参考依据。
第4步:索引
索引是指将来自抓取页面的处理信息添加到名为搜索索引的大数据库中。你可以理解为该大数据库是一个由数万亿个网页组成的数字图书馆,谷歌的搜索结果正是来源于此。当您在搜索引擎中键入查询时,您不会直接在互联网上搜索匹配的结果。您正在搜索搜索引擎的网页索引。如果网页不在搜索索引中,搜索引擎用户将找不到它。这就是为什么将您的网站索引到谷歌和必应等主要搜索引擎中如此重要的原因。
第3章—-搜索引擎如何对页面进行排名
当用户执行搜索时,搜索引擎还需要一种对匹配结果进行排名的方法。每个搜索引擎都有独特的算法来对网页进行排名。但是,由于谷歌是迄今为止使用最广泛的搜索引擎(至少在西方)。
众所周知,谷歌有200多个排名因素。但谷歌并未直接公开排名因素,但我们可以通过优化以下公认的因素来提高排名:
①反向链接
②链接相关性
③新鲜度
④局部权威
⑤页面速度
⑥移动设备友好性
反向链接
反向链接是谷歌最重要的排名因素之一。谷歌搜索质量高级策略师Andrey Lipattsev在2016年的现场网络研讨会上证实了这一点。当被问及两个最重要的排名因素时,他的回答很简单:内容和链接。
自1997年推出PageRank以来,链接一直是谷歌的一个重要排名因素,PageRank是一种根据指向网页的反向链接的数量和质量来判断网页价值的公式:
当我们分析超过10亿网页时,我们发现链接到一个页面的网站数量与它从谷歌获得的自然流量之间存在明显的相关性。
但是这并不意味着拥有更多的反向链接就一定能拥有更高排名。具有一些高质量反向链接的页面,完全有可能比具有大量低质量反向链接的页面,排名靠前。
谷歌在评定反向链接质量的时候采用了六个指标,其中最重要的两个是:权威和相关性。
链接权重
来自权威页面和网站的反向链接通常对排名的影响最大。
你如何定义权威?在搜索引擎优化的背景下,权威页面和网站是那些有很多反向链接或“投票”的页面和网站。
在Ahrefs中,我们有两个指标来估计网站和页面的相对权威:
域名评级(DR):网站的相对权威范围从0到100。
URL评级(UR):页面在0-100的相对权威范围内。
您可以在Ahrefs的网站资源管理器中检查任何网站或网页的权限。
链接相关性
来自相关网站和网页的链接通常是最有价值的。
谷歌在对其页面上的有用页面进行搜索如何工作的排名时谈到了相关性。
如果其他优质网站链接到该相关页面,那么表明该页面的信息质量很高。如果您想知道为什么相关性很重要,不妨这么理解:在寻找最好的意大利餐厅时,你可能会相信厨师朋友的建议,而不是兽医朋友的建议。但如果你正在寻找猫粮推荐,情况就相反了。
相关性
谷歌有很多方法可以确定页面相关性。
最基本的,它能查找包含与搜索查询相同的关键字的页面。但网页内容的相关性远远超出了关键词匹配度,谷歌还使用交互数据来评估搜索结果是否与查询相关。你可以理解为谷歌还在思考如何将搜索者认为对他们有用的页面推送给用户。
这就是为什么当你在谷歌中输入“苹果”,你将发现的所有靠前结果都是关于“苹果”这家科技公司,而不是水果“苹果”。这是因为谷歌从交互数据中知道,大多数搜索者正在寻找有关前者的信息,而不是后者。
不过,交互数据远非谷歌实现高质量排名的唯一方法。
谷歌还研发了许多技术,以帮助了解人、地方和事物等实体之间的关系。知识图是这些技术之一,本质上是实体及其之间关系的巨大知识库。其中,苹果(水果)和苹果(技术公司)都是知识图表中的实体。谷歌利用实体之间的关系来更好地了解页面相关性。谈论橘子和香蕉的“苹果”的匹配结果显然是关于水果。但谈论iPhone、iPad和iOS的显然是关于“苹果”这家科技公司。
部分要归功于知识图表,谷歌可以超越关键词匹配。
有时,您甚至可能会看到没有提到查询中看似重要的关键字的搜索结果。例如,为“苹果纸应用程序”选择第二个结果,该结果在页面上的任何地方都没有提到“苹果”一词。
谷歌可以分辨出这是一个相关的结果,部分原因是它在知识图表中提到了iPhone和iPad等无疑与苹果密切相关的实体。
交互数据和知识图并不是谷歌用于了解页面与搜索查询相关性的唯一技术。大部分工作都是使用技术来理解查询本身背后的含义和意图完成的,例如BERT和RankBrain。谷歌有时甚至在幕后重写查询,以提供更相关的结果。
新鲜度
新鲜度是一个依赖于查询的排名因素,这意味着它对某些结果比其他结果更重要。
对于像“亚马逊Prime的新功能”这样的查询,新鲜度很重要,因为搜索者想知道最近添加的电影和电视节目。这可能是谷歌对新发布或更新的搜索结果进行更高排名的原因。
对于“最佳耳机”等查询,新鲜度很重要,但并不那么重要。耳机技术发展迅速,因此2015年的结果不会有多大用处,但2-3个月前发布的帖子仍然有用。
谷歌知道这一点,并优先显示过去几个月更新或发布的结果。
还有一些查询,结果的新鲜度大多无关紧要,例如“如何围棋打成平局”。几十年来,这个过程没有任何变化,所以搜索结果是昨天还是1998年并不重要。谷歌知道这一点,并未将新鲜度列为排名的主要影响因素,还是会显示几十年前就以认定是最佳结果的网页。
局部权威
谷歌在他们的一项专利中谈到了这一点:
搜索系统是否认为网站是权威的,通常取决于局部查询结果。搜索系统可以考虑疾病控制中心的网站“cdc.gov”是查询“CDC蚊子停止叮咬”的权威网站,但可能不会认为同一网站对查询“餐厅建议”具有权威性。
虽然这只是谷歌提交的许多专利之一,但我们看到证据表明,在许多查询的搜索结果中,“局部权威”很重要。
如果您只需查看“sous vide真空密封器”的结果。在这里,我们看到两个关于苏维德烹饪的小利基网站排名高于《纽约时报》。虽然这里无疑还有其他因素在起作用,但似乎“局部权威”可能是这些网站排名的原因之一。
这就是为什么谷歌的搜索引擎优化入门指南告诉网站所有者:
在特定领域培养专业知识和可信度的声誉。
页面速度
没有人喜欢等待页面加载,谷歌知道这一点。这就是为什么他们在2010年将页面速度作为桌面搜索的排名因素,在2018年将移动搜索的排名因素。
不过,从已经速度已经快的网站上剃掉几毫秒加载速度,不太可能提高排名。它只需要足够快,以免对用户产生负面影响。
您可以在PageSpeed Insights中检查任何网页的速度,这也会生成建议,使页面更快。
PageSpeed Insights还显示了您的页面在Core Web Vitals方面的表现。
Core Web Vitals由三个指标组成,用于评估网页的加载性能、交互性和视觉稳定性。谷歌已确认,截至2021年6月,Core Web Vitals将是一个排名信号。
您可以使用谷歌搜索控制台中的Core Web Vitals报告查看网站上所有页面的性能。
如果许多URL表现不佳或需要改进,您可以与爱普开发人员交谈。
移动设备友好性
65%的谷歌搜索发生在移动设备上。这就是为什么自2015年以来,移动设备友好性一直是移动的一个因素。
自2019年以来,由于谷歌切换到移动设备优先索引,移动设备友好性也是桌面搜索的排名因素。这意味着谷歌“主要使用移动版内容进行索引和排名”,在所有设备上进行索引和排名。
换句话说,缺乏移动设备友好性可能会影响任何地方的排名。
您可以使用谷歌的移动设备友好测试工具或谷歌搜索控制台中的移动可用性报告中检查任何网页的移动设备友好性。
第4章—-搜索引擎如何展现个性化搜索结果
搜索引擎明白,每个人都希望看到最自己最希望看到的内容。这就是为什么谷歌将为每个用户量身定制搜索结果。
如果您曾经在多台设备或浏览器上搜索过相同的东西,您可能已经看到了这种个性化定制的影响:他们会优先展出您最可能感兴趣的网页。
正是由于这种个性化,如果您正在做搜索引擎优化,您最好使用Ahrefs的排名跟踪器等专用工具来跟踪排名位置。这些工具中报告的位置可能更接近用户需求,因为它们浏览网页的方式不会为搜索引擎提供太多有用的个性化信息。
搜索引擎如何定制个性化展示结果?
谷歌表示,“您的位置、过去的搜索历史记录和搜索设置等信息,都有助于谷歌根据当时对您最有用和最相关的内容,以调整展示给您的结果。”
1、位置
如果您在纽约,搜索“意大利餐厅”,地图包中的所有结果都是纽约的餐厅而不是意大利的餐厅。
谷歌这样做是因为它认为你不太可能飞遍半个世界到意大利吃午饭。
谷歌还使用您的位置在地图包之外个性化搜索结果。如果我们向下滚动搜索“意大利餐厅”,甚至TripAdvisor(旅游推荐)的结果也是个性化的,我们看到许多排名靠前的结果都是来自当地餐馆的网站。
对于像“买房子”这样的查询来说,结果也会非常类似。谷歌返回带有本地列表而不是其他国家列表的页面,因为您大概率不会考虑搬迁到另一个国家买房。
您的位置对本地查询结果的影响如此之大,以至于在从两个不同位置搜索相同内容时,显示的结果几乎没有重叠之处。
2、语言
谷歌知道,向西班牙语用户显示英语结果是没有意义的。
不过,谷歌在某种程度上是依赖网站所有者来确定展示的语言。如果您有多种语言的页面,除非您告诉谷歌要展示某特定语言,否则谷歌可能不会展示该语言的页面。
您可以使用名为hreflang的HTML属性来做到这一点。
Hreflang有点复杂,远远超出了本指南的范围,但基本上它是一小段代码,表明不同语言同一页面的多个版本之间的关系。
3、搜索历史记录
也许您能感受到谷歌使用搜索历史记录,来达到个性化展示结果的最贴切的案例便是,下次您运行相同搜索时,它会将之前点击的结果“排名”得更高。
这似乎很常见——特别是如果您在短时间内多次单击或访问页面。
让我们总结一下
了解搜索引擎的工作原理是在谷歌中排名更高并获得更多流量的第一步。如果搜索引擎找不到、抓取和索引您的页面,您可能无法在短期内获得流量。
如果您想知道如何做到这一点,以及如何开始优化您的网站进行搜索引擎优化,请继续阅读我们的其他搜索引擎优化基础知识文章。