1. 您的位置:首页 > seo技术 >内容

常见问题解答:有关Google RankBrain算法的全部信息

google-brain-data2-ss-1920

Google使用称为“ RankBrain”的机器学习人工智能系统来帮助对其搜索结果进行排序。 想知道这如何运作并适合Google的整体排名系统吗? 这就是我们对RankBrain的了解。

下面介绍的信息来自三个原始来源,并且随着时间的推移进行了更新,并记录了发生更新的地方。 这些是这些来源:

首先是彭博社的故事,它打破了有关RankBrain的新闻(另请参见我们的文章)。 其次,Google现在直接提供给Search Engine Land的其他信息。 第三,在Google未提供答案的地方我们的知识和最佳假设。 除了一般的背景信息外,我们还将在必要时弄清楚在何处使用这些资源。

什么是RankBrain?

据彭博社报道,RankBrain是Google的机器学习人工智能系统的名称,该系统用于帮助处理其搜索结果,并已得到Google的确认。

什么是机器学习?

机器学习是计算机自学如何做某事的方法,而不是由人教或遵循详细的编程方法。

什么是人工智能?

真正的人工智能(或简称AI)是一台计算机可以像人类一样聪明的地方,至少在意义上,既可以通过讲授知识,也可以通过建立知识来建立新的连接来获取知识。

当然,真正的AI仅存在于科幻小说中。 在实践中,AI用于指代旨在学习和建立连接的计算机系统。

AI与机器学习有何不同? 就RankBrain而言,在我们看来它们是相当的同义词。 您可能会听到它们互换使用,或者您会听到机器学习用于描述所采用的人工智能方法的类型。

那么RankBrain是Google对搜索结果进行排名的新方式吗?

不会。RankBrain是Google整体搜索“算法”的一部分,该计算机程序用于对已知的数十亿个页面进行排序,并找到与特定查询最相关的页面。

Google的搜索算法的名称是什么?

Google-hummingbird1-ss-1920

正如我们过去报道的那样,它被称为蜂鸟。 多年来,整个算法没有正式名称。 但在2013年中,Google对该算法进行了全面修改,并为其命名为Hummingbird。

那么RankBrain是Google的Hummingbird搜索算法的一部分吗?

那是我们的理解。 蜂鸟是整体搜索算法,就像汽车中装有整体引擎一样。 发动机本身可以由各种零件组成,例如机油滤清器,燃油泵,散热器等。 同样,蜂鸟包含了各个部分,而RankBrain是最新的成员之一。

特别是,我们知道RankBrain是整体Hummingbird算法的一部分,因为Bloomberg文章清楚地表明RankBrain不能像所有整体算法那样处理所有搜索。

蜂鸟还包含SEO领域中其他人熟悉的名称,例如旨在打击垃圾邮件的Panda, Penguin和Payday,旨在改善本地搜索结果的Pigeon,旨在降级广告大量网页的Top Heavy以及旨在奖励移动设备的Mobile Friendly友好的页面和海盗旨在打击版权侵害。

我以为Google算法被称为“ PageRank”

PageRank是整个蜂鸟算法的一部分,该算法涵盖了一种基于指向其他页面的链接来赋予页面信誉的特定方式。

PageRank之所以与众不同,是因为它是Google曾经对其排名算法的其中一个部分取的名字,最早可以追溯到1998年搜索引擎开始时。

Google用来排名的这些“信号”呢?

信号是Google用来帮助确定网页排名方式的东西。 例如,它将读取网页上的单词,因此单词是一个信号。 如果某些单词以粗体显示,则可能是另一个提示信号。 作为PageRank一部分的计算会为页面提供PageRank得分,该得分被用作信号。 如果某个页面被标记为适合移动设备浏览,则表示已注册了另一个信号。

所有这些信号都由Hummingbird算法中的各个部分进行处理,以找出Google响应各种搜索而显示的页面。

有多少个信号?

Google一直以来都在谈论200多个主要排名信号,这些信号经过评估后可能会多达10,000个变体或子信号。 正如昨天在彭博社的文章中所说,它通常只是说出“数百个”因素。

如果您想获得更直观的信号排名指南,请参阅我们的SEO成功因素周期表:

SEO成功因素周期表2015

我们认为,这是关于Google等搜索引擎用来帮助对网页进行排名的一般知识的不错指南。

而RankBrain是第三重要的信号吗?

那就对了。 毫无疑问,这个新系统已成为Google所说的网页排名的第三重要因素。 彭博社文章:

Corrado说,RankBrain是进入算法的“数百种”信号之一,该算法确定哪些结果显示在Google搜索页面上以及它们的排名。 他说,在部署了几个月后,RanrainBrain已成为搜索查询结果的第三重要信号。

最重要和最重要的信号是什么?

最初写这个故事的时候,Google不会告诉我们。 我们的假设是:

我个人的猜测是,链接仍然是最重要的信号,这是Google以投票形式计算这些链接的方式。 正如我在“我的链接:过去Google和Bing使用的破碎的”投票箱”中所介绍的那样,这也是一个非常老化的系统

至于第二重要的信号,我猜可能是“单词”,其中单词涵盖了从页面上的单词到Google如何解释人们进入RankBrain分析之外的搜索框的所有内容。

事实证明这是非常正确的。 2016年3月,Google揭露了前两个因素是内容和链接。 或链接和内容,因为它不会说哪个是第一个。 有关更多信息,请参见我们的文章:

  • 现在我们知道:以下是Google排名前三的搜索因素

RankBrain到底是做什么的?

从与Google的电子邮件中,我收集到了RankBrain,它主要是用来解释人们提交的搜索内容,以查找可能没有所搜索单词的页面。

除了输入的确切查询信息外,Google还没有其他方法来查找页面吗?

是的,Google很长时间以来发现的页面超出了用户输入的确切术语。 例如,几年前,如果您输入的是“鞋子”之类的内容,则Google可能找不到显示“鞋子”的页面,因为从技术上讲这是两个不同的词。 但是“踩踏”让Google变得更聪明,了解鞋子是鞋子的一种变体,就像“跑步”是“跑步”的变体一样。

Google还获得了**arts的同义词,因此,如果您搜索“运动鞋”,它可能会理解您的意思也就是“跑鞋”。 它甚至获得了一些概念上的聪明才智,以了解存在有关“苹果”(Apple)和技术公司“苹果”(apple)水果的页面。

知识图呢?

知识图谱(Knowledge Graph)于2012年推出,这是Google变得更加聪明的一种方法,可用于单词之间的连接。 更重要的是,它学会了如何搜索“不是字符串的东西”,正如Google描述的那样。

字符串表示仅搜索字母字符串,例如与拼写为“奥巴马”的页面匹配的页面。 事情意味着,谷歌了解当有人搜索“奥巴马”时,他们可能意味着美国总统巴拉克·奥巴马,这是与其他人,地方和事物有联系的实际人。

知识图是有关世界事物及其之间关系的事实数据库。 这就是为什么您可以进行搜索(例如“奥巴马的妻子何时出生”)并获得有关Michele Obama的答案,如下所示,而无需使用她的名字:

奥巴马的妻子

RankBrain如何帮助优化查询?

Google已经使用的改进查询的方法通常全部流回某个人在工作的某个地方,他们创建了词干列表或同义词列表,或者在事物之间建立数据库连接。 当然,其中涉及一些自动化。 但很大程度上,这取决于人类的工作。

问题是Google每天要处理30亿次搜索。 Google在2007年表示,从未有过20%到25%的查询。 2013年,这一数字下降到了15%,在昨天的彭博社文章中再次使用了这一点,谷歌再次向我们证实。 但是,在30亿个查询中,有15%仍然是从未有任何人类搜索者输入过的大量查询-每天有4.5亿个查询。

其中可能是复杂的多字查询,也称为“长尾”查询。 RankBrain旨在帮助更好地解释这些查询,并以某种方式在后台有效地翻译它们,以找到适合搜索者的最佳页面。

正如Google告诉我们的那样,它可以查看看似无关的复杂搜索之间的模式,以了解它们之间的实际相似之处。 反过来,这种学习可以使其更好地了解未来的复杂搜索以及它们是否与特定主题相关。 最重要的是,根据Google告诉我们的信息,它可以将这些搜索组与它认为搜索者最喜欢的结果相关联。

Google未提供搜索组示例,也未提供有关RankBrain如何猜测最佳网页的详细信息。 但是后者可能是因为,如果它可以将模棱两可的搜索转换为更具体的内容,则可以带回更好的答案。

一个例子呢?

虽然Google没有提供搜索组,但彭博社的文章确实提供了一个示例,其中可以说RankBrain可以提供帮助。 这里是:

食物链最高层的消费者的头衔是什么

对于像我这样的外行人来说,“消费者”听起来像是对某人进行购买的参考。 但是,这也是食用食物的科学术语。 食物链中也有许多消费者。 那个消费者处于最高水平? 标题-名称-是“捕食者”。

即使查询本身听起来很奇怪,将查询输入Google也会提供很好的答案:

食物链消费者

现在考虑一下搜索结果的相似程度,例如“食物链的最高层”,如下所示:

top_level_of_the_food_chain _-_ Google_Search

想象一下,RankBrain正在将原始的冗长而复杂的查询连接到这个短得多的查询,这可能是更常见的做法。 它了解它们非常相似。 因此,Google可以利用其所获得的全部知识来获得更常见查询的答案,以帮助改善其为不常见查询提供的功能。

让我强调一点,我不知道RankBrain正在将这两个搜索联系在一起。 我只知道Google举了第一个例子。 这只是一个示例,说明了如何使用RankBrain将不常见的搜索连接到常见的搜索,以此来改善情况。

Bing也可以使用RankNet做到这一点吗?

早在2005年,微软就开始使用自己的机器学习系统RankNet,作为今天Bing搜索引擎的一部分。 实际上,RankNet的首席研究员和创建者最近获得了荣誉。 但是这些年来,微软几乎没有谈论RankNet。

您可以打赌这可能会改变。 有趣的是,当我将上面的搜索放到Bing中时,以Google的RankBrain有多出色为例,Bing给了我很好的结果,其中包括Google还返回的一个列表:

什么是_消费者的食物_最高食物_食物_食物_食物_食物_食物

一个查询并不意味着Bing的RankNet与Google的RankBrain一样好,反之亦然。 不幸的是,很难拿出一份清单来进行这种比较。

还有更多例子吗?

Google确实给了我们一个新的例子: “一杯汤匙有多少汤匙?” 谷歌表示,尽管名称相似,但RankBrain倾向于在澳大利亚和美国针对该查询提供不同的结果,因为每个国家/地区的测量结果均不同。

我试图通过在Google.com和Google Australia上进行搜索来进行测试。 我自己,没什么太大的不同。 即使没有RankBrain,结果也常常会以这种方式有所不同,这仅仅是因为“过时的”手段偏爱那些使用Google Australia的搜索者从澳大利亚已知站点访问的页面。

RankBrain真的有帮助吗?

尽管我上面的两个例子不足以证明RankBrain的出色表现,但我确实相信,正如Google声称的那样,它可能会产生巨大的影响。 该公司对其排名算法的内容相当保守。 它一直在进行小型测试。 但是,只有在充满信心的情况下,它才会引发重大变化。

在一定程度上集成RankBrain(据认为是第三重要信号)是一个巨大的变化。 我认为Google不会这么做,除非它真的相信自己会有所帮助。

RankBrain何时开始?

Google告诉我们,2015年初将逐步推出RankBrain,并且几个月前它已经全面投入使用并在全球范围内推广。

哪些查询会受到影响?

2015年10月,Google告诉彭博社,通常从未见过的15%查询中的“很大一部分”是由RankBrain处理的。 简而言之,等于或小于15%。

2016年6月,有消息传出,Google处理的每个查询都使用了RankBrain。 请参阅我们的故事:

  • Google每次搜索都会使用RankBrain,从而影响其中“很多”的排名

RankBrain一直在学习吗?

Google告诉我们,RankBrain所做的所有学习都是离线的。 它提供了成批的历史搜索,并可以据此做出预测。

这些预测已经过测试,如果被证明是正确的,则最新版本的RankBrain上线。 然后重复学习-离线-测试周期。

RankBrain的作用不仅限于查询优化吗?

通常,查询的优化方式(无论是通过词干,同义词还是现在通过RankBrain进行)都未被认为是排名因素或信号。

信号通常是与内容相关的因素,例如页面上的单词,指向页面的链接,页面是否在安全服务器上等等。 它们还可以绑定到用户,例如搜索者所在的位置或其搜索和浏览历史记录。

因此,当Google将RankBrain列为第三重要信号时,这真的意味着排名信号吗? 是。 Google向我们再次确认,RankBrain可以直接以某种方式对网页的排名做出贡献。

到底如何是否有某种类型的“ RankBrain得分”可以评估质量? 也许吧,但RankBrain似乎更有可能以某种方式帮助Google根据网页包含的内容对网页进行分类。 RankBrain可能比Google现有系统更好地总结页面的含义。

或不。 Google除了参与排名之外没有说其他任何话。

我如何了解有关RankBrain的更多信息?

Google告诉我们想要学习单词“向量”的人-单词和短语在数学上的连接方式-应该查看此博客文章,其中讨论了系统(该文章中未命名为RankBrain)如何学习只需浏览新闻文章即可了解国家首都的概念:

image00

这里有一篇更长的研究论文。 您甚至可以使用Google的word2vec工具来玩自己的机器学习项目。 此外,Google和Microsoft一样,在整个领域都拥有AI和机器学习论文。

另外,请务必参阅Google解释的文章“机器学习的工作原理”。

注意:此故事自最初于2015年10月发布以来已进行了修订,以反映最新信息。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/9671.html