预测搜索引擎排名信号的值

作者:站群原创• 更新时间：2022-01-29 02:43:08 •阅读:1187

Google最近获得了具有广泛实际应用的专利。该专利涵盖了通过机器学习如何在未知值时预测排名信号值的方法。

鉴于互联网上的内容众多，而且每天都有更多内容出现，因此Google需要找到一种为页面分配价值的方法，即使这些页面尚未经过爬网和建立索引也是如此。如果Google没有抓取页面，该如何对其排名？ Google如何使用没有入站链接的新内容？

该专利中的方法解决了Google算法如何解决和计算未知因素，并使用它们来确定页面的排名。

我们将讨论Google可能使用的实现方式，以及为搜索引擎优化专家（SEO）解决的一些问题。但是在开始之前，我有义务提供我的标准免责声明。

仅仅因为某些东西已获得专利，并不意味着它已被纳入算法中。我们需要权衡我们周围看到的以及有意义的东西使用专利或其部分的概率。如果没有别的，它可以让我们瞥见Google的工作。

考虑到该专利中概述的主题和方法，我想说很可能至少会使用一些迭代，并且有可能随着机器学习系统的发展而扩展。

专利20180157758

让我们从深入研究螺母和螺栓开始。如果您对源感兴趣，可以在这里找到完整的专利，但是我将介绍该专利的申请，它们的含义以及使用方法。

让我们从专利中的图片开始，该图片现在不再有意义，但将有助于作出以下解释：

看一下上图中的项目150和160。这两个因素很重要，这就是我们要讨论的，因为机器学习用于解决SEO多年来一直抱怨的重大搜索问题。

问题

尽管我们将要讨论的系统具有多种应用，但该专利在第0008节中概述了一个核心问题：

搜索系统可以使用针对该资源的搜索引擎排名信号的生成值来更新对资源进行索引的搜索引擎索引，然后生成的值可以被搜索引擎用于对资源进行排名。因此，可以提高搜索引擎索引的完整性，进而可以提高搜索引擎的准确性和效率。

基本上，他们发现了一个重大问题：在没有已知排名信号值的情况下，即使内容最适合特定查询，也无法对内容进行排名。

没有链接时

让我们考虑以下针对新内容链接的简化计算：

链接数（信号a）=未知或不可用
内容与“蓝色小部件”的相关性（信号b）= 9.8 / 10
传递的域名价值/内部PageRank（信号C）= 9.2 / 10

根据计算，我们知道页面的相关性，并且知道域传递给页面的强度。但在不知道链接数或链接的权重的情况下，Google如何正确地对页面进行排名？如果Google不知道一个页面有多少个或哪些类型的入站链接，那么Google如何对其排名？任何将链接计数用作乘数的公式或算法都将归零。

如果信号值未知，则任何计算都将是不正确的，而且Google将无法产生最佳结果。作为SEO，我们有一个类似的问题：没有链接就无法进行排名，即使对于查询而言，即使内容最佳，也很难获得不排名的链接。

该专利中的方法使该算法具有预测值直到被确认的能力。这个预测因素可能是最令人兴奋的方面，因为它有助于快速测试并加速机器学习的更正的部署。

尽管该专利中讨论了多种排列，但其核心在于训练机器学习系统，以在没有排序信号时为排序信号生成可能的值。

两个索引的故事

专利中概述的方法需要两个指标。这些不应与我们每天使用的搜索索引相混淆。尽管其目的是将其应用于一般索引，但在此之前Google将使用两个封闭索引，与一般搜索索引分开。

为了便于说明，我们将它们称为索引A和索引B。

对于索引A，排名信号值是已知的，并用于训练算法以了解其起点。还为该算法提供了页面和反向链接。一旦训练过该算法以了解网页的结构并适应了诸如反向链接之类的相关元素，便会分配一个值，然后将信号值应用于第二个索引。

在索引B中，信号值是算法已知的，但未合并到机器学习系统中。索引B通过学习在何处给出因子的正确权重以及在哪些地方不基于索引A的信息进行训练。

在第二个索引中，事情变得更加有趣，因为该算法还考虑了可能应用于排名信号的其他查询。当索引B中的算法尝试预测单个结果时，它可能总是有点偏离，但是当预测许多结果时，预测变得更加准确。由于存在“众人智慧”现象，因此索引B可以自我更正（这是起作用的机器学习元素），并且可以通过合并其他查询及其所学内容来进行自我更正。

如果索引B中的系统可以确定多个相关查询的信号值，则可以帮助生成初始查询的未知值。

为什么这很重要？

了解搜索引擎的工作原理总是很有价值的，但更直接的是，了解可以使新站点和新资源快速排名的系统也很有价值。

上述的双索引系统具有编码器和解码器。编码器访问网页并创建编码表示。尽管我显然并不确切知道后端的外观，但基于对专利中实体的多次引用，它很可能是页面内实体的映射以及已知关系到索引或索引中其他实体的映射。其他资源。

Google已获得一项专利，该专利使他们可以使用可能的排名信号对新资源（页面）进行排名。这项相同的专利还将促进其他工程师或机器学习系统创建新信号，并允许整个算法对尚未分配值的页面进行排名。

可以根据链接，用户行为指标以及它们可能获得的内容质量为新内容或资源分配值。或基本上，他们找到了预测搜索未来的方法。

但是，更突破性的事实是该系统提供了一种方法，使机器学习系统能够自行生成信号。人们不再需要告诉算法什么是重要的：机器学习教会算法寻找，识别信号并为信号分配值。

如何使用该专利

尽管您几乎无力直接影响机器学习，但您可以通过继续产生大量内容并促进良好链接的发展而间接地有所作为。

查看您网站上的内容，并找出产生流量和链接的内容类型，因为这些是Google可以通过其分析和搜索控制台工具衡量的指标。 IMO，这是机器学习系统将使用的信号。

如果您当前的内容排名不错，可以生成链接，点击和共享，则新内容可能会做同样的事情。

查看您的分析和反向链接，并记下您在做的事情，并以此激发未来的内容和建立链接的努力。相反，请注意发生的问题。就像算法记录成功一样，它也记录失败。如果您网站上的趋势是积极的，则很可能会得到回报;如果趋势是消极的，则可能相反。

而且，如果您没有快速排名，特别是对时间敏感的内容，那么您可能也不会获得需要排名下一个曲目的信号。

本文中表达的观点是来宾作者的观点，不一定是Search Engine Land。 工作人员作者在此处列出。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。如若转载，请注明出处:http://www.botadmin.cn/sylc/10053.html

站酷qq群站群计划站群服务器租用