1. 您的位置:首页 > 站群资讯 >内容

Bing看着排名分析的短语

当涉及语义分析以及搜索引擎如何处理文本时,最后一直抛出了很多理论。从我们的长期过去在LSI Snake-Oil中,到最近的LDA惨败,似乎SEO试图让他们周围的集体头。

在5月份,在SEJ上,(噢,看!我是抒情的)我正在讨论这篇文章(语义分析);了解语义搜索和SEO。重要的是要记住,搜索引擎可能会分析您的内容有很多方法。

今天我们要看另一个。

专利

2009年3月24日使用短语定义和容器的文本分析 - 2010年9月30日获奖

发明者; umesh madan.

我们越来越早日遇到的更有趣的事情之一,提到了一些事情;

使用系统进行查询和文档分析

使用同义词(库)在其他方法中不那么常见。

用于检测/处理拼写错误

分类特征提取对象(例如“Joe是律师”)

利用“和'和'或'相关分类器的组合

在这种申请中,他们的大部分方法似乎都相对于我们过去所见的看法看起来像基于短语的IR(站群)。上面提到的一些点,似乎有点不同。他们似乎在各种目的上建议使用这一点,包括搜索文件匹配,lemmatization(相同词的变体),拼写检查/校正和相关文本分析。

他们真的似乎没有区别为输入类型,他们称之为“

输入流

'。这意味着使用(为了我们的目的)系统来分析索引中的文档和输入的查询以查找信息。我发现这种有趣的时间是大量的语义分析,特别是基于短语的方法,往往更专注于事物的索引/排名方面。

分类条款

分类器词典可以包括特定的短语是同义词的纪念和单词/短语。它们还可用于模式匹配;

这可以用于标记概念,在此示例中,

'医疗条件

' 和 '

药物治疗

'。这是一种有趣的方法,并且乍一看,似乎从事事物的处理方面可能有点问题。与站群方法不同,这一个将基于现有分类具有更多的禁用方法,而不是来自给定培训集的分析方法。

继续描述3个地区;

短语**相关术语/概念

地图集 - 拼写错误

等效 - 常见的拼写变化

为什么我不断充分感受这是一个捕获 - 所有人都不仅是搜索,而且还有文字处理器?玛哈。只是偏执狂。

和/或连接

还讨论使用定义为的“容器”;

“和”容器寻求找到两个(或更多)相关概念

“或”容器查找一个或多个实例。

“所有”容器匹配所有短语(从输入)更多查询分析共同

“列表”容器更多的是扩展'或',但会搜索完整的输入,而不仅仅是在第一次出现时停止。

重复“容器会改进或扩展其他容器。适用于短语的多个实例(更多内容分析)

“开关”容器可以符合其他容器的语义等同物。

“通配符”容器可用于对所需短语之间的单词进行分类。 IE; “疾病名称”“野卡术语”“药物名称” - 没有WC,比赛将失败。

他们还讨论为诸如的元素创建自定义容器;

或者

这一切都很划分,这是肯定的。没有很多关于''

词典

'正在创建或涉及任何培训文件。除了在谈论之外,我不得不说

短语

与站群的相比,这种方法几乎没有共同之处。

Bing堆叠如何?

正如我已经注意到的那样,它不确定分析的数据集是存在的衍生的。他们确实提到“字典”,但这似乎暗示了自己,而不是传统的。这是真正的肉是imo,因为它是这种方法的生活和死亡的地方。包括其他一些缺失的碎片;

没有提到用户反馈

没有提到(帖子)查询分析

一个评分/排名过程将全部拉到一起

据说,鉴于我不得不仔细考虑的时间,我喜欢这个'容器'的建议系统,如果只有它在最终产品中没有膨胀和过程敌对。分析方法最肯定是一个有趣的方法。

我们也可以看到他们有时会这样做,并不只会将单词混合到方法中。给出的深圳seo优化一些例子似乎是从流中的郴州seo单独词汇中汇集'短语'。最终,评分来自系统正确分析查询,然后使用容器模型寻找定义的术语。

当我说没有评分系统时,我的意思超出了明显的。是的,这个w找到'

最好的比赛

',但没有真正的

领带破碎机

如果你愿意。这个分数显然只会被添加到其他得分机制(链接,元数据,地理数据,上下文等。但嘿,也许这就是让它永远被臃肿的东西。

站群更好

什么是“相关的短语”?不要竖起har方法,但是使用该系统了解更多相关短语给特定的概念,似乎是这种受过良好教育的啤酒骑师的逻辑方法。在过去的微软中,奇怪的是,足够潜在的语义论文/专利而不是♥做过。我们想知道这个产品的最终目的地。

它似乎没有定制,以便找到概念和含义,就像纯粹的短语匹配一样。那是一件坏事?一点都不。我们绝不能在真空中看待这些,微软在最近有一些关于语义分析的专利;

我们只能为此采取这一点。如何集成部件是如何实现最终结果。可能是下次,我们将通过SERP分析来了解它们如何通过语义分析来处理相关性。这将是一个有趣的骑行。

最终分析

在一天结束时,我留下了想法,如果方法的一些主要差异(从站群到微软/冰)与两种发动机产生的结果有关。如上所述,我并没有真正研究他们如何掌握相关信号的研究,而是从多年来读过的东西,他们似乎在语义分析中采取不同的路线,这是肯定的。

如果您严重针对Bing和Extension Yahoo,(值得考虑),我会尝试解决一个满足两种方法的程序。实际上,站群的似乎更复杂。 Bing幸福的方法似乎是确保核心概念清晰,早期在内容/页面上,并强烈地针对“正确”的用户方法,与KW研究一致。

这只是胆量**。我真的Y必须找到一些时间将更多的文件覆盖才能获得更清晰的图片。有人关心吗?如果是这样,请在评论中进行声音。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/changjianwenti/1067.html