1. 您的位置:首页 > seo技术 >内容

情感和谷歌;不仅仅是一种感觉

上周,我们研究了Google如何在搜索和广告中查看和使用社交图形。人们确实是可以开采的不断增长的信号来源。这相当明显。当然,这可以连接的另一个领域是评论,或更具体地说,情感。

搜索引擎如何处理这个问题?事实上,多年来,这一直是他们难以处理的领域之一,但他们仍在继续尝试。我最后一次真正谈到这一点谷歌是在2011年;谷歌如何处理评论和情绪?

然而,本周,有一个有趣的专利奖(对谷歌)再次涉及这一领域,这就是我们今天将要进入的。有关的专利是;

特定领域情绪分类;2011年6月17日提交-授予;2013年1月15日

 

问题似乎是什么?

对于初学者,让我们解决最令人不安的方面;术语交叉。很好地解释了,

“(…)它不考虑特定领域单词表达的情绪。例如,“小”一词通常在描述便携式电子设备时表示积极情绪,但在用于描述餐厅服务部分的大小时可能表示消极情绪。因此,在一个域中为正的单词在另一个域中为负。而且,在一个域中相关的单词可能在另一个域中不相关。例如,“电池寿命”可能是便携式音乐演奏者领域的关键概念,但与餐馆领域无关。不同领域缺乏等价性使得难以在多个领域进行情感分类。

这确实突出了核心问题之一。一种情况下的积极情绪可能不在另一种情况下。为了解决这个问题,他们开始分配一个可以使用的特定领域的情感词典d关于特定性质的文件。

另一个主要问题当然是审查审稿人。但我上次报道了这一点,所以我们今天将继续走在这条轨道上。

现在,在你走得太远之前,他们将“领域”描述为特定的活动领域,关注或功能领域(如餐厅,电子设备,国际商业和电影)。它没有具体指互联网域名

螺母和螺栓

他们定义了各种实体的跟踪情绪,包括;

  • 公司,
  • 产品,
  • 和人。

和情绪;

  • 正面,
  • 否定,
  • 或中立(即情绪无法确定)。

和包含情绪的文件;

  • 网页和/或部分网页
  • 书籍文本
  • 报纸
  • 杂志
  • ****
  • 新闻组帖子
  • 和/或其他电子消息

本身就是一个有趣的**。“****”部分对那里的锡箔人群特别感兴趣。我个人认为他们正在用名单覆盖他们的背面。至少要强调一下,只要你的头部空间超过了单纯的网页。

例如,特定领域语料库中的文档可以包括与餐厅相关的文档,例如从专门讨论餐厅的网站检索的网页部分。同样,语料库中的特定领域文档可以包括从网站检索的网页,这些网页包括与便携式电子设备(例如手机和音乐播放器)相关的评论和/或讨论。相反,独立于域的语料库中的文档可以包括与各种不同域相关联的文档,因此没有单个域占主导地位。此外,域中的文档依赖语料库可以从与任何特定来源无关的来源中提取,例如一般利益杂志或其他期刊。

因此,情绪并不总是仅仅是评论网站。确保他们被考虑过,但不是唯一可以看的地方。当然,我们也可以回到上周的文章,并考虑社交图表如何发挥作用。

 

方法

他们研究了创建特定于域的分类器(同样,域不是网站,而是概念空间)。基本上会有一些情感术语,例如一个关于“搜索引擎优化”的网站。域并不意味着'Searchmetrics谷歌.com’. 你跟随?

因此,像我们这样的网站可能有多个域分类。这对于涵盖多个主题的文档来说是显而易见的(想想新闻纸网站的中心页面)。当然,这将是一个巨大的处理元素,因此对于信息检索中的许多事情,他们在此过程中使用培训文档讨论

人们在哪里找到词典?很难说,但在他们提到的专利中;

在一个实施方案中,与领域无关的情感词典基于词汇数据库,例如可从新泽西州普林斯顿普林斯顿大学获得的WordNet电子词汇数据库。词汇数据库描述了相关单词之间的映射。也就是说,数据库描述了单词之间的同义词,反义和其他类型的关系。”

然后…

“(…)管理员通过查看词汇数据库并手动选择和评分表达高度情感的单词,为领域独立情感词典选择初始术语。管理员最初在一个实施例中选择约360个这样的单词,尽管单词的数量在其他实施例中可以变化。这个初始单词集通过一个自动化过程扩展到包括同义词和反义词在词汇数据库中引用。扩展的单词集构成了与领域无关的情感词典。

有趣的是,它是部分手动和部分自动化的。我想知道谷歌评论者是否通过这种东西开始行动?

他们甚至给出了一些在训练元素中使用站点的示例,例如;

  • 流行产品评论网站
  • 亚马逊
  • CitySearch
  • Cnet

再一次,只是例子……这是在2011年完成的。

这些网站包括文本产品评论,这些评论由评论提交者手动标记,并带有相应的数字或字母分数(例如,5颗星中的4颗星或“B-”等级)。

 

为什么重要?

再次,我将开始回顾我们在社交图表上的最后一篇文章。当然,这种评分方法在电子商务,地方和品牌/权威建设等空间中要注意,但如果他们设法将其与社交图形等其他算法元素对齐,它可以发挥巨大作用。在个性化的范围内也可以在您的搜索可见性中推出。

由于如此多的搜索营销人员警惕最近与他们联系的人,您可能还想知道谁在谈论你以及在什么情况下。我想说,除了为下一次链接构建活动找到目标之外,它还更加重视嗡嗡声监控

当然,所有这些都应该有希望开始将您从链接图近视的深渊中拖回。谷歌发生的事情不仅仅是链接。拥抱社交图表,实体关联,情感,知识图表及其种类。那么也许(你的)搜索引擎优化不会死,它会发展。

 

更多阅读;

  • Google如何处理评论和情绪?
  • 新闻和博客的大规模情感分析(PDF)
  • 负反馈系统的监控算法
  • Google的评论搜索选项和情绪分析
  • Google的Google Places情绪短语片段

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/439.html