[索引]爬行和实时网络
这是关于幸福指标
一段时间后,我写在这里关于搜索引擎如何发现发现,找到你的页面的行为。我以为我们应该继续看看它们的爬行和索引它们。随着扭曲,我们将讨论优步快速世界的实时。
在最后,我们看到了寻求社交和所谓的实时搜索的鲜明兴趣。实际上,即使在越来越多的速率下筹集网站的努力现在已经是多年的主要原因(记得站群站群刷一次/月?这些天闻所未闻)。为此结束(基础设施)我们可以看看最新努力;***。
许多领域的速度有一个决定的速度需要;
***
pubsubhubub.
社会(探索)
来自任何页面的RSS
页面加载速度(?)
你明白了。在处理时需要考虑的一件事是使能够实现最佳效率的系统。真正的问题在决定是什么而不是我“实时”对人们很重要。
搜索引擎需要关注;
爬行成本
刷新率
查询空间新鲜度要求
变化的价值
内容类型
当然,这是一个有趣的讨论,并且无论我们是否意识到,它都是我们集体未来(作为搜索营销商和人们)的一部分。我们在搜索领域经常看到的一个问题是,我们比主动更具反应性。我们看到了我们周围所有这些演变过程,但很少深入研究。
启动引擎
现在,由于我们已经热身了,让我们快速浏览一下Greg Linden的帖子;重新抓取并保持搜索结果新鲜-尤其是;
因此,搜索引擎人员不仅需要考虑“
如果
' 和 '
什么时候
’它已经被抓取/编入索引,但是它们在何处以及如何返回,重新抓取等……(尤其是在繁重的普遍情况下)。但是,同时爬网Web的所有页面效率低下且成本高昂。
在实时甚至常规索引的情况下,更新频率谦虚将是一个巨大的考虑因素。活跃的网站往往具有较高的爬网率。这意味着,如果我们想充分利用新的Speeder搜索引擎,就应该制定强有力的内容策略。
实时网络非常重视可发现性和索引编制。如前所述,这意味着在您的工作中采用更多的推送技术可能是一个好主意。搜索引擎(例如站群)关注的方面包括:
触发事件–这将是诸如热点新闻,查询分析之类的元素,这些元素会触发实际事件以建立索引/显示结果。
质量信号–建立社交(信任域等,一个单轨)链接的信任/和谐等级类型的概念
更新频率–显然,一致性会影响访问页面的频率(并希望对其进行索引)。
显然,搜索引擎不仅必须找到更好的信号来做出能够产生有价值结果的决策,而且还必须找到寻找创建包容性/界面的方法,以更好地吸引用户。
实时搜索的未来
这一切似乎都表明我们还不存在。但是索引,让我们继续前进,看看它的去向。
我们需要考虑的下一个考虑因素是所提供信息的有效性。这里显而易见的元素将是更流畅的数据点。站群r说的是他们所说的“
幸福指标
’。这些是用户指标,例如查询分析,点击数据和其他形式的隐含用户反馈。
但是问题仍然存在,RTS结果有多少价值?在One Up Web所做的一项最新研究中,他们发现了:
73%的人参与这项研究之前从未听说过实时结果
仅有四分之一的消费者关心实时结果,而信息搜寻者则占47%
大多数受访者对实时结果无动于衷
但是,我们也知道,消费者的选择是有影响的由他们的社会图造成。但有趣的是,这是在实时结果的社会成果中最不兴趣的消费者。
消费者倾向于忽略实时结果,因为他们发现它们“分散注意力”或“恼人”,而信息逼失者在搜索期间更有可能与恒定的更新进行偶然。
想到的一件事是为社会世界寻找某种普及措施。或者,用个性化将其带到更粒度水平。它认为,令人思想的用户会产生更多可用的结果。此时,实时和社交搜索领域是分开的。我必须相信某种类型的混合动力车,包括个性化方面,是RTS的未来。
至少(将用户反馈信号与社交图组合)到某种程度。
抓住和抓住
如果它是为了实时搜索,新闻或只是较快的常规索引搜索,速度是值得注意的概念用于SEO。
如果您曾经在QDF上玩过“抓握”(查询值得新鲜),那么您就会熟悉力度概念。如果还没有,那就让我们回顾一下。这种类比来自军事概念,即占有一块土地并持有一块土地。为了达到我们的目的,我们希望立足于暂时的优势,然后保持稳固的基础。
如果您发现排名相对较新的网页排名靠前,但是随着时间的推移却降级了,那么您已经看到了它的作用。
尽管不那么稳定,但从RTS获得最大收益通常是相同的。从SEO到PR窥视和社交媒体部门,您将连续需要所有鸭子索引。考虑到RTS的通量和时间性质,这是非常宝贵的。结合我们对信任信号的了解,这是任何RTS定位组件的自然组成部分。
这是一个充满挑战的世界
因此,作为SEO,我们不仅需要开始考虑推送技术的工作方式,还需要考虑t的(潜在)发展实时搜索的世界。它是所有通用搜索策略的重要组成部分。我们需要与公关和社会窥视保持一致。但是我们现在需要做吗?
不,不是。就目前的化身而言,就通用搜索策略而言,这是我最少的担心。我们最好看新闻,视频和购物等垂直行业。我确实认为这是我们应该注意的事情,因为它有可能在不久的将来成为有价值的细分市场。此外,了解如何充分利用推送技术,在需要速度的现代时代中的联合组织和可见性,只会从长远来看对我们有帮助。
顺便说一句,当我昨晚写这篇文章时试图在站群上实际获得一些RTS结果时,它似乎已经缩小了。实际上需要一些Twitter趋势术语来产生一个。这似乎表明了它在当前SERP领域中的价值。
无论如何,我希望您喜欢这个小冒险,如果您对抓取有疑问,或对实时搜索有任何想法–请在评论中注明。
资源
与往常一样,我为那些希望更深入地研究爬网/索引使用的各种方法的人提供了一些有趣的专利。
谷歌专利
重复内容搜索
搜索引擎系统中查询数据缓存和优化的方法和系统
基于信任度的搜索结果排名
基于多索引的信息检索系统
索引同步的系统和方法
Web搜寻器系统中的重复文档检测
微软专利
使用核心词从文档中提取关键短语
根据关系挖掘信息
在不承诺下载网页的情况下获取网页信息
分类搜索查询流量
雅虎专利
在查询日志中细分搜索主题
使用趋势分析进行搜索查询处理的系统和方法
使用点击数据优化排名功能
刷新缓存结果的系统
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/6157.html