1. 您的位置:首页 > seo技术 >内容

适用于JavaScript的网站的SEO(Google IO 18摘要)«SEOPressor – WordPress SEO插件

适用于JavaScript的网站的SEO(Google IO 18摘要)

您可能听说过,在最近的Google I / O 18中,Google对SEO有所了解。

Google的Tom Greenaway和John Muller进行了一场关于使您的现代JavaScript驱动的网站搜索友好的会议

他们实际上列出了一些推荐的最佳做法,有用的工具以及Google的政策变更。

这是东西:

通过与Google完全不同的方式,二人组也阐明了javascript网站的实际爬网和索引过程是如何工作的。

看看这个视频:

但是,如果您不想花40分钟观看录音。

请稍等,这里简要介绍了会议的重点。

主持人简要背景介绍...

Tom Greenaway是来自澳大利亚的高级开发人员拥护者。 约翰·穆勒John Mueller ,又名johnmu,敲钟?)是Google的网站管理员趋势分析师,来自瑞士苏黎世。

如何对JavaScript驱动的网站进行爬网,渲染和索引工作?

汤姆通过分享一些搜索引擎背景开始了这次演讲。

这是交易

搜索引擎的目的是提供一个相关列表来回答用户的查询。 编译网页库,从中提取答案。

该库是索引。

建立索引始于可抓取的URL

现在,爬网程序旨在查找要爬网的内容。

但是,为此,必须通过URL检索内容。 搜寻器到达URL时,它将通过HTML进行浏览以为页面编制索引以及查找要搜寻的新链接。

搜索的工作方式

这是有关Google搜索工作原理的图表。

那么,如何确保Googlebot可以访问您的内容?

这是您需要知道的,Tom分享了六个步骤以确保您的网页将被索引。

    1.确保您的网址可抓取

    –在您网站的顶级域中设置robots.txt。 Robots.txt可让Googlebot知道要抓取哪些URL和忽略哪些URL。

    2.利用规范标签

    –如果是内容联合组织,则在不同站点上分发内容以最大程度地展示内容。 源文档应标记为规范文档。

    3.确保网址干净且唯一

    –不要在URL上列出会话信息。

    4.向Googlebot提供站点地图

    –通过这种方式,搜寻器便具有要爬行的URL列表,并且您知道自己的网站已被正确爬行,因此您晚上可以睡得更好。

    5.使用历史记录API

    –它替换了hashbang标记(#!),如果使用该标记将不再被索引。

    6.确保您的链接具有带有HREF属性的锚标记

    – Googlebot仅识别具有锚标记和HREF属性的链接,否则,将不会对其进行爬网,因此不会对其进行索引。

更重要的是

汤姆(Tom)表示,在尝试抓取和索引使用Javascript构建的网站时,Google遇到了一系列问题。

这是javascript网站索引中最常见的问题列表

确保对其有一个很好的了解,不要重复这些相同的错误。

    1.服务器发送的HTML内容不存在…

    –导致Googlebot认为没有要索引的内容。

    2.延迟加载图像有时仅可索引

    –确保正确索引它们,使用noscript标记或结构化数据。
    –请注意,仅通过CSS引用的图像不会被索引。

    3.任何通过交互触发的内容都不会被索引

    -Googlebot不是交互式机器人,这意味着他不会绕过您网站上的标签。 通过预先加载内容或通过CSS切换可见性来确保漫游器可以处理所有东西。
    –更好的是,只需使用单独的URL即可将用户和Googlebot分别导航到这些页面。

    4.渲染超时

    –通过限制嵌入式资源的数量来确保页面高效且高效,并避免人为的延迟,例如时间插页式广告。

    5.不支持存储本地信息的API。

    –相反,发生的是Googlebot以无状态方式抓取并呈现您的页面。

现在,由于JavaScript的使用越来越广泛,因此在爬网和索引编制之间又增加了一步。 那就是渲染。

渲染是HTML本身的构造。

如前所述,搜寻器需要在HTML中进行筛选以对页面进行索引。 需要对基于JavaScript的网站进行渲染,然后才能对其建立索引。

据汤姆和约翰说,Googlebot已经在渲染您的JavaScript网站。

我们可以从JavaScript网站的呈现过程和索引过程中获得以下收益。

    1. Googlebot使用Chrome 41浏览器进行渲染

    -Chrome 41始于2015年,不支持在Chrome 41之后添加的任何API。

    2.推迟在搜索中显示JavaScript网站

    –呈现网页是一个资源密集的过程,因此呈现可能会延迟几天,直到Google拥有免费资源为止。

    3.两阶段索引

    –首次索引发生在渲染过程完成之前。 最终渲染到达后,将进行第二次索引编制。
    –第二个索引不会检查规范标记,因此最初呈现的版本需要包含规范链接,否则Googlebot会完全忽略它。
    –由于两阶段索引的性质,网页的可索引性,元数据,规范标记和HTTP代码可能会受到影响。

John Mueller接过指挥棒,并与我们分享了一些有关渲染的基本信息。

重要的是,他与众人分享了这是Google首选的渲染方法。

客户端,服务器端,混合和动态渲染。

    1.客户端渲染
    –这是一种传统状态,在用户浏览器或搜索引擎上进行渲染。

    2.服务器端渲染
    –您的服务器处理渲染,并像静态HTML一样为用户和搜索引擎服务。

    3.混合渲染(​​长期推荐)
    –将预渲染的HTML发送给用户和搜索引擎。 然后,服务器在此之上添加JavaScript。 对于搜索引擎,他们将仅选择预渲染的HTML内容。

    4.动态渲染(政策更改和Google的首选方式)
    –当搜索引擎获取服务器端渲染的内容时,此方法将客户端渲染的内容发送给用户。
    –这以您的站点动态检测其是否为搜索引擎搜寻器请求的方式工作。
    –需要相应地提供针对设备的内容(桌面爬网程序的桌面版本和移动爬网程序的移动版本)。

混合渲染

混合渲染如何工作。

现在,Google公开采用了(NEW)动态渲染方法来帮助您的网站进行爬网,渲染和索引。 John还提供了一些有关如何实现动态渲染的建议。

实现动态渲染的方法

    1.木偶
    – Node.js库,它使用无头版本的Google Chrome浏览器,可让您在自己的服务器上呈现页面。

    2. Rendertron
    –可以作为将内容呈现和缓存在您身边的软件或服务运行。

这两个都是开源项目,其中自定义功能丰富。

John还建议渲染需要大量资源,因此请从常规Web服务器上带外进行渲染,并在需要时实施缓存。

动态渲染的最重要的要点是,

它具有从普通用户请求中识别搜索引擎请求的能力。

但是您如何识别Googlebot请求?

  • 第一种方法是在用户代理字符串中找到Googlebot。
  • 第二种方法是进行反向DNS查找
  • John在会议期间强调,实现建议的呈现方法不是索引的必要条件。

    它的作用是让Googlebot简化过程的抓取和编制索引过程。

    考虑到运行服务器端渲染所需的资源,您可能需要在实施之前考虑费用。

    那么什么时候需要动态渲染呢?

    这是什么

    当您拥有大型且不断更新的网站(例如新闻门户)时,因为您希望快速正确地建立索引。

    或者,当您依赖Chrome 41不支持的许多现代JavaScript功能时,这意味着Googlebot无**确呈现它们。

    最后,如果您的网站依赖于需要访问页面内容的社交媒体或聊天应用程序

    现在,让我们来看看,当你不需要使用动态渲染。

    答案很简单,

    如果Googlebot可以正确索引您的网页,则您无需执行任何操作。

    那么,您怎么知道Googlebot是否做得正确呢?

    您可以采用渐进式检查。

    请记住,您不需要在每个网页上都运行测试。 从模板中测试每个可能两个,以确保它们工作正常。

    所以这是检查您的页面是否被索引的方法

      1.验证所有权后,在Google Search Console上以Google的身份获取,这将向您显示HTTP响应,然后Googlebot接收任何呈现。

      2.运行Google移动友好测试

      为什么?

      由于Google推出了移动优先索引技术,因此移动页面将成为索引的主要焦点。 如果页面在测试中呈现良好,则意味着Googlebot可以呈现您的页面以供搜索

      3.注意移动友好测试中的新功能。 它会向您显示Googlebot渲染的版本以及有关着陆问题的完整信息,以防无**确渲染。

      4.当页面在浏览器中失败时,您始终可以检查开发者控制台。 在开发者控制台中,您可以在Googlebot尝试呈现某些内容时访问控制台日志。 这使您可以检查一堆问题。

      5.所有诊断程序也可以在桌面版本站点的丰富结果测试中运行。

    在会议结束时,John还提到了将要发生的一些变化。

    第一个喜讯,

    Google将使渲染更接近于爬网和索引编制

    我们可以放心地假设这将意味着第二次索引将比以前快得多。

    第二个喜讯,

    Google将使Googlebot使用更现代的Chrome版本。 这意味着对API的广泛支持。

    他们确实明确指出,至少到今年年底,这些变化才会发生。

    为了使事情变得简单,这里有四个步骤来确保您的JavaScript网站具有搜索友好性。

    至此,会议结束。 请检查我们的幻灯片以快速刷新。

    总而言之,Google正在使用麦克风,并告诉您他们到底想要什么。

    最好注意一下。

    Jia Thong Lo交付搜索友好的Java脚本支持的网站(Google io 18摘要)

    本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/11308.html