1. 您的位置:首页 > seo技术 >内容

在重大更改之前可视化您的网站结构

在进行重大更改之前可视化站点结构

在上一篇文章中,我们研究了一些有趣的方法来可视化您的网站结构,以阐明外部链接和PageRank如何流经它。 这次,我们将使用相同的工具,但我们将主要研究站点结构的重大变化可能对您的站点产生的影响。

搜索引擎爬网程序可以部分根据内部链接的结构和组织方式来确定网站上哪些页面最重要。 具有许多内部链接指向它们的页面(包括网站导航中的链接)通常被认为是您最重要的页面。 尽管这些页面不一定总是您排名最高的页面,但较高的内部PageRank通常与更好的搜索引擎可见性相关。

注意:我使用保罗·夏皮罗(Paul Shapiro)创造的短语“内部PageRank”来指代单个网站中基于该网站内部链接结构的每个页面的相对重要性。 该术语可以与“页面权重”互换使用。

我将在下面概述的技术可用于考虑如何通过添加新的部分,对全局站点导航进行重大更改(如下所述)以及对站点结构或内部链接进行的大多数重大更改来影响内部PageRank。

了解网站的任何重大更改可能如何影响其搜索可见性,对于确定实施该网站的风险与回报至关重要。 这是我发现在这种情况下最有用的技术之一,因为它提供了可供我们参考的数字,以了解结构调整是否(以及如何)影响页面重量。

在下面的示例中,我们假设您可以访问登台服务器,并且在该服务器上,您将托管具有经过适当调整的站点副本。 在没有这种服务器的情况下,您可以手动编辑电子表格以反映所考虑的更改。 (但是,为了节省时间,可能值得为测试和开发设置辅助托管帐户。)

值得注意的是,在登台服务器上,仅需模拟结构即可,而无需最终设计或内容。 示例:对于正在工作的网站,我考虑过从全局网站导航中的下拉列表中删除一部分链接,并用单个文本链接替换该链接块。 该链接将转到包含下拉菜单中先前链接的页面。

当我在登台服务器上实施此网站结构更改时,我并不担心其中的任何一个看起来不错–我只是创建了一个包含大量文本链接列表的新页面,从导航下拉列表中删除了所有链接,并将下拉列表替换为指向新页面的单个链接。

很显然,我永远不会将它付诸实践-但是我在登台服务器上的更改模仿了正在考虑的站点结构更改,使我能够洞悉内部PageRank分布将发生什么(如下所示)。 我将其留给设计师以使其看起来不错。

对于此过程,我们将需要三个工具:

  1. Screaming Frog-如果您的网站少于500页,或者您只想大致了解更改的含义,则可以使用免费版本。
  2. Gephi —一个免费的,功能强大的数据可视化工具。
  3. 谷歌分析

所以,让我们潜入……

收集资料

我不想多余,所以我将不带您重新阅读如何使用Screaming Frog来爬网和导出站点数据。 如果您错过了最后一部分,它详细解释了此过程,则可以在这里找到。

抓取完成并获得站点数据后,只需按以下步骤导出相关数据即可:

批量导出>响应代码>成功(2xx)链接

您将同时为现场站点和临时站点(结构经过调整的站点)执行此操作。 下载完这两种结构后,您需要为Gephi格式化它们。 Gephi创建可视化所需的全部工作就是对站点页面(“节点”)及其之间的链接(“边缘”)的理解。

注意:在准备数据之前,建议您在暂存CSV文件中执行“查找并替换”,并将暂存服务器域/ IP替换为实际站点的域/ IP。 这将使以后的步骤更易于使用和理解。

由于Gephi不需要Screaming Frog导出中的大量数据,因此,我们想通过执行以下操作从这些CSV文件中删除不需要的内容:

  • 删除包含“成功(2xx)链接”的第一行。
  • 重命名“目标”列为“目标”。
  • 删除“来源”和“目标”之外的所有其他列。 (注意:在删除它之前,您可能希望对“类型”列进行快速排序,并删除所有未标记为“ AHREF”的内容(CSS,JS,IMG等),以避免污染可视化。)
  • 保存编辑的文件。 您可以随意命名。 我倾向于使用domain-live.csvdomain- staging.csv
边和节点电子表格

我们希望拥有的第三组数据是Google Analytics(分析)的有机目标网页的导出。 您可以使用不同的指标,但是当考虑到结构变化对页面权重的影响时,可视化哪些页面最有助于我的自然流量非常有用。 本质上,如果您发现负责大量流量的页面的内部PageRank数量减少了,那么您将想知道这一点并进行相应调整。

要将信息添加到图表中,只需登录Google Analytics(分析),然后在“行为”下方的左侧导航栏中,转到“网站内容”,然后选择“着陆页”。 在页面顶部的细分中,删除“所有用户”,然后将其替换为“自然流量”。 这样会将您的目标网页数据限制为仅自然访问者。

展开数据以包括任意多的行(最多5,000),然后将数据导出到CSV,这将为您提供以下信息:

删除前六行,使标题行以“着陆页”标签开头。 然后,滚动到底部并删除累计的总数(页面下方的最后一行),以及“日索引”和“会话”数据。

请注意,您需要此电子表格中的着陆页URL的格式必须与Screaming Frog CSV文件中的源URL相同。 在上面显示的示例中,“登录页面”列中的URL缺少协议(https)和子域(www),因此我需要使用“查找并替换”来添加此信息。

现在我们准备出发了。

获得当前站点的可视化

第一步是上传您当前的站点页面地图,即让Gephi知道您拥有哪些页面以及它们链接到什么页面。

首先,打开Gephi并转到文件>导入电子表格。 您将选择实时站点Screaming Frog导出(在我的情况下为yoursite-live.csv),并确保将“按表:”下拉列表设置为“边表”。

导入Gephi

在下一个屏幕上,确保已选中“创建缺少的节点”,这将告诉Gephi为您输入的“ Edges table”(读取:链接映射)创建节点(读取:页面)。 现在您已经有了图表。 有用吗?

杰斐

好的,不是真的,但是会的。 下一步是在其中获取该Google Analytics(分析)数据。 因此,让我们前往数据实验室(位于顶部按钮中)并执行此操作。

首先,我们需要导出页面数据。 在数据实验室中时,请确保您正在查看“节点”数据并将其导出。

数据实验室出口

当您打开CSV时,它应包含以下列:

  • ID(包含您的页面网址)
  • 标签
  • 时间设定

您将添加第四列,其中包含要从Google Analytics(分析)提取的数据,本例中为“会话”。 您需要将第二张工作表临时添加到CSV,并将其命名为“ ****ytics”(分析),在此您可以从较早的Analytics(分析)导出中**数据(实际上只是将其移至此工作簿中)。

现在,我们要做的是用分析中的实际会话数据填充“会话”列。 为此,我们需要一个公式,该公式将遍历工作表1中的节点ID,并在工作表2中寻找相应的目标页面URL。 找到它后,应在适当的地方将该页面的自然点击量会话插入“会话”列。

也许我最常用的Excel脚本可以解决这个问题。 在您创建的“会话”列的顶部单元格中,输入以下内容(粗体数字将根据您的分析导出中的数据行数而变化)。

= IFERROR(INDEX(****ytics!$ B $ 2:$ B $ 236 ,MATCH(A2,****ytics!$ A $ 2:$ A $ 236,0 ),1),“ 0”)

完成后,您需要**“会话”列并使用“粘贴值”命令,该命令会将单元格从包含公式的值切换为包含值的值。

现在剩下的就是将新表重新导入到Gephi中。 将电子表格另存为data-laboratory-export.csv之类的文件(如果需要,也可以将其另存为node.csv)。 使用数据实验室中的导入功能,您可以重新导入文件,该文件现在包括会话数据。

现在,让我们从“数据实验室”选项卡切换回“概述”选项卡。 目前,它看上去几乎与以前的相同-但这将改变。 首先,让我们应用一些内部PageRank。 幸运的是,根据最初的Google专利的计算,Gephi内置了PageRank功能。 它不是完美的,但是对于让您了解内部页面权重流的作用非常有用。

为此,只需单击右侧面板中“ PageRank”旁边的“运行”按钮。 您可以保留所有默认设置。

Gephi中的PageRank

接下来要做的是根据会话数对节点(代表您的站点页面)进行颜色编码,并根据其PageRank调整其大小。 为此,只需在左上方“外观”窗格下为节点选择调色板。 从下拉列表中选择会话,然后选择所需的调色板。 选择设置后,点击“应用”。

在Gephi中套用色彩

接下来,我们将对PageRank进行相同的操作,除了我们将调整大小而不是颜色。 选择上浆工具,从下拉菜单中选择PageRank,然后选择最大和最小尺寸(这是基于页面重量的相对上浆)。 我通常分别从10和30开始,但是您可能想和他们一起玩。 选择所需的设置后,请点击“应用”。

通过Gephi中的PageRank调整节点大小

可视化的最后一步是在左下方的面板中选择一个布局。 为此,我喜欢“ Force Atlas”,但可以尝试一下。 这给了我们一张看起来像下面的图片:

来自Gephi的实时现场图像。

您可以轻松地参考哪些页面没有有机流量,哪些页面基于它们的颜色最多—通过右键单击它们,您可以直接在数据实验室中查看它们以获取其内部PageRank。 (在这种情况下,我们可以了解到访问量最高的页面之一是具有0.016629的PageRank的产品页面。)我们还可以看到访问量最大的页面如何趋向于集中到中心,这意味着它们在内部紧密地链接在一起网站。

现在,让我们看看新结构会发生什么。 您将要执行上述相同的步骤,但是要从登台服务器(在我的例子中是domain-staging.csv )中导出Screaming Frog。 我不会让您阅读所有相同的步骤,但是最终结果如下所示:

Gephi中暂存站点的可视化表示

我们可以看到,此版本中存在许多异常值(页面的内部链接通常已明显减少)。 我们可以通过右键单击页面并在数据实验室中查看它们来调查哪些页面,这将有助于我们找到可能的意外问题。

我们也有机会看到上面提到的高流量产品页面发生了什么。 在这种情况下,在新结构下,其内部PageRank更改为0.02171-换句话说,它变得更强大了。

导致内部PageRank增加的原因有两点:页面链接数量的增加,或其他页面链接数量的减少。

从本质上讲,页面可以被视为具有其页面等级的100%。 尽管考虑了诸如Google减少每个链接的PageRank或按页面上位置的权重之类的考虑因素,但PageRank通过链接流到其他页面,并且“链接汁”在链接之间分配。 因此,如果页面上有10个链接,则每个链接将获得10%。 如果将链接总数减少到五个,则每个链接将获得20%。

同样,这是一个相当简化的解释,但是这些增加(或减少)是我们要衡量的,以了解提议的网站结构更改将如何影响我们最有价值的有机页面的内部PageRank。

在数据实验室中,我们还可以按页面排名对其页面进行排序并比较结果(或者只是看看我们当前的结构如何工作)。

Gephi数据实验室中的PageRank。

和…

这只是冰山一角。 在导入的基于页面的数据中,我们可以用自然会话来代替排名(或者发疯并包括两者)。 有了这些数据,我们就可以判断在站点结构转换中对排名(或即将出现)的页面进行排名的PageRank会发生什么。 还是像上一篇文章中所述,如何考虑传入链接权重,以了解其传递受到的影响?

尽管没有任何工具或技术可以100%保证结构变更将始终如期进行,但此技术可帮助解决许多意外问题。 (请记住:请注意那些异常值!)

通过隔离提议的站点结构而增加页面权重的页面,此练习还可以帮助发现意外的机会。 您可能希望在网站结构更改上线之前(重新)优化这些页面,以便提高他们获得排名提升的机会。


本文中表达的观点是来宾作者的观点,不一定是Search Engine Land。 工作人员作者在此处列出。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/9950.html