1. 您的位置:首页 > seo技术 >内容

[深圳采集站群如何]关于SEO数据分析的简要讨论:如何改进包含的网站

SEO数据分析的距离已经很长一段时间了,最近觉得应该写一些实际的内容点来看看SEO最终如何做。首先明确一些基本要点,包括或不包括网页,有两个因素

你有没有被爬行动物爬行过?

页面质量间隙是否

前一篇文章提到了这样一个索引的速度,很多网站都懒惰地做这个指标,"我看看网站数据不在线!",实际上,没有这样的指标,很多工作都无法开始。从数据中识别问题,使用数据指导解决方案,并分析数据验证工作结果。最近阅读了"简单数据分析,"本书感觉良好,数据分析方法非常生动,表明从事数据分析的感兴趣的学生可以买一看。任何数据分析都由四个要素组成,->****ysis->evaluation->decision。

目标:我们希望了解该网站是如何包含的,在搜索引擎优化方面是否有改进的机会。

分析:包含什么是好的什么是坏的,没有通过一些指标来衡量?该网站不是太一般的收集,应该细分为收集情况的各个页面?

评估:所以我们需要下面的一些数据

网站的页面级关系

页面的每个级别都可以使SEO流量

如何收集每个级别页面

可以从Google Analytics中过滤掉SEO流量的比例。

可以从数据库,机车或自我mad获取页数e小脚本爬行统计。

收集率可以通过搜索工具从页面获得,机车也可以。

Ads-Zero工具的这一面:http://www.gnbase.com/forum.php?mod=viewthread&tid=11468&highlight=%CA%D5%C2%BC%B2%E9%D1%Af

问题立即突出!

1+2级目录页面带来了很多流量,费率不是很好,优化了包含在违规行为中的升级流程!

包含的产品页数不是很理想,但有限的流程除了包含问题以及页面内容外,本文首先忽略它。

决定:我们的结论是立即启动要包含在优化中的目录页面的操作。

看到这一面,似乎是目标的开始:"通过优化增加流量的**"

演变为一个新目标:"如何增加目录页面的数量"

这一面可以再次通过数据分析方法来搜索它?

答案是肯定的!

我们'再次去。目标->分析->评估过程->决策

目标:增加包含的目录页数

分析:本文开头包含两个因素,我们需要检查Web爬行器是否爬行,页面质量是否不清晰。

1. 对于爬行动物,我们需要分析日志以确定。所以我们从日志中拆分一系列数据,看看页面是否真的在爬行。

2. 由于页面质量似乎很难衡量,我们可以使用相同的模板:

爬行/爬行并包括

的页数

评估模板页面质量的影响大小。如果包括爬行页面,则至少显示该页面搜索引擎的内容也被识别。(实际情况比这复杂得多,可能会在问题质量被删除后包含在内,但总是比任何参考都不好,对

评估:(敏感信息替换为数字,所有真实数据)

首先看看crawler日志,通过shell脚本,我们可以进行分析。

目录总数已经爬行了大约13000倍

非重复目录爬行数约为5500倍

通道A下的目录几乎100%爬行至少1次,通道B's目录爬行很好,70%至少捕获一次。

其余渠道下不到30%的重庆城市站群怎么样目录爬行

不认为这个结果是惊人的,事实上,只要你保持数据细分,细分然后细分,很多网站都会面临这样一个坏问题,总是会观察到一些线索。

在日志分析中,不要忽视任何日志分析软件,这是为了懒惰的人使用,自制的脚本+excel是国王,你可以分割任何你想要的数据的显示,当然,甚至可以excel不要。

然后,我们反对最常捕获的频道A和频道B,目录页面收集率

频道A和B非常令人放心,页面的质量没有问题,但其他情况的包含使人们更加担心。

决定:通过上述数据评估,我们得出以下结论。

页面质量不是包含的因素。

频道的a,b异常高,通过调查了解,原本是主页上的目录页面,显示屏上充满了频道a目录页面,主页也是整个车站重量最大的。通道B的外部链比其他通道更强,并且重量非常高。

除a,B通道外,爬行情况的其他通道也不乐观,爬行入口太少,太深,进而影响情况的包含。

显然,从台站的角度来看,现在频道A太强大了,必须做一些"maxi"移动以减少频道A的数量,并传输到其他频道。同时,爬行器需要提供更多访问爬行通道页面的权限。

现在问题变得清楚了,我们开始将工作分为两部分:1。提供更多入口2。跨渠道而不是几个渠道划分资源。

提供入学作品:

1. 将目录页面的URL放入sitemap。提交给搜索引擎,并将其设置为相对较高的爬行重量。

2. 改进母乳导航,使母乳更详细的导航,以提供更多访问权限

3深圳采集站群如何. 其他产品中推荐的目录页面

资源共享:(一些概念:任何页面都可能成为爬行者门户,百度爬行者爬行深度有限,页面相对于浅滩的入口,被爬行的可能性更高。)

1. 最初的主页是通道a+产品页面的目录页面,其全部内容如下,以确保从第一页进入爬行器,所有爬行器都爬到通道页面,通过通道页面,然后进入目录页面(事实上,这并不太重要)

2. 原始通道页面指向自己的产品页面,没有跟随它(确保通道页面条目中的爬行器,最大爬行目录页面)

3. 将目录页面中的链接返回主页,其全部内容。

4. 减少页面上一些不相关的链接。(在什么情况下这样做非常有效。)

现在开始's时间。

结果

这样做有什么效果,让's在修改1个月后看看数据。

目录页面费率提高了100%!

产品页面收集率也有一定程度的提高,这是由于目录页面可以很好地展示产品。

目录页面的SEO性能:

搜索引擎优化流量占15%

访问的关键字数量增加了10%(包含在新页面中)

搜索引擎优化流量增长超过50%。(包括一些季节性因素)

注意:

1. 除了包含之外,排名也是一个问题,您可以同步注意力。

2. 对于通道a的特殊情况,它甚至可以是全屏显示,但技术实现会稍微麻烦。

3. 百度's支持nofollow据说非常混乱,知道百度内部人士的人可以帮助问。

4. 有问题要留下消息深圳采集站群如何

作者:夜间兴趣http://www.imyexi.com/?p=575欢迎重印,请保留来源



本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/5389.html