「网站程序」URL规范化seo基础
URL规范化)它实际上是标准化URL的过程,即将URL转换为符合规范的等效URL(例如,转换http://www.cnblogs.com/shuchaotohttp://www.cnblogs.com/shuchao/)。可以确定这两个URL是等效的。
搜索引擎使用URL规范化来减少页面的重复索引,同时还减少爬行者的重复爬行。浏览器还需要使用URL规范化来识别用户是否访问了URL。
- 1 URL组成
- 2非标准URL
- 3. url标准化流程
- 4 Seo URL标准化
协议://主机名[:Port]/路径/[;参数][?Query]#Fragment
Protocol://host name[:Port]/path/[:parameter][?查询]#Fragment
1. URL
1.1中的其他字符子域名称的URL包含"www":"http://74>www。Shuchao.cnblogs.com/"
1.2包含默认端口:"http://www.cnblogs.com:80/Shuchao/"
1.3松散URL:"http://www.chapters.indigo.ca/books/亚马逊吸吮驴胆汁/9780470170779-Item。Html"
超过1.4剩余文件名index.html,默认。aspx等:"http://www.cnblogs.com/shuchao/blogs Index.html"
1.5文件路径
(1)冗余"/":"http://www.cnblogs.com/shuchao/blogs/"
(2)超顶点修饰符字符串:"x/y/z/Http://www.cnblogs.com/A/B/Http://www.cnblogs.com// Page.html"
1.6冗余查询字符串
(1)?(空查询字符串):http://www.cnblogs.com/shuchao ?
(2)&
(3)无用的查询变量:http://www.example.com/display?Id=123&假=假
2。URL缺少字符串。
2.1缺少"/":"http://www.cnblogs.com/shuchao"
2.2查询字符串缺少名称或值:"http://www.example.com/display?Id="或"http://www.example.com/display?= 123"
3. 其他非标准URL
3.1"http://shuchao.cnblogs.com/"和"http://www.cnblogs.com/shuchao/"实际上是相同的内容
3.2使用IP地址而不是域名
3.3包含扩展字符,区分大小写("http://www.google网站程序.cn/Intl/zh cn/about.html"和"http://www.google.cn/intl/zh-cn/about.html")
混合3.4"+"和"%20"
3.5查询变量顺序障碍:"http://www.example.com/test.aspx?Bar=1&A=test"
3.6包含临时状态变量:http://www.example.com/test?返回=/上一页。aspx
1. 小写URL协议名称和主机名
Http://www.example.com/test->http网站程序://www.example.com/test
2. 逃逸序列被转换为大写,因为逃逸序列的大小是敏感的。
%3A->%3A
3。删除片段seo学习论坛(#)
Http://www.example.com/test/index.html#seo>http://www.example.com/test/index.html
4. 删除'?'
Http://www.example.com/test?->Http://www.example.com/test
5. 删除默认后缀
Http://www.example.com/test/index.html> http://www.example.com/test/
6. 删除不必要的顶点。
Http://www.example.com/./a/B/./c//d.html>http://www.example.com/a/c/d.html
7. 删除不必要的"www"
Http://www.test.example.com/>http://test.example.com/
8. 排序查询变量
Http://www.example.com/test?Id=123&fakefoo=fakebar→http://www.example.com/test?Id=123 \
9。删除默认值的变量。
Http://www.example.com/test?Id=&sort=升序→http://www.example.com/test
10. 删除不必要的查询字符串,例如?,&
Http://www.example.com/test?→ Http://www.example.com/test
11. 粉尘规则(schonfeld等人提出的启发式方法)
Http://www.example.com/test?Id=123-和gt;http://www.example.com/test_123
非标准URL可能会导致网站上出现许多重复的URL。因此,爬行者反复爬行相同的内容,影响网站的有效内容和索引编制。
多个非标准URL导致稀疏PR,最初指向同一页面的PR。结果,路由了多个非标准URL。
也存在用户体验问题。复杂或非标准URL很容易让用户对网站感到不安。
Google管理员添加了URL规范化工具以删除URL中的无用参数。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.botadmin.cn/sylc/1790.html