欢迎来到锦皓工作室
当前位置:首页 > SEO基础

网址规范化优化全面大解析

作者/整理:锦皓工作室 时间: 2015-09-08 浏览:

前言:本篇文章主要讲解的内容为“网址规范化优化”,什么是网址规范化?做SEO的朋友们应该都比较清楚,指的是搜索引擎挑选最合适的URL作为真正(规范化的)网址的过程。

那么,为什么要写这么一篇文章呢?原因为:笔者平时在给客户网站做SEO诊断的 过程中,发现各种各样的关于网址规范化的问题。由此可见,客户对网址规范化这块的知识点了解的非常少,甚至有的站长都不知道这个是什么。所以,为了让更多 站长学习到这块的知识点,笔者写个网址规范化全面大解析。如果各位站长觉得本篇文章对自身有帮助,还请不吝分享给其他站在学习!

一、首先,为什么会出现不规范网址?

如图所示:

http://shyseo.cn

http://www.shyseo.cn

http://www.shyseo.cn/index.html

http://shyseo.cn/index.html

上面这几个URL指的是同一个文件:首页

从技术上来说,这几个URL都是不同的网址,搜索引擎也确实把他当作不同的网址,虽然这些网址返回的都是相同的文件,也就是首页。但从技术上来说: 主机完全可以对这几个网址返回不同的内容。那么,除了图上带与不带www造成的,以及结尾是否带有index.html后缀造成的不规范网址外,其实还有 以下几种原因会造成。例如:

①:网站程序的原因,不少CMS系统经常出现一篇文章可以通过几种不同的URL去访问。

②:URL静态化设置存在错误,同一篇文章中有多个静态化URL可以访问。

http://www.shyseo.cn/16.html

http://www.shyseo.cn/seo/16.html

 

③:URL静态化后,静态和动态URL共存,都有链接,也都可以访问。

④:网站的目录后带与不带斜杠。如图:

下图为不同的网址,但其实是一个页面。

http://www.shyseo.cn

http://www.shyseo.cn/

 

 

⑤:加密网址。如图:

下图的URL同时存在,但都可以访问。

http://www.shyseo.cn/

https://www.shyseo.cn/

 

 

⑥:URL中有端口号。如图:

http://www.shyseo.cn/

http://www.shyseo.cn:80/

 

⑦:跟踪代码。有喜欢做网络推广的人,习惯在URL后面加跟踪代码。

http://www.shyseo.cn/?affid=100

 

二:其次,出现网址不规范会给网站带来什么问题?

网站出现多个不规范网址会给搜索引擎收录和排名带来很多的麻烦,这个已经是毋庸置疑的了。但是,还有不少站长对这个网址不规范不是很重。例如笔者在 给意向客户看网站时,发现不少网站的URL没有做网址规范化。当问他们为什么不做URL规范化?客户回答:什么是网址规范化,怎么做,会写在诊断建议方案 上吗?当场就醉了......还有一部分的SEO诊断客户,诊断的过程中发现网站的URL不规范问题很严重。这里,也希望这些部分站长能够在看完本篇文章 后学习到规范化知识点。我们接着阅读.....

为什么不规范的URL会给搜索引擎和排名带来很多麻烦?为了让站长彻底的明白,我们举个例子,比如:网站首页是固定的且只有一个,但很多站长在链接 回首页的时候所使用的URL并不是唯一的,而是一会连到http://www.shyseo.cn/,一会连到http://www.shyseo.cn/index.html。

一般来说,虽然不会给用户造成什么麻烦,但因为这些网址都是同一个文件,会间接性的给搜索引擎造成困惑,搜索引擎会认为:到底哪一个网址才是真正的 首页?哪一个网址应该被当作首页返回?那么,这里有个重点:如果网站上不同版本的网址同时出现,就会很可能被搜索引擎收录。被收录之后,后果就可想而知 了。而此时,搜索引擎在计算排名的时候必须要找到所谓规范化的网址,也就是搜索引擎认为的最合适的URL版本。

不规范化会造成的问题,笔者简单的来说下:

①: 网站上有多个URL,这样会分散页面权重,不利于排名。

②:搜索引擎判断的规范化网址并不是站长想要的那个网址。如图(站长想要的是不带后缀的,搜索引擎去把带后缀的给收录了):

③:如果网址规范化问题太严重,也可能影响收录。因为:一个权重不是很高的域名,能收录的总页面数和蜘蛛总爬行时间是有限的,而搜索引擎把资源花在收录不规范的网址上,留给独特内容的资源就变得越来越少了。

④:重复页面过多,搜索引擎可能认为有作弊嫌疑。

⑤:对于搜索引擎来说,浪费资源、浪费宽带。

三、最后,如何解决网址规范化的问题

关于如何解决网址规范化问题,可能这个对于站长而言是重点也是核心内容了。那么,可以解决URL规范化问题的方法有很多,比如接下来我们要说的这些:

①:现在企业、个人站长用的程序最多的就是CMS,那么此时你就要确定你使用的这个CMS系统是否只能产生规范化网址,无论是否有静态化,比如DEDE、帝国CMS等。

②:所有内链要保持统一,都指向规范化网址。比如:以带与不带www为例子,确定一个版本为规范化网址后,网站的内部链接都要统一使用这个版本,这 样搜索引擎就会明白哪一个是站长希望的网站规范化网址。而从用户体验的角度去看:用户通常第一选择就是带www的版本为规范化网址。

③:301转向。这个最常用也是最普遍的一个方法,站长可以通过301转向把不规范化URL全部转向到规范化URL。

④:canonical标签。目前也是站长使用比较多的一种了,而且百度也是全面支持这个标签了。

⑤:制作XML地图,地图中全部使用规范化网址,然后提交给搜索引擎。

虽然方法很多,但很多方法都有局限性,比如:有的网站因为技术的缺失或不成熟,导致301无法实现。再比如:很多CMS系统经常无法受自己控制等 等。那么,笔者这里主要针对301和canonical做下具体的说明,因为这两种规范化方式是站长最常用的手段,而且也是百度最认同的。