首页 > 编程笔记

网址规范化对SEO的影响

网址规范化(URL Canonicalization)指的是搜索引擎挑选最合适的 URL 作为真正(规范化的)网址的过程。

造成网址不规范的原因

举例来说,下面这几个 URL 一般指的是同一个文件(页面):
但是从技术上来讲,这几个 URL 都是不同的网址,搜索引擎也确实把它们当作不同的网址。虽然在绝大部分情况下这些网址所返回的是相同的文件,也就是网站首页,但是从技术上说,主机完全可以对这几个网址返回不同的内容。

除了上面因为带与不带 www 以及结尾是否带 index.html 文件名造成的不规范网址,网址规范化问题还可能由于以下原因出现:

网址不规范对 SEO 的影响

网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦。比如,网站首页应该是固定的,只有一个,但很多站长在链接回首页时所使用的 URL 并不是唯一的,一会儿连到 http://www.example.com,一会儿连到 http://www.example.com/index.html。

虽然不会给用户造成什么麻烦,因为这些网址其实是同一个文件,但是给搜索引擎造成了困惑,哪一个网址是真正的首页呢?哪一个网址应该被当作首页返回呢?

如果网站上不同版本的网址同时出现,那么两个或更多版本的 URL 都可能被搜索引擎收录,这就会造成复制内容。搜索引擎计算排名时必须找到所谓的规范化网址,也就是搜索引擎认为的最合适的 URL 版本。

网址规范化造成几个问题:

如何解决网址规范化问题

要解决 URL 规范化问题有很多方法,比如:
但这些方法都各有局限:

去除域名后的 index.html

1) Windows 服务器(VPS 或云主机)

使用本地电脑“远程桌面连接”连接到服务器,在服务器桌面找到并打开“Internet信息服务(IIS)管理器”,找到自己的网站,右击“属性→文档”,将 index.html 上移到顶部,如图1所示。

IIS服务器去除域名后的index.html
图1:IIS 服务器去除域名后的 index.html

2) 虚拟主机

登录空间服务商会员中心找到对应的虚拟主机,单击“管理→设置默认首页”或“设置首页”,同样将 index.html 上移到顶部,如图2所示。

虚拟主机去除域名后的index.html
图2:虚拟主机去除域名后的 index.html

所以,虽然有解决方法备选,但截至目前网址规范化一直是困扰站长及搜索引擎的一个问题。据统计,网上有 10%~30% 的 URL 是内容相同但 URL 不一样的不规范化网址。为了万无一失,经常需要综合使用多种方法。

所有教程

优秀文章