×

网站 博客

一个标签解决网站内容重复度过高的问题

转载 转载 发表于2015-10-10 22:04:57 浏览3303 评论1

1人参与发表评论

几乎任意一个网站都会遇到这样一个情况,通过多个URL可以打开同一个页面,比如未做301的域名,还有部分网站需要记录来源地址,所以会在URL上加一个后缀,比如你打开so.com的域名的时候,会自动跳转到haosou.com的域名上,但后缀却多了一个?src=so.com的东西,以上情况就导致网站出现多个URL一样可以打开这个页面。大多数网站都有这样的情况。

如果你网站没有出现意外情况,理论上加上这些后缀是没有多大问题的,但是由于外链、内链等方面的原因,推荐加后缀过多后,网站出现的收录可能会是加后缀的网页,另外原创页面也会被判断为加后缀的页面,比如虎嗅网就是一个很好的案例,最新收录的文章页面,URL上基本是带有后缀的。下面我举例虎嗅网的三种URL后缀形式。

http://www.huxiu.com/article/127421/1.html
http://www.huxiu.com/article/127421/1.html?f=wangzhan
http://www.huxiu.com/article/127421/1.html?f=index_top1

上面的三个页面都可以打开(实际虎嗅网不只三种),最终我们决定想让百度收录及排名的页面肯定是没有后缀的,但是搜索引擎并不知道你的想法,所以有可能会将三个页面都收录,也有可能会导致其他页面权重比你预想的页面权重要高,那么问题来了,重复度这么高的页面,我们如何避免?我们只需要一个标签即可解决。

Canonical是被各大搜索引擎(谷歌、雅虎、微软)一起联合推出的一个标签,此标签的主要作用是为了让网页有一个规范化,通过不同URL访问内容得到的一样的问题,因此推出此标签来解决此问题,目前此标签百度也支持,下面是标签的写法。

<link rel="canonical" href="http://ssffx.com/wangluoyingxiao/1209.html"/>

将上面的代码放到你网页的头部即可,首页、栏目页、内容页都需要放置,另外上面的URL更换成你自己的URL,如果是内容页需要结合CMS标签调用本文的URL即可,下面是织梦、ZBLOG、WordPress的写法。

织梦CMS系统中使用canonical标签的方法,编辑article_article.htm模版文件,在head加入以下代码。

<link rel="canonical" href="{dede:field name='arcurl'/}"/>

Zblog系统中使用canonical标签的方法,编辑single模版文件,在head上加入一下代码。

<link rel="canonical"href="<#article/url#>"/>

wordpress中使用canonical的方法是,添加以下代码到你使用主题的 header.php 文件的 head 区域:

<?php if(is_single()){?>
<link rel="canonical" href="<?php echo get_permalink($post->ID);?>" />
<?php } ?>

什么时候应该使用到Canonical标签

1、当一个网页的内容需要两个URL打开的时候,我们就需要用到Canonical标签来规范URL的主体地址,前面说到了,在URL上加后缀可以统计到网站的来路。

2、当然网站后缀被收录或被索引的时候,比如说很多刷链接的,会把你的网站URL刷出他们的链接,这个时候,你的URL中带后缀的即会被收录。

3、当动态页面和静态页面都可以打开网页的时候,需要使用Canonical标签来规范化,比如织梦cms,通常动态和静态都可以打开一篇文章,但大多没有关注!

Canonical标签和301的区别

1、301是有跳转,当用户打开这个页面会跳转到一个新的页面,而Canonical标签则不会出现跳转,用户看不到跳转,而搜索引擎却知道哪个页面更重要!

2、Canonical标签要求必须两个页面或几个页面相同,或主题内容相同,而301则不需要要求,可以直接做301转向。

总结:80%的网页有必要做这个操作,但80%的网页并没有做这个操作!

来源:冯耀宗博客(QQ/微信号:394062665)

评论列表

访客
季节网 季节网2015-10-28 15:34:41 · 回复 小白一枚 没看懂代码