相信各位站长在做网站优化时,比如互联网标准和浏览器、正确处理垃圾留言及利用各网站优化工具优化分析。那么,现在如何看待动态网址与静态网址、重复内容处罚等,与此同时,网络上有关“重复的元说明”和“重复的标题标记”的话题突然间增多了起来,开始没太在意,直到一天登 陆google管理员工具后台的时候,在“故障诊断”的“内容分析”栏突然发现几个站出现了“重复的元说明”和“重复的标题标记”的说明,虽然有些说明对 于google来说自己可以通过技术选择性的处理掉,但对于站长来说,让自己的网站更加优化高效的为浏览者服务、为搜索引擎所喜爱,应该是责任所在,这是 习惯使然。 重复的元说明指的是:页面描述标签相同引起重复;重复的标题标记就是各个页面的标题有重复,这类现象对于搜索引擎来说,会引起误解,虽然google曾经 说明可以通过其他相关技术,判断出最适合浏览者的页面反馈至搜索结果,但google还是建议,站长通过一些技术把此重复给处理掉。这里稍稍举两个例子, 一个是discuz论坛,一个是zblog博客程序。 论坛,使用了discuz论坛提供的伪静态规则,服务器也支持rewrite控件,一方面,在列表页面提示重复的元说明和重复的标题标记,主要体现在列表 页翻页时,各页面的元说明和标题标记一样,引起重复;同样一个帖子,在列表页的首页和第二页不同时间出现时,不同尾地址参数,但是同样的标题标记和元说 明,比如这个地址:ht tp://www.xxxxxx.net/thread-64785-1-1.html ,第一个数字64785代表帖子的id,第二个数字1代表这个主题的第一页,第三个数字1代表这个主题在这个版的第一页。但是随着帖子的增加,或者其他帖 子被会员支持起来,这个帖子会跑到第二页,第三页……然后最后这个数字就会不断变化,也就是说Discuz网站的url在不断变化,但该页面的内容几乎是 全部一致的;Discuz虽然设置了如果是蜘蛛抓取,最后一位返回是1,但是还是不能从根本上解决问题。它只解决了搜索引擎直接到你的网站抓取的网页地址是单一的,但是如果别的网站引用你的帖子地址,蜘蛛顺地址爬到站上索引时,还是会出现URL地址重复的问题。 这个问题开始发现后一直没有好的解决方法,伪静态帖子页面与archiver页面重复问题,可以通过robot.txt文件来屏蔽archiver目录来解决,但这个是程序方面问题,一直没有好的解决方案;休息了这些天以后,习惯性的到discuz官方论坛插件区转转,想不到早期这个问题已经有人给出了解决方案:直接修改Discuz控制伪静态地址的函数,最后一个数字始终输出为1,这样可以保证rewrite之后的地址是单一的,但是缺点是这个伪静态的URL地址不能给discuz正确传递参数,所以如果返回版面的时候只能返回到该版的首页而不能返回到该帖所在的当前时间的列表页面,这个也无所谓啦,相对于大部分浏览者来说,看的都是比较新的帖子。 修改方法:修改Rewrite的格式,最后一个数字统一用1代替,解决url变化和重复的问题,适合discuz6.1,其他版本未曾测试。 修改文件include/global.func.php的: function rewrite_thread($tid, $page = 0, $prevpage = 0, $extra = '') { return '<a href="thread-'.$tid.'-'.($page ? $page : 1).'-'.($prevpage && !IS_ROBOT ? $prevpage : 1).'.html"'.stripslashes($extra).'>'; } 复制代码改为: function rewrite_thread($tid, $page = 0, $prevpage = 0, $extra = '') { return '<a href="thread-'.$tid.'-'.($page ? $page : 1).'-'.'1'.'.html"'.stripslashes($extra).'>'; } 这样修改以后,不管帖子ht tp://www.xxxxxx.net/thread-64785-1-1.html 在列表的哪个页面,地址都是一致的,这样搜索引擎就不会误认重复了。 zblog博客站,列表页面,比如重复的标题标记出现在:http://www.laiquliu.com/jixie/和http://www.laiquliu.com/jixie/jixieyuanli10.html,再比如http://www.laiquliu.com/jixie/jixieyuanli11.html和http://www.laiquliu.com/jixie/jixieyuanli21.html,这些页面由于没有描述性标记,因此没有出现“重复的元说明”;这种现象在zblog官方论坛也已经有相应的解决思路,解决方法还是源自zblog的模板文件与标签说明,其实解决起来也是很简单,在catalog.html模板标题中加入页码<#articlelist/page/now#>,这样页面的标题标记就会稍有不同了,就不会引起google索引时重复的标题标记提示了。演示可见本博客。 网站优化说简单也就是那二三事,说复杂却也是涉及到网站的方方面面,利用google管理员工具的指导对网站做出优化设置,不失为站长最快速的优化网站方式,不要觉得你的google收录减少是正常事,快看看你的google管理员工具后台吧! 注意这里讨论的与“重复内容”有本质的区别,重复内容的解决思路。 (责任编辑:laiquliu) |