关于404错误和“软404”的说明

2014年03月19日 01:38 by:老修

导读: 首先“软404”是google站长工具里的叫法,软404的意思是原本应该返回404错误的页面返回码却是200状态,可能有的朋友不理解这个“软404”有什么影响,一个有404外貌的网页返回200状态这势必导致搜索引擎收录了没有内容的页面,大量的重复页面可能导致网站降权。

我们知道如果一个网页不存在会返回404错误,而网页因服务器或其它临时不能访问的问题返回的代码应该是503,如果程序出现错误则会返回400错误代码,更多请参考: 网页状态码意思查询表

首先“404错误”的意思是网页不存在

正常情况下如果一个网页不存在就会返回一个404网页不存在的错误。 老吧博客在另外一篇文章《你的404错误页设置正确吗?》分享过这个404错误的设置。

什么是“软404”呢?

“软404”这个概念首先是从”谷歌站长工具“ 里叫出来的, 大概的意思是本应该返回404错误的网页返回的确实200代码,造成这个原因多是因为程序设计缺陷造成的。

例如在查询某个数据的时候如果没有查到会返回一个空数据,页面的呈现可以根据自己的需要设计,但是规范的设计应该返回一个404错误码,而不应该是一个200返回码,这个返回码不是给用户看的,实际上是给搜索引擎设计的。

404代码告诉搜索引擎这个网页不用再来抓取了。而200代码是表示网页可以正常访问,但是网页数据是空的,网站太大的话避免不了造成大量的这种网页返回码,最终造成搜索蜘蛛反复抓取的这种没有内容的网页而导致网站降权。

谷歌站长工具“软404”

如果临时没有内容的网页的返回码应该如何设计呢?

比如一个新的分类,还没有添加内容,当搜索引擎抓取这个网页的时候那么我们就不应该返回一个404错误码了,这时候我们应该返回的是503代码。 告诉搜索引擎当前这个空白页临时不要抓取,等返回200代码的时候再来。

我觉得站长们有必要检查一下自己的网站是否出现“软404”呢,大家可以用google站长工具,查询网页返回码可以用老吧博客的查询工具: http://www.lao8.org/test_geturl_status.php

网页设计规范化很重要, 针对不同页面有不同的设计方案, seo是门大学问。欢迎关注老吧博客。

标签:404 软404