百度推出论坛收录开放协议
实际上百度以RSS的思路定义一个收录开放协议,需要论坛提供的就是XML文件格式的文档,也叫文档类型定义(DTD),“使用此开放协议,将会为您的网站带去更多流量!”
《互联网论坛收录开放协议》是百度网页搜索制定的论坛内容收录标准,论坛网站可将论坛内发布的帖子制作成遵循此开放协议的XML格式的网页供搜索引擎索引,将论坛发布的帖子主动、及时地告知百度搜索引擎。
采用了《互联网论坛收录开放协议》,就相当于论坛中的帖子被搜索引擎订阅,通过百度这个平台,网民将有可能在更大范围内更高频率地访问到您网站论坛中的帖子,进而为您的网站带来潜在的流量。
开放协议非常简单! 下图为遵照《互联网论坛收录开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站论坛发布的帖子的相关信息。
XML网页示例

XML标签说明 (其中带星号标记的为必选项,未带星号标记为可选项)
*
*
*
*
*
*
*
* ——帖子的 url 地址,即帖子第一页的地址,请尽量去除url中不必要的参数。
创建并提交论坛XML文件!
第一步:创建XML文件
请按照上面公布的开放协议内容制作XML文件。
- 其它说明:
- 支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB2312和UTF-8。注意:XML文件头部的encoding值必须与XML文件的实际编码类型一致。
- 请保持每个XML文件处于按更新周期持续自动更新的状态。
- XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的帖子,具体参见下表。
?? 转义字符中的"&"无需再转。字符 转义后的字符 HTML字符 字符编码 和(and) & & & 单引号 ' ' ' 双引号 " " " 大于号 > > > 小于号 < < <
第二步:验证XML文件
下面的地址提供了帮助您验证XML文件结构的多种工具:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的视频信息不被搜索引擎遗漏。
第三步:使用XML文件
请将XML文件命名为sitemap_baidu.xml上传到您网站根目录下,并保证文件所在的url地址能够被百度spider正常访问。例如,网站为post.baidu.com,则将xml文件上传至post.baidu.com/sitemap_baidu.xml。
当百度spider发现了xml文件后,会根据上面提供的参数自动对xml文件进行更新,并抓取高质量的内容。
注意: 百度spider不保证一定能收录您提交的全部内容。
原文地址:http://www.baidu.com/search/pageop.htm
最后修改时间:2007-12-28 19:51:00
- 来源:转载
- 版权声明:请尊重原作者的版权,转载请注明作者、出处(老吧)。
- 本文链接地址:http://www.lao8.org/html/8/2007-12-28/20071228160241.html
- 文章名:百度推出论坛收录开放协议
相关"百度 论坛收录"文章
- 百度知道也被采集
- 百度对百度空间的权重削减
- 百度加强图片搜索
- 最搞笑的百度知道问答
- 影响百度排名的主要因素
- 关于百度的收录开放协议
- 如何查看百度谷歌等搜索引擎今天收录了那些内容
- 百度今日关闭相关搜索功能
- 百度更新是喜是忧?
- 百度与盛大联合进军网页游戏



