|
百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。
百
度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap
索引文件提交。每个sitemap文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。
XML格式sitemap说明:
XML格式举例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2010-01-01</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
</urlset>
具体格式及规范说明请查看:
http://zhanzhang.baidu.com/site/format
XML标签说明:
|
属性
|
是否必填项
|
说明
|
<urlset>
|
必填 |
只填写
<urlset>
。
|
<url>
|
必填 |
每个网址记录的父标记。 |
<loc>
|
必填 |
该页的网址。该值必须少于256个字节。 |
<lastmod>
|
可选 |
该文件上次修改的日期。 |
<changefreq>
|
可选 |
页面可能发生更改的频率。有效值为:
-
always
-
hourly
-
daily
-
weekly
-
mothly
-
yearly
-
never
|
<priority>
|
可选 |
此网页的优先级。有效值范围从 0.0 到
1.0。 |
文本格式sitemap说明:
您可以提供纯文本文件,其中每行包含一个网址。
文本文件格式举例:
http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=2
此文本文件需要遵循以下指南:
-
文本文件每行都必须有一个网址。网址中不能有换行。
-
您必须指定完整的网址,包括 http。
-
每个文本文件最多可包含 50,000 个网址,并且
应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
-
文本文件需使用 UTF-8 编码或GBK编码。
-
文本文件不应包含网址列表以外的任何信息。
使用sitemap索引文件(对多个sitemap文件)说明:
您可以使用 gzip 压缩 sitemap
文件,以减少带宽要求;但是解压缩后的 sitemap 文件应小于10MB(10,485,760字节)。使用sitemap 索引文件必须:
-
以
<sitemapindex>
开始标记作为开始,以
</sitemapindex>
结束标记作为结束。
-
每个 sitemap 包含一个
<sitemap>
条目作为 XML
父标记。
-
每个
<sitemap>
父标记包含一个
<loc>
子标记条目。
sitemap索引文件标签说明:
|
属性
|
是否必填项
|
说明
|
| <sitemapindex> |
必填 |
压缩文件中所有sitemap的相关信息 |
| <sitemap> |
必填 |
压缩文件中个别sitemap的相关信息 |
| <loc> |
必填 |
识别sitemap的位置
|
| <lastmod> |
可选 |
识别相对sitemap文件的修改时间
|
|