百度站长平台
百度站长平台介绍   注册平台账号   数据提交流程   百度sitemap协议   协议类型及包含范围   搜索引擎优化相关知识   操作常见问题解答

  百度站长平台介绍

    百度站长平台是一个服务于百度网页收录的数据提交平台。借助本平台,您可以:
1. 向百度推送您网站希望被百度收录的数据;
2. 在一定程度上减轻抓取产生的额外负担;
3. 网页更容易被百度发现和抓取,新增及删除的数据能更快被百度了解;
4. 还可查看数据的详细统计等其它附加功能。

  关于 sitemap


     sitemap(即站点地图)就是您网站上各网页的列表。创建并提交sitemap有助于百度发现并了解您网站上的所有网页,包括百度通过传统抓取方式可 能找不到的网页。您还可以使用sitemap提供有关您网站的其他信息,如上次更新日期、sitemap文件的更新频率等,供百度spider参考。
    百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。
    此外,sitemap 与搜索排名没有关系。


返回页首
  注册平台账号

 平台首页提供了账号注册入口,需要按照注册页面的要求认真填写注册信息,即可拥有平台账号。
  进入平台注册页面


  如何获取激活码

Sitemap工具正在内测中,需要激活使用,请发送邮件至zhanzhang@baidu.com获取激活码。邮件标题请填写申请站长平台激活码,正文需要包括您的网站信息和联系方式,谢谢!


  数据提交流程

第一步:添加网站,验证网站归属。
·登录后点击“添加网站”。若网站删除或更换域名,则需重新提交。
·点击“验证此网站”,选择验证方式并获取验证文件,完成验证。详细请参考右图。
     · 验证方式一:文件验证
     · 验证方式二:HTML标签验证




 

第二步:点击“数据管理”,添加新数据。
  如何添加新数据(如右图所示):
·选择您希望百度定期抓取/删除的数据
·选择数据的类型,根据类型对应的xml格式规范部署您的数据文件。
·为您的数据指定更新周期。
·按照xml格式规范部署好文件后,在地址栏填写文件存放地址,点击提交即可。
  我们对文件的处理时间长短将视文件大小而定。

 

 

  如何手动更新已提交的数据:
·如果您想在指定更新周期以外,手动通知我们数据有更新,可以在“数据管理”页面选中
要手动更新的文件并点击“更新所选”即可。
·如果数据存在错误或不符合协议格式,则状态栏会显示为错误,请参考平台提示修改并更新。
·您可通过平台查看数据的统计信息,包括已抓取数量,最新处理时间等。
  :百度对已提交的数据,不保证一定会抓取及索引所有网址,并且不保证其排名。

 


返回页首
  百度sitemap协议


    百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。 百 度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap 索引文件提交。每个sitemap文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。


XML格式sitemap说明:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>
   <urlset>
        <url>
          <loc>http://www.example.com/</loc>
          <lastmod>2010-01-01</lastmod>
          <changefreq>always</changefreq>
          <priority>1.0</priority>
        </url>
   </urlset>
											

具体格式及规范说明请查看: http://zhanzhang.baidu.com/site/format

XML标签说明:
属性
是否必填项
说明
<urlset> 必填 只填写 <urlset>
<url> 必填 每个网址记录的父标记。
<loc> 必填 该页的网址。该值必须少于256个字节。
<lastmod> 可选 该文件上次修改的日期。
<changefreq> 可选 页面可能发生更改的频率。有效值为:
  • always
  • hourly
  • daily
  • weekly
  • mothly
  • yearly
  • never
<priority> 可选 此网页的优先级。有效值范围从 0.0 到 1.0。

文本格式sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:
http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:

  • 文本文件每行都必须有一个网址。网址中不能有换行。
  • 您必须指定完整的网址,包括 http。
  • 每个文本文件最多可包含 50,000 个网址,并且 应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
  • 文本文件需使用 UTF-8 编码或GBK编码。
  • 文本文件不应包含网址列表以外的任何信息。


使用sitemap索引文件(对多个sitemap文件)说明:

    您可以使用 gzip 压缩 sitemap 文件,以减少带宽要求;但是解压缩后的 sitemap 文件应小于10MB(10,485,760字节)。使用sitemap 索引文件必须:

  • <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
  • 每个 sitemap 包含一个 <sitemap> 条目作为 XML 父标记。
  • 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。

sitemap索引文件标签说明:

属性
是否必填项
说明
<sitemapindex> 必填 压缩文件中所有sitemap的相关信息
<sitemap> 必填 压缩文件中个别sitemap的相关信息
<loc> 必填

识别sitemap的位置

<lastmod> 可选

识别相对sitemap文件的修改时间


  sitemap协议类型及包含范围

  • 百度sitemap协议支持提交收录网页列表以及死链列表。

        收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及sitemap索引文件提交。
        死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。
        死链列表目前只能使用文本格式在百度站长平台提交。

  • sitemap文件的包含范围以主域为单位。

        如果您验证了 http://www.example.com/这个网站,那么sitemap文件中可以包含http://www.example.com/、 http://example.com/、http://bbs.example.com/等所有example.com主域下站点中的网址。


  • 搜索引擎优化相关知识
    • 什么是好的url?

      创建具有良好描述性、规范、简单的url,有利于用户更方便的记忆和判断网页的内容,也有利于搜索引擎更有效的抓取您的网站。网站设计之初,就应该有合理的url规划。
      我们建议:
      网站中同一网页,只对应一个url。
      如果网站上多种url都能访问同样的内容,会有如下危险:
      1. 搜索引擎会选一种url为标准,可能会和正版不同
      2. 用户可能为同一网页的不同url做推荐,多种url形式分散了该网页的权重
      如果你的网站上已经存在多种url形式,建议按以下方式处理:
      1. 在系统中只使用正常形式url,不让用户接触到非正常形式的url
      2. 不把Session id、统计代码等不必要的内容放在url中
      3. 不同形式的url,301永久跳转到正常形式
      4. 防止用户输错而启用的备用域名,301永久跳转到主域名
      5. 使用robots.txt禁止Baiduspider抓取您不想向用户展现的形式
    • 怎样书写页面对搜索引擎最友好?

      title信息
      网页的title用于告诉用户和搜索引擎这个网页的主要内容是什么,而且当用户在百度网页搜索中搜索到你的网页时,title会做为最重要的内容显示在摘要中。
      搜索引擎在判断一个网页内容权重时,title是主要参考信息之一。
      我们建议
      通常网页标题可以这样描述:
      • 首页:网站名称 或者 网站名称_提供服务介绍or产品介绍
      • 频道页:频道名称_网站名称
      • 文章页:文章title_频道名称_网站名称
      同时一些需要注意的点是:
      • 标题要主题明确,包含这个网页中最重要的内容
      • 简明精练,不罗列与网页内容不相关的信息
      • 用户浏览通常是从左到右的,重要的内容应该放到title的靠前的位置
      • 使用用户所熟知的语言描述。如果你有中、英文两种网站名称,尽量使用用户熟知的那一种做为标题描述
      Meta信息
      Meta description是meta标签的一部分,位于html代码的<head>区。
      Meta description是对网页内容的精练概括。如果description描述与网页内容相符,百度会把description当做摘要的选择目标之 一,一个好的description会帮助用户更方便的从搜索结果中判断你的网页内容是否和需求相符。
      Meta description不是权值计算的参考因素,这个标签存在与否不影响网页权值,只会用做搜索结果摘要的一个选择目标。
      推荐做法:
      • 网站首页、频道页、产品参数页等没有大段文字可以用做摘要的网页最适合使用description。
      • 为每个网页创建不同的description,避免所有网页都使用同样的描述
      • 长度合理,不过长不过短
      图片alt信息
      我们建议您为图片加alt说明。
      这样在网速较慢图片不能显示时让用户明白图片要传达的信息,也能让搜索引擎了解图片的内容。
      同理,使用图片做导航时,也可以使用Alt注释,用Alt告诉搜索引擎所指向的网页内容是什么。
      Flash文字信息
      目前Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、图片中的文字,百度无法识别。
      所以如果一定要使用flash,我们建议您给object标签添加注释信息。
      这些信息会被看作是对Flash的描述信息。让搜索引擎更好的了解您flash的内容。
      frame和iframe框架结构
      我们建议您不要使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。
    • 关于以上问题更详细的情况,可以参考百度官方 《搜索引擎优化指南》
      什么是网址删除


    如果您的网站有不想被百度访问或者过期的内容,可以通过网址删除来请求删除这些网址。添加删除数据时,请先在已添加sitemap数据列表中将该数据删除,然后在网址删除中将该数据提交。设置网址删除后,百度将不在搜索结果中显示您删除的数据。

    提交需要删除的网址后,需要做如下处理,才能从百度搜索结果中成功去除:
    1、使用robots.txt阻止其被抓取;
    2、或者返回404状态码表示当前页面不存在。

      操作常见问题解答

    1. 网站验证失败都有哪些原因?
    2. 提交sitemap失败的原因?
    3. sitemap验证错误该怎么做,错误原因有哪些?
    4. sitemap提交后状态总为等待该怎么办?
    5. 网址删除不成功该怎么办?
    6. 网址删除错误可能是哪些原因导致的?
    7. 网址误删除后该如何操作?百度能恢复对该网址的收录吗? 
    8. 如何防止网站被黑?
    9. 如何处理网站被黑?
    10. 我的网站已恢复正常,为什么还有被黑提示?
    11. 百度ping服务常见问题解答
      sitemap协议常见问题解答

    1. sitemap都支持哪些格式?
    2. 我可以提交多少个sitemap数据?提交的sitemap会都被收录吗?
    3. sitemap提交后,多久能被百度抓取?
    4. sitemap提交后,还需要大量的人力进行维护吗?
    5. 应该将 sitemap 文件放在哪里?
    6. 我的 sitemap 可以有多大?
    7. 我的网站拥有几千万个网址;我可以只提交最近更改过的网址吗?
    8. sitemap 中的网址需要完整地指定吗?
    9. 我的网站同时具有“http”和“https”格式的网址。需要把它们都列出来吗?
    10. 网址在 sitemap 中的位置是否会影响它的使用?
    11. 我可以压缩我的 sitemap 吗?它们是否需要用 gzip 压缩?
    12. XML格式的 sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?
    13. 如果我在使用协议或提交 sitemap 时遇到其他问题怎么办?


    © 2012 Baidu 免责声明