商务 商用网址 商务 网络营销 商务 网站资讯 商务 投资理财 商务 网站评估 商务 本站老版本 返回首页

Google Sitemaps (BETA)

2005-8-17 16:55:42
Google又出新花样,Sitemaps(站点地图) https://www.google.com/webmasters/sitemaps 免费服务正在测试中。与以往不同的是,这次Google推出Sitemaps是打着Collaboration(协同工作)的旗帜。Sitemaps服务旨在使用Feed文件sitemap.xml通知Google的Crawler(爬虫)网站上哪些文件需要索引、这些文件的最后修订时间、更改频度、文件位置、相对优先索引权,这些信息将帮助 Google Crawler建立索引范围和索引的行为习惯。原先传统的爬虫方式当然会继续工作下去,但是Google倡议站长们利用Sitemaps技术与搜索引擎形成积极互动的协作关系,真正参与到搜索引擎的索引页面缓存的建立中来,改变爬虫机械式的重复工作模式,使搜索引擎能返回更准确有效的的结果,同时也可以有效地减少带宽的消耗以及服务器的压力,提高互联网的效率......

sitemap文件必须包含几个主要的描述性标记:

* changefreq — 文件更改频度,可以是always/hourly/daily/weekly/monthly/yearly/never中的任意一个值
* lastmod — 文件最后被修订的时间,必须是遵循ISO 8601规范的时间戳格式,比如2005-06-04或2005-06-04T02:20:30+08:00
* loc — 文件通用资源定位符地址,呵呵,就是URL网址,绝对地址
* priority — 相对于同一站点上其他文件的被索引的优先权,值域0.0~1.0,默认值是0.5
* url — 用来包围以上四个标记
* urlset — 用来包围以上五个标记

例如:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="' target=_blank>http://www.google.com/schemas/sitemap/0.84">
 <url>
  <loc>http://plod.popoever.com/</loc>
  <lastmod>2005-06-04</lastmod>
  <changefreq>daily</changefreq>
  <priority>0.8</priority>
 </url>
 <url>
  <loc>
http://plod.popoever.com/archives/cat_google_around.html</loc>
  <changefreq>weekly</changefreq>
 </url>
 <url>
  <loc>
http://plod.popoever.com/archives/2005_06.html</loc>
  <lastmod>2005-06-04</lastmod>
  <changefreq>monthly</changefreq>
 </url>
</urlset>


sitemap文件必须使用UTF-8编码,所有实体必须转换成字符,可以压缩成.gz格式以减小文件体积,节省带宽,但是文件未压缩体积不能大于 10MB(10,485,760字节),否则的话必须使用多个sitemap文件,而这些sitemap文件必须在sitemap_index.xml中通过loc标记分别指定sitemap文件来得到索引,但sitemap_index.xml不能索引超过1000个sitemap文件。

例如:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="' target=_blank>http://www.google.com/schemas/sitemap/0.84">
 <sitemap>
  <loc>http://www.mysite.com/sitemap1.xml.gz</loc>
  <lastmod>2004-10-01T18:23:17+00:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>
http://www.mysite.com/sitemap2.xml.gz</loc>
  <lastmod>2005-01-01</lastmod>
 </sitemap>
</sitemapindex>


  同时Google也准备了Sitemap Generator(地图生成器) 这个开源项目的Python脚本方便站长们使用,脚本必须运行于Python 2.2以上环境,请访问安装使用介绍页面。更多内容也可以订阅Google Group上的Sitemaps论坛来获得。我刚才传了我的RSS上去试试它竟然也通过了,晕,难道没有校验程序么~~~

  Google总是比我们smarter一点,而现在我们又要帮助Google的爬虫更smarter一点,我们是不是很那个什么的啊?!而近期真正实惠的是Google已经开通中文的“更多”,并且“大学搜索”也已经本地化,可以查询中国的大学了。
相关资讯

会员登录
ID:
密码:



注册可以获得什么?

新闻排行

禁止搜索引擎收录需要怎么做?
面向搜索引擎的内容管理系统(CM
用google 突破收费网站
GOOGLE的最新用法
Google广告-成长的烦恼 
整站优化要注意平衡
如何针对MSN搜索进行网站优化
在搜索引擎上排名前位——“桥”
网站登陆Google的关键:网站外部
网站推广十不要 
PHP搜索引擎技术核心揭密 
揭密Google伪代理骗钱术 四大谎言
分析人士预计百度上市后的表现将
揭秘Google成长史:曾经不愿公开
雅虎开发博客搜索技术 抢Technor
Google AdSense 全面解析 申请+操
odp开放式样目录,dmoz的历史
桌面搜索谁领风骚:资料、浏览器
新形式下的网络营销手段
如何开展成功的搜索引擎营销活动
如何取一个响亮的域名?
新浪搜索引擎服务简介
网易搜索引擎服务问答
Internet上域名命名的一般规则是
国家域名顶级节点落户上海 华东上
利用RSS你可以做的15件事
按照web标准将是网页设计的一个趋
你的网站有这些毛病吗?
不用模板,只用ASP+FSO生成静态H
什么是SMTP?

OK 商务网主页 | 广告服务 | 联系我们

中国 OK 商务网 版权所有 1999-2009 技术支持:腾达网络