robotstxt是一个辅助生成 http://YourDrupalRoot/robots.txt 文件的模块.而robots.txt是可以帮助站长告知网络蜘蛛(搜索引擎的机器人)那些目录不要被收录,而那些希望被收录的咚咚.详细可以见robotstxt.org

gsitemap是一个辅助Drupal站长提交Google Sitemaps的模块.其可以工作在两种不同的模式.

  1. 配合Sitemaps账号的设置,提供Sitemap.xml文件
  2. 没有Sitemaps账号的情况下主动提交Sitemap.xml文件(我不知道这样是否有效,只是在WatchDog中看到主动提交成功,因我有Sitemaps账号所以也没有深究)

在安装上以上2个模块后:

第一步、先配置robotstxt模块,其默认的配置如下

User-agent: *  Disallow: /node/  Disallow: /database/  Disallow: /includes/  Disallow: /misc/  Disallow: /modules/  Disallow: /sites/  Disallow: /themes/  Disallow: /admin/

需要注意的是需要将 Disallow: /node/ 这一行去掉, node 可是Drupal的基本页面单元。

可以使用浏览器访问地址 http://YourDrupalRoot/robots.txt 来检查。如果看到以上的配置文本即配置成功。

第二步、确认sitemap.xml地址

gsitemap默认生成的地址是 http://YourDrupalRoot/gsitemap。而Google Sitemaps对非.xml结尾的地址似乎有问题。总是提示找不到。

解决方法就是使用Drupal系统自带的path(url_alias/Url别名)模块设置一个gsitemap.xml到 gsitemap的别名。

第三步A、配置gsitemap模块主动提交

方法很简单:只需要在模块配置中的 Other Settings 中勾选上有 Submit sitemap to Google 的两项即可。到底有效与否不知道 ;-P

第三步B、配置gsitemap模块适应Sitemaps账号

  1. 在Google Sitemaps的Sitemaps地址一栏填写:http://YourDrupalRoot/gsitemap.xml

  2. 选 使用上传文件的方式 验证网站

  3. 复制下给出的文件名,将这个文件名粘贴到模块设置 Other Settings 中的 Verification link

    剩下的就是等待迎接Google的蜘蛛人。;-)