毎度ながら前置きが長くなりましたが、GSiteCrawler の導入方法と運用について順を追って解説していきます。
GSiteCrawler は以下のサイトから入手可能です。ここでは、正式リリースの v1.02 を使用しています。
入手先 => Google Sitemap Generator for Windows :: GSiteCrawler
2005年12月25日現在、 v1.03 ~ v1.05 βリリースがあります。自分は v1.02 から初めて利用しますので未確認ですが、オンラインナップデートも行えるようです。ちなみにv1.02 で実行すると ver 1.05 βにアップグレードする事は出来ませんでした。安定版がリリースされたら出来るようになると思います。
GSiteCrawler だけでなく HTTPレスポンスを確認するオンラインツールも公開されており、エラーチェックに利用できます。 Yahoo! 検索エンジンのバックリンク、キャッシュ状況を調べるオンラインツールなども公開されています。素敵過ぎます!!
ファイルシステムとの連携のため、レジストリがあれこれ追加されます。インストールをすると再起動が求められます。
GSiteCrawler v1.02 では、プロジェクトごとに XMLサイトマップを作成する仕様になっています。一般的に1サイト1プロジェクトになるかと思います。
規模が大きい(URL50000、非圧縮XMLサイトマップ10MBを超える)場合、ディレクトリ毎にプロジェクトを分ける必要もあります。GSiteCrawler では、この規模を超えないようにデフォルトで設定されています。
1サイト 1プロジェクト を例に説明します。初めてプロジェクトを作成する場合、応答形式で行うウィザードによるセットアップと、手動で行う二通りのプロジェクト作成方法があります。
ここでは、何れの方法でも解説していますが、可成、ウィザードは利用しないで手動で行うセットアップをお勧めします。ウィザードでは、フィルターに関する微かな設定が行えないからです。場合によっては、セキュリティにも関係してきますので、可成、手動による設定をお勧めします。