.
Linux 活用ガイド:目次

サーバ構築ガイド

レンタル ガイド

ショップ 構築ガイド

情報漏洩対策

GSiteCrawler 入手先とセットアップ

毎度ながら前置きが長くなりましたが、GSiteCrawler の導入方法と運用について順を追って解説していきます。

GSiteCrawler の入手先

GSiteCrawler は以下のサイトから入手可能です。ここでは、正式リリースの v1.02 を使用しています。

入手先 => Google Sitemap Generator for Windows :: GSiteCrawler

2005年12月25日現在、 v1.03 ~ v1.05 βリリースがあります。自分は v1.02 から初めて利用しますので未確認ですが、オンラインナップデートも行えるようです。ちなみにv1.02 で実行すると ver 1.05 βにアップグレードする事は出来ませんでした。安定版がリリースされたら出来るようになると思います。

GSiteCrawler だけでなく HTTPレスポンスを確認するオンラインツールも公開されており、エラーチェックに利用できます。 Yahoo! 検索エンジンのバックリンク、キャッシュ状況を調べるオンラインツールなども公開されています。素敵過ぎます!!

ファイルシステムとの連携のため、レジストリがあれこれ追加されます。インストールをすると再起動が求められます。

GSiteCrawler のセットアップ

GSiteCrawler v1.02 では、プロジェクトごとに XMLサイトマップを作成する仕様になっています。一般的に1サイト1プロジェクトになるかと思います。

規模が大きい(URL50000、非圧縮XMLサイトマップ10MBを超える)場合、ディレクトリ毎にプロジェクトを分ける必要もあります。GSiteCrawler では、この規模を超えないようにデフォルトで設定されています。

ここでのセットアップ例

1サイト 1プロジェクト を例に説明します。初めてプロジェクトを作成する場合、応答形式で行うウィザードによるセットアップと、手動で行う二通りのプロジェクト作成方法があります。

  • ウィザードによるプロジェクトセットアップ
    • ウィザード は20~30ページほどの小規模サイト、動的に生成される事の無い単純なリンク構造をもつサイトなど、初心者向けです。この場合、設定によっては、Google Sitemap に通知するか聞かれますので、必ずキャンセルしてください。収集したURLを確認した上で、通知される事を強くお勧めします。 設定の変更については、『手動で行うプロジェクトセットアップ』 を参照して下さい。
  • 手動で行うプロジェクトセットアップ
    • 規模の大きな Web サイトや、掲示板などプログラムが出力する動的なページアドレスが含まれる Web サイトは 手動で設定する事をお勧めします。ウィザードでは微かなフィルタ設定など行えないからです。誤って Google Sitemap サービスにリクエストを送信する事も無いように設定を詰める必要があります。

ここでは、何れの方法でも解説していますが、可成、ウィザードは利用しないで手動で行うセットアップをお勧めします。ウィザードでは、フィルターに関する微かな設定が行えないからです。場合によっては、セキュリティにも関係してきますので、可成、手動による設定をお勧めします。

bottom_mark
ページ最上部
ページ最上部 前のページ