.
Linux 活用ガイド:目次

サーバ構築ガイド

レンタル ガイド

ショップ 構築ガイド

情報漏洩対策

STEP 2 対象ファイル・URLの指定 ~ GSiteCrawler ウィザード

STEP 2 ウィザードによるセットアップ

Google Sitemap出力対象に関する設定を行います。ここで設定された値は、URL収集(クロール)後、URLリストテーブルに適用される初期値となります。この値に基づいて、Google Sitemap ファイルを出力する事になりますので重要な設定です。

ウィザード終了後に再設定する事も可能ですが、一度 Crawl を実行してURLリストテーブルを取得してしまった場合、リストをクリア後、再度 Crawl を実行する必要があります。詳しくは、手動セットアップで説明しています。

Step2

  • URLs are case-sensitive
    • Unix、Linux は拡張子の大文字、小文字を識別するためサーバーがUnix系である場合はチェックを入れます。多分、該当するページがあれば除外されるか、警告が出るのだと思います。未確認
  • Include default filters for Session-IDs?
    • セッションIDやパラメーターがURLに含まれる場合、それを対象外とします。これらのURLはセキュリティ上問題なので必ずチェックを入れるようにします。というかネットにさらす(URLを含ませる)事自体不謹慎。ウィザードでは、デフォルトで指定されている値が適用されます。追加、変更の必要がある場合は、ウィザード終了後、Remove Parameters タブで再度、指定できます。
  • List of file-extentions check;
    • ここで記述した拡張子を持つURLアドレスを持つ XML サイトマップファイルを出力されるようになります。デフォルトでは多くのファイルが登録されていますが、自信のサイトに併せて拡張子を限定するようにして下さい。
    • ここで設定されていない拡張子をもつアドレス(画像など)もURLリストテーブルに追加されますが、Include のチェックは外れるためXMLサイトマップファイルには出力されません。
bottom_mark
ページ最上部
ページ最上部 前のページ