STEP 2 対象ファイル・URLの指定 ~ GSiteCrawler ウィザード
STEP 2 ウィザードによるセットアップ
Google Sitemap出力対象に関する設定を行います。ここで設定された値は、URL収集(クロール)後、URLリストテーブルに適用される初期値となります。この値に基づいて、Google Sitemap ファイルを出力する事になりますので重要な設定です。
ウィザード終了後に再設定する事も可能ですが、一度 Crawl を実行してURLリストテーブルを取得してしまった場合、リストをクリア後、再度 Crawl を実行する必要があります。詳しくは、手動セットアップで説明しています。
- URLs are case-sensitive
- Unix、Linux は拡張子の大文字、小文字を識別するためサーバーがUnix系である場合はチェックを入れます。多分、該当するページがあれば除外されるか、警告が出るのだと思います。未確認
- Include default filters for Session-IDs?
- セッションIDやパラメーターがURLに含まれる場合、それを対象外とします。これらのURLはセキュリティ上問題なので必ずチェックを入れるようにします。というかネットにさらす(URLを含ませる)事自体不謹慎。ウィザードでは、デフォルトで指定されている値が適用されます。追加、変更の必要がある場合は、ウィザード終了後、Remove Parameters タブで再度、指定できます。
- List of file-extentions check;
- ここで記述した拡張子を持つURLアドレスを持つ XML サイトマップファイルを出力されるようになります。デフォルトでは多くのファイルが登録されていますが、自信のサイトに併せて拡張子を限定するようにして下さい。
- ここで設定されていない拡張子をもつアドレス(画像など)もURLリストテーブルに追加されますが、Include のチェックは外れるためXMLサイトマップファイルには出力されません。