ディレクトリに存在するファイルを一括で登録します。このため、URLの追加、削除、ページの修正などが行われても、cron でスケジュール実行する事で生成されるサイトマップも上書きされるためメンテナンスフリーでGoogle にsitemap.xml を通知できることになります。
ただし、このURL取得方法は一括取得であるため、個々のURL にlastmod(最終更新日)/ changefreq(更新頻度)/ priority(優先順位)オプションは利用する事が出来ません。SEO的に適したSitemap を作成するのには適しません。
すべてのURLに対して、これらのオプションを指定し、SEOに最適化した XML サイトマップファイルを作成したい場合は、サードパーティー製の Google サイトマップ生成ツール GSiteCrawler の導入も検討してみて下さい。
先ほどの site シンタックス部 の続きに以下を記入します。
<!-- URL取得に関する設定(必須設定) -->
<directory path="/var/www/icons" url="http://www.example.com/images/" />
この例では、/var/www/icons に存在するファイルのURLを生成します。
<!-- URL取得に関する設定(必須設定) -->
<directory
path="/var/www/docroot"
url="http://www.example.com/"
default_file="index.html"
/>
この例ではサイトトップ以下にある全てのファイルが対象となります。画像ファイルが存在する場合、サイトの規模によってはあっというまに規定の 50,000URLを超えてしまいますの注意が必要です。
directory で使用可能なシンタックスは以下のとおりです。
参照 => directory シンタックス部 リファレンス
シンタックス | 必要性 | 内容 |
---|---|---|
path | 必須 | ディレクトリを絶対パスで指定します。 |
url | 必須 |
上記ディレクトリに相当するURLを指定します。 |
encoding |
任意 | テキストの書式がUTF-8 でない場合に指定します。UTF-8 にエンコードして取り込むのだと思います。 |