.
SEO に関連する記事 => Google Sitemap Generator > 5.設定例と(自動)実行
Linux 活用ガイド:目次

サーバ構築ガイド

レンタル ガイド

ショップ 構築ガイド

情報漏洩対策

Sitemap Generator の実行 (sitemap_gen.py)

sitemap_gen.py の実行方法と、cron デーモンを使用したスケジュール実行について説明します。 ここまでのプロセスで作成したconfig.xml の例をこのサイトで示すと以下のようになります。

my_config.xml.

sitemap_gen.pyの設定ファイル config.xml の例です。

<!-- Siteシンタックス部 (必須設定) -->
<site
   base_url="http://safe-linux.homeip.net/"
   store_into="/var/www/sitemap.xml.gz"
   verbose="1"
   suppress_search_engine_notify="1" ←テスト終了後は削除
>
<!-- 上位階層はテキストで個々のURLを指定する -->
<urllist path="/var/www/sitemap_top.txt" encoding="UTF-8" />
<!-- ディレクトリによるURL取得指定 -->
<directory
   path="/var/www/network"
   url="http://safe-linux.homeip.net/network/"
   />
<directory
   path="/var/www/security"
   url="http://safe-linux.homeip.net/security/"
   />
<directory
   path="/var/www/web"
   url="http://safe-linux.homeip.net/web/"
   />
<directory
   path="/var/www/mail"
   url="http://safe-linux.homeip.net/mail/"
   />
<directory
   path="/data01/www-linux/pub/html/other"
   url="http://safe-linux.homeip.net/other/"
   />
<!-- フィルター設定 -->
<filter action="pass" type="wildcard" pattern="*.htm*" />
<filter action="pass" type="wildcard" pattern="*.php*" />
<filter action="drop" type="wildcard" pattern="*" />

sitemap_gen.py の実行.

sitemap_gen.py を実行は、コンソールから行います。ホスティングサービスをご利用の方は、ssh などリモートログイン権限が必要です。

$ python sitemap_gen.py --config=/path/my_config.xml --testing

設定ファイルにミスがある場合は、Google にPing は送信されませんが、問題がなければGoogle にPing が送信されます。--testing を付けた場合は、送信されません。

Google によれば、『 初回はWebサイト上で生成した sitemap.xml のURLを登録する必要がある 』 としていますので問題はないと思うのですが、 念のため、正しくフィルタリングが行われているか確認してから --testing を外して実行するようにして下さい。

この sitemap.xml.gz が更新されたことを知らせるHTTPリクエスト(ping)は、最短で1時間に1回までと定められていますので注意が必要です。

出力されたsitemap.xml.gz に問題がなければ、Google サイトマップサービスにURLを登録後、再度

$ python sitemap_gen.py --config=/path/my_config.xml

を実行します。sitemap.xml に変更があれば、その都度、このコマンドを実行し、Google に通知する必要があります。Linux であれば、cron デーモンで1日おきに実行すればいいでしょう。

crond によるスケジュール実行.

RH系Linux であれば、/etc/cron.daily ディレクトリに以下のスクリプトを設置することで、午前4時頃に、自動実行されるようになります。

/etc/cron.daily/sitemap_gen
#!/bin/bash
python /path/sitemap_gen.py --config=/path/my_config.xml

レポートは cron デーモンが返します。

Google Sitemap Generator 2005年 6月17日 (2006年 1月 13日改定)

Google Sitemap サービス

.
おすすめ度の平均: ゲージ
ゲージ バイブルです
ゲージ 初心者にもオススメ
ゲージ オープンソースがある程度わかる人向けの中級本

ディストリビューションに依存しないtarボールからのLinux サーバー構築を目的としています。書籍の紹介にあるとおり、自由度の高いサーバーを構築する事が出来ますが、パッケージセットアップと異なり、セキュリティメンテナンスは、しっかり行う必要があります。

そういう意味では初心者向けの書籍ではありませんが、ディストリビューションに置き換えて考える事で柔軟に考える力も身に付きます。インターネットサーバ構築に必要な情報は全て網羅しており、Kernel-2.6、BIND9、Apache 2.0、Postfix、SMTP AUTH、vsftpdなど、最新環境に対応しています。オススメの書籍です。

.
.
おすすめ度の平均: ゲージ
ゲージ linux初心者にもお勧めです
ゲージ 一番よい
ゲージ 使えます!

これから Linux を使用して自宅サーバ構築を考えている方や、LINUX サーバ管理者は、一冊は持って置きたい LINUXコマンド リファレンスです。この手の書籍は、引き易さや、使用例などの解説がポイントになります。

目的別に分かり易く整理されており、これからLINUXを始められる方にオススメの一冊です。

.
bottom_mark
ページ最上部
ページ最上部 前のページ