.
SEO に関連する記事 => Google Sitemap Generator > 4.URLのフィルタリング例
Linux 活用ガイド:目次

サーバ構築ガイド

レンタル ガイド

ショップ 構築ガイド

情報漏洩対策

フィルターの設定 ~ 設定ファイル (config.xml)

sitemap_gen 実行の際、取得したいURL、除外したいURLをフィルタリングする事が出来ます。特に、画像ファイルを省くスッキリするばかりか Crawler にも優しくなるのではないかと思います。

フィルターの設定例

画像やPDF などは通知せず、テキストコンテンツのみを登録したいケースが多いと思います。

記述例

フィルターは記述した順に実行されます。このフィルターは、url / urllist / directory / accesslog すべての方法で取得するURLに対して適用されます。

<!-- フィルター設定 -->
<filter action="pass" type="wildcard" pattern="*.htm*" />
<filter action="pass" type="wildcard" pattern="*.php*" />
<filter action="drop" type="wildcard" pattern="*" />

この例では、ワイルドカードで .php / .htm が含まれるURL を全て収集するように指定し、すべてのファイルは除外する事で、テキストコンテンツのみのURLだけを取得し、通知するようにしています。

一般的な運用ではこれで十分だと思います。ケースによってはアクセスログからURLを取得したい場合もあります。この場合、ページアドレスにセッションIDやパラメーターが含まれる場合があるためセキュリティに配慮したフィルタリングを施す必要があります。

ケースによっては、pattern に定義して除外する必要もあります。

pattern="除外する文字列を指定する"

filter で指定可能なシンタックス

filter で指定可能なシンタックス詳細は以下を参照して下さい。

URL => filter で指定可能なシンタックス

シンタックス 必要性 内容
action 任意

pass
pattern で指定した文字列に一致するURLを追加します。指定しない場合はdropとして処理されます。

drop
pattern で指定した文字列に一致するURLを除外します。

type

任意

フィルタの種類を指定します。

wildcard
URL の比較に標準のパスのワイルドカード (? および *) が使用されます。 type 値のデフォルトで、指定しない場合は "wildcard" とみなされます。

regexp
正規表現が使用されます。

pattern

必須

フィルタリングするURLに含まれる文字列を指定します。ここで指定されたURLが上記アクションで処理されます。

Google Sitemap サービス

.
おすすめ度の平均: ゲージ
ゲージ Amazon ウェブサービスを活用したい方にお勧め

プログラミングの知識のない方でも、簡単にWebサイトを充実させるためのテクニックを紹介した書籍です。

Webサイトに色彩りを沿えるアクセサリ的な要素から、Google Adsense やAmazon を始めとするアフィリエイト(広告収入)の具体的な組み込み例も紹介されています。

広告収入を得るためコード埋め込みなど、仕組みから具体例を分かり易く解説されています。

現在、ホームページやブログを持っている方で、アフィリエイトにこれから取り組んでみようと考えている方にもオススメです。

また、XSLTに全く知識のない方でも雛形のXSLTスタイルシートをカスタマイズすることでオリジナリティあるアフィリエイトサイトを構築する方法も紹介されています。初心者から中級者まで楽しめる内容となっています。オススメです。

.
bottom_mark
ページ最上部
ページ最上部 前のページ