サーバーのアクセスログからURLを取得します。この方法は、動的に生成されるURLなどを対象としたい場合に適しますが、セッションIDやが含まれると、セキュリティ上、問題になります。
特に、システム制御をブラウザ経由で行っている場合は、これらのURLやセッションID を含むアドレスが外部に漏れてしまう可能性があります。バーチャルドメインや、SSLに限定するなどして、ログが分離されている必要があります。
フィルターで除外することは可能ですが、意味のわからない方は、このURL取得方法は利用しない方が安全です。Google はこの辺に関する注意点については触れていませんので注意が必要です。
Google はセッションIDが含まれるURLはインデックスしないようですが、URLが外部にもれる危険があります。
先ほどの site シンタックス部 の続きに以下を記入します。
<!-- URL取得に関する設定(必須設定) -->
<accesslog path="/var/log/httpd/domain-A.access.log" encoding="UTF-8" />
<accesslog path="/var/log/httpd/domain-A.access.log.0" encoding="UTF-8" />
<accesslog path="/var/log/httpd/domain-A.access.log.1.gz" encoding="UTF-8" />
loglotedで圧縮されたファイルも指定可能です。
accesslog で使用可能なシンタックスは以下のとおりです。
シンタックス | 必要性 | 内容 |
---|---|---|
path | 必須 | ログファイルのパスを指定します。 |
encoding |
任意 | サーバーによっては、出力するログが、UTF-8 でない場合があります。UTF-8 にエンコードして取り込むのだと思います。 |