2005年8月3日

Google Sitemap を導入してみよう。

壁にへばりつく花

 相変わらず,Google で写真の個別ページが検索対象になっていないので,最後の切り札「Google Sitemap (β)」を導入してみることにしました。

 Photo Lib. のページは全部で4000ページぐらいありますから,これをきちんと読み取ってもえれば,Google 経由の来訪が随分増えてくれるかな。逆に言えば,現在一日1000件くらいあるアクセスは,Google 以外からの来訪ということだから,これが倍以上に増える可能性もある訳だ。これは結構凄いことだと思う。

 Google Sitemap の実体は,XML で記述された URL のリストで,これに最終更新した日付を付すことによって,いつ更新されたかを Google に参照してもらいます。さらにオプションとして,内容の優先度(0から1までの範囲で重み付け)を設定したり,更新頻度を設定することが出来ます。

XMLの例
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>


 写真のページはディレクトリを総なめしてファイルを走査しなくても,MySQL のデータベースから取れるので,URLの一覧は簡単に出力できるのですが,問題は UTF-8 でエンコードする必要があることです。URLの一覧なのでASCII文字だけだから,shift-jis でも問題ない筈なのですが,必須用件なのでなんとか対応する必要があります。

 結局,問題が行き着くところは UTF-8 だな,asp での運用の限界かもしれない。

 とりあえず,静的なファイルを一つ作って,以降の自動更新の方法はちょっと考えてみよう。

追記
 Google の サードパーティツールのページを教えていただいたので,asp用のツールを参考に見てみました。
 すると,特にUTF-8の処理が含まれていないので,試しにコンテントタイプ(content type)を response.ContentType = "text/xml" を利用して,aspファイルをXMLとして出力させると,自動的にUTF-8Nとしてダウンロードできましたので,特に難しいことはしなくてもフォーマットに従って文字列を吐き出させるだけでいいようです。
 とりあえず,試しに,sitemap として登録してみたので,数時間程度の評価待ちとなります。うまく行けばいいなぁ。

 Thanks, kuroyagi (owner of SEM酒場)!

2 件のコメント:

kuroyagi さんのコメント...

この辺にサードパーティによるツールが案内されてますので、試してみてはいかがでしょう? ブラウザから試せる無料ツールもありますよ。4,000ページ分に対応してるかどうかは分かりませんが。

http://code.google.com/sm_thirdparty.html

OpenCage さんのコメント...

ありがとうございます。

結構いろいろありますね。asp用のコードジェネレーターがありましたので参考にしてみます。

ちなみに,Blogger って,Google側で,sitemap不要の対応とかしてくれていたら,とてもうれしいのですが,現実はそうではないようですね。ちょっと残念。

今後ともよろしくお願いいたします。