2010
Mar
12

robots.txtイメージ検索用の調整

悪質なクローラーは問答無用で弾いていますが、robots.txtをしっかり読んで従うクローラーにもしっかりサイトに応じた設定をするべきなのかな。
アクセスログを見ると画像への直リンクがズラリ並ぶこと多かった。その直リンク元は某検索エンジンのイメージ検索。気分が良いものではない。転載のされ負荷かけられてるんだもの。CG系等、画像をメインにしたサイトだとイメージ検索というのも結構なダメージになりそうですね。

でもイメージ検索から来てくれる方も多いので、画像すべてをクローラに拾われるのを拒否するのはチョット。
そこでイメージ検索するユーザーにとって不要な画像、たとえばサイトの装飾用の画像やボタン・アイコン類は拒否しておく。それからWordPressでは原寸の元画像の他にもサムネイル画像など数種類の大きさの画像が作られるので、この縮小画像も拒否しておいて良いでしょうね。

Disallow: /files/*-*x

みたいな感じで。
あるいは逆に縮小サムネイルだけ許可するっていうのもアリでしょうか。「原寸見たけりゃサイトに来てね」と検索エンジンに拾われる事ばかりでなく、拒否することもアクセスアップに必要ってことで。SEOの情報とかって画像検索の事書かれてるサイトって殆どないような…。
ていうか検索エンジンの検索結果で直リンクって危険な気がしません?画像を別のものに置き換えたりリダイレクトすればサイトに入られなくても、ある文字を検索されれば持ち主のやりたい放題。画像ではないものにリダイレクトさせたり数GBある画像に置き換えたり。こういう検索サービスとかってよく考えると発案者のお国柄とか人柄とか見える気がしますよねぇ。

Response

Trackback URI
Add your comment
 (必須)
 (必須) (非公開)

いくつかのスタイル指定用 HTMLタグが使用できます。

Gravatar