「Webサイト自体は見てほしいけれど、素材として使っている画像だけは検索結果に出したくない」
Web制作の現場にいると、著作権の関係や有料素材の規約などで、こうしたニッチな相談を受けることが意外とありますよね。サクッと解決策を提示できていますか?
結論から言うと、サーバーのルートディレクトリにある robots.txt を活用し、Google画像検索専門のクローラー「Googlebot-Image」を制御することで解決可能です。
この記事では、特定の画像、あるいはサイト内の全画像をGoogle画像検索から除外(クロール拒否)する具体的な記述方法をご紹介します。
Googlebot-Imageを指定して画像検索のみを拒否する仕組み
通常の検索結果(Webページ)には表示させつつ、画像検索だけをブロックするには、User-agent の使い分けが肝になります。通常のGoogle検索用ボットは Googlebot ですが、画像検索には Googlebot-Image という専用のロボットが存在することをご存知でしょうか。こいつを名指しで指定し、Disallow(立ち入り禁止)を命令すれば良いのです。
特定の画像ファイルだけをピンポイントで除外する記述法
まずは、特定の画像ファイルだけを狙い撃ちでブロックする方法です。例えば「sample.jpg」という画像があり、これだけを検索結果に出したくない場合は、以下のように記述してください。
|
1 |
User-agent: Googlebot-Image Disallow: /img/sample.jpg |
このようにファイルパスを完全に指定することで、その画像に対するクローラーのアクセスが遮断されます。誤って重要なメインビジュアルまで指定しないよう、パスの確認は慎重に。
サイト内の全画像を検索結果に出さない一括ブロック設定
「サイト内の画像はすべて会員限定コンテンツなので、画像検索には一切出したくない」そんな時は、バッサリと全ての画像を対象にする記述が有効です。
|
1 |
User-agent: Googlebot-Image Disallow: / |
この記述は強力です。Googleの画像検索クローラーに対して、サイト内のあらゆる階層へのアクセスを禁じることになります。ポートフォリオサイトなどで、作品の無断転載リスクを少しでも減らしたい場合などに重宝するでしょう。
拡張子指定など特定パターンの画像をまとめて弾く応用テクニック
実務で最も使い勝手が良いのが、ワイルドカード(*)を使ったパターンマッチングではないでしょうか。例えば、「写真はいいけれど、イラスト素材(.png)や特定の図解(.jpg)だけは除外したい」というケース。ファイル末尾の拡張子を指定して一括制御することが可能です。
|
1 |
User-agent: Googlebot-Image Disallow: /*.jpg$ |
末尾に$をつけることで「.jpgで終わるファイル」を指定しています。
これならファイル名が変わっても拡張子が同じなら適用されるため、運用管理が非常に楽になるはずです!


コメント