Webサイト上の文章や画像が、AIの学習や回答生成のために収集・利用されるケースが増えています。
これまでの「検索エンジンでの利用」は、ただの「参照」であり「お客さんの誘導」につながるものでしたが、AIが利用する場合、「学習のための情報収集」や「回答文作成材料」にとどまり、必ずお客さんを導く仕組みができていません。
そのため、「AIに利用されない自由・権利」が求められているようです。
「AIにうちのコンテンツは使われたくないなー」と考えた方は、まず「何を防ぎたいのか」を分けてみましょう:
- 学習(Training)に使われたくないのか
- 生成AIの回答づくり(検索・要約・引用=Retrieval / Grounding)の材料として使われたくないのか
この2つは混同されがちですが、実務的には“止め方”や“得失”が少し変わります(例:OpenAIは GPTBot と OAI-SearchBot を別々に案内しています)。
2026年現時点での「AIに使われたくない」対策は大きく2つ
Webサイトに掲載している情報をAIに使われたくない、という場合、現時点で主に以下の2系統があります。
- サイト上に「AI学習お断り」等の方針・ポリシーを明示する(表明)
- AI(クローラー)が読み込めないよう、技術的に遮断する(制御)
「AI学習お断りの明示」は効果があるのか
「AI学習お断り」と書けば完全に守られる、という状況ではありません。
法的・業界的な統一ルールがあるわけではないので、相手が遵守する保証は限定的です(とくに robots.txt は“従うかどうかはクローラー次第”という位置づけです)。
しかしそれでも、こうした表明をしておくことには意味があります。
- 会社としてのコンテンツポリシー(姿勢)を明文化できる
- 問い合わせ窓口や許諾方針(引用・転載・学習利用の扱い)を整理できる
- 万が一トラブルになった際に「方針提示をしていた」事実として残る
ここは「完全防御」ではなく、「運用の前提づくり」として捉えるのが現実的です。
コンテンツポリシー、ガイドラインのページを設置することができます。
技術的な遮断は“強度”がある:3段階で整理
さて二つ目の技術的な遮断ですが、強度と副作用に応じて3段階あります:
レベル1:robots.txtにてお願いベースの制御をする
robots.txt は「クロールしてよいURL/だめなURL」を伝える仕組みです。
ただし強制力はなく、守るかどうかはクローラー側、AIが対応してくれるかどうか次第。
レベル2:サーバーレベルで実アクセスを止める
User-AgentやIP等をもとに、サーバ側でアクセス自体を拒否する方法です。
例として、エックスサーバーが「AIクローラー遮断設定」機能を提供開始しています(サーバーパネルでONにする形式)。
この方式は“実際に取りに来る通信”を止められる反面、識別(UA/IP等)の前提があるため「すべてのAI関連アクセスを完全に保証する」とまでは言い切れません。しかし現実的には良い方法です。
サーバレベルで遮断すると、意図せず文章や画像を使われずに済む一方で、
- ユーザーが生成AIを通して調べるとき、情報源として参照されにくくなる
- 今後「AI検索・要約」からの導線が増えた場合に、機会損失になる可能性がある
といった側面も。
OpenAIの案内でも、OAI-SearchBotをブロックすると「要約やスニペットに入らない」等の話が出ています。
レベル3:公開設計の変更
そもそも「公開しない」「会員にのみ見せる」「資料請求後に渡す」など、情報の出し方を変える手段です。
ノウハウ・一次情報・写真素材など、資産性が高い領域ではこの判断が強く効きます。
エックスサーバーの「AIクローラー遮断設定」でできること
エックスサーバーでは、生成AIによる無断利用対策として「AIクローラー遮断設定」機能が提供されています。 
サーバーパネルから対象ドメインを選び、ワンクリックで設定できる趣旨の案内です。
- 「学習」や「回答生成」を目的としたクローラーのアクセス遮断を狙う
- 一方で、用途別(学習だけOK/検索だけOK など)の細かな出し分けは、現時点では一般に難しい
「守り」を強めたいサイトには有力ですが、公開戦略とのセットで判断するのがよいです。
プラグインで設定できるAI向け“サイト案内図”ーllms.txt
最近、WordPress界隈でも「AI時代の見つけられ方」に備える動きがあり、Yoast SEOが llms.txt 生成機能を案内しています。
この機能は、AIに対して「重要なコンテンツをハイライトするガイド(案内図)」という位置づけで、AIから「好まれやすく」するためのものです。
ただしllms.txt は、まだ業界標準スタンダードとして確立されているわけではなく、Google担当者も現時点での有用性とみなしてはいないようです。
Google Search Team Does Not Endorse LLMs.txt Files
しかし、AI向けに“見せたい情報”を整理する、将来の環境変化や、一部のAIクライアント/エージェントに備えるという面はありますので、プラグインでの設定を検討する価値はあるかと思います。
—
AIを「使って」生成した記事や画像、ページというものも昨今驚くほど(むしろ驚かないほど)増えてきました。
そして、AIに記事や画像を「使われる」という時代でもあります。
検索エンジン対策と同じく、AI対策という面では、サイトのポリシーをもっとしっかり考えなくてはいけないかもしれませんね。