ChatGPT・Perplexityに引用される方法
三橋竜彰・
ChatGPTやPerplexityの回答に自分のサイトが引用される——これがAI検索時代の新しい露出です。引用されるための出発点は、AIがWebページを参照する経路を理解し、その経路を閉ざさないことです。この記事では、各AI事業者の公式ドキュメントに基づく仕組みの整理と、引用される確率を上げる実践ポイントを解説します。
筆者はSEO検定1級・ウェブ解析士として、AIによるSEO自動化を自社サイトで実践しています。最初にお断りしておくと、「必ず引用される方法」は存在しません。本記事は、仕組み上の根拠がある施策と、観測に基づく改善方法を扱います。
AIはどの経路であなたのページを参照しますか?
各社の公式ドキュメントを整理すると、ChatGPTやPerplexityがWebページに触れる経路は3つあります。
- AI検索のインデックス: 検索機能用にWebを収集する経路。OpenAIの「OAI-SearchBot」、Perplexityの「PerplexityBot」、Anthropicの「Claude-SearchBot」。
- ユーザー起動のアクセス: ユーザーが質問した瞬間に該当ページを見に行く経路。「ChatGPT-User」「Perplexity-User」「Claude-User」。
- モデルの学習データ: 訓練用の収集。「GPTBot」「ClaudeBot」など。回答の引用リンクに直結するのは主に1と2で、3は間接的です。
引用される・されないを分ける第一関門は、経路1と2のクローラーがあなたのサイトにアクセスできるかです。
引用されるための前提: クローラーを閉ざさない
robots.txtの設定ひとつで、引用の可能性はゼロにも開放にもなります。
OpenAIは公式に、OAI-SearchBotを拒否したサイトはChatGPTの検索結果に表示されないと説明しています(例外として、外部経由でURLを得たページはリンクとタイトルのみ表示される場合があると公式FAQが補足しており、完全な除外にはnoindexが必要です)。Perplexityも、PerplexityBotの許可を推奨し、このボットはAIモデルの学習には使わないと明言しています。つまり「学習に使われたくないから」と全AIボットを一括拒否すると、検索での引用まで失います。
用途別に分けた設定例です(許可する場合、robots.txtでは明示的なDisallowを書かなければクロールは許可されます)。
# 学習用のみ拒否し、AI検索の引用は受け入れる例
User-agent: GPTBot
Disallow: /
User-agent: ClaudeBot
Disallow: /
# OAI-SearchBot / PerplexityBot / Claude-SearchBot には
# Disallowを書かない(=クロール許可)
なお、ユーザー起動型(ChatGPT-User・Perplexity-User等)は、ユーザーの操作に応じたアクセスのためrobots.txtのルールが適用されない場合があると各社が明記しています。本サイトは実証実験のため、すべてのAIボットを許可する方針です。詳しい方針の考え方はLLMO対策のやり方【実測データ付き】で解説しています。
どんなページが引用されやすいですか?
仕組みから逆算すると、「質問への答えをその場で抜き出せるページ」です。
AI検索は、ユーザーの質問に対して検索を行い、取得したページから回答の根拠になる一節を選びます。筆者が全記事で実践している構造は次のとおりです。
- 質問形式の見出し+直後に結論: 見出しを疑問文にし、次の1文で答えを言い切る。AIが「質問と答えのペア」を抽出しやすい形です。
- 一節の自己完結: 「これ」「それ」で始まる文は、切り出された瞬間に意味を失います。主語を明示します。
- 冒頭の結論先出し: ページの第1段落で主題に直答する。
- 表・リスト・手順: 散文より構造化データのほうが抽出に向きます。
これらは特別なテクニックではなく、従来の強調スニペット対策と同じ方向です。AI時代に新たに発明されたものではなく、「機械に抜き出されやすい書き方」の徹底だと捉えてください。
引用に値する中身: 一次情報とエンティティ
構造を整えても、中身が一般論ならAIが引用する理由はありません。
AIは一般論の要約が得意です。それでも外部サイトを引用するのは、そのサイトにしかない情報——実測データ、実装例、失敗記録、当事者の経験——を根拠にするときです。あわせて、「誰が言っているか」を機械可読にします。著者ページ、資格や外部プロフィールへのリンク、Person構造化データのsameAs接続です。本サイトでは著者の資格認定ページ(SEO検定1級・ウェブ解析士)へ実リンクし、sameAsにも含めています。
サイト全体の構成をAIに伝えるllms.txtの設置も、コストの小さい補助施策として実装しています。
引用されたかどうかはどう確認しますか?
「観測→改善」のループを回すために、次の3つを組み合わせます。
- 定点質問: 自分の領域の質問を主要AIに定期的に投げ、引用元リストに自サイトが入るかを記録する
- 参照元の観測: アクセス解析(GA4)の参照元レポートで、AIサービスのドメイン経由の流入を確認する
- クローラーログ: サーバーログやアクセス解析で、OAI-SearchBot等のアクセスが実際に来ているかを確認する
本サイトでも観測を始めており、結果は(引用されなかった期間も含めて)実データで公開していく予定です。仕組みの全体像はLLMOとは?AI時代の検索最適化 完全ガイドをご覧ください。
よくある質問
ChatGPTに引用されるにはどうすればいいですか?
前提として、OpenAIのAI検索用クローラー(OAI-SearchBot)をrobots.txtで拒否しないことです。OpenAIは、OAI-SearchBotを拒否したサイトはChatGPTの検索結果に表示されないと公式に説明しています。その上で、質問に直答する文章構造・一次情報・著者情報を整え、引用される確率を上げます。必ず引用される方法は存在しません。
Perplexityに引用されるための設定はありますか?
PerplexityBotをrobots.txtで拒否しないことが前提です。Perplexityは公式にPerplexityBotの許可を推奨しており、このボットは検索結果の表示・リンク用でAIモデルの学習には使わないと説明しています。設定変更の反映には最大24時間かかるとされています。
AIの学習に使われずに、検索の引用だけ受けることはできますか?
できます。学習用クローラー(GPTBot・ClaudeBot等)とAI検索用クローラー(OAI-SearchBot・PerplexityBot等)は別のUser-agentとして公式に分離されており、robots.txtで個別に制御できます。学習用のみDisallowを書き、検索用には書かない設定が該当します。
引用されているかどうかを確認する方法はありますか?
3つの組み合わせが現実的です。(1)自分の領域の質問を主要AIに定期的に投げて引用元を記録する定点質問、(2)アクセス解析の参照元レポートでAIサービス経由の流入を確認、(3)サーバーログでAI検索用クローラーのアクセスを確認。確立された公式の計測ツールはまだありません。
記事を書けばすぐにAIに引用されますか?
すぐに引用される保証はありません。AI検索のインデックスへの取り込みやクロールには時間がかかり、どの情報源を選ぶかの基準も非公開の部分が多いためです。クローラーを閉ざさない・直答構造で書く・一次情報を持つという確率を上げる施策を整えた上で、定点観測しながら改善を続けるのが現実的です。
まとめ
ChatGPT・Perplexityに引用されるための出発点は、AIがWebを参照する3つの経路(AI検索インデックス・ユーザー起動・学習)を理解し、少なくとも検索用クローラーを閉ざさないことです。その上で、質問に直答する構造・一次情報・機械可読な著者情報が「引用する理由」を作ります。保証のない領域だからこそ、観測と改善のループが唯一の確かな方法です。全体設計は本文中で紹介した完全ガイド・LLMO対策の各記事にまとめています。