ChatGPT・Perplexityに引用される方法

ChatGPTやPerplexityの回答に自分のサイトが引用される——これがAI検索時代の新しい露出です。引用されるための出発点は、AIがWebページを参照する経路を理解し、その経路を閉ざさないことです。この記事では、各AI事業者の公式ドキュメントに基づく仕組みの整理と、引用される確率を上げる実践ポイントを解説します。

筆者はSEO検定1級・ウェブ解析士として、AIによるSEO自動化を自社サイトで実践しています。最初にお断りしておくと、「必ず引用される方法」は存在しません。本記事は、仕組み上の根拠がある施策と、観測に基づく改善方法を扱います。

AIはどの経路であなたのページを参照しますか？

各社の公式ドキュメントを整理すると、ChatGPTやPerplexityがWebページに触れる経路は3つあります。

AI検索のインデックス: 検索機能用にWebを収集する経路。OpenAIの「OAI-SearchBot」、Perplexityの「PerplexityBot」、Anthropicの「Claude-SearchBot」。
ユーザー起動のアクセス: ユーザーが質問した瞬間に該当ページを見に行く経路。「ChatGPT-User」「Perplexity-User」「Claude-User」。
モデルの学習データ: 訓練用の収集。「GPTBot」「ClaudeBot」など。回答の引用リンクに直結するのは主に1と2で、3は間接的です。

引用される・されないを分ける第一関門は、経路1と2のクローラーがあなたのサイトにアクセスできるかです。

引用されるための前提: クローラーを閉ざさない

robots.txtの設定ひとつで、引用の可能性はゼロにも開放にもなります。

OpenAIは公式に、OAI-SearchBotを拒否したサイトはChatGPTの検索結果に表示されないと説明しています（例外として、外部経由でURLを得たページはリンクとタイトルのみ表示される場合があると公式FAQが補足しており、完全な除外にはnoindexが必要です）。Perplexityも、PerplexityBotの許可を推奨し、このボットはAIモデルの学習には使わないと明言しています。つまり「学習に使われたくないから」と全AIボットを一括拒否すると、検索での引用まで失います。

用途別に分けた設定例です（許可する場合、robots.txtでは明示的なDisallowを書かなければクロールは許可されます）。

# 学習用のみ拒否し、AI検索の引用は受け入れる例
User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

# OAI-SearchBot / PerplexityBot / Claude-SearchBot には
# Disallowを書かない（=クロール許可）

なお、ユーザー起動型（ChatGPT-User・Perplexity-User等）は、ユーザーの操作に応じたアクセスのためrobots.txtのルールが適用されない場合があると各社が明記しています。本サイトは実証実験のため、すべてのAIボットを許可する方針です。詳しい方針の考え方はLLMO対策のやり方【実測データ付き】で解説しています。

どんなページが引用されやすいですか？

仕組みから逆算すると、「質問への答えをその場で抜き出せるページ」です。

AI検索は、ユーザーの質問に対して検索を行い、取得したページから回答の根拠になる一節を選びます。筆者が全記事で実践している構造は次のとおりです。

質問形式の見出し＋直後に結論: 見出しを疑問文にし、次の1文で答えを言い切る。AIが「質問と答えのペア」を抽出しやすい形です。
一節の自己完結: 「これ」「それ」で始まる文は、切り出された瞬間に意味を失います。主語を明示します。
冒頭の結論先出し: ページの第1段落で主題に直答する。
表・リスト・手順: 散文より構造化データのほうが抽出に向きます。

これらは特別なテクニックではなく、従来の強調スニペット対策と同じ方向です。AI時代に新たに発明されたものではなく、「機械に抜き出されやすい書き方」の徹底だと捉えてください。

引用に値する中身: 一次情報とエンティティ

構造を整えても、中身が一般論ならAIが引用する理由はありません。

AIは一般論の要約が得意です。それでも外部サイトを引用するのは、そのサイトにしかない情報——実測データ、実装例、失敗記録、当事者の経験——を根拠にするときです。あわせて、「誰が言っているか」を機械可読にします。著者ページ、資格や外部プロフィールへのリンク、Person構造化データのsameAs接続です。本サイトでは著者の資格認定ページ（SEO検定1級・ウェブ解析士）へ実リンクし、sameAsにも含めています。

サイト全体の構成をAIに伝えるllms.txtの設置も、コストの小さい補助施策として実装しています。

引用されたかどうかはどう確認しますか？

「観測→改善」のループを回すために、次の3つを組み合わせます。

定点質問: 自分の領域の質問を主要AIに定期的に投げ、引用元リストに自サイトが入るかを記録する
参照元の観測: アクセス解析（GA4）の参照元レポートで、AIサービスのドメイン経由の流入を確認する
クローラーログ: サーバーログやアクセス解析で、OAI-SearchBot等のアクセスが実際に来ているかを確認する

本サイトでも観測を始めており、結果は（引用されなかった期間も含めて）実データで公開していく予定です。仕組みの全体像はLLMOとは？AI時代の検索最適化完全ガイドをご覧ください。

よくある質問

ChatGPTに引用されるにはどうすればいいですか？

前提として、OpenAIのAI検索用クローラー（OAI-SearchBot）をrobots.txtで拒否しないことです。OpenAIは、OAI-SearchBotを拒否したサイトはChatGPTの検索結果に表示されないと公式に説明しています。その上で、質問に直答する文章構造・一次情報・著者情報を整え、引用される確率を上げます。必ず引用される方法は存在しません。

Perplexityに引用されるための設定はありますか？

PerplexityBotをrobots.txtで拒否しないことが前提です。Perplexityは公式にPerplexityBotの許可を推奨しており、このボットは検索結果の表示・リンク用でAIモデルの学習には使わないと説明しています。設定変更の反映には最大24時間かかるとされています。

AIの学習に使われずに、検索の引用だけ受けることはできますか？

できます。学習用クローラー（GPTBot・ClaudeBot等）とAI検索用クローラー（OAI-SearchBot・PerplexityBot等）は別のUser-agentとして公式に分離されており、robots.txtで個別に制御できます。学習用のみDisallowを書き、検索用には書かない設定が該当します。

引用されているかどうかを確認する方法はありますか？

3つの組み合わせが現実的です。（1）自分の領域の質問を主要AIに定期的に投げて引用元を記録する定点質問、（2）アクセス解析の参照元レポートでAIサービス経由の流入を確認、（3）サーバーログでAI検索用クローラーのアクセスを確認。確立された公式の計測ツールはまだありません。

記事を書けばすぐにAIに引用されますか？

すぐに引用される保証はありません。AI検索のインデックスへの取り込みやクロールには時間がかかり、どの情報源を選ぶかの基準も非公開の部分が多いためです。クローラーを閉ざさない・直答構造で書く・一次情報を持つという確率を上げる施策を整えた上で、定点観測しながら改善を続けるのが現実的です。

まとめ

ChatGPT・Perplexityに引用されるための出発点は、AIがWebを参照する3つの経路（AI検索インデックス・ユーザー起動・学習）を理解し、少なくとも検索用クローラーを閉ざさないことです。その上で、質問に直答する構造・一次情報・機械可読な著者情報が「引用する理由」を作ります。保証のない領域だからこそ、観測と改善のループが唯一の確かな方法です。全体設計は本文中で紹介した完全ガイド・LLMO対策の各記事にまとめています。