llms.txtとは?書き方と設置方法
三橋竜彰・
llms.txtとは、大規模言語モデル(LLM)向けに、サイトの概要と主要コンテンツへのリンクを1つのMarkdownファイルで伝えるための提案仕様です。2024年9月にJeremy Howard氏が提唱しました。この記事では、llms.txtの仕様・書き方・設置方法を、本サイト(hitorideni.com)に実際に設置した実物を例に解説します。
筆者はSEO検定1級・ウェブ解析士として、AIによるSEO自動化を自社サイトで実践しています。llms.txtも「まず自分で設置して、その過程と結果を公開する」方針で扱います。
llms.txtとは何ですか?
llms.txtとは、Webサイトのルートに置く /llms.txt というMarkdownファイルで、AIがサイトを効率よく理解するための「AI向け案内板」です。
提案の背景には、LLMのコンテキストウィンドウ(一度に読める量)の制限があります。人間向けのHTMLページはナビゲーションや装飾が多く、AIが本質的な情報を拾うにはノイズが多い。そこで、サイトの要点と主要ページへのリンクを、AIが読みやすいMarkdownで1枚にまとめておくという発想です。robots.txtが「クローラーへの許可・拒否」を伝えるのに対し、llms.txtは「何がどこにあるか」を伝える、性格の違うファイルです。
llms.txtに効果はありますか?
正直にお伝えすると、執筆時点で、主要なAI検索事業者がllms.txtを公式にサポートすると明言している状況は確認できていません。効果は未確定です。
それでも筆者が本サイトに設置した理由は3つあります。
- コストがほぼゼロ: Markdownファイルを1枚書くだけで、リスクもありません。
- 仕様がシンプルで合理的: AI側の対応が進んだ場合、先に設置してあるサイトが恩恵を受ける可能性があります。
- 実証ブログとしての実験: 設置した結果(AIクローラーのアクセスログなど)を観測し、実データとして公開できます。
「効果があるからやる」ではなく「低コストな先行投資として設置し、効果を観測する」——これが現時点での正直な位置づけです。
llms.txtの書き方(仕様)
llms.txtの仕様はシンプルで、Markdownの基本構造だけで書けます。
| 要素 | 必須/任意 | 内容 |
|---|---|---|
H1見出し(#) | 必須 | サイト名・プロジェクト名。唯一の必須要素 |
引用ブロック(>) | 推奨 | サイトの短い要約 |
| 段落・リスト | 任意 | 補足説明 |
H2セクション(##) | 任意 | 主要ページのリンク集。[タイトル](URL): 説明の形式 |
## Optionalセクション | 任意 | 「コンテキストが足りない場合はスキップしてよい」URL群 |
ポイントは、H1が唯一の必須要素であること、リンクには簡潔な説明を添えること、そして「Optional」という名前のH2セクションだけは特別な意味(スキップ可能)を持つことです。
本サイトのllms.txt(実物)
本サイトに実際に設置しているllms.txtの全文です。https://hitorideni.com/llms.txt で公開しています。
# ヒトリデニ
> AIによるSEO完全自動化——サイト設計から記事作成・公開・分析まで——を実践し、
> その過程と実データを公開する実証ブログです。運営者はSEO検定1級・
> ウェブ解析士の三橋竜彰。
ヒトリデニ(hitorideni.com)は、AIでブログがひとりでに育つ仕組みづくりを、
運営者自身のサイトで実証するブログです。LLMO・AI検索最適化・SEO自動化に
関する一次情報(実装内容・実測データ・失敗例を含む)を扱います。
## 主要ページ
- [トップページ](https://hitorideni.com/): サイト概要
- [ブログ記事一覧](https://hitorideni.com/blog): 全記事のインデックス
- [運営者プロフィール](https://hitorideni.com/author/mitsuhashi): 著者の経歴・資格・執筆記事
## ブログ記事(LLMO・AI検索対策)
- [LLMOとは?AI時代の検索最適化 完全ガイド](https://hitorideni.com/blog/llmo-guide): LLMOの定義・仕組み・対策の全体像
- [LLMO対策のやり方【実測データ付き】](https://hitorideni.com/blog/llmo-taisaku): 実装手順と実測データ
(以下、記事を追加するたびに追記)
## Optional
- [sitemap](https://hitorideni.com/sitemap.xml): 全URLのサイトマップ
構成はシンプルに、(1)H1でサイト名、(2)引用ブロックでサイトの性格と運営者、(3)主要ページ、(4)記事リンク集、(5)Optionalにサイトマップ——としています。
llms.txtの設置方法
静的ファイルとして /llms.txt で配信できれば、どんな構成でも設置できます。
- Next.js:
public/llms.txtに置くだけでhttps://ドメイン/llms.txtで配信されます(本サイトはこの方式です)。 - WordPress: サーバーのドキュメントルート直下に
llms.txtをアップロードします(プラグインで生成する方法もあります)。 - その他の静的サイト: 公開ディレクトリの直下に置きます。
設置後はブラウザで https://自分のドメイン/llms.txt を開き、Markdownがそのまま表示されれば完了です。記事を公開するたびにリンクを追記し、実際のサイト構成と乖離させないことが運用のポイントです。
llms.txtを設置する際の注意点はありますか?
llms.txtは万能ではなく、位置づけの理解が大切です。
- robots.txtの代わりにはなりません: クローラーの許可・拒否はrobots.txtの役割です。AIクローラーの制御はLLMO対策のやり方【実測データ付き】のステップ1をご覧ください。
- sitemap.xmlの代わりにもなりません: 検索エンジン向けのURL一覧はsitemap.xmlの役割で、併存させます。
- 書いた内容が使われる保証はありません: 前述のとおり、対応状況は未確定です。過度な期待を持たず、低コストの整備として扱うのが健全です。
llms.txtはあくまでAI検索最適化の一要素です。全体の初期整備はAI検索最適化の始め方で手順化しています。
よくある質問
llms.txtとは何ですか?
大規模言語モデル(LLM)向けに、サイトの概要と主要コンテンツへのリンクを1つのMarkdownファイルで伝える提案仕様です。2024年9月にJeremy Howard氏が提唱しました。サイトのルートに /llms.txt として設置し、H1見出し(サイト名)が唯一の必須要素です。
llms.txtとrobots.txtはどう違いますか?
役割が異なります。robots.txtはクローラーに対する許可・拒否(アクセス制御)を伝えるファイルで、llms.txtはAIに対してサイトの概要と主要コンテンツの場所(案内)を伝えるファイルです。llms.txtはrobots.txtの代わりにはならず、両方を併存させます。
llms.txtを設置すればAIに引用されやすくなりますか?
保証はありません。執筆時点で、主要なAI検索事業者がllms.txtへの公式対応を明言している状況は確認できていません。設置コストがほぼゼロで、対応が進んだ場合に先行の恩恵を受けられる可能性がある、という低コストの先行投資として位置づけるのが現実的です。
llms.txtはどこに設置しますか?
サイトのルート直下(https://ドメイン/llms.txt)です。Next.jsならpublicディレクトリに、WordPressならドキュメントルート直下にファイルを置きます。ブラウザでURLを開いてMarkdownが表示されれば設置完了です。
llms-full.txtとは何ですか?
llms.txtの派生で、より多くのコンテンツを含めた完全版を指す使われ方をします。提唱元の例では、URLリストを省いた版と全文を含む版など、用途別に複数のファイルを生成する構成が示されています。まずは基本のllms.txtの設置から始めれば十分です。
まとめ
llms.txtとは、AIにサイトの構成を伝えるためのMarkdownファイルの提案仕様で、H1(サイト名)だけが必須というシンプルな作りです。効果は未確定である一方、設置コストはほぼゼロ——本サイトは「設置して観測する」先行投資として実装済みで、実物を本記事で公開しました。LLMO全体の文脈はLLMOとは?完全ガイドをご覧ください。