リファレンス · 読了 7 分

llms.txt と llms-full.txt の違い

どちらをいつ置くか、置いたら何が変わるか。

サイトのルートに置く 2 つのファイル。1 つは「うちのサイトはこういう内容で、 これらのページが重要です」と AI に伝えるもの。もう 1 つは 「そのページの本文を丸ごと渡しておきます」というもの。 ほとんどのサイトは 1 つ目だけで足ります。ドキュメント中心のサイトでは 2 つ目を併設する価値があります。

この記事は、その短いリファレンスです。それぞれが何のためのファイルで、 どんなときに llms-full.txt を上乗せする価値があるか、 Anthropic・Stripe・Cloudflare のような大規模採用事例は実際何を出しているのか ―― を整理します。

30 秒で分かる結論

llms.txt「編集された目次」です。 Markdown 形式の 1 ページにサイトの概要と 5 〜 25 件のリンクをまとめ、 AI に「うちはこういうサイトで、特にこのページを見て」と伝えます。

llms-full.txt「本文バンドル」です。 重要ページの本文を 1 つの Markdown ファイルに連結したもの。 AI が引用したいページを 1 件ずつ取りに行く手間を省きます。

どちらも 2024 年 9 月、Answer.AI の Jeremy Howard 氏が提案した仕様です。llms.txt の方が普及曲線は太く、llms-full.txt はドキュメント中心のサイト (コンテンツそのものがプロダクト)で採用が進んでいます。

llms.txtllms-full.txt
役割重要ページの目次(編集済)重要ページの本文一括
形式Markdown(H1・blockquote・リンクリスト)Markdown(各ページ本文を連結)
典型サイズ1 〜 20 KB50 KB 〜 数 MB
読み手どのページを取りに行くか決める AI回答時に本文を引用する AI
必須?推奨(事実上の標準化中)任意(主にドキュメントサイト)
更新タイミングサイト構造や上位ページが変わったときページ本文が変わったとき

llms-full.txt の中身

実体は、重要ページの Markdown 本文を H1 見出しで区切って連結しただけのものです。 イメージはこんな感じ。

# クイックスタート

5 分でクラスタを起動します。CLI をインストールし、`acme init` を実行して...

# API リファレンス

## 認証
すべてのリクエストは Authorization ヘッダの Bearer トークンを使います...

## エンドポイント
### POST /v1/search
インデックスに対してクエリを実行します...

# アーキテクチャ

インデックスはドキュメント ID でノード間にシャーディングされます。
各シャードは LSM ツリーを持ち...

慣習として、これだけです。XML もメタデータも、フロントマターも要りません。 H1 がページ境界を表し、それ以外はそのページの Markdown 本文。

llms-full.txt を公開する価値があるケース

一般的な企業サイト ―― サービス一覧、会社概要、料金、問い合わせ ―― では llms-full.txt はオーバースペックです。 ページが短く、AI は引用時に直接 HTML を取りに行けるし、llms.txt 側の編集された目次があれば十分仕事をします。

価値があるのは、次の 3 つのケースです。

  • ドキュメントサイト。プロダクトそのものがドキュメント (開発者ツール、API、ライブラリ)。Anthropic・Stripe・Cloudflare、 Mintlify でホストされているサイトはこの理由で llms-full.txt を出しています。
  • JavaScript レンダリングや会員制が多いサイト。 生の HTML から AI が読み取りにくい場合、Markdown でレンダリング済みの バンドルを別途用意することで、レンダリング問題を一度に回避できます。
  • 大規模なナレッジベース(社内ハンドブック、ポリシー集、 長文ブログ)。「サイトの要約」ではなく「自社の言い回しそのまま」で 引用してほしい場合に効きます。

これに該当しないなら、まず llms.txt 単体でリリースして問題ありません。llms-full.txt は後から足しても破綻しない設計です。

2 つのファイルがどう連携するか

AI がサイトを引用する際の流れは、おおむね次のようになります。

  • まず llms.txt を取得し、サイトの概要と 重要ページの一覧を把握する。
  • 引用したいページの本文が必要になった時点で、llms-full.txt があれば手元に本文がそろっている ―― 追加リクエストも HTML パースも不要。
  • llms-full.txt がなければ、対象 URL を 1 件ずつ取りに行き、 HTML から本文を抽出する。

報告ベースの効果として、AI が消費するトークンは HTML を直接読む場合に比べて1/10 程度に減ります。これは llms.txt 単独でも 言われている数字で、llms-full.txt はこの削減効果を「本文部分」にまで広げる役割です。 トークン予算の厳しい AI ほど、引用されやすくなります。

実例:大規模採用サイトは何を出しているか

  • Anthropic: docs.anthropic.com/llms.txt docs.anthropic.com/llms-full.txt の両方を公開。 フルバンドルには API リファレンスと Claude のドキュメントを含む。
  • Stripe: stripe.com/llms.txt stripe.com/llms-full.txt の両方。フルバンドルには 公開 API ドキュメントが Markdown で入っている。
  • Cloudflare・Vercel: ドキュメントサイトに llms.txt を公開。2026 年時点で、llms-full.txt の有無は採用しているドキュメント基盤 によって異なる。
  • Mintlify でホストされているサイト: 両方のファイルが 自動生成される。2025 〜 2026 年にかけて開発者向けドキュメントで 両方公開する例が増えたのは、これが理由。

llms-full.txt の作り方

手書きで書くものではありません。標準的な手順は次のとおり。

  • llms.txt のリンクリストにある URL を抽出する。
  • 各ページの本文を Markdown に書き出す (静的サイトジェネレーターやドキュメント基盤の多くは Markdown 出力に対応)。
  • H1 見出しでページ境界を区切って連結し、 https://yoursite.com/llms-full.txt で配信する。

Mintlify・GitBook・Docusaurus 系のプラットフォームでは、 llms-full.txt はチェックボックス 1 つや組み込み機能で生成できます。 自社管理サイトなら、llms.txt の URL リストを巡回して Markdown をシリアライズする小さなビルドスクリプトで十分です。

よくある失敗

  • llms.txt なしで llms-full.txt だけを置く。 AI が「どのページを引用するか」を選ぶための目次レイヤーが抜けます。 必ず両方、llms.txt を先に。
  • バンドルが古くなる。 ページ本文を更新したら llms-full.txt も再生成が必要。 半年前のバンドルが現在のドキュメントと食い違っている状態は、 バンドルが無いより悪くなります。
  • ログインが必要なページを含めてしまうllms-full.txt は公開ファイルです。「載せられるから」 という理由で会員限定コンテンツを混ぜないでください。あくまで認証なしで 読めるページに限定します。
  • URL がずれるllms-full.txt に含めるページ本文は、llms.txt に出てくる URL と対応している必要があります。 でないと、AI が引用文を自社サイトのページに紐づけ直せません。

よくある質問

llms-full.txt は llms.txt の仕様の一部ですか?

同じ提案者(Jeremy Howard 氏、2024 年 9 月)による「対の慣習」という位置づけです。仕様としては、重要ページの本文を 1 つの Markdown ファイルに連結したもの、と定義されていますが、公開はあくまで任意。llms.txt が基本形、llms-full.txt はその拡張版、と捉えてください。

AI は本当に llms-full.txt を読みに来ていますか?

ナビゲーションではなく本文そのものが必要なケースで読みに来る AI があります。ChatGPT・Claude・Perplexity が、llms-full.txt を公開しているドキュメントサイトで取得している様子は観測されています。ただし 2026 年時点で、llms.txt ほど普遍的ではありません。llms.txt を優先し、llms-full.txt はコンテンツが多いサイト向けの「上乗せ」として扱うのが現実的です。

llms-full.txt を公開するなら、llms.txt はもう不要ですか?

両方必要です。役割が違います。llms.txt は「どのページが重要か、どこにあるか」を AI に伝える目次。llms-full.txt は「そのページの中身」を渡すバンドル。llms-full.txt だけを公開すると、AI が引用するページを選ぶための「目次」レイヤーが抜け落ちます。

llms-full.txt はどれくらい大きくしていいですか?

仕様上の上限はありませんが、実務的には注意が必要です。AI には文脈長(コンテキストウィンドウ)があり、数 MB 規模のファイルは打ち切られたり読まれなかったりします。実例は、小規模なドキュメントサイトで 50 KB 程度、Anthropic や Stripe で数 MB クラス。数 MB を超えるなら「特に引用される上位ページに絞る」運用が安全です。

llms-full.txt は SEO(Google 順位)に効きますか?

直接の効果はありません。Google のランキングアルゴリズムは llms-full.txt を使っていません(2026 年 5 月時点)。llms.txt と同じく、これは AI 検索向けのファイルです。ただし、整える過程でサイト構造と主要ページの整理が進むので、間接的なコンテンツ改善効果はあります。

llms-full.txt を公開すると、AI が学習データに使ってしまうのでは?

サイト上に同じ内容を公開しているのと、リスクは同等です。llms-full.txt は「引用(retrieval)」のための成果物で、学習データへの組み込みを意図したものではありません。学習を止めたい場合は、robots.txt で GPTBot や ClaudeBot などをブロックします。これは HTML ページにも llms-full.txt にも同じく効きます。