llms.txt と AI 検索の効果計測の仕方

追うべき 4 つの指標

01
サーバーログのクローラー活動
AI ボット ―― GPTBot・ClaudeBot・PerplexityBot・Google-Extended・Applebot-Extended ―― が実際にあなたのページや llms.txt を取得した回数。公開後、最初に動く指標です。
02
AI ドメインからの参照流入
chat.openai.com・claude.ai・perplexity.ai・gemini.google.com・copilot.microsoft.com からの実ユーザーのクリック。GA4 等の解析ツールで見えます。
03
引用監査(月次)
月に 1 回、自社の顧客が聞きそうな質問を AI アシスタントに実際に投げ、引用元として表示されるかを確認する。手作業ですが、引用シェアを直接測れる唯一の指標です。
04
AI 経由トラフィックのサイト内行動
AI ドメインから来たユーザーの直帰率、ページ深度、コンバージョン率。「量」だけでなく「質」を見るための指標。

どれも単独では誤読しがちですが、4 つを並べて見ると、公開から 4 〜 8 週で「効いているかどうか」のかなり明瞭な像が浮かび上がります。

1. サーバーログのクローラー活動

何を測るか: AI アシスタントが実際にあなたの llms.txt や、そこから参照されているページを取りに来ているか。

なぜ重要か: AI ボットがファイルに到達できていないと、その先のすべての指標は動きません。これはリーディングインジケーターであり、トラブルシューティングのベースラインでもあります。

取得方法

従来型のサーバーなら、アクセスログを次の User-Agent で grep します。

GPTBot/         (OpenAI / ChatGPT browsing)
ClaudeBot/      (Anthropic / Claude)
PerplexityBot/  (Perplexity)
Google-Extended (Google AI 系)
Applebot-Extended (Apple Intelligence)
Bingbot          (Copilot は Bing 経由でも引用)

モダンな構成なら、もう少し楽な選択肢があります。

Cloudflare Logpush: HTTP ログを R2 / S3 に出して SQL で集計。cf-bot-management が AI クローラーをネイティブに分類してくれます。
Cloudflare Workers Analytics Engine: Fire-and-forget なイベントストリーム。SQL で 90 日分を集計可能。本サイトも /api/crawl の集計に使っています。
Vercel Web Analytics: AI ボットのトラフィックを「AI」セグメントに自動集計してくれます。
Plausible / Fathom / Umami: モダンなアクセス解析の多くは「AI ボット」の専用レポートを持っています。

見るべきポイント

/llms.txt の日次フェッチ数(ボット別)。公開から 1 週間以内にゼロでなくなれば OK。
llms.txt 内に列挙したページの日次フェッチ数。列挙したページは、それ以外のページに比べて不釣り合いに多くボットに踏まれているはず。
ステータスコードの分布。AI ボットへの 4xx・5xx はリグレッションです。他の指標を見る前に、まずここを直してください。

典型的なハマり所: robots.txt で GPTBot や ClaudeBot を Disallow していると、ファネル全体が静かに死にます。計測を始める前に必ず一度監査してください。

2. AI ドメインからの参照流入

何を測るか: AI アシスタントの回答からリンクをクリックして実際に訪問してくれた人間。

なぜ重要か: 「引用が訪問につながった」かどうかを示す唯一の指標です。AI ボットがフェッチしているだけでは不十分。

追跡対象の参照元ドメイン

chat.openai.com
chatgpt.com
claude.ai
perplexity.ai
www.perplexity.ai
copilot.microsoft.com
gemini.google.com
search.brave.com  (Brave AI)
you.com           (You.com Smart)

GA4 でカスタムチャネルグループ「AI search」を作ってこれらのドメインをまとめておきます。セッション帰属は素直に効いてくれて、この区切りでレポートが組めます。

見るべきポイント

週次セッション数(参照元別)。絶対値ではなくトレンドを見てください。初期の AI 流入はノイズが大きいです。
AI 参照元別のランディングページ。AI 流入はトップページに着地することがほぼありません。よく出るのは特定のサービスページ・料金ページ・比較ページ・技術ドキュメント。llms.txt で列挙したページに流入が集中しているなら、「正しいページが届いている」サインです。
検索クエリ(取得できる場合)。Bing・Google AI Overviews・一部の Perplexity からの参照には検索クエリが付いて来ます。通常のオーガニック検索クエリと同じように扱えます。

3. 引用監査(月次)

何を測るか: 自社の顧客が聞きそうな質問を AI に投げたとき、自社サイトが引用元として表示されるか。

なぜ重要か: 引用シェアを直接観測できる唯一の方法。ボットのフェッチも訪問者のクリックも、最終的にはここから派生します。

運用手順

代表的なクエリを 5 〜 10 個選ぶ。実際の問い合わせ文面、SEO で狙っているキーワード、比較系のプロンプト(「X vs Y」「◯◯におすすめの X」など)を含めます。
ログアウト状態のブラウザで、ChatGPT・Claude・ Perplexity・Google AI Overviews(任意で Copilot)に投げます。シークレットウィンドウを使って、パーソナライズの影響を排除します。
クエリ × アシスタントごとに 3 つ記録: 引用されたか、引用順位、スニペットの文章(誰の文言が拾われたか)。
月次で再実行。AI の回答は Google 順位より動きが遅く、月次のリズムで十分にトレンドが見えます。

追うべき指標

引用率=(自社が出てきたクエリ数)÷(総クエリ数)。アシスタント間と時系列で比較します。
引用順位。1 番手の引用と 5 番手の引用は意味が違います。
スニペット帰属。AI が言い換えているなら「引用されたが引き写しではない」状態。AI があなたの文言をそのまま引用しているなら、他者の回答にも自社の表現が伝播していく ―― これが最強の引用形態です。

小規模サイトなら、10 クエリ × 4 アシスタント × 月 1 回で約 1 時間の作業です。やる価値は十分にあります。Otterly・Profound・Athena といった自動化ツールも存在しますが、手作業のベースラインがそれらの精度を判定する材料になります。

4. AI 経由トラフィックのサイト内行動

何を測るか: AI から来たユーザーが、サイト上でちゃんとコンバートしているか。

なぜ重要か: 週 200 セッションが ChatGPT 経由で来ても全員直帰しているなら、引用がユーザーをミスリードしている可能性があります ―― あるいはページが重い、AI が古いセクションを引用している、など。「量だけ」を喜ぶのではなく、原因を調査するべき指標です。

比較すべき指標

直帰率(AI 検索セグメント vs サイト平均)。
セッションあたりページ数。AI ユーザーは「1 ページを深く読む」傾向があり、1.2 〜 1.5 程度なら正常で健全です。
コンバージョン率(AI 検索セグメント)。定義は問い合わせ送信、無料トライアル登録、ニュースレター登録、デモ予約など、自社で重要なものなら何でも構いません。
滞在時間。直帰率が高くて滞在時間が短い場合、 AI 側で答えはもう得たユーザーが「念のためソースを確認している」だけ、という可能性があります。これは悪い結果ではなく、むしろ「引用が効いている」サインです。文脈で読んでください。

月次ダッシュボード(最小構成)

高機能 BI は要りません。月 1 行のスプレッドシート、列はこれだけで十分運用できます。

llms.txt の GPTBot / ClaudeBot / PerplexityBot 別フェッチ数
同 3 つのボットによる、llms.txt 内 URL のフェッチ数(合計)
AI 検索からの参照セッション数(解析ツールから)
AI 検索からの参照コンバージョン数
月次の引用監査による引用率
1 行メモ: その月に変えたもの(コンテンツ、llms.txt、robots.txt)

3 か月分の行が並べばベースラインができます。 6 か月でノイズと傾向が区別できるようになります。

計測しなくていいもの

ボット総アクセス数の「桁の大きさ」。キャッシュ設定の不備で /llms.txt が 1 万回 fetch されても、それは効果ではありません。
アシスタント不明の「AI らしきトラフィック」。帰属が取れないトラフィックは背景ノイズとして扱い、帰属が明確なセッションだけを追ってください。
1 回限りの引用。AI に 1 度引用された、はパターンではありません。 4 週間以上のトレンドで判断してください。

よくある質問

llms.txt の効果はどれくらいで測れるようになりますか?

AI ボット(GPTBot・ClaudeBot・PerplexityBot)のクロールは、通常公開から数日でアクセスログに現れます。引用への影響やサイトへの参照流入はもう少し時間がかかり、週単位〜月単位で積み上がっていきます。目安としては、1 〜 2 週目にログでクローラー活動が見え、4 〜 8 週目で参照流入が動き始め、最初の四半期で安定したパターンが現れる、という流れです。

AI からの参照流入は Google Analytics でどう見えますか?

AI アシスタントは独自ドメインでリンクします。代表的な参照元は chat.openai.com、chatgpt.com、claude.ai、perplexity.ai、copilot.microsoft.com、gemini.google.com など。これらを GA4 のカスタムチャネルグループ「AI search」としてまとめて運用するのが定番です。セッションは短く、特定の深いページに直接ランディングして直帰または即コンバートする傾向があります。

Google AI Overviews への引用は Search Console で追えますか?

部分的に追えます。2026 年時点で、AI Overviews での引用は通常の Search Console の検索クエリと同じ枠で表示・クリックがカウントされており、専用の「AI Overview」フィルタはありません。ただし引用されたページは「表示数に対するクリック率の比率」が変わる傾向があり、これと月次の引用監査(後述)を突き合わせると、AI Overviews 経由の影響を切り分けられます。

llms.txt は A/B テストできますか?

Google ランキングのような「リダイレクトで分割テスト」はできません。AI アシスタントは自由に分割できないからです。現実的には Before / After の比較になります。4 週間のベースラインを取り、llms.txt を公開し、その後 4 〜 8 週間同じ指標で計測します。大規模サイトであれば「セクション単位の出し分け」(llms.txt にドキュメントの半分だけ列挙して、どのセクションが引用されやすくなるかを比較)も可能です。

1 つだけ重視するなら、どの指標がいいですか?

サーバーログでの AI ボットのフェッチ数です。公開から数日で動き、計測も簡単で、最終的な引用活動と相関します。2 週経っても GPTBot や ClaudeBot が llms.txt を取得していなければ、何かが間違っています(robots.txt でブロックされている、Content-Type が違う、ファイルがルートにない)。まずそこを直してください ―― 他の指標は全部、ここが動いていることが前提です。

全部の AI ボットを追うべき? それとも主要 3 つだけ?

最低限、GPTBot・ClaudeBot・PerplexityBot は追ってください ―― ボリュームの大半はこの 3 つです。Bard / Gemini や Apple Intelligence の影響まで見たければ Google-Extended と Applebot-Extended を追加。マイナーボットは大量に存在しますが、引用流入に直結することは稀で、追ってもノイズになりがちです。

AI 検索の効果計測の仕方

追うべき 4 つの指標

1. サーバーログのクローラー活動

取得方法

見るべきポイント

2. AI ドメインからの参照流入

追跡対象の参照元ドメイン

見るべきポイント

3. 引用監査(月次)

運用手順

追うべき指標

4. AI 経由トラフィックのサイト内行動

比較すべき指標

月次ダッシュボード(最小構成)

計測しなくていいもの

よくある質問

次に読む