実践ガイド · 読了 9 分

AI 検索の効果計測の仕方

動かすべき 4 つの指標。

ChatGPT 用の Search Console はまだありません。 「llms.txt を入れたら 30% 流入が伸びました」と言うマーケターは、 たいてい 1 つのグラフを指して残り全部を無視しています。 とはいえ、計測不能というわけではありません。 4 つの異なる指標を 三角測量 する必要がある、というだけです。

これは私たち自身が運用している計測プレイブックです。 すでに llms.txt は公開済で、「効いているのかどうか」を 知りたい段階を想定しています。

追うべき 4 つの指標

  1. 01

    サーバーログのクローラー活動

    AI ボット ―― GPTBot・ClaudeBot・PerplexityBot・Google-Extended・Applebot-Extended ―― が実際にあなたのページや llms.txt を取得した回数。公開後、最初に動く指標です。

  2. 02

    AI ドメインからの参照流入

    chat.openai.com・claude.ai・perplexity.ai・gemini.google.com・copilot.microsoft.com からの実ユーザーのクリック。GA4 等の解析ツールで見えます。

  3. 03

    引用監査(月次)

    月に 1 回、自社の顧客が聞きそうな質問を AI アシスタントに実際に投げ、引用元として表示されるかを確認する。手作業ですが、引用シェアを直接測れる唯一の指標です。

  4. 04

    AI 経由トラフィックのサイト内行動

    AI ドメインから来たユーザーの直帰率、ページ深度、コンバージョン率。「量」だけでなく「質」を見るための指標。

どれも単独では誤読しがちですが、4 つを並べて見ると、公開から 4 〜 8 週で「効いているかどうか」のかなり明瞭な像が浮かび上がります。

1. サーバーログのクローラー活動

何を測るか: AI アシスタントが実際にあなたの llms.txt や、そこから参照されているページを取りに来ているか。

なぜ重要か: AI ボットがファイルに到達できていないと、 その先のすべての指標は動きません。これはリーディングインジケーターであり、 トラブルシューティングのベースラインでもあります。

取得方法

従来型のサーバーなら、アクセスログを次の User-Agent で grep します。

GPTBot/         (OpenAI / ChatGPT browsing)
ClaudeBot/      (Anthropic / Claude)
PerplexityBot/  (Perplexity)
Google-Extended (Google AI 系)
Applebot-Extended (Apple Intelligence)
Bingbot          (Copilot は Bing 経由でも引用)

モダンな構成なら、もう少し楽な選択肢があります。

  • Cloudflare Logpush: HTTP ログを R2 / S3 に出して SQL で集計。cf-bot-management が AI クローラーを ネイティブに分類してくれます。
  • Cloudflare Workers Analytics Engine: Fire-and-forget なイベントストリーム。SQL で 90 日分を集計可能。 本サイトも /api/crawl の集計に使っています。
  • Vercel Web Analytics: AI ボットのトラフィックを 「AI」セグメントに自動集計してくれます。
  • Plausible / Fathom / Umami: モダンな アクセス解析の多くは「AI ボット」の専用レポートを持っています。

見るべきポイント

  • /llms.txt の日次フェッチ数(ボット別)。 公開から 1 週間以内にゼロでなくなれば OK。
  • llms.txt 内に列挙したページの日次フェッチ数。列挙したページは、それ以外のページに比べて不釣り合いに多く ボットに踏まれているはず。
  • ステータスコードの分布。AI ボットへの 4xx・5xx は リグレッションです。他の指標を見る前に、まずここを直してください。

典型的なハマり所: robots.txt で GPTBot や ClaudeBot を Disallow していると、ファネル全体が静かに死にます。 計測を始める前に必ず一度監査してください。

2. AI ドメインからの参照流入

何を測るか: AI アシスタントの回答からリンクをクリックして 実際に訪問してくれた人間。

なぜ重要か: 「引用が訪問につながった」かどうかを示す 唯一の指標です。AI ボットがフェッチしているだけでは不十分。

追跡対象の参照元ドメイン

chat.openai.com
chatgpt.com
claude.ai
perplexity.ai
www.perplexity.ai
copilot.microsoft.com
gemini.google.com
search.brave.com  (Brave AI)
you.com           (You.com Smart)

GA4 でカスタムチャネルグループ「AI search」を作って これらのドメインをまとめておきます。セッション帰属は素直に効いてくれて、 この区切りでレポートが組めます。

見るべきポイント

  • 週次セッション数(参照元別)。絶対値ではなくトレンドを見てください。 初期の AI 流入はノイズが大きいです。
  • AI 参照元別のランディングページ。AI 流入は トップページに着地することがほぼありません。よく出るのは 特定のサービスページ・料金ページ・比較ページ・技術ドキュメント。llms.txt で列挙したページに流入が集中しているなら、 「正しいページが届いている」サインです。
  • 検索クエリ(取得できる場合)。Bing・Google AI Overviews・ 一部の Perplexity からの参照には検索クエリが付いて来ます。 通常のオーガニック検索クエリと同じように扱えます。

3. 引用監査(月次)

何を測るか: 自社の顧客が聞きそうな質問を AI に投げたとき、 自社サイトが引用元として表示されるか。

なぜ重要か: 引用シェアを直接観測できる唯一の方法。 ボットのフェッチも訪問者のクリックも、最終的にはここから派生します。

運用手順

  1. 代表的なクエリを 5 〜 10 個選ぶ。 実際の問い合わせ文面、SEO で狙っているキーワード、 比較系のプロンプト(「X vs Y」「◯◯におすすめの X」など)を含めます。
  2. ログアウト状態のブラウザで、ChatGPT・Claude・ Perplexity・Google AI Overviews(任意で Copilot)に投げます。 シークレットウィンドウを使って、パーソナライズの影響を排除します。
  3. クエリ × アシスタントごとに 3 つ記録: 引用されたか、引用順位、スニペットの文章(誰の文言が拾われたか)。
  4. 月次で再実行。AI の回答は Google 順位より動きが遅く、 月次のリズムで十分にトレンドが見えます。

追うべき指標

  • 引用率=(自社が出てきたクエリ数)÷(総クエリ数)。 アシスタント間と時系列で比較します。
  • 引用順位。1 番手の引用と 5 番手の引用は意味が違います。
  • スニペット帰属。AI が言い換えているなら「引用されたが 引き写しではない」状態。AI があなたの文言をそのまま引用しているなら、 他者の回答にも自社の表現が伝播していく ―― これが最強の引用形態です。

小規模サイトなら、10 クエリ × 4 アシスタント × 月 1 回で約 1 時間の作業です。 やる価値は十分にあります。Otterly・Profound・Athena といった自動化ツールも 存在しますが、手作業のベースラインがそれらの精度を判定する材料になります。

4. AI 経由トラフィックのサイト内行動

何を測るか: AI から来たユーザーが、サイト上で ちゃんとコンバートしているか。

なぜ重要か: 週 200 セッションが ChatGPT 経由で来ても 全員直帰しているなら、引用がユーザーをミスリードしている可能性があります ―― あるいはページが重い、AI が古いセクションを引用している、など。 「量だけ」を喜ぶのではなく、原因を調査するべき指標です。

比較すべき指標

  • 直帰率(AI 検索セグメント vs サイト平均)。
  • セッションあたりページ数。AI ユーザーは 「1 ページを深く読む」傾向があり、1.2 〜 1.5 程度なら正常で健全です。
  • コンバージョン率(AI 検索セグメント)。 定義は問い合わせ送信、無料トライアル登録、ニュースレター登録、 デモ予約など、自社で重要なものなら何でも構いません。
  • 滞在時間。直帰率が高くて滞在時間が短い場合、 AI 側で答えはもう得たユーザーが「念のためソースを確認している」だけ、 という可能性があります。これは悪い結果ではなく、むしろ 「引用が効いている」サインです。文脈で読んでください。

月次ダッシュボード(最小構成)

高機能 BI は要りません。月 1 行のスプレッドシート、 列はこれだけで十分運用できます。

  • llms.txt の GPTBot / ClaudeBot / PerplexityBot 別フェッチ数
  • 同 3 つのボットによる、llms.txt 内 URL のフェッチ数(合計)
  • AI 検索からの参照セッション数(解析ツールから)
  • AI 検索からの参照コンバージョン数
  • 月次の引用監査による引用率
  • 1 行メモ: その月に変えたもの(コンテンツ、llms.txt、robots.txt)

3 か月分の行が並べばベースラインができます。 6 か月でノイズと傾向が区別できるようになります。

計測しなくていいもの

  • ボット総アクセス数の「桁の大きさ」。 キャッシュ設定の不備で /llms.txt が 1 万回 fetch されても、 それは効果ではありません。
  • アシスタント不明の「AI らしきトラフィック」。 帰属が取れないトラフィックは背景ノイズとして扱い、 帰属が明確なセッションだけを追ってください。
  • 1 回限りの引用。AI に 1 度引用された、はパターンではありません。 4 週間以上のトレンドで判断してください。

よくある質問

llms.txt の効果はどれくらいで測れるようになりますか?

AI ボット(GPTBot・ClaudeBot・PerplexityBot)のクロールは、通常公開から数日でアクセスログに現れます。引用への影響やサイトへの参照流入はもう少し時間がかかり、週単位 〜 月単位で積み上がっていきます。目安としては、1 〜 2 週目にログでクローラー活動が見え、4 〜 8 週目で参照流入が動き始め、最初の四半期で安定したパターンが現れる、という流れです。

AI からの参照流入は Google Analytics でどう見えますか?

AI アシスタントは独自ドメインでリンクします。代表的な参照元は chat.openai.com、chatgpt.com、claude.ai、perplexity.ai、copilot.microsoft.com、gemini.google.com など。これらを GA4 のカスタムチャネルグループ「AI search」としてまとめて運用するのが定番です。セッションは短く、特定の深いページに直接ランディングして直帰または即コンバートする傾向があります。

Google AI Overviews への引用は Search Console で追えますか?

部分的に追えます。2026 年時点で、AI Overviews での引用は通常の Search Console の検索クエリと同じ枠で表示・クリックがカウントされており、専用の「AI Overview」フィルタはありません。ただし引用されたページは「表示数に対するクリック率の比率」が変わる傾向があり、これと月次の引用監査(後述)を突き合わせると、AI Overviews 経由の影響を切り分けられます。

llms.txt は A/B テストできますか?

Google ランキングのような「リダイレクトで分割テスト」はできません。AI アシスタントは自由に分割できないからです。現実的には Before / After の比較になります。4 週間のベースラインを取り、llms.txt を公開し、その後 4 〜 8 週間同じ指標で計測します。大規模サイトであれば「セクション単位の出し分け」(llms.txt にドキュメントの半分だけ列挙して、どのセクションが引用されやすくなるかを比較)も可能です。

1 つだけ重視するなら、どの指標がいいですか?

サーバーログでの AI ボットのフェッチ数です。公開から数日で動き、計測も簡単で、最終的な引用活動と相関します。2 週経っても GPTBot や ClaudeBot が llms.txt を取得していなければ、何かが間違っています(robots.txt でブロックされている、Content-Type が違う、ファイルがルートにない)。まずそこを直してください ―― 他の指標は全部、ここが動いていることが前提です。

全部の AI ボットを追うべき? それとも主要 3 つだけ?

最低限、GPTBot・ClaudeBot・PerplexityBot は追ってください ―― ボリュームの大半はこの 3 つです。Bard / Gemini や Apple Intelligence の影響まで見たければ Google-Extended と Applebot-Extended を追加。マイナーボットは大量に存在しますが、引用流入に直結することは稀で、追ってもノイズになりがちです。