追うべき 4 つの指標
- 01
サーバーログのクローラー活動
AI ボット ―― GPTBot・ClaudeBot・PerplexityBot・Google-Extended・Applebot-Extended ―― が実際にあなたのページや llms.txt を取得した回数。公開後、最初に動く指標です。
- 02
AI ドメインからの参照流入
chat.openai.com・claude.ai・perplexity.ai・gemini.google.com・copilot.microsoft.com からの実ユーザーのクリック。GA4 等の解析ツールで見えます。
- 03
引用監査(月次)
月に 1 回、自社の顧客が聞きそうな質問を AI アシスタントに実際に投げ、引用元として表示されるかを確認する。手作業ですが、引用シェアを直接測れる唯一の指標です。
- 04
AI 経由トラフィックのサイト内行動
AI ドメインから来たユーザーの直帰率、ページ深度、コンバージョン率。「量」だけでなく「質」を見るための指標。
どれも単独では誤読しがちですが、4 つを並べて見ると、公開から 4 〜 8 週で「効いているかどうか」のかなり明瞭な像が浮かび上がります。
1. サーバーログのクローラー活動
何を測るか: AI アシスタントが実際にあなたの llms.txt や、そこから参照されているページを取りに来ているか。
なぜ重要か: AI ボットがファイルに到達できていないと、 その先のすべての指標は動きません。これはリーディングインジケーターであり、 トラブルシューティングのベースラインでもあります。
取得方法
従来型のサーバーなら、アクセスログを次の User-Agent で grep します。
GPTBot/ (OpenAI / ChatGPT browsing) ClaudeBot/ (Anthropic / Claude) PerplexityBot/ (Perplexity) Google-Extended (Google AI 系) Applebot-Extended (Apple Intelligence) Bingbot (Copilot は Bing 経由でも引用)
モダンな構成なら、もう少し楽な選択肢があります。
- Cloudflare Logpush: HTTP ログを R2 / S3 に出して SQL で集計。
cf-bot-managementが AI クローラーを ネイティブに分類してくれます。 - Cloudflare Workers Analytics Engine: Fire-and-forget なイベントストリーム。SQL で 90 日分を集計可能。 本サイトも
/api/crawlの集計に使っています。 - Vercel Web Analytics: AI ボットのトラフィックを 「AI」セグメントに自動集計してくれます。
- Plausible / Fathom / Umami: モダンな アクセス解析の多くは「AI ボット」の専用レポートを持っています。
見るべきポイント
/llms.txtの日次フェッチ数(ボット別)。 公開から 1 週間以内にゼロでなくなれば OK。llms.txt内に列挙したページの日次フェッチ数。列挙したページは、それ以外のページに比べて不釣り合いに多く ボットに踏まれているはず。- ステータスコードの分布。AI ボットへの 4xx・5xx は リグレッションです。他の指標を見る前に、まずここを直してください。
典型的なハマり所: robots.txt で GPTBot や ClaudeBot を Disallow していると、ファネル全体が静かに死にます。 計測を始める前に必ず一度監査してください。
2. AI ドメインからの参照流入
何を測るか: AI アシスタントの回答からリンクをクリックして 実際に訪問してくれた人間。
なぜ重要か: 「引用が訪問につながった」かどうかを示す 唯一の指標です。AI ボットがフェッチしているだけでは不十分。
追跡対象の参照元ドメイン
chat.openai.com chatgpt.com claude.ai perplexity.ai www.perplexity.ai copilot.microsoft.com gemini.google.com search.brave.com (Brave AI) you.com (You.com Smart)
GA4 でカスタムチャネルグループ「AI search」を作って これらのドメインをまとめておきます。セッション帰属は素直に効いてくれて、 この区切りでレポートが組めます。
見るべきポイント
- 週次セッション数(参照元別)。絶対値ではなくトレンドを見てください。 初期の AI 流入はノイズが大きいです。
- AI 参照元別のランディングページ。AI 流入は トップページに着地することがほぼありません。よく出るのは 特定のサービスページ・料金ページ・比較ページ・技術ドキュメント。
llms.txtで列挙したページに流入が集中しているなら、 「正しいページが届いている」サインです。 - 検索クエリ(取得できる場合)。Bing・Google AI Overviews・ 一部の Perplexity からの参照には検索クエリが付いて来ます。 通常のオーガニック検索クエリと同じように扱えます。
3. 引用監査(月次)
何を測るか: 自社の顧客が聞きそうな質問を AI に投げたとき、 自社サイトが引用元として表示されるか。
なぜ重要か: 引用シェアを直接観測できる唯一の方法。 ボットのフェッチも訪問者のクリックも、最終的にはここから派生します。
運用手順
- 代表的なクエリを 5 〜 10 個選ぶ。 実際の問い合わせ文面、SEO で狙っているキーワード、 比較系のプロンプト(「X vs Y」「◯◯におすすめの X」など)を含めます。
- ログアウト状態のブラウザで、ChatGPT・Claude・ Perplexity・Google AI Overviews(任意で Copilot)に投げます。 シークレットウィンドウを使って、パーソナライズの影響を排除します。
- クエリ × アシスタントごとに 3 つ記録: 引用されたか、引用順位、スニペットの文章(誰の文言が拾われたか)。
- 月次で再実行。AI の回答は Google 順位より動きが遅く、 月次のリズムで十分にトレンドが見えます。
追うべき指標
- 引用率=(自社が出てきたクエリ数)÷(総クエリ数)。 アシスタント間と時系列で比較します。
- 引用順位。1 番手の引用と 5 番手の引用は意味が違います。
- スニペット帰属。AI が言い換えているなら「引用されたが 引き写しではない」状態。AI があなたの文言をそのまま引用しているなら、 他者の回答にも自社の表現が伝播していく ―― これが最強の引用形態です。
小規模サイトなら、10 クエリ × 4 アシスタント × 月 1 回で約 1 時間の作業です。 やる価値は十分にあります。Otterly・Profound・Athena といった自動化ツールも 存在しますが、手作業のベースラインがそれらの精度を判定する材料になります。
4. AI 経由トラフィックのサイト内行動
何を測るか: AI から来たユーザーが、サイト上で ちゃんとコンバートしているか。
なぜ重要か: 週 200 セッションが ChatGPT 経由で来ても 全員直帰しているなら、引用がユーザーをミスリードしている可能性があります ―― あるいはページが重い、AI が古いセクションを引用している、など。 「量だけ」を喜ぶのではなく、原因を調査するべき指標です。
比較すべき指標
- 直帰率(AI 検索セグメント vs サイト平均)。
- セッションあたりページ数。AI ユーザーは 「1 ページを深く読む」傾向があり、1.2 〜 1.5 程度なら正常で健全です。
- コンバージョン率(AI 検索セグメント)。 定義は問い合わせ送信、無料トライアル登録、ニュースレター登録、 デモ予約など、自社で重要なものなら何でも構いません。
- 滞在時間。直帰率が高くて滞在時間が短い場合、 AI 側で答えはもう得たユーザーが「念のためソースを確認している」だけ、 という可能性があります。これは悪い結果ではなく、むしろ 「引用が効いている」サインです。文脈で読んでください。
月次ダッシュボード(最小構成)
高機能 BI は要りません。月 1 行のスプレッドシート、 列はこれだけで十分運用できます。
llms.txtの GPTBot / ClaudeBot / PerplexityBot 別フェッチ数- 同 3 つのボットによる、
llms.txt内 URL のフェッチ数(合計) - AI 検索からの参照セッション数(解析ツールから)
- AI 検索からの参照コンバージョン数
- 月次の引用監査による引用率
- 1 行メモ: その月に変えたもの(コンテンツ、llms.txt、robots.txt)
3 か月分の行が並べばベースラインができます。 6 か月でノイズと傾向が区別できるようになります。
計測しなくていいもの
- ボット総アクセス数の「桁の大きさ」。 キャッシュ設定の不備で
/llms.txtが 1 万回 fetch されても、 それは効果ではありません。 - アシスタント不明の「AI らしきトラフィック」。 帰属が取れないトラフィックは背景ノイズとして扱い、 帰属が明確なセッションだけを追ってください。
- 1 回限りの引用。AI に 1 度引用された、はパターンではありません。 4 週間以上のトレンドで判断してください。
よくある質問
llms.txt の効果はどれくらいで測れるようになりますか?
AI ボット(GPTBot・ClaudeBot・PerplexityBot)のクロールは、通常公開から数日でアクセスログに現れます。引用への影響やサイトへの参照流入はもう少し時間がかかり、週単位 〜 月単位で積み上がっていきます。目安としては、1 〜 2 週目にログでクローラー活動が見え、4 〜 8 週目で参照流入が動き始め、最初の四半期で安定したパターンが現れる、という流れです。
AI からの参照流入は Google Analytics でどう見えますか?
AI アシスタントは独自ドメインでリンクします。代表的な参照元は chat.openai.com、chatgpt.com、claude.ai、perplexity.ai、copilot.microsoft.com、gemini.google.com など。これらを GA4 のカスタムチャネルグループ「AI search」としてまとめて運用するのが定番です。セッションは短く、特定の深いページに直接ランディングして直帰または即コンバートする傾向があります。
Google AI Overviews への引用は Search Console で追えますか?
部分的に追えます。2026 年時点で、AI Overviews での引用は通常の Search Console の検索クエリと同じ枠で表示・クリックがカウントされており、専用の「AI Overview」フィルタはありません。ただし引用されたページは「表示数に対するクリック率の比率」が変わる傾向があり、これと月次の引用監査(後述)を突き合わせると、AI Overviews 経由の影響を切り分けられます。
llms.txt は A/B テストできますか?
Google ランキングのような「リダイレクトで分割テスト」はできません。AI アシスタントは自由に分割できないからです。現実的には Before / After の比較になります。4 週間のベースラインを取り、llms.txt を公開し、その後 4 〜 8 週間同じ指標で計測します。大規模サイトであれば「セクション単位の出し分け」(llms.txt にドキュメントの半分だけ列挙して、どのセクションが引用されやすくなるかを比較)も可能です。
1 つだけ重視するなら、どの指標がいいですか?
サーバーログでの AI ボットのフェッチ数です。公開から数日で動き、計測も簡単で、最終的な引用活動と相関します。2 週経っても GPTBot や ClaudeBot が llms.txt を取得していなければ、何かが間違っています(robots.txt でブロックされている、Content-Type が違う、ファイルがルートにない)。まずそこを直してください ―― 他の指標は全部、ここが動いていることが前提です。
全部の AI ボットを追うべき? それとも主要 3 つだけ?
最低限、GPTBot・ClaudeBot・PerplexityBot は追ってください ―― ボリュームの大半はこの 3 つです。Bard / Gemini や Apple Intelligence の影響まで見たければ Google-Extended と Applebot-Extended を追加。マイナーボットは大量に存在しますが、引用流入に直結することは稀で、追ってもノイズになりがちです。