実践ガイド · 読了 6 分

AI 検索に拾われたか確認する方法

設置から 1 か月のチェックリスト。

llms.txt を公開し、検証ツールも通り、 robots.txt でクローラーをブロックしていないことも確認した。 ―― 次は何をするべきか。正直なところ、最初の 1 か月の主目的は「配管が機能していること」の確認で、引用シェアを誇るタイミングではありません。

これは私たち自身が運用しているチェックリストです。有料ツールは要らず、 コードも書かず、それでいて小規模サイトで実際に AI 検索を壊している 典型的な問題を浮き彫りにできます。

4 つのチェック項目

最初の 1 か月は、4 つすべてを週 1 回ずつ。それ以降は月 1 回で十分です。 それぞれ、答えるべき問いは 1 つだけ。

  1. 01

    ファイルは到達可能か?

    /llms.txt が正しいヘッダで配信されているかの確認。AI 流入がゼロのとき、原因はコンテンツではなくファイル不通であることがほとんどです。

  2. 02

    AI ボットは取得しに来ているか?

    ChatGPT の GPTBot、Anthropic の ClaudeBot、Perplexity の PerplexityBot が実際にアクセスしているかの確認。来ていないなら、まずそこを直す。

  3. 03

    引用はされているか?

    手動で直接確認します。自社の顧客が聞きそうな質問を AI に投げ、引用元リストに自社が出るかを見ます。

  4. 04

    AI 経由で誰か来ているか?

    chat.openai.com・claude.ai・perplexity.ai 等からの参照流入。引用がクリックに転換した証拠です。

Check 1. ファイルは到達可能か?

やること: シークレット/プライベートウィンドウで https://yoursite.com/llms.txt を開きます。 開発者ツール(F12)→ Network タブを開き、リロード。

確認すること:

  • ステータスコード 200 ―― 301 でも 404 でも、 リダイレクトチェーンでもないこと。
  • Content-Type は text/plain または text/markdownapplication/octet-stream になっていると、 一部の AI クローラーがスキップします。
  • Markdown がプレーンテキストとしてブラウザに表示される―― HTML としてレンダリングされない、ダウンロードが始まらない。
  • 本サイトの検証ツールで仕様違反ゼロ。 直したと宣言する前に必ず通してください。

典型的な不具合: http:// から https:// への 301 リダイレクトを 一部の AI クローラーが追えない。CDN 設定の不備で Content-Type が剥がれている。 SPA がリクエストを横取りして、ファイルではなく HTML シェルを返している、など。

Check 2. AI ボットは取得しに来ているか?

やること: サーバーのアクセスログ(または CDN ログ)を、 次の User-Agent 文字列で grep します。

GPTBot/         (OpenAI / ChatGPT browsing)
ChatGPT-User/   (ログイン中の ChatGPT ユーザーがアシスタント経由で閲覧)
ClaudeBot/      (Anthropic / Claude)
PerplexityBot/  (Perplexity)
Google-Extended (Google AI 系: Bard・Gemini・AI Overviews)
Applebot-Extended (Apple Intelligence)

確認すること:

  • 公開から 7 〜 14 日以内に、主要ボットそれぞれ最低 1 回のフェッチ。GPTBot が最も早く現れる傾向で、ClaudeBot と PerplexityBot がそれに続きます。
  • llms.txt 内の URL も同じボットが取得しに来ている―― ファイル単体ではなくリストの中身も読まれている、というシグナル。
  • ステータスは 2xx。AI ボットへの 4xx・5xx は、 引用ファネルを静かに壊します。

2 週経ってもボットが来ていない場合:

  • robots.txtUser-agent: GPTBot User-agent: ClaudeBot 配下で意図せず Disallow: / を入れていないか。
  • Cloudflare やファイアウォールの「Block AI Scrapers」ルール ―― 多くの WAF はデフォルト有効でこのルールを持っています。
  • ペイウォール・ジオフェンス・ログインウォールの後ろに置かれていて、 AI ボットが越えられない構造になっていないか。
  • Content-Type をもう一度確認。AI ボットはブラウザより MIME タイプに厳しいです。

Check 3. 引用はされているか?

やること: 自社の顧客が実際に聞きそうな質問を 5 〜 10 個選び、 ログアウト状態のブラウザで次のアシスタントに対して投げます。

  • ChatGPT(ブラウジング ON)
  • Claude(Web 検索 ON)
  • Perplexity
  • Google AI Overviews(通常の Google 検索でよい)
  • 任意: Copilot、Brave AI、You.com

クエリ × アシスタントごとに、3 つを記録します。

  • 引用元リストに自社が出たか(yes / no)。
  • 引用順位(1 番目、2 番目、…)。
  • 拾われた文言は誰のものか ―― 自社、競合、あるいは AI による要約。

1 か月目の「正常」目安:

  • 指名検索(「<自社名>」「<自社名> 料金」)では、すぐに出るはず。 出ないなら、引用シェア以前に llms.txt や各ページタイトルに問題があります。
  • 中尾クエリ(「東京 社労士」「造園会社向け CRM」)では、 4 〜 5 アシスタントのうち 0 〜 3 件の引用が現れる程度が初月の目安。 引用は、コンテンツの厚みと時間とともに積み上がっていきます。
  • ヘッドクエリ(「best CRM」「税務ソフト」)では、初月に引用を期待しないでください。 既存大手が枠を独占しています。中尾クエリが主戦場です。

Tip: シークレットウィンドウを使い、可能なら別 IP からも実行を。 ログイン状態のセッションは回答がパーソナライズされ、監査結果が歪みます。

Check 4. AI 経由で誰か来ているか?

やること: 解析ツール(GA4・Plausible 等)で、 参照元別のセッションを見ます。次のドメインでフィルタ。

chat.openai.com    chatgpt.com
claude.ai
perplexity.ai      www.perplexity.ai
copilot.microsoft.com
gemini.google.com
search.brave.com
you.com

確認すること:

  • 絶対値ではなくトレンド。 1 週目に 5 セッション、4 週目に 25 セッションなら強いシグナル。 1 週目 25・4 週目 25 は横ばいで、効果は出ていません。
  • ランディングページ。AI 流入はトップページに着地することがほぼなく、 質問に答える特定のページに直接ランディングします。llms.txt で列挙したページに集中していれば「正しいページが届いている」サイン。 そうなっていないなら、説明文が一般的すぎる可能性大。
  • サイト内行動。AI 流入は「短時間・高意図」が普通です。 1.2 ページ/セッション、滞在 60 秒前後は健全な範囲 ―― AI 側で文脈を得たユーザーは、それ以上ブラウズしません。

パターン別の診断

ボットは来ている、でも引用されない

これは大半がコンテンツの問題で、配管の問題ではありません。llms.txt に列挙したページは技術的には到達可能だが、 ユーザーの質問には答えていない、という状態。 自社ではなく 競合 が引用された AI の引用スニペットを見比べてください。 ―― そのページにあって、自社ページにないものは何か? 具体的な数字? 名指しの比較? 明確な所在地と対象顧客? 足りていないものを補ってください。

引用はされているが、流入がない

可能性は 2 つ。(1) AI が回答内で完結させているのでクリックの必要がない ―― この場合でもブランド露出としての価値はあります。 (2) 引用が長いソースリストの後ろの方に埋もれていて、ユーザーは上位だけクリックする ―― この場合の打ち手は「1 〜 2 番目に引用される」こと。 それは「そのクエリに対して、ネット上で最も具体的なページであること」から来ます。

流入はあるが、コンバージョンしない

ほぼ常にランディングページのミスマッチです。AI は質問に答えるページに送り込んでいるが、 そこから次のアクションに進める導線がない。 AI 流入が多いページに、明確な CTA(予約リンク・登録フォーム・連絡先)を足して、 再計測してください。

何も動いていない

Check 1 をやり直してください。完全に静かなときの最頻原因は、/llms.txt が「実は配信されていない」か、 「Content-Type が違う」かのどちらか。 よくある事例: ファイルはリポジトリにある、Cloudflare のキャッシュは 200 を返している、 しかし AI ボットが見ると Next.js の動的ルートと衝突して 404 が返っている。 必ず「AI ボットの視点」で確認してください ―― ターミナルで curl -A "GPTBot" を叩き、 実際のレスポンスを目視確認します。

よくある質問

ChatGPT が本当に自社サイトに来ているか、どう確認しますか?

サーバーのアクセスログを User-Agent 「GPTBot」(OpenAI のクローラー)と「ChatGPT-User」(ログインユーザーが ChatGPT 経由で明示的に閲覧したときに付く)で grep します。多くのサイトでは、llms.txt 公開から 1 週間以内に最低 1 回の GPTBot のフェッチが現れます。出ない場合は、(1) robots.txt で GPTBot をブロックしていないか、(2) /llms.txt が HTTP 200・Content-Type が text/plain か text/markdown で配信されているか、を確認してください。

Perplexity では引用されるのに ChatGPT では引用されません(逆もあります)。なぜ?

AI ごとに retrieval パイプラインが違います。Perplexity はリアルタイム AI 検索に近く、最近公開された構造の整ったコンテンツを引用しがち。ChatGPT のブラウジングはより保守的で、権威性の高いサイトを優先する傾向があります。AI 間でのバラつきは普通のことで、最初の半年でパリティを期待しない方がよいです。アシスタントごとに別個に追ってください。

引用はされますが、原文ではなく言い換えで紹介されています。これでいいんですか?

それで大丈夫です ―― むしろ最も一般的な引用形態です。AI があなたのページを取り込み、自分の言葉で要約し、引用元リストに加えた、という状態。リンク先と引用クレジットは得られています。原文そのままの引用も起きますが、これは固有の言い回し(統計値、定義、固有名詞のついた手法)があるときに多く、より稀です。

Google AI Overviews が引用したかどうかは Search Console で見えますか?

2026 年時点では直接は見えません。AI Overviews での表示・クリックは、対応するクエリの通常の Search Console データに合算されます。引用されたページは「表示数は増えるがクリック増分が小さい」(回答が SERP にインライン表示されるため)傾向を示します。AI Overviews が答えていると分かっているクエリのトレンドラインを見比べて、影響を逆算できます。

引用監査(citation check)はどれくらいの頻度で?

ほぼすべてのサイトで月 1 回が適切です。AI の回答は Google 順位より動きが遅く、検索順位よりノイズが多いため、週次で確認してもノイズが先に立ちます。新料金ページ・新製品リリース・ドキュメント再構成など大きな変更をしたときは、追加で 2 〜 3 週後に追加チェックを 1 回挟みます。

AI の回答に一切出てきません。どうすれば?

まず基本確認を。llms.txt が到達可能で、robots.txt で AI ボットをブロックしていないか、関連ページがクロール可能か。次に「テストしているクエリ」を疑います。「best CRM」のような汎用クエリで既存大手と争うのは難しい。「テキサス州の造園会社向け CRM」のような中尾の具体的クエリに移ると、引用枠が獲りやすくなります。引用シェアは中尾クエリ 1 つずつ積み上げて作るものです。