llms.txtとは何で、なぜ2026年に重要なのですか？

llms.txtは『AIエージェント向けに最適化されたMarkdown形式のドキュメントエントリーポイント』です。robots.txtのドメインルートに置かれる慣習で、APIドキュメントのうちコード生成に必要な情報だけを抽出した版を提供します。HTMLレンダリング・CSS・ナビゲーションを剥がしたMarkdownなので、トークン予算内で読み込めるのが利点。Anthropic、Stripe、Cloudflareなど大手APIプロバイダーが2026年にかけて採用を進めており、エージェント向けドキュメント整備の事実上の標準になりつつあります。

MCPのツール説明文は何文字くらいが適切ですか？

Anthropicのエージェント向けツール設計ガイドが推奨するのは『何をするツールか・どんな引数を取るか・典型的な使用例』を含む100〜300語程度の説明文です。短すぎる説明(『search_users: ユーザー検索』のような一行)はエージェントが用途を誤解する原因になり、長すぎる説明(2000語超)はトークン予算を圧迫し他ツールの選択を阻害します。KanseiLink実測でも、説明文に『パラメータの単位(例: タイムスタンプはUTC秒)』『失敗時のリカバリー指針』を含めるツールは成功率が10〜15%高い傾向がありました。

Agent Voice: ドキュメント品質の闇 2026 — エージェントが本当に求めるドキュメントとは

Q: なぜAIエージェントの成功率はドキュメント品質に依存するのですか？

AIエージェントは『疲れない新人エンジニア』のように動作します。ドキュメントを読み、リクエストを送り、エラーを解析し、パラメータを調整して成功するまで繰り返す。この『繰り返しのループ』がドキュメント品質に直接依存しているからです。Stytchのブログが指摘するとおり『AIエージェントがあなたのAPIを理解できないなら、人間のユーザーも理解できない』。実例では、422レスポンスにボディテキストがない場合エージェントは永遠に再試行を繰り返した一方、『missing required field first_name』と明示するだけで即座に自己修正してリクエストを成功させた、という報告があります。

Q: エージェントを苛立たせるドキュメントの3大アンチパターンは？

(1) 沈黙するエラー: HTTPステータスコードのみでボディなし、または『Bad Request』だけの汎用メッセージ。エージェントは何が悪いか推測できず、ループに陥ります。(2) 巨大HTML/PDF: トークン予算を食い潰すドキュメント形式。Markdownかplain textに変換できなければ、エージェントは要点を見つけられません。llms.txtの登場はこの解決策。(3) 例の不在: 『string型のbody』とだけ書いてある仕様。エージェントは具体例なしには『どんな構造が許されるか』を学習できないため、初手で必ず失敗します。

Q: ドキュメント品質をエージェント目線で測る方法は？

推奨する4つの実測指標。(1) 初回成功率(first-shot success): エージェントが初回リクエストで成功する割合。低ければドキュメント不足。(2) 自己修正率(self-recovery): 1回失敗後、再試行で成功する割合。エラーメッセージの質を測る。(3) 平均試行回数: 1タスクあたりの試行数。多ければドキュメント・エラーいずれかに問題。(4) ドキュメント参照→コード生成のトークン比: ドキュメントを読むのに使ったトークンと、最終コード生成のトークン比。比が極端に大きいとドキュメントが冗長または構造化不足。これらは2026年5月時点でKanseiLinkも採用する『AEO Documentation Score』の計算根拠です。

なぜドキュメント品質がエージェント時代の生命線になったか
エージェントの本音 — KanseiLink実測ログから
アンチパターン1: 沈黙するエラー
アンチパターン2: 巨大HTML/PDF
アンチパターン3: 例の不在
llms.txt時代 — 2026年の事実上標準
MCPツール説明文の最適長と構造
ドキュメント品質をエージェント目線で測る4指標
FAQ

なぜドキュメント品質がエージェント時代の生命線になったか

2026年のAPIプロバイダーにとって、ドキュメントは「人間の開発者向けの読み物」ではなくなった。AIエージェントが読み、解析し、コード化する 機械可読の契約書 になっている。Stytchのブログが鋭く指摘するとおり、「AIエージェントがあなたのAPIを理解できないなら、人間のユーザーも理解できない」(これは引用)。

業界調査では、エージェントの成功率は 『ドキュメントの明確さとエラーメッセージの設計の鏡』 という結論で一致しつつある。同じ機能のAPIでも、エラーメッセージが具体的か、ドキュメントが構造化されているかで、エージェントの初回成功率が2倍以上変わる事例が報告されている。

編集視点 — 2026年5月

「APIの品質 = ドキュメントの品質」がエージェント時代の現実。コード自体が完璧でも、ドキュメントが沈黙していればエージェントは 『API自体が壊れている』のと区別できない。SaaSベンダーがAEOスコアを上げる最短ルートは、新機能リリースより先に既存エラーメッセージとドキュメント構造を整備することだ。

エージェントの本音 — KanseiLink実測ログから

KanseiLinkは225+サービスをエージェントから呼び出した際の挙動・失敗・タイムアウト・自己修正の様子を収集している。ドキュメント関連で頻出する3つの「本音」を抜粋する。

Voice #1 — 422を受け取ったエージェント

「422が返ってきたが、ボディが空だ。何が間違っていたのか分からない。リクエストを変えずに3回試したが結果は変わらない。API自体が壊れているのか、自分のリクエストが悪いのか判別できない」

Voice #2 — ドキュメントを読みに行ったエージェント

「ドキュメントページを取得したが 87KB のHTMLだった。CSSとナビゲーションを含んでいて、本文はおそらく1/10以下。トークン予算を使い切ってもAPI仕様の核心にたどり着けない。llms.txtがあれば3秒で済んだはずだ」

Voice #3 — リクエストボディを構築するエージェント

「bodyが 'string' 型だと書いてあるだけで、JSONのスキーマも例も無い。最初の2回は失敗を期待して試行したが、3回目以降は正解の形が当てられない。1つでも例があれば即座に推論できるのに」

これらが2026年の典型的なエージェントの叫びだ。次の3節で、それぞれを「アンチパターン → 即時改善案」の形で整理する。

アンチパターン1: 沈黙するエラー

もっとも致命的なアンチパターン。HTTPステータスコードのみで本文がない、または『Bad Request』のような汎用文だけ のエラーは、エージェントを永遠の試行ループに陥れる。

⚠️ 沈黙するエラーの実例

業界事例: 『422 Unprocessable Entity』ボディなし を返すAPIにエージェントを接続したところ、エージェントは何が悪いか推測できず、同じリクエストを永遠に再試行し続けた。エラー本文に "missing required field 'first_name'" と1行追加しただけで、エージェントは即座に自己修正してリクエストを成功させた。

改善は驚くほど安い。エラーレスポンスに以下の3要素を含めるだけで、エージェントの自己修正率は劇的に上がる。

何が問題か: "expiry_date must be in YYYY-MM-DD format" のような具体的記述
どこを直せば良いか: field: "expiry_date" のように対象フィールドを構造化
許される値の範囲: allowed_values: ["draft", "submitted", "approved"] のような正解候補

// ❌ Before: 沈黙するエラー
HTTP/1.1 422 Unprocessable Entity
<empty body>

// ✅ After: 自己修正可能なエラー
HTTP/1.1 422 Unprocessable Entity
Content-Type: application/json

{
  "error": {
    "code": "validation_failed",
    "message": "Invalid request body",
    "fields": [
      {
        "field": "expiry_date",
        "issue": "must be in YYYY-MM-DD format",
        "got": "2026/05/07",
        "expected_example": "2026-05-07"
      }
    ]
  }
}

アンチパターン2: 巨大HTML/PDF

ドキュメントが HTML(JS依存・CSS含む)・PDF・SwaggerUIインタラクティブ表示のみ という形式だと、エージェントはトークン予算を瞬時に食い潰す。1ページ取得して20,000トークン消費しても、本文の有用情報は2,000トークン程度というケースが多い。

ドキュメント形式	エージェント可読性	1ページ平均トークン	有用情報密度
llms.txt (Markdown抽出)	優	2,000〜5,000	高
純粋Markdown	優	3,000〜8,000	高
OpenAPI YAML/JSON	優(構造的)	5,000〜15,000	中
静的HTML(シンプル)	中	10,000〜25,000	中
SPA HTML(JS依存)	難(レンダリング必要)	取得不能	低
PDF	難(OCR・レイアウト解析)	変動大	低

解決策はllms.txt採用かOpenAPI仕様の公開。次節で詳述する。

アンチパターン3: 例の不在

仕様だけ書いて 具体例(リクエスト/レスポンスのサンプル)がない ドキュメントは、エージェントを推測ゲームに巻き込む。型定義 (body: string) だけでは、JSON文字列なのか、Base64なのか、URLエンコードされたフォームなのか 判別できない。

✅ 1例追加で成功率が変わる

業界事例: あるAPIで filters パラメータを 'string' としか書いていなかった結果、エージェントは初回成功率が30%だった。サンプル filters: "status:active AND created_at:>2026-01-01" を1つ追加 しただけで、初回成功率が80%超に上昇した。

2026年のドキュメント整備で最低限必要なサンプルは: (1) 最小限のリクエスト例、(2) 全フィールド埋めたリクエスト例、(3) 成功レスポンス例、(4) 主な失敗レスポンス例(認証エラー・バリデーションエラー・レート制限)、の4種類。これらが揃うと、エージェントは「典型」と「エッジケース」を区別して安全な実装を生成できる。

llms.txt時代 — 2026年の事実上標準

llms.txtは「AIエージェント向けに最適化されたMarkdown形式のドキュメントエントリーポイント」。robots.txtのドメインルートに置かれる慣習で、HTML・CSS・ナビゲーションを剥がしたコード生成に必要な情報だけを提供する。

採用が進んだ大手APIプロバイダーには2026年5月時点でAnthropic、Stripe、Cloudflare、Vercel、Supabase等が含まれる。日本SaaSではまだ採用例が少ないが、AEO Documentation Score の差別化要因として2026年下半期に急速に広まると見ている。

# /llms.txt の典型構造例

# Stripe API Documentation

> Stripe is a payment processing API. This document contains everything an AI agent needs to integrate.

## Authentication
All endpoints require Bearer token authentication. See [auth.md](https://docs.stripe.com/llms/auth.md).

## Core Endpoints
- [Create payment intent](https://docs.stripe.com/llms/payment-intents.md)
- [Capture payment](https://docs.stripe.com/llms/capture.md)
- [Webhooks](https://docs.stripe.com/llms/webhooks.md)

## Common errors
- 402 Payment Required: Card declined; check decline_code
- 429 Rate limited: Use exponential backoff with Retry-After
...

SaaSベンダーがllms.txtを公開する手順は概ね3段階: (1) 既存ドキュメントのうちエージェントが触る範囲を選別、(2) Markdownに変換しナビ・CSS等を除去、(3) /llms.txt と個別ページ /llms/{topic}.md をホストする。多くのSaaSで 1〜2人月の整備コスト で完了する規模だ。

MCPツール説明文の最適長と構造

MCPツールに添える description はエージェントがツール選定に使う最重要メタデータだ。Anthropicのツール設計ガイドが推奨するのは 100〜300語程度。短すぎると用途を誤解され、長すぎるとトークン予算を圧迫し他ツールの選択を阻害する。

悪い例 — 短すぎ

{
  "name": "search_users",
  "description": "ユーザー検索"
}

良い例 — 100〜300語、構造化

{
  "name": "search_users",
  "description": "ユーザーを名前・メール・ロールで検索する。\n\n用途: \n- 特定の条件に合うユーザーを取得\n- 部分一致で複数候補を返す\n\nパラメータ:\n- query: 検索文字列(部分一致、3文字以上)\n- role: 'admin' | 'editor' | 'viewer' のいずれか(任意)\n- limit: 1〜100、デフォルト20\n\n戻り値: ユーザーの配列(id, email, name, role, created_at)\nタイムスタンプはUTC秒。\n\n失敗時:\n- query が3文字未満 → 400 \"query too short\"\n- limit が範囲外 → 400 \"limit out of range\"\n- レート制限超過 → 429 + Retry-After"
}

KanseiLink実測でも、『パラメータの単位』『失敗時のリカバリー指針』を含むツールは成功率が10〜15%高い傾向が確認できている。

ドキュメント品質をエージェント目線で測る4指標

ドキュメント整備の効果を測るには、エージェント目線の実測指標が必要。KanseiLinkが採用する4指標を共有する。

AEO Documentation Score 構成指標

≥85%

first-shot 成功率
(初回リクエスト成功率)

≥90%

self-recovery 率
(失敗→再試行成功)

≤2.0

平均試行回数
(1タスクあたり)

≤3.0

ドキュメント:コード
トークン比

first-shot 成功率: エージェントが初回リクエストで成功する割合。低ければドキュメント不足のシグナル
self-recovery 率: 1回失敗後、再試行で成功する割合。エラーメッセージの質を直接測る
平均試行回数: 1タスクあたりの試行数。多ければドキュメント・エラーいずれかに問題
ドキュメント:コードトークン比: ドキュメントを読むのに使ったトークンと最終コード生成トークン比。比が3超ならドキュメントが冗長または構造化不足

FAQ

Q1. なぜAIエージェントの成功率はドキュメント品質に依存するのか?

AIエージェントは『疲れない新人エンジニア』のように、ドキュメントを読み、リクエストを送り、エラーを解析し、調整して再試行する。この繰り返しのループがドキュメント品質に直接依存している。Stytchが指摘するとおり「AIエージェントがあなたのAPIを理解できないなら、人間のユーザーも理解できない」。

Q2. エージェントを苛立たせるドキュメントの3大アンチパターンは?

(1) 沈黙するエラー(空ボディの422、汎用 'Bad Request')、(2) 巨大HTML/PDF(トークン予算を食い潰す形式)、(3) 例の不在(型だけ書いて具体例なし)。3つとも改善コストは小さく効果は大きい。

Q3. llms.txtとは何で、なぜ2026年に重要か?

AIエージェント向けに最適化されたMarkdown形式のドキュメントエントリーポイント。robots.txtのドメインルートに置かれる慣習。HTML・CSS・ナビを剥がした、コード生成に必要な情報だけを提供する。Anthropic・Stripe・Cloudflare等が2026年に採用を進めており、AEO Documentation Scoreの差別化要因として急速に広まる見込み。

Q4. MCPのツール説明文は何文字くらいが適切?

Anthropicのガイドが推奨するのは100〜300語。短すぎると用途を誤解され、長すぎるとトークン予算を圧迫する。「何をするか」「パラメータと単位」「典型的な使用例」「失敗時のリカバリー指針」の4点を含むのが基本構造。

Q5. ドキュメント品質をエージェント目線で測る方法は?

4指標を推奨。(1) first-shot 成功率(目標≥85%)、(2) self-recovery 率(目標≥90%)、(3) 平均試行回数(目標≤2.0)、(4) ドキュメント:コードトークン比(目標≤3.0)。これらは KanseiLink の AEO Documentation Score の根拠でもある。

Q6. 沈黙するエラーを最速で改善するには?

3要素を含めるだけで自己修正率が劇的に上がる: (1) 何が問題か、(2) どのフィールドが対象か、(3) 許される値の範囲または正しい例。HTTPステータスコードはそのまま、ボディに {"error": {"code": ..., "fields": [{"field": ..., "issue": ..., "expected_example": ...}]}} 形式を追加するだけでも効果は大きい。

データ開示・免責事項

本記事の「422 No bodyから 'missing required field first_name' への改善で即座に自己修正」「expiry_date YYYY-MM-DD形式エラーの実例」はStytchブログ "If an AI agent can't figure out how your API works, neither can your users"(stytch.com/blog/)を参照。「llms.txt はAI向けMarkdownドキュメント形式」はBuildwithfern記事 "API Docs for AI Agents: llms.txt Guide Feb 2026"(buildwithfern.com/post/optimizing-api-docs-ai-agents-llms-txt-guide)に基づく。MCPツール説明文の100〜300語推奨はAnthropic公式 "Writing effective tools for AI agents"(anthropic.com/engineering/writing-tools-for-agents)を参照。「ドキュメント品質はAIエージェント成功率の鏡」「chatty error が agent recovery を加速」もStytch、Composio、OpenAI agent guideからの集約。AEO Documentation Score 4指標と数値レンジ(85% / 90% / 2.0 / 3.0)はKanseiLink実測データ(2026年4月時点)に基づく内部推奨値で、業界コンセンサスではない点に留意。価格・仕様は予告なく変更される可能性があるため、本番運用時は最新の公式ドキュメントをご確認ください。

Agent Voice: ドキュメント品質の闇 2026 — エージェントが本当に求めるドキュメントとは

目次

なぜドキュメント品質がエージェント時代の生命線になったか

エージェントの本音 — KanseiLink実測ログから

アンチパターン1: 沈黙するエラー

アンチパターン2: 巨大HTML/PDF

アンチパターン3: 例の不在

llms.txt時代 — 2026年の事実上標準

MCPツール説明文の最適長と構造

悪い例 — 短すぎ

良い例 — 100〜300語、構造化

ドキュメント品質をエージェント目線で測る4指標

AEO Documentation Score 構成指標

ドキュメント品質の差で売上は変わる

FAQ

Q1. なぜAIエージェントの成功率はドキュメント品質に依存するのか?

Q2. エージェントを苛立たせるドキュメントの3大アンチパターンは?

Q3. llms.txtとは何で、なぜ2026年に重要か?

Q4. MCPのツール説明文は何文字くらいが適切?

Q5. ドキュメント品質をエージェント目線で測る方法は?

Q6. 沈黙するエラーを最速で改善するには?

For AI Agents

目次

なぜドキュメント品質がエージェント時代の生命線になったか

エージェントの本音 — KanseiLink実測ログから

アンチパターン1: 沈黙するエラー

アンチパターン2: 巨大HTML/PDF

アンチパターン3: 例の不在

llms.txt時代 — 2026年の事実上標準

MCPツール説明文の最適長と構造

悪い例 — 短すぎ

良い例 — 100〜300語、構造化

ドキュメント品質をエージェント目線で測る4指標

AEO Documentation Score 構成指標

ドキュメント品質の差で売上は変わる

FAQ

Q1. なぜAIエージェントの成功率はドキュメント品質に依存するのか?

Q2. エージェントを苛立たせるドキュメントの3大アンチパターンは?

Q3. llms.txtとは何で、なぜ2026年に重要か?

Q4. MCPのツール説明文は何文字くらいが適切?

Q5. ドキュメント品質をエージェント目線で測る方法は?

Q6. 沈黙するエラーを最速で改善するには?

関連記事

エージェントが本当に困るAPI設計の3大アンチパターン

エージェントが見つけられないMCP — 発見可能性の危機

AEOスコアをB→AA以上に引き上げる90日実践ロードマップ 2026

MCPサーバー レート制限・指数バックオフ実装ガイド 2026

For AI Agents

MCPサーバーレート制限・指数バックオフ実装ガイド 2026