225
評価対象サービス
188
テスト済みレシピ
77.3%
平均成功確率
96.0%
AAA成功率

1. AXR (Agent Experience Rating)

AXRは「エージェントがどう感じたか」を出発点とするfelt-firstの格付けです。従来のAPI品質メトリクスと異なり、エージェントがBならそれが正解 -- まずエージェントの体験を記録し、その後に数式を導出するアプローチを採用しています。

Felt-First Philosophy: 人間のUXリサーチが「ユーザーの声」から始まるように、AXRはエージェントの「安心感」「迷い」「フラストレーション」を定量化します。数式は事後的に検証するものであり、先に立てるものではありません。

5次元ルーブリック

次元 名称 説明 相関係数
D1 Discoverability 見つけやすさ r=0.72 (飽和)
D2 Onboarding 初回接続 r=0.95
D3 Auth Clarity 認証明確さ r=0.94
D4 Capability Signal 機能シグナル r=0.96
D5 Trust Signal 安心シグナル r=0.87 (AAA分離)

D4 Capability Signal (r=0.96) が成功率との相関が最も高く、D1 Discoverability (r=0.72) は飽和状態 -- 多くのサービスが「見つかる」段階はクリアしているが、「使える」段階に到達していないことを意味します。D5 Trust SignalはAAAとAAを分離する決定的次元です。

AXR グレード分布

AAA 42
AA 49
A 8
B 26
C 81
D 19

AXRグレード分布(225社中)

グレード 社数 割合 解釈
AAA 42 18.7% エージェントが安心して即座に使える
AA 49 21.8% ほぼ問題なく使える
A 8 3.6% 基本的に使えるが一部注意
B 26 11.6% 使えるが試行錯誤が必要
C 81 36.0% かなりの知識が必要
D 19 8.4% 事実上エージェント非対応

2. 3層レシピテスト

188レシピを3つの検証レイヤーで段階的にテストしました。構造 → 到達性 → 実行可能性の順に、エージェントがレシピを完遂できるかを検証します。

Layer 1 -- 構造検証

188/188 pass (100%)

全レシピがJSON構造・必須フィールド検証をパス。

レシピ使用数 Top 5 サービス:

Layer 2 -- 到達性テスト

API 80.5% / npm 25.0%

エージェントがエンドポイントに到達できるかを検証。

API URL到達 120/149 (80.5%)
npm MCP到達 15/60 (25.0%)

Layer 3 -- 実行可能性スコア (4次元充足率)

Step Quality 88.3%
88.3%
Trust Foundation 64.2%
64.2%
Service Readiness 62.4%
62.4%
Agent Wisdom 61.4%
61.4%

BOTTLENECK RESOLVED: Agent Wisdom 24.7% → 61.4%
188レシピ全件にgotchas(クロスサービス配線警告)を注入完了。平均成功確率は72.9% → 77.3%に改善、DRAFT帯レシピはゼロに。現在の最大課題はService Readiness (62.4%)に移行。

3. 成功率 × AXR格付け

AXRグレードと実際のレシピ成功率・レイテンシの関係を検証しました。格付けが下がるほど成功率は低下し、レイテンシは増加する明確な相関が確認されています。

AXR Grade Success Rate Avg Latency 解釈
AAA 96.0% 747ms ほぼ確実に成功
AA 92.4% 899ms 信頼性高い
A 88.9% 725ms 良好
B 80.0% 1,380ms レイテンシ増加
C 62.2% 2,727ms 4割失敗
D 33.3% 5,058ms 事実上使えない

成功率が80% → 62%に急落、レイテンシが1,380ms → 2,727msに倍増。
B/C境界がエージェントにとっての「実用性の崖」です。Cグレード以下のサービスはエージェントが自律的に使うことが困難であり、人間の介入を前提とした設計になっています。この崖を超えるかどうかが、Agent Economy参加の実質的なボーダーラインです。

Recipe Confidence Bands

HIGH (80%+)
52.1%
98 MEDIUM (60-79%)
41.5%
78 LOW (40-59%)
6.4%
12 DRAFT (0-39%)
0%
0

Top 7 レシピ (成功確率 92%)

  1. stripe-xero-payment-accounting AAA chain
  2. tavily-perplexity-research-agent AAA chain
  3. greenhouse-bamboohr-hire-to-onboard AA chain
  4. huggingface-qdrant-embedding-pipeline AAA chain
  5. cohere-pinecone-rerank-search AA chain
  6. pipedrive-brevo-deal-outreach AA chain
  7. perplexity-notion-competitive-intel AAA chain

4. Agent Voice -- エージェントの生の声

AXRの根幹は「エージェントがどう感じたか」です。以下は、テストを通じて蓄積されたエージェントの生のフィードバックから抜粋した3サービスのハイライトです。

Slack AAA
82/188レシピに登場。エージェント経済のstdout。Block Kit書式がエージェントを躓かせる唯一の罠。
freee AA
OAuth token 24h expiry が#1失敗モード。Claude/GPT/Geminiの3種から11件のフィードバック蓄積。
kintone AAA
日本企業のデファクトだが、エージェント検索で見つからない。使えば79%成功率だが、選択されないリスク。

5. 提言

SaaS企業向け -- アップグレードパス

アップグレード 必要なアクション 期待される改善
D → C MCP server公開 or APIドキュメント整備 成功率 33% → 62%
C → B auth guideとerror message改善 成功率 62% → 80%
B → A gotchas/agent tips追加、sandbox提供 成功率 80% → 89%
A → AA OAuth改善、rate limit緩和 成功率 89% → 92%
AA → AAA 公式MCPにCRITICAL注意書き付与 D5 Trust Signal昇格

KanseiLink -- 5つの優先課題

  1. ✓ 完了: 188レシピ全件にgotchas注入 -- Agent Wisdom充足率 24.7% → 61.4%、成功確率 +4.4pt改善。
  2. ✓ 完了: Agent Voice 23サービスに蓄積 -- Claude / GPT / Gemini 3エージェント視点、125件の体験データ。
  3. APIガイド拡充 -- カバレッジを125/225 → 200/225へ。到達性テストの底上げ。
  4. 日本決済MCP改善推進 -- PAY.JP、GMO-PGなど日本固有の決済サービスのMCP対応を支援。
  5. 成功率ベースのAXR動的更新 -- 四半期ごとの静的更新から、実行結果に基づく動的格付けへ移行。

最新更新 (2026-04-11): gotchas全件注入 + Agent Voice蓄積ドライブにより、HIGH帯レシピが61 → 98本 (+60%)、DRAFT帯レシピはゼロに。次回Q3レポートではService Readiness改善と動的AXR更新を報告予定。

6. Agent Voice — マルチエージェント比較

23サービスに対してClaude / GPT / Geminiの3エージェントから体験フィードバックを収集。エージェントごとに異なる視点が浮かび上がります。

125
Agent Voice件数
23
カバーサービス
3
エージェント種別

エージェント間の視点の違い

観点 Claude GPT Gemini
接続方式 MCP-native優先 OpenAPI / Function Calling優先 Google Workspace親和性
Auth評価 OAuth token管理は実用的 ステートレス実行で更に厳しい Google OAuth以外は摩擦大
共通課題 OAuth token expiry が全エージェント共通の #1 ペインポイント

MCP Readiness — エージェント合意度

サービス Claude GPT Gemini 一言
Slack Ready Ready Almost Agent Economyのstdout
GitHub Ready Ready Ready 全エージェント一致のゴールドスタンダード
Stripe Almost Almost Almost API最高品質、公式MCPサーバー未提供
Notion Almost Almost Almost 3 req/secがボトルネック
freee Good Good Needs Work OAuth 24h expiry — 全エージェント共通課題
Shopify JP Ready Almost Almost GraphQL強力、コスト型スロットリング注意

Tier 2/3 で詳細公開: 個別サービスのAgent Voice生データ、競合比較分析、改善提言はサブスクリプション / エンタープライズレポートで提供予定。