目次

  1. なぜ今「MCPホスティングコスト」を比較するのか
  2. 2つのシナリオ — 月100万呼び出しと月1000万呼び出し
  3. Cloudflare Workers — $5固定+egress無料のコスト最強
  4. AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き
  5. Vercel Functions — 開発体験と「3軸課金」のトレードオフ
  6. Railway — Dockerコンテナ系の安心と従量制
  7. Fly.io — エッジコンテナ、無料枠廃止後の現実
  8. 用途別の選定フロー
  9. FAQ

なぜ今「MCPホスティングコスト」を比較するのか

2026年に入って リモートMCPサーバー(クライアント側にローカルランタイムを置かず、HTTPSで叩く形態)が一気に主流化した。Dropbox、Box、Microsoft 365、Cloudflare、AWS、Pipedreamと、主要ベンダーが「自社プラットフォーム上にホストしたMCPサーバー」を立て続けに公開している。同時に、これからMCPサーバーを自社で構築・提供するSaaS企業も増え、選択肢としての「どこにデプロイするか」が現実問題になってきた。

本記事はMCPサーバー特有のワークロード — 短時間・高頻度・I/Oバウンド・コールドスタートが体感に直結 — を念頭に、2026年5月時点の各プラットフォーム料金を5つ並べて比較する。

2026年5月の編集視点

「とりあえず安いところ」という選び方は危ない。MCPサーバーは 呼ばれない時はゼロ円、呼ばれる時は数十msで返さないとエージェントの体感が落ちる という特殊な負荷プロファイルを持つ。サーバーレス(Workers / Lambda / Vercel)が原則的に有利だが、 永続接続・長時間処理 ならコンテナ系(Railway / Fly.io)が必要になる。

2つのシナリオ — 月100万呼び出しと月1000万呼び出し

比較を具体化するため、以下の2つのワークロードを置く。MCPサーバーの典型として、1呼び出しあたりCPU 50ms / メモリ128MBを仮定する。

プラットフォーム 無料枠 シナリオA 月額 シナリオB 月額 コールドスタート
Cloudflare Workers Paid—($5最低)$5$5<5ms
AWS Lambda (ARM Graviton2)1M req + 400k GB-sec/月 永続$0(無料枠内)$1.80〜$2.50280ms平均
Vercel Functions (Pro)1M invocations(Hobby)$20(Pro基本)$20+$5.40追加100〜200ms
Railway (Hobby/Pro)$5/$20分の使用クレジット込み$5(常駐最小)$20〜$50常駐(scale-to-zeroで数秒)
Fly.io新規$5試用クレジットのみ$2〜$5(shared-cpu-1x)$10〜$30(複数Machine)常駐

※ AWS Lambdaのシナリオ B試算: 1000万req − 100万無料枠 = 900万req × $0.20/1M = $1.80。GB秒は1000万 × 50ms × 0.125GB = 62,500 GB秒、永続無料枠400,000 GB秒に収まるためコンピュート無料。ARM選択時の単価で計算。

※ Cloudflare Workers Paidは$5/月で1000万reqまで込み。シナリオBちょうど。

Cloudflare Workers — $5固定+egress無料のコスト最強

2026年5月時点で、リモートMCPサーバーのコストパフォーマンスを最も支配しているのが Cloudflare Workers。料金体系はシンプルだ。

シナリオAでもシナリオBでも、Workers Paidなら月$5固定で収まる。コールドスタートがV8 Isolatesで5ms未満(報告ではsub-millisecondも)という性能は、エージェントが連続的にMCPを叩く用途で体感差として現れる。AWS Lambda(us-east-1で平均280ms、長時間アイドル後500ms)と比較すると、約100倍速い。

✅ Cloudflare Workersを選ぶべきケース

・短時間・高頻度のMCP tool call主体(エージェントの「呼ぶ→返る」が頻発)
egress(レスポンスサイズ)が大きい(ファイル取得・ベクトル検索結果など)
・グローバル分散・低レイテンシをデフォルトで欲しい
・固定$5で予算管理を確定したい

⚠️ Workersの制約

1呼び出しあたりCPU時間に上限(FreeはCPU 10ms、PaidはCPU 30秒まで)。長時間のLLM呼び出しや重い計算を内部で同期的に走らせる設計は向かない。waitUntil() / Durable Objectsを正しく使い、外部APIへのI/Oは fetch の壁時間に流す設計が前提。

AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き

AWS Lambdaは 1M requests + 400,000 GB-seconds/月の永続無料枠(新規アカウント限定ではなく恒久)を持つ点が他と一線を画す。シナリオAは無料枠内に完全に収まり、純粋にAWS他リソース(API Gateway等)のみが課金対象。

2026年の重要なオプションが ARM Graviton2。GB秒単価が$0.0000133334(x86の$0.0000166667比で20%引き)。報告ベースではワークロードによって最大34%のprice-performance改善。リクエスト単価は$0.20/100万reqでアーキ問わず同額。MCPサーバーは多くがNode.js/Pythonで動くため、純TypeScriptなら無条件でARM64を選んで問題ない。

シナリオBの試算: (1000万 − 100万) × $0.20/1M = $1.80 + コンピュート分(無料枠内)で合計約$2.50/月に落ち着く。Workers Paid($5固定)よりさらに安いケースが多い。ただしコールドスタート平均280msはMCPユーザー体験では明確に体感できる差で、これを許容できるかが選定軸になる。

# AWS SAM template抜粋(ARM64 + 永続無料枠最大化)
Resources:
  McpServer:
    Type: AWS::Serverless::Function
    Properties:
      Runtime: nodejs20.x
      Architectures: [arm64]   # ← 20%引き
      MemorySize: 256
      Timeout: 30
      Handler: dist/handler.mcp

Vercel Functions — 開発体験と「3軸課金」のトレードオフ

Vercel Functionsは 3軸同時課金 という独特な料金体系を持つ。$0.60/100万invocations + $0.128/CPU時間 + $0.0106/GB時間のメモリ。Hobbyプランの無料枠は100,000 invocations(後述: 1M invocationsとの記載もありplan依存)、Proプランは$20/月で1M invocations込み。

シナリオAはPro $20/月の範囲内、シナリオBは1000万 − 1M = 900万 × $0.60/1M = $5.40追加 + CPU/メモリ加算。同じ呼び出し量でWorkers Paidの3〜4倍になる傾向だが、Next.js統合・プレビューデプロイ・Edge Network・チーム機能などの開発体験を取りに行く価値があるかで判断する。

2026年4月以降に話題になった「実際の請求が$286になった」事例(2026 Deploywiseレポート)は、Pro $20の固定額ではなく 3軸×超過分 が積み上がった結果で、MCPサーバーのトラフィックが想定より大きい場合に発生し得る。on-demand usage budget(デフォルト$200)の設定は必須。

⚠️ Vercelの請求が膨らむ典型パターン

(1) メモリ大きめのFunctionをデフォルトのまま運用 → GB時間が積み上がる。(2) ストリーミング応答でCPU時間がカウントされる。(3) bandwidth超過(MCPがファイル系を返す場合)。usage budgetを設定し、毎週請求アラートをチェック。

Railway — Dockerコンテナ系の安心と従量制

Railwayは サブスクリプション+使用クレジット込み という料金モデル。HobbyプランはサブスクリプションのみでOK(月$5、$5分使用クレジット込み)、Proプランは月$20で$20分の使用クレジット込み。超過分はvCPU $20/月、RAM $10/GB/月の従量で課金される。秒単位でCPU/メモリ使用量を計測するため アイドル時は実質ほぼゼロ

MCPサーバーをDockerで動かしたい・既存のWebSocket/SSE永続接続を活かしたい・OSSのMCPサーバー(MongoDB MCP等)を改修せずそのまま動かしたいケースでは、サーバーレスよりコンテナ系のRailwayが現実的だ。Postgres・MySQL・Redisのマネージドが組み込まれ、永続ボリュームとオブジェクトストレージも含まれる。

シナリオA(月100万呼び出し)では shared CPU 0.5 vCPU + 512MB RAMが概ねHobby枠($5/月)内。シナリオBでは1〜2 vCPU + 1〜2GB RAMでProプラン$20の使用クレジット内に収まることが多い。scale-to-zero未対応の構成だと、深夜の無トラフィック時間もコストが発生する点には注意。

Fly.io — エッジコンテナ、無料枠廃止後の現実

Fly.ioは2024年に 無料枠を廃止。新規アカウントには$5の試用クレジットが付与されるが、その後はクレジットカード必須で、すべてのMachineとストレージが課金対象となった。

料金構造はfixed planではなく完全従量制。shared-cpu-1x、256MB RAMのMachineを常時稼働で約$1.94/月、ストレージ$0.15/GB/月、egress $0.02/GB〜。最小現実コストは小規模アプリで約$5/月。

Fly.ioの強みは シングルバイナリでマルチリージョン にMachineを撒けること(複数地域でMCPサーバーをミラー)。Cloudflare Workersほどのグローバル分散ではないが、Lambdaが原則us-east-1中心になるのに対し、東京・大阪・シンガポール・フランクフルトに同じコンテナを置いて低レイテンシ提供する設計がしやすい。長時間タスク・WebSocket常時接続・カスタムランタイム(Go、Rust、Bun等)を使うMCPサーバーで真価を発揮する。

用途別の選定フロー

「迷ったらこれ」という万能解は存在しない。以下のフローで多くのケースをカバーできる。

MCPサーバーの本番運用前に、AEO実測データを確認しませんか

KanseiLinkは225+のSaaSについて、成功率・レイテンシ・エラー類型・既知ワークアラウンドの実測データをMCP経由で提供。ホスティング選定の前に、エージェントが実際にどう叩いているかを把握できます。

MCPサーバー設計を相談する

FAQ

MCPサーバーを最も安く運用できるのは?

ワークロード次第。月100万呼び出しまで→AWS Lambda(永続無料枠で実質$0)。月1000万呼び出しまで→Cloudflare Workers Paid($5固定、egress無料)。1000万超え→Workers Paidが追加$0.50/100万req+egress無料で依然優位。永続接続が必要ならRailway($5〜$20、scale-to-zero次第)。

コールドスタートはどれが速い?

Cloudflare Workers(V8 Isolates、<5ms、報告ではsub-msも)が圧勝。AWS Lambdaはus-east-1で平均280ms。Vercel Functionsは100-200ms。Railway/Fly.ioは常駐コンテナのためコールドスタート概念は実質なし(scale-to-zero時は再起動に数秒)。

Fly.ioの無料枠はまだありますか?

2024年に廃止されました。新規アカウントには$5試用クレジットのみ。最小常時稼働(shared-cpu-1x、256MB RAM)で約$1.94/月、実務最小コストは約$5/月です。

AWS Lambda ARMは本当に20%引きですか?

はい、GB秒単価が$0.0000133334(x86の$0.0000166667比で20%引き)になります。リクエスト単価は$0.20/100万reqでアーキ問わず同額。MCPサーバーがNode.js + 純TypeScriptならARM64を無条件で選んで問題ないケースが多いです。

Cloudflare Workers無料プランで本番運用できますか?

個人開発・小規模PoCなら可能ですが、本番は$5/月のPaidが標準解です。Freeは1日10万req・CPU 10ms/invocationの上限があり、エンタープライズ向けMCPサーバーには厳しい。Paidなら1000万reqまで$5、追加$0.50/100万reqでegress無料。

シナリオに当てはまらない大量ワークロード(月1億呼び出し以上)は?

その規模では 専用契約・コミット割引 の領域。Cloudflare Workers for Platformsのエンタープライズプラン、AWS Compute Savings Plans(Lambdaも対象)、Vercel Enterpriseなど。月100M req以上ならVercelで$200のon-demand budget上限を超えるリスクがあり、Workers Paid or Workers Enterprise一択になりがちです。

データ開示・免責事項

本記事の料金・性能数値は2026年5月時点の各社公式ドキュメントとサードパーティレポートに基づきます: Cloudflare Workers Paid($5/月、1000万req込み、egress無料)は developers.cloudflare.com/workers/platform/pricing/、AWS Lambda(永続無料枠1M req + 400k GB-sec、ARM Graviton2 20%引き)は aws.amazon.com/lambda/pricing/、Vercel Functions(3軸課金、Hobby/Pro $20)は vercel.com/docs/functions/usage-and-pricing、Railway(Hobby $5/Pro $20、$20/vCPU/月、$10/GB RAM/月)は railway.com/pricing、Fly.io(2024年無料枠廃止、$5試用クレジット、shared-cpu-1x ≈ $1.94/月)は fly.io/docs/about/pricing/。コールドスタート数値はCloudflare公式blog(V8 Isolates <5ms)、Rebal AI Blog 2026年3月レポート(Lambda 280ms平均)に基づきます。Vercel $286請求事例はDeploywise 2026年レポート。サンプル試算は1呼び出しCPU 50ms / メモリ128MBを仮定したMCPサーバー典型値で、実際のワークロードに応じて変動します。本番運用前は最新の各公式ドキュメントを必ずご確認ください。