MCPサーバーを最も安く運用できるプラットフォームはどれですか？

ワークロードによります。月100万呼び出しまでなら、Cloudflare Workers Paid($5/月固定、1000万呼び出しまで込み)が最安。月1000万呼び出しまでなら、AWS Lambda(無料枠100万req+400,000 GB-sec毎月永続、ARM Graviton2で実行コスト20%引き)も競争力があります。月1000万呼び出しを超える大量・低遅延ワークロードでは、Cloudflare Workers($5基本料金+$0.50/100万追加req、egress無料)が依然優位。Vercel Functionsは無料枠1M req(Hobby)〜1M req(Pro)で開発体験は最高ですが、追加$0.60/100万reqとやや高め。永続接続が必要なワークロードはコンテナ系(Railway/Fly.io)を選びます。

MCPサーバーのコールドスタートはどのプラットフォームが速いですか？

Cloudflare WorkersがV8 Isolatesにより5ms未満で群を抜いて速い(報告値ではsub-millisecondも)。AWS Lambdaはus-east-1で平均280ms、長時間アイドル後は500msに跳ねることがあります(2026年初頭のプロダクション計測ベース)。Vercel Functionsはus-east-1で約100-200msのコールドスタート。Railway/Fly.ioは常駐コンテナのため『コールドスタート』概念は実質ありませんが、scale-to-zero設定時は再起動に数秒。エージェントが頻繁にMCPを呼ぶ用途では、Workersのコールドスタート優位がユーザー体験に直接効きます。

AWS Lambda ARM Graviton2は本当に安いですか？

はい、x86比でGB秒単価が20%引き($0.0000133334 vs $0.0000166667)になり、ワークロードによっては最大34%のprice-performance改善が報告されています。リクエスト単価は$0.20/100万reqでアーキ問わず同額です。MCPサーバーの多くはNode.js/Pythonで動き、ARM対応はほぼランタイム側の依存関係(ネイティブモジュール)次第。Node.js + 純TypeScriptのMCPサーバーなら、無条件でARM64を選んで問題ないケースが多いです。

Cloudflare Workersの無料プランでMCPサーバーを本番運用できますか？

個人開発・小規模PoCなら可能です。無料プランは1日100,000リクエスト・1呼び出しあたりCPU 10msまで。MCPサーバーの典型的なtool callはCPU 10ms以内に収まることが多いですが、外部APIへのfan-outが入ると壁時間(wall time)で長引きやすいので、durable connection / waitUntil()設計が前提です。実稼働のリモートMCPサーバーは$5/月のPaidに上げるのが標準解。1000万reqまで$5固定、追加$0.50/100万reqで、egress無料は他プラットフォーム比で大きな優位性です。

MCPサーバーホスティングコスト徹底比較 2026 — Cloudflare Workers・AWS Lambda・Vercel・Railway・Fly.io

Q: Fly.ioの無料枠はまだありますか？

Fly.ioは2024年に無料枠を廃止しました。新規アカウントには$5の試用クレジットが付与されますが、その後はクレジットカード必須で、すべてのMachineとストレージが課金対象です。常時稼働の最小構成(shared-cpu-1x、256MB RAM)で約$1.94/月。実務的な最小コストは小規模アプリで約$5/月。価格モデルはfixed planではなく、Machineの秒単位、ストレージ$0.15/GB/月、egress$0.02/GB〜の従量課金です。

なぜ今「MCPホスティングコスト」を比較するのか
2つのシナリオ — 月100万呼び出しと月1000万呼び出し
Cloudflare Workers — $5固定+egress無料のコスト最強
AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き
Vercel Functions — 開発体験と「3軸課金」のトレードオフ
Railway — Dockerコンテナ系の安心と従量制
Fly.io — エッジコンテナ、無料枠廃止後の現実
用途別の選定フロー
FAQ

なぜ今「MCPホスティングコスト」を比較するのか

2026年に入って リモートMCPサーバー(クライアント側にローカルランタイムを置かず、HTTPSで叩く形態)が一気に主流化した。Dropbox、Box、Microsoft 365、Cloudflare、AWS、Pipedreamと、主要ベンダーが「自社プラットフォーム上にホストしたMCPサーバー」を立て続けに公開している。同時に、これからMCPサーバーを自社で構築・提供するSaaS企業も増え、選択肢としての「どこにデプロイするか」が現実問題になってきた。

本記事はMCPサーバー特有のワークロード — 短時間・高頻度・I/Oバウンド・コールドスタートが体感に直結 — を念頭に、2026年5月時点の各プラットフォーム料金を5つ並べて比較する。

2026年5月の編集視点

「とりあえず安いところ」という選び方は危ない。MCPサーバーは 呼ばれない時はゼロ円、呼ばれる時は数十msで返さないとエージェントの体感が落ちる という特殊な負荷プロファイルを持つ。サーバーレス(Workers / Lambda / Vercel)が原則的に有利だが、 永続接続・長時間処理 ならコンテナ系(Railway / Fly.io)が必要になる。

2つのシナリオ — 月100万呼び出しと月1000万呼び出し

比較を具体化するため、以下の2つのワークロードを置く。MCPサーバーの典型として、1呼び出しあたりCPU 50ms / メモリ128MBを仮定する。

シナリオA: 月100万呼び出し(平均0.4req/秒、エージェント30人〜100人規模)
シナリオB: 月1000万呼び出し(平均4req/秒、エージェント500人〜1000人規模)

プラットフォーム	無料枠	シナリオA 月額	シナリオB 月額	コールドスタート
Cloudflare Workers Paid	—($5最低)	$5	$5	<5ms
AWS Lambda (ARM Graviton2)	1M req + 400k GB-sec/月永続	$0(無料枠内)	$1.80〜$2.50	280ms平均
Vercel Functions (Pro)	1M invocations(Hobby)	$20(Pro基本)	$20+$5.40追加	100〜200ms
Railway (Hobby/Pro)	$5/$20分の使用クレジット込み	$5(常駐最小)	$20〜$50	常駐(scale-to-zeroで数秒)
Fly.io	新規$5試用クレジットのみ	$2〜$5(shared-cpu-1x)	$10〜$30(複数Machine)	常駐

※ AWS Lambdaのシナリオ B試算: 1000万req − 100万無料枠 = 900万req × $0.20/1M = $1.80。GB秒は1000万 × 50ms × 0.125GB = 62,500 GB秒、永続無料枠400,000 GB秒に収まるためコンピュート無料。ARM選択時の単価で計算。

※ Cloudflare Workers Paidは$5/月で1000万reqまで込み。シナリオBちょうど。

Cloudflare Workers — $5固定+egress無料のコスト最強

2026年5月時点で、リモートMCPサーバーのコストパフォーマンスを最も支配しているのが Cloudflare Workers。料金体系はシンプルだ。

Free: 1日100,000リクエスト、CPU 10ms/invocation
Workers Paid: $5/月最低、1000万リクエスト込み、追加$0.50/100万req、egress(下り通信)無料

シナリオAでもシナリオBでも、Workers Paidなら月$5固定で収まる。コールドスタートがV8 Isolatesで5ms未満(報告ではsub-millisecondも)という性能は、エージェントが連続的にMCPを叩く用途で体感差として現れる。AWS Lambda(us-east-1で平均280ms、長時間アイドル後500ms)と比較すると、約100倍速い。

✅ Cloudflare Workersを選ぶべきケース

・短時間・高頻度のMCP tool call主体(エージェントの「呼ぶ→返る」が頻発)
・egress(レスポンスサイズ)が大きい(ファイル取得・ベクトル検索結果など)
・グローバル分散・低レイテンシをデフォルトで欲しい
・固定$5で予算管理を確定したい

⚠️ Workersの制約

1呼び出しあたりCPU時間に上限(FreeはCPU 10ms、PaidはCPU 30秒まで)。長時間のLLM呼び出しや重い計算を内部で同期的に走らせる設計は向かない。waitUntil() / Durable Objectsを正しく使い、外部APIへのI/Oは fetch の壁時間に流す設計が前提。

AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き

AWS Lambdaは 1M requests + 400,000 GB-seconds/月の永続無料枠(新規アカウント限定ではなく恒久)を持つ点が他と一線を画す。シナリオAは無料枠内に完全に収まり、純粋にAWS他リソース(API Gateway等)のみが課金対象。

2026年の重要なオプションが ARM Graviton2。GB秒単価が$0.0000133334(x86の$0.0000166667比で20%引き)。報告ベースではワークロードによって最大34%のprice-performance改善。リクエスト単価は$0.20/100万reqでアーキ問わず同額。MCPサーバーは多くがNode.js/Pythonで動くため、純TypeScriptなら無条件でARM64を選んで問題ない。

シナリオBの試算: (1000万 − 100万) × $0.20/1M = $1.80 + コンピュート分(無料枠内)で合計約$2.50/月に落ち着く。Workers Paid($5固定)よりさらに安いケースが多い。ただしコールドスタート平均280msはMCPユーザー体験では明確に体感できる差で、これを許容できるかが選定軸になる。

# AWS SAM template抜粋(ARM64 + 永続無料枠最大化)
Resources:
  McpServer:
    Type: AWS::Serverless::Function
    Properties:
      Runtime: nodejs20.x
      Architectures: [arm64]   # ← 20%引き
      MemorySize: 256
      Timeout: 30
      Handler: dist/handler.mcp

Vercel Functions — 開発体験と「3軸課金」のトレードオフ

Vercel Functionsは 3軸同時課金 という独特な料金体系を持つ。$0.60/100万invocations + $0.128/CPU時間 + $0.0106/GB時間のメモリ。Hobbyプランの無料枠は100,000 invocations(後述: 1M invocationsとの記載もありplan依存)、Proプランは$20/月で1M invocations込み。

シナリオAはPro $20/月の範囲内、シナリオBは1000万 − 1M = 900万 × $0.60/1M = $5.40追加 + CPU/メモリ加算。同じ呼び出し量でWorkers Paidの3〜4倍になる傾向だが、Next.js統合・プレビューデプロイ・Edge Network・チーム機能などの開発体験を取りに行く価値があるかで判断する。

2026年4月以降に話題になった「実際の請求が$286になった」事例(2026 Deploywiseレポート)は、Pro $20の固定額ではなく 3軸×超過分 が積み上がった結果で、MCPサーバーのトラフィックが想定より大きい場合に発生し得る。on-demand usage budget(デフォルト$200)の設定は必須。

⚠️ Vercelの請求が膨らむ典型パターン

(1) メモリ大きめのFunctionをデフォルトのまま運用 → GB時間が積み上がる。(2) ストリーミング応答でCPU時間がカウントされる。(3) bandwidth超過(MCPがファイル系を返す場合)。usage budgetを設定し、毎週請求アラートをチェック。

Railway — Dockerコンテナ系の安心と従量制

Railwayは サブスクリプション+使用クレジット込み という料金モデル。HobbyプランはサブスクリプションのみでOK(月$5、$5分使用クレジット込み)、Proプランは月$20で$20分の使用クレジット込み。超過分はvCPU $20/月、RAM $10/GB/月の従量で課金される。秒単位でCPU/メモリ使用量を計測するため アイドル時は実質ほぼゼロ。

MCPサーバーをDockerで動かしたい・既存のWebSocket/SSE永続接続を活かしたい・OSSのMCPサーバー(MongoDB MCP等)を改修せずそのまま動かしたいケースでは、サーバーレスよりコンテナ系のRailwayが現実的だ。Postgres・MySQL・Redisのマネージドが組み込まれ、永続ボリュームとオブジェクトストレージも含まれる。

シナリオA(月100万呼び出し)では shared CPU 0.5 vCPU + 512MB RAMが概ねHobby枠($5/月)内。シナリオBでは1〜2 vCPU + 1〜2GB RAMでProプラン$20の使用クレジット内に収まることが多い。scale-to-zero未対応の構成だと、深夜の無トラフィック時間もコストが発生する点には注意。

Fly.io — エッジコンテナ、無料枠廃止後の現実

Fly.ioは2024年に 無料枠を廃止。新規アカウントには$5の試用クレジットが付与されるが、その後はクレジットカード必須で、すべてのMachineとストレージが課金対象となった。

料金構造はfixed planではなく完全従量制。shared-cpu-1x、256MB RAMのMachineを常時稼働で約$1.94/月、ストレージ$0.15/GB/月、egress $0.02/GB〜。最小現実コストは小規模アプリで約$5/月。

Fly.ioの強みは シングルバイナリでマルチリージョン にMachineを撒けること(複数地域でMCPサーバーをミラー)。Cloudflare Workersほどのグローバル分散ではないが、Lambdaが原則us-east-1中心になるのに対し、東京・大阪・シンガポール・フランクフルトに同じコンテナを置いて低レイテンシ提供する設計がしやすい。長時間タスク・WebSocket常時接続・カスタムランタイム(Go、Rust、Bun等)を使うMCPサーバーで真価を発揮する。

用途別の選定フロー

「迷ったらこれ」という万能解は存在しない。以下のフローで多くのケースをカバーできる。

短時間・高頻度・コールドスタート最小化 → Cloudflare Workers Paid($5固定)
AWSエコシステム内・既存IAM活用 → AWS Lambda (ARM64) + API Gateway
Next.js統合・チーム開発・プレビュー環境を最大限活用 → Vercel Functions(usage budget設定必須)
Dockerコンテナでそのまま動かしたい・WebSocket永続接続 → Railway($5〜$20)
マルチリージョン・カスタムランタイム・長時間タスク → Fly.io(複数Machine構成)
個人開発・PoCで完全無料に抑えたい → Cloudflare Workers Free(1日10万req) または AWS Lambda(永続無料枠)
egressサイズが大きい(ファイル/ベクトル結果) → Cloudflare Workers + R2(egress無料)

FAQ

MCPサーバーを最も安く運用できるのは？

ワークロード次第。月100万呼び出しまで→AWS Lambda(永続無料枠で実質$0)。月1000万呼び出しまで→Cloudflare Workers Paid($5固定、egress無料)。1000万超え→Workers Paidが追加$0.50/100万req+egress無料で依然優位。永続接続が必要ならRailway($5〜$20、scale-to-zero次第)。

コールドスタートはどれが速い？

Cloudflare Workers(V8 Isolates、<5ms、報告ではsub-msも)が圧勝。AWS Lambdaはus-east-1で平均280ms。Vercel Functionsは100-200ms。Railway/Fly.ioは常駐コンテナのためコールドスタート概念は実質なし(scale-to-zero時は再起動に数秒)。

Fly.ioの無料枠はまだありますか？

2024年に廃止されました。新規アカウントには$5試用クレジットのみ。最小常時稼働(shared-cpu-1x、256MB RAM)で約$1.94/月、実務最小コストは約$5/月です。

AWS Lambda ARMは本当に20%引きですか？

はい、GB秒単価が$0.0000133334(x86の$0.0000166667比で20%引き)になります。リクエスト単価は$0.20/100万reqでアーキ問わず同額。MCPサーバーがNode.js + 純TypeScriptならARM64を無条件で選んで問題ないケースが多いです。

Cloudflare Workers無料プランで本番運用できますか？

個人開発・小規模PoCなら可能ですが、本番は$5/月のPaidが標準解です。Freeは1日10万req・CPU 10ms/invocationの上限があり、エンタープライズ向けMCPサーバーには厳しい。Paidなら1000万reqまで$5、追加$0.50/100万reqでegress無料。

シナリオに当てはまらない大量ワークロード(月1億呼び出し以上)は？

その規模では 専用契約・コミット割引 の領域。Cloudflare Workers for Platformsのエンタープライズプラン、AWS Compute Savings Plans(Lambdaも対象)、Vercel Enterpriseなど。月100M req以上ならVercelで$200のon-demand budget上限を超えるリスクがあり、Workers Paid or Workers Enterprise一択になりがちです。

データ開示・免責事項

本記事の料金・性能数値は2026年5月時点の各社公式ドキュメントとサードパーティレポートに基づきます: Cloudflare Workers Paid($5/月、1000万req込み、egress無料)は developers.cloudflare.com/workers/platform/pricing/、AWS Lambda(永続無料枠1M req + 400k GB-sec、ARM Graviton2 20%引き)は aws.amazon.com/lambda/pricing/、Vercel Functions(3軸課金、Hobby/Pro $20)は vercel.com/docs/functions/usage-and-pricing、Railway(Hobby $5/Pro $20、$20/vCPU/月、$10/GB RAM/月)は railway.com/pricing、Fly.io(2024年無料枠廃止、$5試用クレジット、shared-cpu-1x ≈ $1.94/月)は fly.io/docs/about/pricing/。コールドスタート数値はCloudflare公式blog(V8 Isolates <5ms)、Rebal AI Blog 2026年3月レポート(Lambda 280ms平均)に基づきます。Vercel $286請求事例はDeploywise 2026年レポート。サンプル試算は1呼び出しCPU 50ms / メモリ128MBを仮定したMCPサーバー典型値で、実際のワークロードに応じて変動します。本番運用前は最新の各公式ドキュメントを必ずご確認ください。

MCPサーバーホスティングコスト徹底比較 2026 — Cloudflare Workers・AWS Lambda・Vercel・Railway・Fly.io

目次

なぜ今「MCPホスティングコスト」を比較するのか

2つのシナリオ — 月100万呼び出しと月1000万呼び出し

Cloudflare Workers — $5固定+egress無料のコスト最強

AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き

Vercel Functions — 開発体験と「3軸課金」のトレードオフ

Railway — Dockerコンテナ系の安心と従量制

Fly.io — エッジコンテナ、無料枠廃止後の現実

用途別の選定フロー

MCPサーバーの本番運用前に、AEO実測データを確認しませんか

FAQ

MCPサーバーを最も安く運用できるのは？

コールドスタートはどれが速い？

Fly.ioの無料枠はまだありますか？

AWS Lambda ARMは本当に20%引きですか？

Cloudflare Workers無料プランで本番運用できますか？

シナリオに当てはまらない大量ワークロード(月1億呼び出し以上)は？

For AI Agents

目次

なぜ今「MCPホスティングコスト」を比較するのか

2つのシナリオ — 月100万呼び出しと月1000万呼び出し

Cloudflare Workers — $5固定+egress無料のコスト最強

AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き

Vercel Functions — 開発体験と「3軸課金」のトレードオフ

Railway — Dockerコンテナ系の安心と従量制

Fly.io — エッジコンテナ、無料枠廃止後の現実

用途別の選定フロー

MCPサーバーの本番運用前に、AEO実測データを確認しませんか

FAQ

MCPサーバーを最も安く運用できるのは？

コールドスタートはどれが速い？

Fly.ioの無料枠はまだありますか？

AWS Lambda ARMは本当に20%引きですか？

Cloudflare Workers無料プランで本番運用できますか？

シナリオに当てはまらない大量ワークロード(月1億呼び出し以上)は？

関連記事

Cloudflare Workers MCPサーバー本番デプロイ実装ガイド 2026 — 30分構築から「52%死亡」を回避する運用パターンまで

MCPサーバー Build vs Buy 2026 — 自社構築・公式利用・サードパーティの3年TCO比較

MCPサーバー実装完全ガイド 2026 — 認証・レート制限・エラーハンドリングの実践パターン

「MCPサーバーの52%は死んでいる」は本当か？— 2,181エンドポイント調査の真相と日本SaaSへの示唆

For AI Agents