目次
なぜ今「MCPホスティングコスト」を比較するのか
2026年に入って リモートMCPサーバー(クライアント側にローカルランタイムを置かず、HTTPSで叩く形態)が一気に主流化した。Dropbox、Box、Microsoft 365、Cloudflare、AWS、Pipedreamと、主要ベンダーが「自社プラットフォーム上にホストしたMCPサーバー」を立て続けに公開している。同時に、これからMCPサーバーを自社で構築・提供するSaaS企業も増え、選択肢としての「どこにデプロイするか」が現実問題になってきた。
本記事はMCPサーバー特有のワークロード — 短時間・高頻度・I/Oバウンド・コールドスタートが体感に直結 — を念頭に、2026年5月時点の各プラットフォーム料金を5つ並べて比較する。
「とりあえず安いところ」という選び方は危ない。MCPサーバーは 呼ばれない時はゼロ円、呼ばれる時は数十msで返さないとエージェントの体感が落ちる という特殊な負荷プロファイルを持つ。サーバーレス(Workers / Lambda / Vercel)が原則的に有利だが、 永続接続・長時間処理 ならコンテナ系(Railway / Fly.io)が必要になる。
2つのシナリオ — 月100万呼び出しと月1000万呼び出し
比較を具体化するため、以下の2つのワークロードを置く。MCPサーバーの典型として、1呼び出しあたりCPU 50ms / メモリ128MBを仮定する。
- シナリオA: 月100万呼び出し(平均0.4req/秒、エージェント30人〜100人規模)
- シナリオB: 月1000万呼び出し(平均4req/秒、エージェント500人〜1000人規模)
| プラットフォーム | 無料枠 | シナリオA 月額 | シナリオB 月額 | コールドスタート |
|---|---|---|---|---|
| Cloudflare Workers Paid | —($5最低) | $5 | $5 | <5ms |
| AWS Lambda (ARM Graviton2) | 1M req + 400k GB-sec/月 永続 | $0(無料枠内) | $1.80〜$2.50 | 280ms平均 |
| Vercel Functions (Pro) | 1M invocations(Hobby) | $20(Pro基本) | $20+$5.40追加 | 100〜200ms |
| Railway (Hobby/Pro) | $5/$20分の使用クレジット込み | $5(常駐最小) | $20〜$50 | 常駐(scale-to-zeroで数秒) |
| Fly.io | 新規$5試用クレジットのみ | $2〜$5(shared-cpu-1x) | $10〜$30(複数Machine) | 常駐 |
※ AWS Lambdaのシナリオ B試算: 1000万req − 100万無料枠 = 900万req × $0.20/1M = $1.80。GB秒は1000万 × 50ms × 0.125GB = 62,500 GB秒、永続無料枠400,000 GB秒に収まるためコンピュート無料。ARM選択時の単価で計算。
※ Cloudflare Workers Paidは$5/月で1000万reqまで込み。シナリオBちょうど。
Cloudflare Workers — $5固定+egress無料のコスト最強
2026年5月時点で、リモートMCPサーバーのコストパフォーマンスを最も支配しているのが Cloudflare Workers。料金体系はシンプルだ。
- Free: 1日100,000リクエスト、CPU 10ms/invocation
- Workers Paid: $5/月最低、1000万リクエスト込み、追加$0.50/100万req、egress(下り通信)無料
シナリオAでもシナリオBでも、Workers Paidなら月$5固定で収まる。コールドスタートがV8 Isolatesで5ms未満(報告ではsub-millisecondも)という性能は、エージェントが連続的にMCPを叩く用途で体感差として現れる。AWS Lambda(us-east-1で平均280ms、長時間アイドル後500ms)と比較すると、約100倍速い。
・短時間・高頻度のMCP tool call主体(エージェントの「呼ぶ→返る」が頻発)
・egress(レスポンスサイズ)が大きい(ファイル取得・ベクトル検索結果など)
・グローバル分散・低レイテンシをデフォルトで欲しい
・固定$5で予算管理を確定したい
1呼び出しあたりCPU時間に上限(FreeはCPU 10ms、PaidはCPU 30秒まで)。長時間のLLM呼び出しや重い計算を内部で同期的に走らせる設計は向かない。waitUntil() / Durable Objectsを正しく使い、外部APIへのI/Oは fetch の壁時間に流す設計が前提。
AWS Lambda — 永続無料枠 + ARM Graviton2で20%引き
AWS Lambdaは 1M requests + 400,000 GB-seconds/月の永続無料枠(新規アカウント限定ではなく恒久)を持つ点が他と一線を画す。シナリオAは無料枠内に完全に収まり、純粋にAWS他リソース(API Gateway等)のみが課金対象。
2026年の重要なオプションが ARM Graviton2。GB秒単価が$0.0000133334(x86の$0.0000166667比で20%引き)。報告ベースではワークロードによって最大34%のprice-performance改善。リクエスト単価は$0.20/100万reqでアーキ問わず同額。MCPサーバーは多くがNode.js/Pythonで動くため、純TypeScriptなら無条件でARM64を選んで問題ない。
シナリオBの試算: (1000万 − 100万) × $0.20/1M = $1.80 + コンピュート分(無料枠内)で合計約$2.50/月に落ち着く。Workers Paid($5固定)よりさらに安いケースが多い。ただしコールドスタート平均280msはMCPユーザー体験では明確に体感できる差で、これを許容できるかが選定軸になる。
# AWS SAM template抜粋(ARM64 + 永続無料枠最大化)
Resources:
McpServer:
Type: AWS::Serverless::Function
Properties:
Runtime: nodejs20.x
Architectures: [arm64] # ← 20%引き
MemorySize: 256
Timeout: 30
Handler: dist/handler.mcp
Vercel Functions — 開発体験と「3軸課金」のトレードオフ
Vercel Functionsは 3軸同時課金 という独特な料金体系を持つ。$0.60/100万invocations + $0.128/CPU時間 + $0.0106/GB時間のメモリ。Hobbyプランの無料枠は100,000 invocations(後述: 1M invocationsとの記載もありplan依存)、Proプランは$20/月で1M invocations込み。
シナリオAはPro $20/月の範囲内、シナリオBは1000万 − 1M = 900万 × $0.60/1M = $5.40追加 + CPU/メモリ加算。同じ呼び出し量でWorkers Paidの3〜4倍になる傾向だが、Next.js統合・プレビューデプロイ・Edge Network・チーム機能などの開発体験を取りに行く価値があるかで判断する。
2026年4月以降に話題になった「実際の請求が$286になった」事例(2026 Deploywiseレポート)は、Pro $20の固定額ではなく 3軸×超過分 が積み上がった結果で、MCPサーバーのトラフィックが想定より大きい場合に発生し得る。on-demand usage budget(デフォルト$200)の設定は必須。
(1) メモリ大きめのFunctionをデフォルトのまま運用 → GB時間が積み上がる。(2) ストリーミング応答でCPU時間がカウントされる。(3) bandwidth超過(MCPがファイル系を返す場合)。usage budgetを設定し、毎週請求アラートをチェック。
Railway — Dockerコンテナ系の安心と従量制
Railwayは サブスクリプション+使用クレジット込み という料金モデル。HobbyプランはサブスクリプションのみでOK(月$5、$5分使用クレジット込み)、Proプランは月$20で$20分の使用クレジット込み。超過分はvCPU $20/月、RAM $10/GB/月の従量で課金される。秒単位でCPU/メモリ使用量を計測するため アイドル時は実質ほぼゼロ。
MCPサーバーをDockerで動かしたい・既存のWebSocket/SSE永続接続を活かしたい・OSSのMCPサーバー(MongoDB MCP等)を改修せずそのまま動かしたいケースでは、サーバーレスよりコンテナ系のRailwayが現実的だ。Postgres・MySQL・Redisのマネージドが組み込まれ、永続ボリュームとオブジェクトストレージも含まれる。
シナリオA(月100万呼び出し)では shared CPU 0.5 vCPU + 512MB RAMが概ねHobby枠($5/月)内。シナリオBでは1〜2 vCPU + 1〜2GB RAMでProプラン$20の使用クレジット内に収まることが多い。scale-to-zero未対応の構成だと、深夜の無トラフィック時間もコストが発生する点には注意。
Fly.io — エッジコンテナ、無料枠廃止後の現実
Fly.ioは2024年に 無料枠を廃止。新規アカウントには$5の試用クレジットが付与されるが、その後はクレジットカード必須で、すべてのMachineとストレージが課金対象となった。
料金構造はfixed planではなく完全従量制。shared-cpu-1x、256MB RAMのMachineを常時稼働で約$1.94/月、ストレージ$0.15/GB/月、egress $0.02/GB〜。最小現実コストは小規模アプリで約$5/月。
Fly.ioの強みは シングルバイナリでマルチリージョン にMachineを撒けること(複数地域でMCPサーバーをミラー)。Cloudflare Workersほどのグローバル分散ではないが、Lambdaが原則us-east-1中心になるのに対し、東京・大阪・シンガポール・フランクフルトに同じコンテナを置いて低レイテンシ提供する設計がしやすい。長時間タスク・WebSocket常時接続・カスタムランタイム(Go、Rust、Bun等)を使うMCPサーバーで真価を発揮する。
用途別の選定フロー
「迷ったらこれ」という万能解は存在しない。以下のフローで多くのケースをカバーできる。
- 短時間・高頻度・コールドスタート最小化 → Cloudflare Workers Paid($5固定)
- AWSエコシステム内・既存IAM活用 → AWS Lambda (ARM64) + API Gateway
- Next.js統合・チーム開発・プレビュー環境を最大限活用 → Vercel Functions(usage budget設定必須)
- Dockerコンテナでそのまま動かしたい・WebSocket永続接続 → Railway($5〜$20)
- マルチリージョン・カスタムランタイム・長時間タスク → Fly.io(複数Machine構成)
- 個人開発・PoCで完全無料に抑えたい → Cloudflare Workers Free(1日10万req) または AWS Lambda(永続無料枠)
- egressサイズが大きい(ファイル/ベクトル結果) → Cloudflare Workers + R2(egress無料)
FAQ
MCPサーバーを最も安く運用できるのは?
ワークロード次第。月100万呼び出しまで→AWS Lambda(永続無料枠で実質$0)。月1000万呼び出しまで→Cloudflare Workers Paid($5固定、egress無料)。1000万超え→Workers Paidが追加$0.50/100万req+egress無料で依然優位。永続接続が必要ならRailway($5〜$20、scale-to-zero次第)。
コールドスタートはどれが速い?
Cloudflare Workers(V8 Isolates、<5ms、報告ではsub-msも)が圧勝。AWS Lambdaはus-east-1で平均280ms。Vercel Functionsは100-200ms。Railway/Fly.ioは常駐コンテナのためコールドスタート概念は実質なし(scale-to-zero時は再起動に数秒)。
Fly.ioの無料枠はまだありますか?
2024年に廃止されました。新規アカウントには$5試用クレジットのみ。最小常時稼働(shared-cpu-1x、256MB RAM)で約$1.94/月、実務最小コストは約$5/月です。
AWS Lambda ARMは本当に20%引きですか?
はい、GB秒単価が$0.0000133334(x86の$0.0000166667比で20%引き)になります。リクエスト単価は$0.20/100万reqでアーキ問わず同額。MCPサーバーがNode.js + 純TypeScriptならARM64を無条件で選んで問題ないケースが多いです。
Cloudflare Workers無料プランで本番運用できますか?
個人開発・小規模PoCなら可能ですが、本番は$5/月のPaidが標準解です。Freeは1日10万req・CPU 10ms/invocationの上限があり、エンタープライズ向けMCPサーバーには厳しい。Paidなら1000万reqまで$5、追加$0.50/100万reqでegress無料。
シナリオに当てはまらない大量ワークロード(月1億呼び出し以上)は?
その規模では 専用契約・コミット割引 の領域。Cloudflare Workers for Platformsのエンタープライズプラン、AWS Compute Savings Plans(Lambdaも対象)、Vercel Enterpriseなど。月100M req以上ならVercelで$200のon-demand budget上限を超えるリスクがあり、Workers Paid or Workers Enterprise一択になりがちです。
本記事の料金・性能数値は2026年5月時点の各社公式ドキュメントとサードパーティレポートに基づきます: Cloudflare Workers Paid($5/月、1000万req込み、egress無料)は developers.cloudflare.com/workers/platform/pricing/、AWS Lambda(永続無料枠1M req + 400k GB-sec、ARM Graviton2 20%引き)は aws.amazon.com/lambda/pricing/、Vercel Functions(3軸課金、Hobby/Pro $20)は vercel.com/docs/functions/usage-and-pricing、Railway(Hobby $5/Pro $20、$20/vCPU/月、$10/GB RAM/月)は railway.com/pricing、Fly.io(2024年無料枠廃止、$5試用クレジット、shared-cpu-1x ≈ $1.94/月)は fly.io/docs/about/pricing/。コールドスタート数値はCloudflare公式blog(V8 Isolates <5ms)、Rebal AI Blog 2026年3月レポート(Lambda 280ms平均)に基づきます。Vercel $286請求事例はDeploywise 2026年レポート。サンプル試算は1呼び出しCPU 50ms / メモリ128MBを仮定したMCPサーバー典型値で、実際のワークロードに応じて変動します。本番運用前は最新の各公式ドキュメントを必ずご確認ください。