117万トークンが1,069に——CloudflareのMCP「Code Mode」が変えるAPIの呼び方

この記事のポイント

Cloudflareが公開しているAPIエンドポイントは2,594以上ある。Workers、KV、R2、D1、Pages、DNS、Firewallなど、インフラ周りをほぼすべてカバーする規模だ。これをMCPツールとして素直に展開すると、そのツール定義だけで約117万トークンを消費する。コンテキストウィンドウの大部分が、API仕様書で埋まってしまう計算になる。

Cloudflareが「Agents Week 2026」で発表した「Code Mode」は、この問題に対して別のアプローチで応答した。117万トークンを、わずか1,069トークンに収める。削減率は99.9%。

なぜ従来型MCPはここまでトークンを消費するのか

MCPの設計上、ツール定義はLLMのコンテキストにすべて展開される。エンドポイントが100本あれば100本分の説明文・パラメータ定義が積み上がり、2,500本超なら117万トークンが積み上がる。それだけではない。LLMが31件のカレンダーイベントを処理する場合、従来の設計では31回の独立したツール呼び出しが発生する。逐次実行のオーバーヘッドが、さらにコストを押し上げる。

Cloudflareのエンジニアリングチームが着目したのは「LLMはツール呼び出しより、コードを書く方が得意」という事実だ。TypeScriptの学習データはインターネット上に大量に存在するが、MCPのツール呼び出しパターンは合成データに頼らざるを得ない。コードを書かせれば、LLMは本来の強みを発揮できる。

2ツールだけで済む仕組み

Code Modeが公開するMCPツールはsearch()execute()の2本だけだ。

search()は、OpenAPI仕様をコンテキストに展開する代わりに、サーバー側に保持しておく。LLMが「Workersのデプロイに関するエンドポイントを調べたい」と思えば、プロダクト名・パス・タグで絞り込んで必要な分だけ取得できる。全仕様をコンテキストに詰め込む必要はない。

execute()は、LLMが生成したJavaScriptコードを受け取って実行する。実行環境はDynamic Worker——V8アイソレートベースのサンドボックスだ。ファイルシステムへのアクセスはなく、外部ネットワークも遮断されており、RPCを通じたツール呼び出しのみが許可されている。cloudflare.request()という専用クライアントでAPIを叩く設計なので、任意コード実行に近い柔軟性を持ちながら、逸脱できる範囲は構造的に制限されている。

31件のカレンダーイベントを処理する例が分かりやすい。従来型なら31回の独立したツール呼び出しが必要だったところ、Code Modeでは「31件をループしてAPIを叩くJavaScriptコード」を1回生成して実行するだけで済む。単純タスクで32%、このようなバッチ処理では81%のトークン削減を確認している。

接続方法とこの発表の文脈

MCPクライアントの設定に1行追加するだけで使い始められる。

{"mcpServers": {"cloudflare-api": {"url": "https://mcp.cloudflare.com/mcp"}}}

認証はOAuth 2.1(推奨)またはAPIトークンで行う。

この発表はAgents Week 2026の一環だった。同週にCloudflareはDynamic Workers(V8アイソレートベースのコンテナより100倍高速な起動環境)、エージェント向け永続Linux環境のSandboxes GA、エージェントの記憶を管理するAgent Memory、RFC 9728採用のManaged OAuthなど、エージェントインフラを一気に積み上げた。Code Modeはその中の一つだが、MCPの設計思想そのものに疑問を呈しているという点で、他の発表とは異なる性格を持つ。

残る問い

「LLMが生成したコードをそのまま実行する」というアプローチには、当然の疑問が伴う。コードの品質はLLMの出力に依存するため、エラーハンドリングやエッジケースの処理が意図通りに行われるかどうかは、コンテキストの設計次第になる。サンドボックスが逸脱を防ぐとはいえ、「意図通りに動くコード」と「安全なコード」は別の話だ。

もう一点、スケーラビリティも気になる。現在の実装でLLMが生成できるJavaScriptの複雑さに上限はあるのか、長時間バッチ処理でのV8アイソレートの振る舞いはどうなのか——公式ドキュメントには詳細が乗っていない部分もある。

99.9%削減という数字のインパクトは疑いようがない。ただ、「コードを書かせる」という設計が万能かどうかは、実際に複雑なユースケースで使い込まれてからが本番だろう。MCPのエコシステムが公開サーバー1万以上、SDK月間ダウンロード9,700万という規模に達している今、その答えが出るのはそう遠くないはずだ。


関連記事


Sources

この記事をシェア