GPT-5.5/GPT-6こと「Spud」、3月に学習完了で4月末リリースが有力

OpenAIの次期フラッグシップモデル、コード名「Spud」(ジャガイモの意)の事前学習は2026年3月24日に完了した。Sam Altmanはその日のうちに「数週間以内にリリース」とXに投稿しており、4月14日〜5月5日が有力なリリースウィンドウとされている。Polymarketは4月30日までのリリースを78%と見ており、予測市場としては相当高い水準だ。
正式名称はまだ決まっていない。GPT-5.5になるのかGPT-6になるのかは、実際の性能の跳躍度によって判断されると伝えられている。78%という確率が業界の期待と緊張感の両方を凝縮しているとすれば、この命名の曖昧さはもう一つの読み所だ。
事前学習は3月24日に完了済み
Spudの事前学習が完了したのは2026年3月24日。Sam AltmanがX(旧Twitter)で「数週間以内にリリース」と述べたのはその日のことだ。あれから3週間近くが経過し、いよいよそのウィンドウに入ってきた。
リリーススケジュールとしては、4月14日から5月5日の間が有力視されており、Polymarketのオッズは4月30日までに78%、6月末までには95%を示している。残る22%の不確実性には、ポスト学習の安全評価やEU AI法に基づく規制審査、Google I/O(5月19〜20日)との競合タイミングへの配慮などが絡んでいる。
「インクリメンタルな改善ではない」
命名をめぐる議論の焦点は、性能の跳躍度にある。
Greg Brockmanは社員向けメッセージで「2年分の研究の成果。モデル開発に対する考え方の大きな変化だ」と語っている。Sam Altmanは「経済を大きく加速させる可能性があるモデル」と表現したとも伝えられている。
いずれの発言も、意図的にハードルを上げている。実際、直近のGPT-5.4がOSWorld-Verified(PCオペレーティングシステム上での自律タスク評価)で75.0%を記録しており、Spudはこれを大きく上回ることが見込まれている。仮にこれが「GPT-5.5」の範疇に収まる改善であれば、Brockmanがわざわざ「インクリメンタルな改善ではない」とは言わないだろう。GPT-6を名乗る可能性を排除できない背景はここにある。
性能面で何が変わるのか
複数の情報源が示す予測仕様には、コンテキストウィンドウの大幅拡張(256K〜512Kトークン規模)、エージェント的なマルチステップタスクでのツール連携精度の向上、コード生成ベンチマーク(HumanEvalなど)での8〜12ポイント改善が並ぶ。これらはあくまで予測であって公式発表ではないが、既存のGPT-5(128Kトークン)と比較すると方向性は一致している。
注意しておきたいのは、Spudが「o3系列」とは別の路線に位置する点だ。o3はステップバイステップの推論に特化した最適化モデル系列であり、Spudは汎用フラッグシップの主軸を担う。混同されやすいが、用途の設計が異なる。
なぜ「今」なのか
Anthropic Claude CodeとGoogle Geminiの急成長は、OpenAIが「最先端モデルを出し続ける会社」というナラティブを維持するうえでの圧力になっている。Claude 3.7 Sonnetが特定のコーディングタスクでGPT-5を超えたという評価も広まっており、OpenAI内部にはリリースを急ぎたいという空気がある。
一方で、急いで出した「残念なアップデート」が信頼を損なうリスクも十分認識されている。Spudが本当にGPT-6を名乗るなら、それ相応の質を伴わなければブランドの毀損につながる。命名の慎重さは、その綱引きの反映でもある。
4月中旬という今この瞬間、OpenAIは相当なプレッシャーの中にいる。Spudが本当に「経済を大きく加速させる」ものかどうか、発表を待つ以外に確かめる方法はない。
関連記事
- OpenAIがAgent Skills標準を正式採用、Anthropicが業界仕様を2度主導する構図
- ARR $30BでAnthropicがOpenAIを抜いた 3.5GWコンピュート確保が示す次の賭け
