概要

OpenAIは2026年4月、コーディング支援AIツール「Codex」のデスクトップアプリ(macOS/Windows)に対して大幅なアップデートを実施した。今回の刷新では、PC画面の自律操作(computer use)、内蔵ウェブブラウザ、画像生成連携、90以上の外部プラグイン対応など、多岐にわたる新機能が追加されている。これにより、Codexはコーディング専用のツールから、あらゆる作業を担う汎用AIエージェントへと大きく進化した。アップデートはChatGPT認証済みのCodexデスクトップアプリユーザーへ段階的に提供される。

主要な新機能

最も注目される新機能が「computer use」と呼ばれるPC自律操作機能だ。Codexが独自のカーソルを操作してPC画面を直接制御できるようになり、たとえばXcodeでアプリを起動し、三目並べゲームのバグ(「プレイヤーの1クリックに対してコンピュータが2手進む」という不具合)を発見して自動修正するデモが披露された。macOS向けに先行提供され、複数エージェントの並列実行時もカーソルの競合が起きない設計となっている。

内蔵ウェブブラウザ機能では、Webコンテンツに対して直接指示を出すことが可能になった。ページ上の特定要素を選択して「フォントサイズを小さくしテキストを短縮して」といった指示を与えるデモが公開されており、現時点ではlocalhostのWebアプリに限定されているが、今後より広範なブラウザ制御への拡張が予定されている。さらに、GPT Image 1.5との連携による画像生成機能も追加され、Webプロジェクト内への画像配置やモックアップ・製品コンセプトの作成を一元的なワークフローで行えるようになった。

拡張エコシステムと連携機能

今回のアップデートでは、90以上のプラグインが同時に提供開始された。これらはMCP(Model Context Protocol)サーバーを介して外部アプリと連携するものであり、GitHubとのイシュー管理やデータ整理、複数プラットフォームにまたがる長期タスクの自動化を担うスケジューリング機能、マルチターミナルサポート、SSH経由のリモート環境への接続など、多彩なユースケースに対応する。

これらの拡張により、Codexは単なるコード補完・生成ツールを超え、開発ライフサイクル全体をAIが横断的に支援するプラットフォームとしての位置づけを強めている。バックグラウンドで複数のエージェントを並列実行できる点も、大規模プロジェクトへの適用を見据えた設計といえる。

今後の展望

Codexの今回の進化は、AIエージェントが人間の代わりにPCを直接操作するという「computer use」の実用化に向けた大きな一歩だ。OpenAIはlocalhostに限定している内蔵ブラウザの制御範囲を段階的に拡大する方針を示しており、今後はより複雑なWebタスクの自動化も視野に入ってくる。コーディング支援から始まったCodexが、あらゆる知的作業を担う汎用エージェントへと変貌しつつある流れは、AIツール全体の進化方向を示す象徴的な動きといえる。