Googleがマルチエージェント管理基盤「Scion」をOSS公開、コンテナ分離でエージェントを並列実行

概要 Googleは、複数のAIエージェントを並列かつ分離した環境で管理するオーケストレーション基盤「Scion」を実験的なオープンソースプロジェクトとして公開した。Scionは「エージェントのハイパーバイザー」として機能し、ローカル環境やリモートVM、Kubernetesクラスタをまたいでエージェントグループを統制する。各エージェントには独自のコンテナ、Gitワークツリー、認証情報が割り当てられ、プロジェクトの異なる部分を干渉せずに並行して担当できる設計となっている。 アーキテクチャと技術的な詳細 Scionの特徴はルールをエージェントのコンテキストに埋め込むのではなく、インフラストラクチャ層で境界を強制する「分離優先」の設計思想にある。Googleはこのアプローチを「–yoloモード」と表現しており、エージェント自体の行動制約に頼らず、コンテナ化・Gitワークツリー・ネットワークポリシーによって隔離を実現する。 タスク管理では動的なタスクグラフを並列実行し、コーディング・監査・テストなど異なる役割を持つエージェントが協調して動作できる。エージェントのライフサイクルは柔軟で、長期稼働する専門エージェントと単一タスク専用のエフェメラルエージェントの両方をサポートする。コンテナランタイムはDocker・Podman・Appleコンテナ・Kubernetesからプロファイルで選択可能だ。 また、Gemini CLI・Claude Code・OpenCode・Codexなどの人気エージェントに接続するための「ハーネス」アダプタが提供されており、各ハーネスのサポート機能レベルは異なる。独自の用語体系として、プロジェクト単位を「grove」、中央コントロールプレーンを「hub」、hubが稼働する場所を「runtime broker」と定義している。 デモと今後の展望 Scionの能力を示すデモとして、エージェントグループが協力して計算パズルを解くゲーム「Relics of the Athenaeum」が同時に公開された。このデモでは、異なるハーネスを使用するエージェントが共有ワークスペースやダイレクトメッセージで連携しながら動作する様子を確認できる。Scionの公開は、AIシステムの複雑化にともない、マルチエージェントの協調フレームワークへの業界の関心が高まっていることを反映しており、専門化されたエージェントワークフローが本番環境で普及していく流れを加速させる可能性がある。

April 7, 2026

Tufts大学の神経記号型AI、エネルギー消費を従来比100分の1に削減しながら精度も大幅向上

概要 Tufts大学のMatthias Scheutz氏率いる研究チームが、ニューラルネットワークと記号的推論(シンボリック推論)を組み合わせた「神経記号型AI(ニューロシンボリックAI)」システムを開発し、その成果を発表した。このハイブリッドアーキテクチャは、タワーオブハノイ(ハノイの塔)パズルにおいて95%の成功率を達成した。一方、従来の純粋なニューラルネットワークベースのモデルでは同タスクの成功率がわずか34%にとどまっており、精度面での大幅な向上が確認された。 エネルギー効率の改善 精度向上に加え、このアプローチはエネルギー効率の面でも画期的な成果を示している。学習(トレーニング)フェーズにおけるエネルギー消費は従来モデルのわずか1%、推論(動作)フェーズでも**5%**程度に抑えられている。現在、AIシステムは米国の総電力消費の10%以上を占めるまでに拡大しており、そのエネルギー消費問題は業界全体の課題となっている。今回の研究成果は、この問題に対する有力なアプローチとして注目されている。 技術的背景と意義 従来のディープラーニングモデルは大量のデータと膨大な計算資源を使った試行錯誤の学習に依存しており、これがエネルギー消費の増大につながっていた。神経記号型AIは、ニューラルネットワークによるパターン認識能力と、記号推論によるルールベースの論理的思考を組み合わせることで、より少ないリソースで高い推論能力を実現する。タワーオブハノイのような構造的な問題解決タスクでは、この記号推論部分が特に効果を発揮する。 今後の展望 今回の研究は、AIの能力向上と省エネルギー化を同時に実現できる可能性を示した点で重要な一歩となる。今後は、より複雑なタスクへの適用や、実用的なAIシステムへの統合が課題となる。エネルギー消費の増大が懸念されるAI業界において、神経記号型アプローチは持続可能なAI開発の方向性を示す研究として、引き続き注目が集まりそうだ。

April 7, 2026

AnthropicのARRが300億ドル超に急拡大、GoogleおよびBroadcomと次世代TPU複数ギガワット規模の大型契約を締結

概要 Anthropicは2026年4月6日、GoogleおよびBroadcomとの大型コンピュートパートナーシップの拡大を発表した。2027年から稼働開始予定の次世代TPU(Tensor Processing Unit)を複数ギガワット規模で確保する契約であり、フロンティアAIモデル「Claude」の訓練・運用インフラを大幅に強化する。あわせて、同社の年間換算収益(ARR)が300億ドルを超えたことも公表された。これは2025年末時点の約90億ドルから数ヶ月で3倍以上に急増した数字であり、AIサービス市場における同社の急速な成長を示している。 急成長する顧客基盤と収益 Anthropicの財務指標は急速に改善している。年間100万ドル以上を支出するエンタープライズ顧客数は、わずか2ヶ月足らずで500社から1,000社超へと倍増した。CFOのKrishna Rao氏は今回のパートナーシップについて「これまでで最も重要なコンピュートコミットメント」と評価し、「インフラスケーリングに対する規律あるアプローチの継続」と述べた。急増する顧客需要に対応するため、大規模なコンピューティングキャパシティの確保が急務となっていた背景がある。 インフラ戦略とマルチプラットフォームアプローチ 新たに確保するコンピュート容量の大部分は米国内に設置される予定であり、Anthropicが2025年11月に表明していた米国AIインフラへの500億ドル投資コミットメントをさらに拡大する形となる。同社はAWS Trainium、Google TPU、NVIDIA GPUといった多様なハードウェアプラットフォームでClaudeの訓練・推論を行うマルチクラウド戦略を維持しており、Claudeはこれまで通りAmazon Web Services、Google Cloud、Microsoft Azureの3クラウドで提供される。特定ベンダーへの依存を避けながら、スケーラブルなインフラを構築する姿勢が明確になっている。 今後の展望 今回の契約は2027年以降の大規模なコンピュート確保を見据えたものであり、より高性能なAIモデルの開発・提供に向けた長期的な布石とみられる。ARRの急増とエンタープライズ顧客の拡大が続く中、Anthropicは競合他社との差別化を図るうえでコンピュートの優先確保を最重要課題の一つと位置付けている。次世代TPUの本格稼働を迎える2027年以降、同社のモデル性能とサービス提供能力がさらに向上することが期待される。

April 7, 2026

OpenAI・Anthropic・Google、Frontier Model Forumを通じて中国によるモデル蒸留攻撃への共同対策を発表

概要 OpenAI、Anthropic、Googleの3社は2026年4月、Frontier Model Forum(FMF)を通じた共同対策として、中国AI企業による無断モデル蒸留攻撃(Adversarial Distillation)の検知・阻止に向けた脅威情報の相互共有を開始したと発表した。FMFはOpenAI、Anthropic、Google、Microsoftが2023年に設立した業界非営利組織で、今回の協調行動はフロンティアAIモデルの知的財産保護を目的とした初の本格的な共同取り組みとなる。 背景には、2026年2月に相次いで明らかになった「産業規模」の蒸留攻撃キャンペーンがある。Anthropicは、DeepSeek・Moonshot AI・MiniMaxの3社が合計約2万4千の不正アカウントを使って約1600万件ものClaudeとのやり取りを生成し、モデルの応答データを収集していたと公表。OpenAIも同時期、米下院中国特別委員会への提出文書の中でDeepSeekによる蒸留活動の継続的な観測を報告した。 攻撃手法と規模 Adversarial Distillationとは、大規模な「教師モデル」の出力データを使って小型の「生徒モデル」を訓練することで、研究コストをかけずにモデル能力を模倣する技法である。正規の用途も存在するが、利用規約への同意なしに組織的・大規模に行われる場合は知的財産の侵害とみなされる。 Anthropicが特定した攻撃の内訳は以下の通りだ。DeepSeekは15万件超のやり取りを通じて推論能力や政治的に敏感な質問への応答パターンを収集し、Moonshot AIは約340万件のクエリでエージェント推論・ツール使用・コーディング・コンピュータビジョンを標的にした。MiniMaxは最大規模の約1300万件の交換を実施し、コーディングとツール活用能力の吸い出しを図った。攻撃者たちは商業プロキシサービスと「ヒドラクラスター」と呼ばれる2万以上の不正アカウント群を組み合わせ、検知を回避するために蒸留トラフィックを無関係なリクエストに紛れ込ませる手口を使っていた。 FMFの対応と分類フレームワーク FMFは2026年2月16日に脅威情報共有の進捗レポート、同23日には「Adversarial Distillation」のイシューブリーフを公表し、攻撃手法を次の5種類に分類した:Chain-of-Thought Exfiltration(思考過程の抽出)、Chain-of-Thought Critiquing(批評プロセスの模倣)、Chain-of-Thought Autograding(自動採点機能の複製)、Prompt Generation for Reinforcement Learning(強化学習用プロンプト生成)、Synthetic Data Generation(合成データ生成)。数学・科学的推論、コーディング、マルチモーダル処理といった高付加価値能力の選択的な抽出は、フロンティアモデルに組み込まれた安全機能を迂回できるとして特に危険視されている。 安全保障上の懸念と反論 Anthropicは「蒸留されたモデルは必要なセーフガードを欠く」として、権威主義的政府によるサイバー攻撃・監視・偽情報工作への転用リスクを強調。OpenAIもDeepSeekのモデルが危険な用途における「意味のあるガードレールを持たない」と批判した。一方でGoogleは「一般ユーザーのデータや可用性への直接リスクはない」との立場を示し、RANDやカウンターポイント・リサーチなどの分析機関は、蒸留が業界標準の技法であり、今回の発表のタイミングと文脈が中国企業の半導体アクセス制限という地政学的文脈と重なると指摘している。米中AI覇権競争が激化するなか、今後もAI知的財産の保護を巡る議論は続くと見られる。

April 7, 2026

OpenAI出身者ら5名が最大1億ドルのVCファンド「Zero Shot」を設立、AIスタートアップへの早期投資を開始

概要 OpenAIの元従業員3名を含む5名が共同で新しいベンチャーキャピタルファンド「Zero Shot」を設立し、最大1億ドルの資金調達を目指していることが明らかになった。ファンド名はAI分野の専門用語「ゼロショット推論(zero-shot inference)」に由来し、スローガンは「Investing in the Post-AGI World(ポストAGI時代への投資)」。すでに2,000万ドルの第1次クローズを達成しており、AIベースの管理ソフトウェア企業「Worktrace AI」やAI活用の工場ロボティクス企業「Foundry Robotics」などへの投資を実行済みだ。 ファンドの創設者と背景 創業パートナーは5名。DALL-EやChatGPT、CodexのローンチをOpenAIで担当したEvan Morikawa(現ロボティクス企業Generalist在籍)、OpenAI初代プロンプトエンジニアでポッドキャストホストも務めたAndrew Mayne(AIコンサルティング会社Interdimensional創業)、エンジニア・研究者出身でGenAIスタートアップSynthefyも手がけるShawn Jain、グロースステージVC「01A」出身のKelly Kovacs、そして元Twitter・Disney出身のBrett Rounsavilleという顔ぶれだ。アドバイザーにはOpenAI元人事部長のDiane Yoon、元コミュニケーション部長でApple広報責任者も歴任したSteve Dowling、元プロダクトリーダーのLuke Millerが名を連ねる。 設立のきっかけについてMayneは「OpenAIを離れた後、VCからAI技術についてのコンサルティング依頼が相次いだ。物事の行方を自分たちの方がよく把握しており、優れたビルダーたちへのアクセスもある。それなら自分たちでファンドをやるべきだと判断した」と語っている。 投資戦略とトレンドの位置付け Zero Shotは「バイブコーディング(vibe coding)」や「デジタルツイン」といった過剰に炒り立てられたセクターを意図的に避け、技術的な内部知識と優秀なビルダーコミュニティへのアクセスを強みとした早期ステージ投資に特化している。今回の動きは、「OpenAI Mafia」とも称されるOpenAI出身者が独立してVCや新企業を次々と立ち上げているという広いトレンドの一部でもある。The Informationも同様に「OpenAIマフィアが広がる中、元スタッフがファンドを設立」として報道しており、AIエコシステムにおける元OpenAI社員ネットワークの影響力は今後さらに拡大していくとみられる。

April 7, 2026

Google ADK Go 1.0正式リリース、本番対応のAIエージェント開発がGo言語で本格化

概要 Googleは2026年3月31日、Go言語向けAIエージェント開発キット「Agent Development Kit for Go(ADK Go)」のバージョン1.0を正式リリースした。これまで実験的なスクリプトレベルに留まっていたGoでのAIエージェント開発を、本番運用に耐えるサービスレベルへと引き上げることを目的としたGAリリースであり、Goエコシステムでのエージェント開発が本格的な段階に入ったことを示している。 主要な新機能 ADK Go 1.0では、本番運用に不可欠な以下の機能が追加・強化された。 OpenTelemetryによるトレーシング: モデル呼び出しやツール実行ループのたびに構造化トレースが生成される。Cloud Traceなどの観測ツールと連携することで、エージェントの意思決定プロセスを可視化し、デバッグを大幅に効率化できる。 プラグインシステム: 新たに導入された「Retry and Reflect」プラグインにより、エージェントがツール実行中にエラーが発生した場合に自動で修正・再試行できる。手動介入の頻度を減らし、エージェントの自律性を高める。 Human-in-the-Loop(HITL)確認機能: ツールにRequireConfirmationフラグを設定することで、データベース削除などの重大な操作に対して人間による明示的な承認を要求できる。AIの自動化と安全性のバランスを保つ仕組みとして重要な機能だ。 YAML設定サポート: コマンドラインツールを通じてエージェントの設定をYAMLで管理できるようになり、バイナリの再ビルドなしに素早く構成を変更・反復できる。 Agent2Agent(A2A)プロトコル: Go・Java・Python間でAIエージェントが標準化されたプロトコルで相互通信できる。異なる言語で実装されたエージェントを組み合わせた複合システムの構築が容易になる。 設計思想と今後の展望 ADK Go 1.0は「Safe AI Framework」ガイドラインに準拠した設計となっており、セキュリティと可観測性を優先している。GoのパフォーマンスとシンプルさというGoらしい設計思想を継承しつつ、AIエージェント特有の課題である信頼性・安全性・透明性に対応した機能セットが揃った形だ。 多言語対応のA2Aプロトコルや充実したプラグイン基盤により、大規模なマルチエージェントシステムをGoで構築するための土台が整った。今後はGoエコシステムにおけるAIエージェント開発のデファクトスタンダードとしての地位確立が期待される。

April 7, 2026

OpenAIが超知能時代の経済政策を提言——ロボット税・公共富裕ファンド・週4日労働制を柱に

概要 OpenAIはCEOサム・アルトマンの名義で「Intelligence Age のための産業政策(Industrial Policy for the Intelligence Age)」と題した12〜13ページの政策文書を公表した。この文書はAI自動化が雇用と富の分配に与える影響を正面から取り上げ、政府・AI企業・市民社会が協調して対処すべき具体的な政策の枠組みを提示している。文書自体は「意図的に早期かつ探索的なもの」と位置づけられており、最終的な政策要求ではなく、国際的な議論の起点とすることを意図している。 主な政策提言 富の再分配については、市民がAI経済成長に直接参加できる「公共ウェルスファンド(Public Wealth Fund)」の創設を中心に据える。財源として、高所得者への資本利得税の引き上げ、持続的なAI収益に対する法人税、そして自動化労働への課税(いわゆる「ロボット税」)を組み合わせる構想だ。OpenAIは市場資本主義を否定するのではなく、再分配メカニズムを組み込むことで幅広い層がAI経済の恩恵を受けられる仕組みを目指している。 労働政策の面では、週4日・32時間労働(給与は現状維持)のパイロットプログラムの推進を求めており、生産性が維持されれば恒久化すべきとしている。また、AI導入でコスト削減した企業はその利益を年金・医療・育児に再投資すべきとし、AI採用の意思決定プロセスに従業員が正式な役割を持つべきとも主張する。自動化によって職を失った労働者には、柔軟な失業給付・迅速な支援・訓練バウチャーを提供するとともに、育児・介護・教育・医療といったケア経済の雇用を代替的な受け皿として支援する方針も示した。 インフラ・ガバナンス面の提言 文書はAIへの公平なアクセスをリテラシーや電力と同様に不可欠なインフラとして位置づけ、「スタートアップ・イン・ア・ボックス」支援パッケージやエネルギーインフラの拡充を求めている。ガバナンス面では、公的説明責任を組み込んだ構造の整備、危険なAIシステムに対するモデル封じ込めプレイブックの策定、そしてグローバルAI機関を通じた国際協力の推進を訴える。 背景と意義 今回の提言は、AGI(汎用人工知能)や超知能の実現が現実味を帯びる中で、AI開発の最前線に立つOpenAI自身が経済的・社会的リスクを正面から認めた点で注目される。アルトマンCEOはかねてからベーシックインカムやAI課税の議論に関心を示してきたが、今回は組織としての公式文書として包括的な政策枠組みを示した。市場原理と再分配を組み合わせたアプローチは、テクノロジー企業の社会的責任をめぐる議論に新たな視点をもたらしており、各国政府や国際機関の政策立案にも影響を与える可能性がある。

April 7, 2026

MetaがカスタムAIチップ「MTIA」4種類を発表、Nvidia依存脱却へデータセンター展開を本格化

概要 Metaは自社開発のAIチップ「MTIA(Meta Training and Inference Accelerator)」シリーズとして、MTIA 300・400・450・500の4種類を発表した。MTIA 400はすでにテスト段階に入っており、主要な商用製品と競争力のあるパフォーマンスを持つとMetaは主張している。MTIA 450・500については2027年末までに大規模展開が予定されており、AIインフラの自社化戦略が本格的に加速している。 技術的な詳細 MTIAシリーズは、コンテンツのランキング・レコメンデーション処理から、高度な生成AI推論(Generative AI Inference)まで幅広いワークロードに対応できる汎用設計が特徴だ。Metaが公開したスペックによると、HBMメモリ帯域幅はMTIA 400が9.2TB/s、MTIA 450が18.4TB/s、MTIA 500が27.6TB/sとなっており、主要な商用チップと競争力のあるパフォーマンスを実現しているとMetaは強調している。 背景と戦略的意図 MetaがMTIAシリーズを推進する主な動機は、NVIDIAをはじめとする外部ベンダーへの依存度を低減し、データセンター運用コストを大幅に削減することにある。AIモデルの学習・推論にかかるインフラコストは急増しており、独自チップの開発・展開によってその費用を長期的に抑えることが目標だ。2027年までに全シリーズをデータセンターへ展開することで、AIインフラの自主性と経済効率を高める長期戦略の一環となっている。GoogleのTPUやAmazonのTrainiumと同様に、Metaもハイパースケーラーとして独自シリコン路線を選択したことになる。 今後の展望 MTIA 450・MTIA 500は2027年に大量展開される見込みで、現行のMTIA 400よりもさらに高い性能と効率が期待されている。Metaは今後もMTIAシリーズの継続的な進化を通じて、AI推論コストの削減と自社AIサービスの競争力強化を目指す方針だ。Nvidia依存の軽減が実現すれば、調達コストの低減だけでなく、チップ設計や供給チェーンにおける戦略的な柔軟性も高まることになる。

April 6, 2026

OpenAI、Responses APIにシェルツール・エージェントスキル・コンテキスト圧縮を追加しエージェント開発基盤を強化

概要 OpenAIはResponses APIに対して大規模な機能拡張を実施し、複雑なエージェントワークフローを構築するための基盤機能を一式追加した。今回の更新により、開発者はカスタム実行環境を自前で構築せずとも、単一のプロンプトから長時間にわたるタスクをこなすAIエージェントを作れるようになる。追加された主要機能は、シェルツール、組み込みエージェント実行ループ、ホスト型コンテナワークスペース、サーバーサイドコンパクション、そして再利用可能なエージェントスキルの5つだ。 シェルツールとコンテナ環境 新たに追加されたシェルツールにより、エージェントはUnixコマンド(grep、curl、awkなど)を含むターミナル環境で作業できるようになった。従来のPython実行だけでなく、Go、Java、Node.jsなど多様な言語・ランタイムの利用が可能になっている。ホスト型コンテナワークスペースは、ファイルシステムやオプションのSQLiteデータベース、制限されたネットワークアクセスを備えた隔離された実行環境を提供する。セキュリティ面では、APIキーなどの認証情報はモデルから見えないよう外部でプレースホルダーに置き換えられる仕組みになっており、組織レベルと個別リクエストレベルの二層アローリストでネットワーク権限を制御できる。 組み込みエージェント実行ループとコンパクション 今回のアップグレードの核心は、Responses APIに組み込まれた新しいエージェント実行ループだ。従来の「リクエストに即時回答する」モデルから、「モデルがアクションを提案→環境で実行→結果をフィードバック→タスク完了まで繰り返す」という反復型のエージェントランタイムへと転換される。長時間稼働するエージェントがコンテキスト上限に近づいた際の問題には、サーバーサイドコンパクションで対応する。過去のやり取りを単純に切り捨てるのではなく、モデルが過去のアクションをコンパクトな状態に要約することで、本質的なコンテキストを保ちながらトークン消費を抑える。手動で管理することなく自動的に動作する点が特徴だ。 再利用可能なエージェントスキル エージェントスキルは、複雑で繰り返し発生するタスクをモジュール化・再利用可能にするための仕組みだ。具体的にはSKILL.md(メタデータと実行手順)とサポートリソース(APIスペック、UIアセットなど)をまとめたフォルダバンドルとして定義される。モデルはメタデータを参照してスキルを呼び出すか判断し、必要に応じてフル手順を読み込む。実際の開発事例では、スキルの説明文に「この場合に使う/この場合は使わない」というルーティングロジックを書いたり、当初スキルベースのルーティング精度が約20%低下したが、ネガティブ例やエッジケースの説明を追加することで回復したという報告もある。スキルはテンプレートを内部に持てるため、関係のないクエリでは不要なトークンを消費しない設計になっている。 開発者への影響と今後の展望 今回の拡張により、OpenAI Responses APIは単なるLLM推論APIから、エージェントの実行基盤へと進化した。ファイル処理、プロンプト最適化、安全なネットワークアクセス、タイムアウト・リトライ管理といったインフラ課題をOpenAI側が担うことで、開発者はエージェントのロジック設計に集中できる。AIエージェントを活用したソフトウェア開発や業務自動化の複雑性を大きく下げる可能性があり、競合他社のエージェントフレームワークとの差別化要因となりそうだ。

April 6, 2026

AlibabaのQwenチームがFIPOを開発、推論モデルの思考チェーンを4,000から10,000トークンへ拡張

概要 AlibabaのQwenチームは、強化学習における報酬配分を改善する新アルゴリズム「FIPO(Future-KL Influenced Policy Optimization)」を開発した。このアルゴリズムは、推論モデルの「思考チェーン」が一定の長さで頭打ちになるという既存手法の根本的な限界に対処するもので、Qwen2.5-32Bモデルでの検証において応答長を約4,000トークンから10,000トークン以上に拡張し、数学ベンチマークの精度も大幅に向上させた。 FIPOのしくみ 従来のGRPOなどの強化学習手法では、生成されたシーケンス内のすべてのトークンに対して同一の報酬が付与されるため、モデルがより深い推論を行うインセンティブが生まれにくかった。FIPOはこの問題を「先読み」アプローチで解決する。具体的には、あるトークンを生成した後にモデルの挙動がどのように変化するかを追跡し、後続トークンにわたる累積的な確率変化を計算することで、生産的な推論チェーンを開始するトークンには大きな報酬を、行き詰まりにつながるトークンには小さな報酬を配分する。 また、従来の一部手法が必要とする補助的な価値モデルを使用しない設計となっており、事前学習データによる汚染を回避しながらも同等の性能を維持している。 ベンチマーク結果と特記すべき挙動 Qwen2.5-32Bでの実験では、以下の改善が確認された。 応答長: 約4,000トークンから10,000トークン以上へ拡張 AIME 2024精度: 50%から56%に向上(訓練中のピーク時には58%を記録) AIME 2025精度: 38%から43%に向上 特筆すべきは、FIPOで訓練されたモデルが自発的に「検証行動」を獲得した点だ。異なる解法を切り替えながら答えを相互確認する挙動はOpenAIのoシリーズモデルの特徴と類似しているが、FIPOでは純粋な強化学習によって達成されている。 今後の展望と課題 現時点での検証は数学問題の単一データセットおよびlong chain-of-thought事前学習なしのベースモデルに限定されており、コーディングなど他の領域への汎化については未検討の状態だ。Qwenチームはシステムをオープンソース化する計画を示しており、補助的な価値モデルなしで推論性能を高めるこのアプローチが広く活用されることが期待される。

April 5, 2026