概要
米スタートアップArcee AIは、400Bパラメータのオープンウェイト推論モデル「Trinity Large Thinking」をApache 2.0ライセンスで公開した。CEO Mark McQuadeは「非中国企業がリリースしたオープンウェイトモデルとして史上最高性能」と主張している。同社は従業員わずか26名、トレーニング予算2000万ドルという極めて小規模なチームでこのモデルを開発しており、潤沢なリソースを持つ大手AIラボに少人数チームが真っ向から対抗できることを示す事例として業界の注目を集めている。
モデルはHugging Faceからウェイトをダウンロードして利用できるほか、Arcee APIを通じたクラウドホスト版(出力トークン100万件あたり$0.90)や、オンプレミスでのデプロイ・カスタムトレーニングにも対応している。
技術的な詳細
Trinity Large Thinkingは、短期的なコーディング性能よりも**長時間稼働するエージェントタスク(long-horizon agents)**に最適化されている点が特徴だ。マルチターンのツール呼び出しや、拡張ワークフローでのコンテキスト一貫性の維持、長期エージェントループでの安定したパフォーマンスを重視して設計されている。Arceeチームは「開発者が毎日24時間365日稼働させているエージェントで異常なほど優れたモデルを構築することに注力した」と説明している。
インフラ面では、事前学習にNVIDIA B300を2,048基、後処理学習にH100を1,152基使用。本番環境にはNVIDIA DynamoとBlackwell Ultra GPU、vLLMを組み合わせて運用している。ベンチマークでは、Kiloのエージェント特化評価「PinchBench」で2位を記録(1位はClaude Opus-4.6のみ)。OpenRouterにおける米国内オープンモデルの使用量でも首位を達成しており、ピーク時(2026年3月1日)には1日あたり806億トークン以上を処理したという。
普及の背景と今後の展開
同モデルが急速に普及した背景には、AnthropicがClaude Codeのサブスクリプション条件を変更し追加料金が必要になったことで、開発者がオープンソース代替を探し始めたタイミングがあったとされる。また、中国系AIモデルへのデータセキュリティ・地政学的リスクへの懸念から、自社インフラで運用・カスタマイズできる西側企業製オープンウェイトモデルへの需要が高まっていることも追い風となっている。
今後はTrinity Large Thinkingで確立したトレーニング手法を、Trinity-MiniやTrinity-Nanoといった小型モデルへディスティレーションで展開する計画だ。「まず大きなモデルで優れた手法を確立し、その後スタック下方へと流し込む」という段階的アプローチを採用しており、エンタープライズおよび開発者コミュニティへのさらなる普及拡大を目指している。