概要
中国のZhipu AI(智谱AI、現在はZ.AIとも表記)は2026年3月27日、コーディングタスクに特化したフラッグシップのオープンソース大規模言語モデル「GLM-5.1」を公開した。MITライセンスのもとで重みが公開されており、開発者が自由に利用・改変できる。特筆すべきはソフトウェアエンジニアリングベンチマーク「SWE-Bench Pro」でスコア58.4を記録し、Claude Opus 4.6(57.3)、GPT-5.4(57.7)、Gemini 3.1 Pro(54.2)といった米国主要モデルを上回ったとの同社発表だ。これは中国製モデルがこのベンチマークで米国主要モデルを初めて超えたケースとして注目されている。
技術的な詳細
GLM-5.1はMixture-of-Experts(MoE)アーキテクチャを採用しており、総パラメータ数は744Bだが、推論時にはトークンあたり40Bのみが活性化される設計となっている。コンテキストウィンドウは200K、最大出力は128Kに対応する。特徴的なのは単純なコード生成を超えた「最大8時間の長時間自律実行」を実現している点で、計画立案・実行・テスト・修正・最適化までの一連の工程を自律的にこなし、本番環境対応のアウトプットを生成できるという。オプションのDeep Thinking機能、ストリーム型ツール呼び出し出力、Claude CodeやClineなどOpenAI互換ツールへの対応も備え、vLLM・SGLang・KTransformersを用いたデプロイが可能だ。
SWE-Bench Pro以外のベンチマークでも、CyberGym(68.7)、MCP-Atlas(71.8)、AIME 2026(95.3)、GPQA-Diamond(86.2)といった高いスコアを示している。ただしSWE-Bench Verified(コード修正成功率)では77.8%と、Claude Opus 4.6(80.8%)やGPT-5.4(80.0%)をやや下回る結果もあり、ベンチマークによって得意・不得意があることが示されている。
開発背景と注目ポイント
Zhipu AIはNvidiaのGPUを使用せず、華為(Huawei)のAscend 910Bチップ10万基とMindSporeフレームワークでGLM-5.1を訓練した。同社は2025年1月に米国の輸出規制リスト(エンティティリスト)に掲載されたが、開発を継続し、2026年1月には香港IPOで約5億5800万ドル(約857億円)を調達している。今回の公開はGLM-5(2月)、Turbo版(3月中旬)に続く6週間で3度目の重要モデル更新であり、急速な開発ペースを維持している。
展望と課題
GLM-5.1のオープンソース公開は、オープンウェイトのコーディング特化モデルとして開発者コミュニティへの訴求力が高く、「80%のスタートアップが中国オープンモデルを採用」という現状をさらに後押しする可能性がある。一方でSWE-Bench Proのスコアは現時点でZhipu AI自身の自己申告であり、第三者機関による独立した評価はまだ確認されていない点には注意が必要だ。米中のAI競争が激化するなか、Huaweiチップを活用した大規模訓練インフラの実績とオープンソース戦略の組み合わせは、今後の中国製LLMの動向を占う重要な事例となりそうだ。