概要

Cloud Native Computing Foundation(CNCF)は2026年3月、Kubernetes AIコンフォーマンスプログラムの大幅な拡張を発表した。2025年11月のプログラム開始以来、認定プラットフォーム数は18から31へと70%以上増加し、OVHcloud、SpectroCloud、JD Cloud、China Unicom Cloudなどの新規プラットフォームが加わった。KubeCon Europe 2026での発表では、最新のKubernetes v1.35に対応した新要件(KAR)も公開されており、AIインフラの標準化が業界全体で急速に進んでいることを示している。

新たに追加されたAI要件

v1.35サイクルで追加された主な要件は、エージェントAIワークロードへの対応を中心としている。エージェントワークフローサポートでは、複数ステップからなる複雑なAIエージェントの安全な実行環境(サンドボックス)が義務付けられた。インプレースPodリサイズは推論モデルが再起動なしにリソースを動的に変更できる機能で、稼働中の推論サービスへの影響を最小限に抑える。また、ワークロード対応スケジューリングにより、分散トレーニング時のリソースデッドロックを防ぐ仕組みが求められるようになった。

技術ベンチマークとして新たに3つのKAR仕様が追加されている。KAR-10はPod間の高性能通信、KAR-11は高度な推論イングレス、KAR-41はdisaggregated推論(プリフィルと復号フェーズを別ノードで処理する手法)のサポートを規定する。

コアとなる技術的柱

Google、Microsoft、RedHat、Kubermaticなど複数の組織が参加するオープンソースの共同作業として策定されたプログラムは、4つの技術的柱を持つ。**動的リソース割り当て(DRA)**はGPU/TPUを単純な個数でなく属性ベースで制御できる仕組みを提供し、データサイエンティストが必要なメモリ容量や特殊機能を細かく指定できるようにする。オールオアナッシングスケジューリング(KueueなどのKAR実装を通じて)は全リソースが確保できた場合のみジョブを開始することでクラスター効率を改善する。インテリジェントなオートスケーリングはCPU/メモリでなくGPU/TPU使用率などのカスタムAIメトリクスに基づくHPAをサポートし、標準化されたオブザーバビリティはアクセラレーターのパフォーマンスメトリクス(推論レイテンシ、スループット、ハードウェアヘルスなど)の統一的な公開を義務付ける。

今後のロードマップ

2026年に向けては、サードパーティによる自動検証を行う「Verify Conformance Bot」の導入が計画されており、現在の自己申告ベースから自動化された認定プロセスへの移行が進む。また、強化されたサンドボックスを備えるSovereign AI標準への対応拡張や、高度な推論パターンおよびセキュリティ要件をカバーする新しい認定基準の策定も予定されている。CNCFのAI Tech Radarレポートによれば、AIデベロッパーの41%がすでにクラウドネイティブを自認しており、今後もKubernetes上でのAIワークロード標準化の需要が加速すると見込まれる。