クラウド市場の年率収益が5,000億ドル突破——2026年Q1は35%成長でAIブームが成長を加速

概要 Synergy Researchが発表した調査レポートによると、2026年第1四半期のクラウドインフラ市場の四半期売上は1,290億ドル(約20兆6,400億円)に達し、年率換算収益が初めて5,000億ドル(約5,140億ドル)を突破した。前年同期比成長率は35%で、これは2021年第4四半期以来の最高水準であり、しかも9四半期連続で成長率が加速しているという異例の状況にある。過去12か月の累計収益も4,550億ドルに達している。 同社のチーフアナリスト、ジョン・ディンズデール氏は「Q1市場は10年前の15倍の規模に成長しており、現在も年率35%で拡大を続けている」とコメント。かつて成長が鈍化していたクラウド業界が、生成AIの爆発的な需要を受けて新たな成長局面に入ったと分析している。 大手3社のシェアと競合の台頭 市場シェアの構成はAWSが28%、Microsoft Azureが21%、Google Cloudが14%と前四半期から変化がなく、上位3社合計でパブリッククラウド市場の67%を占める。市場全体が35%成長しているにもかかわらず各社のシェア比率が不変なのは、大手3社がいずれも市場平均と同等のペースで成長していることを意味する。なお、MicrosoftとGoogle CloudはAWSを上回るペースで成長しているとも報告されており、シェア率の変化がより長期的な視点で注目される。 一方、AIワークロードに特化した「ネオクラウド」企業の台頭も顕著だ。CoreWeave、OpenAI、Oracle、Crusoe、Nebius、Anthropic、ByteDanceといった企業を含むネオクラウド5社がすでにトップ30プロバイダーにランクインしており、これらが合計で市場全体の約5%を占めるまでに急成長している。 地域別の成長動向と今後の見通し 地域別では米国市場が最大の規模を保ちつつ、Q1に37%の成長を記録した。アジア太平洋地域ではインド、インドネシア、台湾、タイ、マレーシアが現地通貨ベースで特に高い成長率を示した。欧州では規模面でUKとドイツがリードし、成長率ではアイルランド、ノルウェー、ポーランドが上位に入っている。 今後の見通しについて、Synergy Researchは生成AIの普及がクラウド消費をさらに押し上げ、新たな商業機会を創出し続けるとして、高い成長基調が継続すると予測している。市場の規模が大きくなるにつれ、同じ成長率を維持することは通常困難になるが、AIという構造的な需要ドライバーがある限り、急成長が当面続くとの見方が有力だ。

May 15, 2026

AnthropicのClaudeプラットフォームがAWSで一般公開、既存アカウントから直接利用可能に

概要 Amazonは2026年5月11日、Claude Platform on AWSの一般提供(GA)開始を発表した。これにより、企業は既存のAWSアカウントを通じてAnthropicのネイティブClaude Platformに直接アクセスできるようになった。AWSは「クラウドプロバイダーとして初めてネイティブClaude Platformエクスペリエンスへのアクセスを提供する」とアピールしており、別途Anthropicアカウントを作成・管理する手間なく、統合されたクラウド環境からClaudeの機能を活用できる点が特長だ。 これまでAnthropicのClaudeをAWS環境で利用するにはAmazon Bedrockを介したAPIアクセスが主な手段であったが、今回のGA化によりAnthropicネイティブの体験がAWSアカウントから直接提供されるようになった。企業にとってはアカウント管理の一元化や請求の統合が実現し、AI導入の障壁が大幅に低下する。 利用可能な機能 今回のリリースで利用できる主な機能は以下の通りだ。Claude Managed Agents(ベータ)とアドバイザー戦略(ベータ)によりエージェント型AIワークフローの構築が可能になるほか、Web検索・Web取得、コード実行、Files API(ベータ)、スキル(ベータ)、MCPコネクタ(ベータ)といった実用的なツール群が揃っている。また、プロンプトキャッシング、引用機能、バッチ処理、Claude Consoleも利用可能で、開発から運用まで一貫したプラットフォームを提供する。 セキュリティと運用体制 セキュリティ面では、Claude Platform on AWSはAnthropicが運営・管理するサービスであり、顧客データはAWSのセキュリティ境界外で処理される点に注意が必要だ。一方で、既存のIAM認証情報をそのまま活用できるほか、AWS統合請求によるコスト管理、CloudTrail監査ログによる操作履歴の追跡が可能となっており、エンタープライズ環境での運用管理を支援する。 提供リージョンと展望 サービスは北米・南米・欧州・アジア太平洋地域を含む全17リージョンで提供される。グローバルな展開体制によりデータレジデンシーの要件にも対応しやすくなっており、多国籍企業や規制の厳しい業界での採用が期待される。AnthropicとAWSの連携強化は、MicrosoftとOpenAIの関係に対抗する形でのクラウドAI市場の競争激化を示しており、今後の機能拡充にも注目が集まる。

May 14, 2026

GoogleがCloud Next '26でGKE Agent SandboxとHyperclusterを発表、AI推論インフラを大幅強化

概要 Googleは2026年のCloud Next ‘26において、AI時代の大規模ワークロードに対応するKubernetesインフラ基盤として、「GKE Agent Sandbox」と「GKE Hypercluster」という2つの新機能を発表した。マルチエージェントAIワークフローの利用が過去数ヶ月で327%急増し、組織の66%が生成AIアプリケーションにKubernetesを採用している現状を受け、GoogleはKubernetesをAIワークロードのオペレーティングシステムとして確立する戦略を鮮明にしている。 GKE Agent Sandbox:安全なエージェント実行環境 GKE Agent Sandboxは、信頼されていないエージェントコードを安全に実行するためのカーネルレベルの分離環境を提供する。gVisor技術を採用し、1秒あたり300のサンドボックスを生成できる高速なプロビジョニング性能を持ち、ウォームプールの活用によってコールドスタートを1秒未満に抑える。 KubernetesプリミティブとしてSandbox・SandboxTemplate・SandboxClaimという3つの新規リソースを導入しており、オープンソースの実装として任意のKubernetesクラスタへの導入も可能だ。GoogleはCloudflareやE2Bなど独自サービスを提供する競合とは異なり、標準的なKubernetesプリミティブとして展開する点を差別化要因として強調しており、主要ハイパースケーラーの中で唯一のネイティブエージェントサンドボックスオファリングと位置付けている。 GKE Hypercluster:大規模AI基盤の統合管理 GKE Hypercluster(プライベートGA)は、単一のコントロールプレーンから複数リージョンにまたがる最大100万個のアクセラレータチップと最大256,000ノードを管理できる。従来のアーキテクチャでは大規模なAI基盤の運用において分断が生じていたが、Hyperclusterはこの課題を解消し、超大規模な分散推論ワークロードの統合管理を実現する。 推論パフォーマンスの改善 今回の発表にはインフラ管理以外の推論性能改善も含まれている。「予測遅延ブースト」機能では最初のトークンまでの遅延を最大70%削減でき、「KVキャッシュストレージティアリング」では50,000トークンのプロンプトに対して約70%のスループット向上を実現する。また「インテントベースオートスケーリング」では、メトリクスを外部監視スタックではなくPodから直接取得することで、HPA(水平Pod自動スケーラー)の反応時間を25秒から5秒へ短縮できる。これらの機能を組み合わせることで、GKE上でのAI推論ワークロード全体のコストパフォーマンス向上を図っている。

May 13, 2026

Grafana Kubernetes Monitoring Helm Chart v4リリース、GitOps対応と設定構造を大幅改善

概要 Grafana Labsは2026年4月、Kubernetes Monitoring Helm Chartのバージョン4を正式リリースした。同チャート導入以来最大規模のアップデートと位置付けられており、設定管理の構造的な改善とマルチクラスタGitOpsワークフローにおける信頼性向上が主な目的となっている。ユーザーがデプロイメントをスケールアップするにつれて顕在化していた設定上の課題に対応するもので、Argo CD、Terraform、Fluxなどを利用するGitOps環境での運用品質が大幅に改善された。 主な変更点 最も重要な変更の一つが、destinations定義のリスト形式からマップ形式への移行だ。従来のリスト形式では設定の順序が変わるだけでoverride設定が意図せず誤適用されるリスクがあったが、マップ形式への移行により安定した命名が保証される。これはGitOpsの差分管理との相性が悪かった既知の問題を根本から解決するものだ。 collector設定も大きく刷新された。ハードコードされていたcollector名は廃止され、ユーザーはcollectorをマップとして定義しclustered・statefulset・daemonsetのいずれかのプリセットを明示的に指定する形式に変わった。featuresを直接collector要素に割り当てることで、従来存在していた隠れたルーティングロジックが排除され、設定の透明性が向上している。 さらに、バックエンドサービスのデプロイと機能の消費を分離するためのtelemetryServicesキーが新設された。これによりNode ExporterやKube-state-metricsが意図せず重複デプロイされる問題を防止できる。単一だったclusterMetrics機能もclusterMetrics・hostMetrics・costMetricsの3つに分割され、それぞれ独立した設定オプションを持つようになった。 メモリ最適化とマイグレーション支援 パフォーマンス面では、Podラベルの取り扱いが「フィルタリング付き一括適用」から「明示的な宣言」方式へ変更されたことで、ログ収集パイプラインにおけるAlloyのメモリ消費量が大幅に削減される。大規模クラスター環境での運用コスト低減に直結する改善だ。 v3からの移行を支援するため、Grafanaはマイグレーションツールも提供している。v3のvaluesファイルを入力として受け取り、v4互換の出力を自動生成することで、設定の構造的変換を手動で行う負担を軽減する。今回のリリースは単なるバグ修正にとどまらず、大規模・GitOps環境での長期運用を見据えた設計の刷新といえる。

May 13, 2026

AnthropicがAkamaiと18億ドル・7年間のクラウドインフラ契約を締結、Akamai株が約26%急騰

概要 Anthropicは2026年5月8日、Akamaiとの間で総額18億ドル(約2,700億円)、期間7年間に及ぶ大規模なクラウドインフラ契約を締結したと発表した。この契約はClaude AIの利用需要が急拡大する中、同社が安定的かつ大規模な計算リソースを確保することを目的としている。年換算で約2億5,700万ドル規模となるこの契約は、AI企業が自社モデルの運用・推論インフラを長期契約で確保しようとするトレンドを明確に示すものだ。 発表を受けてAkamaiの株価は約26%急騰し、市場が同社のAIクラウド事業への転換を高く評価していることが浮き彫りになった。好調な決算発表とも重なり、投資家心理が大きく改善した形となっている。 AkamaiのAIクラウドへの事業転換 Akamaiはこれまで主にコンテンツデリバリーネットワーク(CDN)事業を中核としてきた企業だが、近年はクラウドコンピューティングおよびAIインフラ分野への積極的な転換を図っている。同社は世界中に分散した独自のエッジネットワーク基盤を持ち、これをAI推論や大規模モデルのサービング向けのインフラとして活用する戦略を打ち出している。今回のAnthropicとの大型契約は、その戦略が実を結んだ象徴的な成果といえる。 Anthropic側にとっても、AWS・Google Cloudといった既存のハイパースケーラーへの依存を分散させ、インフラ面での調達リスクを低減させる意味合いがある。AkamaiのエッジネットワークはClaude APIの低レイテンシー提供にも貢献しうるとみられており、両社の利害が一致した提携といえる。 業界への影響と今後の展望 AI企業による大規模インフラ投資はOpenAI・MicrosoftやGoogleとのエコシステム競争において重要な競争優位となっており、Anthropicの今回の動きもその文脈で捉えられる。一方、Akamaiにとっては伝統的なCDN市場の成長鈍化を補う形でAIクラウド収益を確保する足掛かりとなり、同社の事業ポートフォリオ転換を加速させる契機となる可能性が高い。 今後のAI需要の拡大にともない、Anthropicが他のインフラプロバイダーとも追加的な契約を結ぶ可能性は十分あり、AI基盤インフラをめぐる争奪戦はさらに激化するとみられる。

May 10, 2026

AnthropicがSpaceXのColossus 1全キャパシティを確保、22万GPU・300MW超の計算基盤でClaudeを強化

概要 AnthropicとSpaceXは2026年5月6日、Colossus 1データセンターの全コンピューティング資源をAnthropicが利用する契約を締結したと発表した。テネシー州メンフィスに位置するColossus 1は、22万基以上のNvidia GPU(H100、H200、次世代GB200アクセラレーターを含む)と300MWを超える電力容量を備える大規模AIインフラだ。Anthropicは契約締結から1ヶ月以内にこの計算リソースへのアクセスを取得する見込みであり、急増するClaude AIサービスへの需要に対応する。 SpaceXの傘下であるxAIがColossus 1のトレーニング業務をColossus 2へ移行させたことで、Colossus 1が空き状態となり、この大型契約が実現した。SpaceXのElon Musk CEOは本契約について「(面談したAnthropicのメンバーは)非常に有能で、責任あるAI開発への真摯なコミットメントを示していた」と肯定的にコメントし、「誰も悪意センサーを作動させなかった」と述べた。 Claudeサービスへの即時的な影響 今回の契約は、サービスの具体的な改善という形でClaude利用者にも直接的な恩恵をもたらしている。Anthropicは発表と同時に以下のようなレート制限の引き上げを実施した。 Claude Code:Pro・Max・Team・Enterpriseの全有料プランでレート制限を2倍に拡大 ピーク時間帯の制限:Pro・Max向けのピークアワー制限を撤廃 Claude Opus APIレート:APIレートを大幅に引き上げ また、ヘルスケアや金融サービスなど規制の厳しい国際市場向けの提供能力も拡充するとしている。 軌道上コンピュートへの展望 今回の地上データセンター契約に加え、両社はギガワット規模の軌道上AIコンピュートインフラの共同開発についても関心を表明している。SpaceXが保有するロケット打ち上げ能力と衛星インフラを活用した宇宙ベースのAI計算基盤という構想は、AI産業における次世代のインフラ争奪戦を象徴するものだ。具体的なタイムラインや技術仕様はまだ明かされていないが、複数ギガワット規模という目標は地上データセンターをはるかに凌ぐスケールを目指すものであることを示唆している。 大規模インフラ調達戦略の一環 Colossus 1との契約は、Anthropicが近年進める大規模インフラ調達戦略の最新事例だ。同社はすでにAmazonおよびGoogleとそれぞれ5GW規模の契約を締結しており、Microsoft・NvidiaとはAzureキャパシティで300億ドル規模の合意を結んでいる。さらにFluidstackを通じた500億ドルの国内インフラ投資計画も進行中だ。SpaceXとの今回の合意はこうした多角的なコンピュート調達戦略の一端を担うものであり、特定のクラウドベンダーへの依存を避けつつ計算資源を多様化するAnthropicの姿勢を示している。なお、AnthropicとSpaceXはともに2026年後半のIPOを計画しているとも伝えられており、両社にとって今回のパートナーシップは事業成長のアピール材料にもなる。

May 10, 2026

IRENがNVIDIAと34億ドル・5年間の管理型AIクラウド契約を締結、フルスタックプロバイダーへ転換

概要 AIインフラ企業のIREN Limited(NASDAQ: IREN)は2026年5月7日、NVIDIAと5年間の大型AIクラウドサービス契約を締結したと発表した。契約総額は約34億ドルに上り、IRENはNVIDIAの社内AI・研究ワークロード向けに管理型GPUクラウドサービスを提供する。この契約は、IRENが単なるGPUデータセンター事業者から、ソフトウェアスタックを含むフルスタックAIクラウドプロバイダーへと転換を本格化させる重要なマイルストーンとなる。 契約の技術的詳細 本契約に基づくサービスは、テキサス州チルドレスキャンパス内の既存データセンターに展開される。主要な技術仕様は以下のとおりだ。 プラットフォーム:エアクール式NVIDIAブラックウェル(Blackwell)システム 展開規模:約60MWの電力容量 ソフトウェア統合:Mirantisと連携したオーケストレーションおよびクラスター管理ソフトウェア IREN共同創設者兼共同CEOのDaniel Roberts氏は「この契約は、ベアメタルの提供にとどまらず、包括的なマネージドクラウドソリューションを提供できる能力を実証するものだ」とコメントしており、ソフトウェア層を含むサービスの高度化を強調した。 フルスタックAIクラウドへの転換 今回の契約発表は、IRENが直前に実施したMirantisの買収(6億2,500万ドル)と合わせて理解する必要がある。Mirantisはオーケストレーションやクラスター管理に強みを持つソフトウェア企業であり、その買収によってIRENはGPUハードウェアの提供だけでなく、AIワークロードの運用管理に必要なソフトウェアレイヤーも自社で賄えるようになった。NVIDIAとの本契約では、このMirantisの技術が実際に活用されており、買収の戦略的合理性を裏付ける形となっている。 今後の展望 IRENは北米・ヨーロッパ・アジア太平洋地域にわたる大規模データセンターと電力インフラを保有し、再生可能エネルギーが豊富な地域での展開を強みとしている。世界最大のGPUサプライヤーであるNVIDIA自身が顧客となったことは、IRENのインフラおよびサービス品質に対する強力なお墨付きとなり、今後の顧客獲得にも追い風となりそうだ。34億ドルという契約規模はAIクラウド業界においても際立っており、IRENが本格的な競合プロバイダーとしての地位を確立しつつあることを示している。

May 9, 2026

VMware Cloud Foundation 9.1、AIワークロード向けインフラを刷新——サーバーコスト40%削減とKubernetes運用効率化を実現

概要 Broadcomは2026年5月5日、VMware Cloud Foundation(VCF)9.1を正式発表した。本バージョンは、推論やエージェンティックAIアプリケーションを含む本番AIワークロード向けに設計されており、AMD・Intel・NVIDIAのGPU/CPUが混在する環境での統合的なプライベートクラウド基盤を提供する。コスト削減とパフォーマンス向上を同時に実現する複数の機能強化が盛り込まれており、企業がAIインフラをパブリッククラウドだけでなくプライベートクラウドで運用する選択肢を広げる狙いがある。 Broadcomの「Private Cloud Outlook 2026」調査によれば、56%の組織がすでに本番推論をプライベートクラウドで実行中または計画中であり、62%のIT責任者がAIインフラのコスト増大を課題として挙げている。VCF 9.1はこうした市場ニーズに直接応えるリリースと位置づけられている。 主要な改善点とコスト削減効果 VCF 9.1の最大の特徴は、インテリジェントメモリティアリング技術の導入によるサーバーコストの最大40%削減だ。AIと非AIワークロードが混在するクラスター環境において、メモリ使用を自動的に最適化することで、ハードウェア調達コストを大幅に圧縮できる。ストレージ面ではAIデータパイプライン向けのTCOを最大39%削減し、Kubernetes運用コストも最大46%削減を実現している。 パフォーマンス面では、Kubernetesクラスターのアップグレード速度が4倍に向上し、デプロイメントは70%高速化、アップグレード時間は75%短縮された。クラスタースケールは2.6倍に拡大し、フリート容量は2倍に増加するなど、大規模環境での運用効率が著しく改善されている。自動フリート運用は最大5,000ホストまでサポートし、エンタープライズ規模の展開を見据えた設計となっている。 セキュリティとネットワーク機能の強化 セキュリティ面では、ゼロトラストに基づく横展開検査で9Tbpsの脅威検査性能を達成し、アプリケーション識別能力が5倍に向上した。マルチテナント対応も強化されており、複数チームや部門がクラウドインフラを共有する際のセキュリティ分離をより確実に担保できるようになった。NVIDIA ConnectX-7 NICおよびBlueField-3 DPUとの統合、仮想ロードバランシング機能の追加も本バージョンの目玉となっている。 エコシステムの拡充においても、AMD・Intel・NVIDIA・Arista Networks・CrowdStrikeといった主要パートナーとの連携が発表されており、マルチベンダー環境での導入障壁を引き下げることが期待される。 今後の展望 今回のリリースは、企業が本番AIを大規模展開するにあたってプライベートクラウドをどう活用するかという問いに対するBroadcomの回答といえる。コスト・セキュリティ・運用効率のいずれの側面でも定量的な改善指標が示されており、パブリッククラウドのみへの依存を見直す企業にとって、VCF 9.1は有力な選択肢となりそうだ。AIインフラコストへの懸念が高まる中、エンタープライズ市場でのVCF採用がさらに加速するかが注目される。

May 9, 2026

IRENがKubernetes基盤のクラウドプロバイダーMirantisを6億2,500万ドルの全株式交換で買収

概要 垂直統合型AIクラウドプロバイダーのIREN Limitedは2026年5月5日、KubernetesベースのクラウドインフラプロバイダーMirantis, Inc.を約6億2,500万ドル相当のIREN普通株式で買収すると発表した。全額株式による取引で現金の支払いはなく、買収額はIRENの現在の時価総額164億4,000万ドルの約4%に相当する。規制当局の承認など慣例的なクロージング条件を満たした後に取引が完了する見通しだ。 MirantisとIRENの技術的背景 Mirantisは世界1,500社以上のエンタープライズ顧客を持つクラウドインフラの老舗企業で、NVIDIA AI Cloud Ready Initiativeの創設メンバーパートナーでもある。同社が提供する「k0rdent AIプラットフォーム」は、ベアメタル・仮想マシン・Kubernetes環境にまたがる形でAIインフラを統合管理できるのが特徴だ。 一方のIRENは、米国およびカナダの再生可能エネルギーが豊富な地域でデータセンターとGPUクラスターを運営する垂直統合型AIクラウドプロバイダーだ。AIトレーニングおよび推論向けコンピュートを中心に事業を展開しており、過去1年間で株価が699%上昇するなど急成長を遂げている。 買収の戦略的意図 IREN共同創業者兼共同CEOのDaniel Robertsは、「IRENの強みは実行力にある」と述べ、インフラ構築からGPU展開に至る一貫した実行能力を今回の買収でさらに高める狙いを示した。具体的にはMirantisの技術・人材・顧客基盤を活用することで、(1)コンピュートの展開能力向上、(2)運用可視化の強化、(3)カスタマーサポートの拡充、(4)市場アクセスの拡大の4点を実現する計画だ。 Mirantis創業者兼CEOのAlex Freedlandは「10年以上にわたり企業がクラウドインフラを展開・管理するのを支援してきた。IRENとの統合でAIインフラをより迅速にオンラインにできる」とコメントしており、両社のシナジーに強い期待を示している。 今後の展望 Mirantisは買収後も独立した子会社として引き続き運営され、既存の1,500社以上の顧客へのサービスを維持しながらIRENのAIクラウド展開を支援していく予定だ。AIクラウドの需要が急拡大する中、今回の買収はIRENがインフラ整備だけでなくソフトウェア管理・エンタープライズ向けサービスまでを一気通貫で提供できる体制を整えるうえで重要な一手となる。

May 6, 2026

CloudflareがRust製推論エンジン「Infire」と分離プリフィルアーキテクチャでLLM推論インフラを刷新

概要 Cloudflareは、グローバルネットワーク上で大規模言語モデル(LLM)を効率的に実行するための新しいインフラを発表した。その中核となるのが、Rust製の独自AI推論エンジン「Infire」だ。Infireは複数のGPUにまたがってモデルを実行し、メモリ消費量の削減と起動時間の短縮を実現している。パイプライン並列化とテンソル並列化を組み合わせることで負荷分散を図りつつ、GPU間の通信オーバーヘッドを最小限に抑えている。 分離プリフィルアーキテクチャ 今回の技術的な核心となるのが「分離プリフィルアーキテクチャ(Disaggregated Prefill Architecture)」だ。このアプローチではLLMのリクエスト処理を2段階に分割し、それぞれ別のマシンで実行する。第1段階の「プリフィルステージ」では入力トークンを処理してKVキャッシュを構築する(コンピュート集約型)。第2段階の「デコードステージ」では出力トークンを生成する(メモリ集約型)。各ステージの特性に合わせて最適化することで、全体的な処理効率を向上させている。 超大規模モデルへの対応と最適化 現代のLLM推論が直面する課題の一つが、モデルの巨大化に伴うハードウェアリソースの膨大な要求だ。たとえばKimi K2.5(パラメータ数1兆以上、約560GB)はモデルのロードだけでH100 GPUが最低8枚必要で、処理オーバーヘッドを考慮するとさらに多くのリソースが求められる。一方でMeta社のLlama 4 ScoutはH200 GPU 2枚で動作可能であり、Cloudflareはモデルに応じた効率的な構成を実現している。 さらにCloudflareは「Unweight」と呼ぶ可逆圧縮の新手法を開発した。モデルの重みを精度の損失なく約15〜22%圧縮することで、推論時のGPU間データ転送量を削減し、全体のスループット向上に貢献している。 背景と業界への示唆 Cockroach LabsはAI時代の本番ワークロードについて、「従来のインフラはこの種の負荷に対応できる設計になっていない」と指摘しており、根本的なアーキテクチャの変革が必要だとしている。Cloudflareの取り組みは、エッジコンピューティングの強みを活かしてLLM推論をグローバルに分散させるモデルとして注目されており、高性能なAIサービスをより低コストで提供するための新たな方向性を示している。

May 5, 2026