AI | Tech Clip

Google I/O 2026：ChromeがAIエージェント時代の「Agentic Web」に向けWebMCPなど15の新機能を発表

概要 Google I/O 2026において、ChromeチームはAIエージェントによる操作を前提とした新時代「Agentic Web」の到来を宣言し、開発者向けに15件のアップデートを発表した。中心となるのはオープンウェブ標準「WebMCP」で、Chrome 149でオリジントライアルが開始される。WebMCPはJavaScript関数やHTMLフォームなどの構造化ツールをブラウザエージェントに対して公開できる仕組みであり、「エージェントが機械向けの関数を呼び出して、複雑なタスクを数秒でより高い信頼性をもって実行できる」ことを可能にする。たとえば旅行の予約をユーザーが手動でフォームを埋めることなく自動化するといったシナリオが実現する。今回のアップデートは、ウェブを「ユーザーが操作するもの」から「エージェントがプロアクティブに動くもの」へと転換させる方向性を明確に示している。 AIエージェント向け主要機能 WebMCPはAIエージェントとウェブサイトをつなぐ最重要機能で、サイト側がJavaScript関数やHTMLフォームを「エージェントフレンドリー」なAPIとして公開できるようにする。Chrome 149でオリジントライアルが始まり、Model Context Protocol（MCP）のウェブ版として位置付けられる。 Chrome DevTools for Agents（Update 3）ではエージェントがDevToolsのコンソールログやアクセシビリティツリーに直接アクセスできるようになる。LY Corporationはこの機能を活用して手動によるパフォーマンス分析作業を96〜98%削減したと報告している。 Modern Web Guidance（Update 2）はコーディングエージェント向けのガイドで、100以上のユースケースをカバーし、ブラウザ互換性指標「Baseline」と統合されている。開発者はモダンで安全かつ高パフォーマンスなウェブ体験を、手動でのフォールバック管理なしに構築できる。 UI・パフォーマンス・ビルトインAI HTML-in-Canvas API（Update 6）は、WebGL/WebGPUのCanvas内に実際のDOM要素を統合する技術で、3Dエクスペリエンスを検索可能・アクセシブル・ネイティブ翻訳対応のまま実現できる。Declarative Partial Updates（Update 7）はシングルページアプリケーション向けにネイティブな部分更新を提供し、複雑なDOM操作を不要にする。Soft Navigations APIはSPAでCore Web Vitalsを計測するための標準として追加された。 Built-in AI（Update 5）では、Prompt APIがChrome 148で安定版となり、デバイス上で動作する超軽量モデル「Gemma 197M」も利用可能になった。Gemma 197Mはサーバーコストなしで無制限のリクエストを処理できる点が評価されており、Trip.comはローカルAIサマリーによりサーバー費用を削減している。 Gemini統合とユーザー向け機能 Chromeに直接統合されるGemini機能も複数発表された。Android向けGemini統合（Update 10）は2026年6月から提供開始予定で、記事の要約やコンテキスト質問、カレンダー・Gmail・Keepとの連携ができる。Auto Browse（Update 11）はパーキングの予約などのタスクをAIエージェントが自動化する機能でAndroidとデスクトップの両方で動作する。Skills in Chrome（Update 13）は頻繁に使うAIプロンプトをワンクリックツールとして保存・再利用できる機能だ。また、音声インタラクション（Update 15）ではGeminiモデルを用いた文字起こし補正付きの音声フォーム入力が可能になる。今後の展望 Expedia、Booking.com、Shopify、Trip.comといった主要企業がすでにこれらの技術を試験運用しており、ウェブのエージェント対応が加速している。Googleは今回の発表を通じて、ブラウザを「ユーザーが全力で操作しなければならないもの」から「ウェブがプロアクティブにユーザーのために動くもの」へと変えるビジョンを明示した。WebMCPをはじめとするオープン標準化への取り組みは、特定ベンダーに依存しないエージェント対応ウェブの基盤づくりに向けた重要な一歩として注目される。

Programming Languages AI

HPE Q2 2026決算でAIサーバー需要が爆発的成長、2018年以来最大の上方乖離で株価30%超急騰

概要ヒューレット・パッカード・エンタープライズ（HPE）は2026年6月初頭に発表したQ2 FY2026決算で、売上高が前年同期比40%増の約107億ドルに達し、過去最高を更新した。Non-GAAPベースのEPSは0.79ドルと、会社が当初示していたガイダンス（0.51〜0.55ドル）を大幅に超過。2018年以来最大の上方乖離とされ、発表翌営業日の株価は30%超急騰した（年初来では約97%高）。この好決算は企業のオンプレミスAIインフラへの投資加速を鮮明に示すものとして市場の注目を集めた。セグメント別の業績ハイライト売上成長を牽引したのはサーバー事業とネットワーキング事業の2本柱だ。サーバー部門の売上は前年同期比33%増と大幅に拡大し、AIワークロード向け高性能サーバーへの需要が継続していることを裏付けた。ネットワーキング部門はさらに際立ち、前年比148%増という驚異的な伸びを記録した。この急成長の主な要因は2025年7月に完了したJuniper Networks買収の統合効果であり、ネットワーク製品ラインアップが一気に拡充されたことが大きく貢献した。経営陣のコメントと受注動向 CEOのアントニオ・ネリ氏は決算発表後の電話会議で「記録的な売上高、予想を上回る収益性、フリーキャッシュフローの増加」を強調した。特に注目されたのは受注の質に関するコメントで、「過去の景気サイクルとは異なり、キャンセルはゼロ」と述べ、顧客のコミットメントが強固であることを示した。また受注額は売上高の伸びを2倍以上上回るペースで増加しており、今後複数四半期にわたる売上貢献が見込まれるとした。通期見通しの上方修正と長期目標の前倒し好調な業績を受け、同社はFY2026通期の売上高成長率ガイダンスを29〜33%に引き上げた。フリーキャッシュフローの見通しも少なくとも35億ドル以上へと増額し、当初掲げていた長期目標の達成時期を2年前倒しすることを表明した。HPEの好決算はSuper Micro Computer（SMCI）の株価も5%押し上げるなど（年初来67%高）、AIインフラ市場全体のセンチメント改善につながった。企業のAI投資が過去の一過性ブームとは異なる持続的な需要であることを示す決算として、業界全体に強いポジティブシグナルを発した形だ。

Other AI

Meta AIサポートボットの認証不備を悪用したInstagramアカウント乗っ取り攻撃、著名人アカウントに被害

概要 2026年6月1日の週末にかけて、Metaが2025年12月に導入したAIサポートアシスタントを悪用したInstagramアカウント乗っ取り攻撃が発覚した。被害を受けたのはSephora、米スペース・フォースの最上位期間兵曹（Chief Master Sergeant of the Space Force）、セキュリティ研究者のJane Manchun Wong、開発者Albert Renshaw（ハンドル名@albert）、オバマ政権ホワイトハウスのアーカイブアカウント、さらに著名な@kornや@heyといったバニティハンドルなど、多数の高プロファイルアカウントが含まれる。攻撃者はこの脆弱性を少なくとも2026年3月から悪用しており、Telegramのブラックマーケットチャンネルを通じて不正アクセス権が売買されていた。攻撃手口の詳細攻撃は複数の欠陥を組み合わせた手口で実行された。まず攻撃者は「パスワードを忘れた」フローを開始し、身元確認のために要求されるセルフィー（自撮り）確認をAI生成のディープフェイク動画で突破した。ターゲットのInstagramプロフィール上の公開写真から静止画を取得し、AIビデオジェネレーターでリアルタイム動画に変換することで、Metaの顔認証システムを欺いた。さらに深刻な問題として、Meta AIサポートボットは位置情報ベースの認証を主要な確認手段としており、VPNを使ってターゲットの通常利用地域付近からアクセスするだけで所有者確認が通過できる状態にあった。加えて、ボットはメールアドレスの変更要求を「ほぼ確認なし」で処理していたことが判明しており、メールアドレスを変更した後に標準的なパスワードリセット手順を踏むことで2段階認証（2FA）を完全に回避できた。被害者の証言とMetaの対応 @kornアカウントの所有者は「6時間かけてヒトのサポートを探したが、Meta AIは4つのリンク切れを返すだけだった。『AIに盗まれ、別のAIには直せない』状態だ」と述べ、被害後の救済策の不在も問題化した。被害アカウントはAIサポートツールを通じた回復もできず、人間のサポート担当者に直接連絡する手段もなかった。 MetaのVP（コミュニケーション担当）Andy Stoneは「問題は解決済みで、影響を受けたアカウントを保護している」と表明し、パッチは6月1日までに適用された。ただし正式な声明は発表されておらず、詳細な技術的説明も公開されていない。セキュリティへの示唆今回の攻撃は、AI搭載のカスタマーサポートツールが新たな攻撃ベクターとなることを示す事例として注目されている。従来のフィッシングや総当たり攻撃とは異なり、AIシステムの「便利さ」を目的とした設計上の妥協点（確認なしのメール変更、位置情報ベースの緩い認証）を突いた攻撃であり、AIサポートツールの設計における認証の厳格化と人間によるエスカレーションパスの確保が急務であることを浮き彫りにした。

Security AI

トランプ大統領、AI安全保障大統領令に署名——フロンティアモデルの政府への任意事前共有枠組みを創設

概要トランプ大統領は2026年6月2日、「先進的人工知能のイノベーションとセキュリティの促進（Promoting Advanced Artificial Intelligence Innovation and Security）」と題する大統領令に署名した。この大統領令は、米国のAIリーダーシップを強化しつつ、連邦政府システムおよびインフラのサイバー防衛を近代化することを目的としている。最も注目される措置は、AI開発企業がフロンティアモデルを一般公開する前に政府と任意で共有できる枠組みの創設だ。大統領令は、このような事前共有が「義務的なライセンス制度や事前許可制度を授権するものではない」と明示しており、強制力のない協調的アプローチを採用している。フロンティアモデルの任意共有枠組み大統領令の署名から60日以内に、NSA・CISA・財務省は先進的なAI能力のベンチマーク手法を共同で策定する。その上で、AI開発企業が公開前のフロンティアモデルを政府機関と共有し、セキュリティ評価を受けられる任意参加の枠組みが整備される。政府はこの枠組みを通じて、新たなモデルに潜む脆弱性や悪用リスクを早期に把握し、対策を講じることが可能になる。なお、大統領令は「いかなる規定も義務的な政府によるライセンス付与・事前審査・許可を授権するものと解釈してはならない」と明確に規定しており、業界の懸念に配慮した設計となっている。サイバー防衛の近代化と法執行強化サイバーセキュリティの強化についても複数の具体的指示が盛り込まれた。署名から30日以内に、国家安全保障システム委員会はサイバー防衛を最優先課題として取り組むよう指示され、国防総省は情報システムの防護体制を強化しなければならない。CISAは連邦民間システム向けのガイダンスを発行し、AI活用のサイバーセキュリティツールの普及を拡大する。また、財務省はAIサイバーセキュリティ情報共有センターを新設し、業界との連携による脆弱性スキャンとパッチ調整を担う。法執行面では、司法長官がAIを悪用したサイバー犯罪と不正アクセス行為の訴追を優先するよう指示されている。規制より協調を重視する姿勢今回の大統領令は、強制的な規制を避けながら安全保障上のリスクに対応するという、トランプ政権のAI政策の基本姿勢を反映したものだ。前政権が設けた一部のAI規制を撤廃した方針と一貫しており、民間企業のイノベーションを阻害せずに政府との情報共有を促す枠組みを選んだ。NSA・CISA・財務省・商務省・OMBなど複数省庁が連携して取り組む体制が定められており、米国のAI競争力を維持しながら国家安全保障リスクに対処するという二重の目標達成が期待される。

Microsoft Build 2026：WindowsをAIエージェント基盤に再定義、Project PolarisでOpenAI依存を脱却

概要 Microsoft Build 2026が6月2〜3日にサンフランシスコのフォートメイソンで開幕し、Microsoftは「Windowsをエージェントプラットフォームとして再定義する」という方針のもと、開発者向けの大型発表を相次いで行った。約2,500人規模の開発者イベントとして設計された今回のカンファレンスでは、AIエージェントが中心テーマに据えられ、エンタープライズ展開から本番運用フェーズへの移行を加速する施策が打ち出された。最大のサプライズはProject Polarisの発表だ。MicrosoftがGitHub Copilotのデフォルトエンジンとして採用しているGPT-4 Turboを自社開発モデルに置き換えるプロジェクトで、2026年8月より切り替えが始まる。Mixture-of-Experts（MoE）アーキテクチャを採用した同モデルは、HumanEvalおよびMBPPベンチマークでGPT-4 Turboを上回るとされ、特に低リソース言語での性能が強みとして挙げられた。この移行によりMicrosoftはモデル・推論インフラ・開発者体験の全てを自社コントロール下に置くことになる。 Windows AIエージェントプラットフォームの構造 Windowsのエージェント基盤は以下の3層アーキテクチャで構成される。 Windows Agent Framework（WAF）v1.0はMITライセンスで公開される開発者向けSDKで、YAMLでエージェントを定義すればローカルマシンからWindows 365 Cloud PC、Azure Arcエッジデバイスまでアーキテクチャの変更なしにスケールできる。Windows Agent RuntimeはOSレベルのネイティブAPIを提供し、エージェントをファーストクラスの存在として扱う。現在のプレビューではJSON・XML・PDFファイルに対するテキストベースのエージェントをサポートしており、AdobeやZoomなどがパートナーとして参加している。Windows Agent Storeはキュレーションされたエージェントのマーケットプレイスで、収益の85%が開発者に配分される——これは現行のMicrosoft Storeと同条件だ。インフラ面では、オンプレミス・クラウド・エッジにまたがる実行を統合するAzure Agent Mesh（2026年Q4 GA予定）、Intel・AMD・Qualcomm NPUの差異を吸収してクラウドラウンドトリップなしにローカルAI推論を可能にするDirectML 2.0、GPU/NPUアクセス付きでLinuxカーネルを仮想化するWSL 3も発表された。 GitHub CopilotとAzure AI Foundryの強化 GitHub Copilot/Copilot Workspaceがベータを卒業し、正式リリースとなった。Jira・Datadog・ServiceNowとの拡張機能連携、自律的な反復タスクを処理する「フリートモード」、スケジュール実行でバックグラウンド操作を行う「オートパイロット」機能が追加されている。またCopilotはマルチモデル対応にシフトし、OpenAIモデルに加えてAnthropicのClaudeも代替として選択できるようになる。 .NETおよびPython向けのAgent Framework 1.0も本番提供が開始された。階層的なエージェント調整、イベント駆動型ワークフロー、ステートフルなエージェント機能をサポートする。Azure AI Foundryのモデルカタログは約1,600から3,000以上に拡張され、エージェント評価ツールとDevUIデバッガーも追加された。マルチモーダルモデルMAI v2 Microsoftは自社のマルチモーダルモデルスイート「MAI v2」も発表した。画像生成・編集機能を持つMAI-Image-2.5、14言語・感情表現に対応したMAI-Voice-2、前バージョンMAI-Transcribe-1が25言語で単語誤り率3.9%（FLEURS）を達成しており、その漸進的な改良版であるMAI-Transcribe-1.5の3モデルで構成される。価格設定は一般提供時に公表される予定だ。今回のBuild 2026は、MicrosoftがAzure AI収益の拡大を背景に、単なるAIモデルの提供者からエンドツーエンドのエージェント実行基盤へと自社を再定位する戦略的転換点と言える。Project PolarisによるOpenAI依存の低減は、同社のAI事業における長期的な独自性確保という観点でも注目される。

AI Programming Languages

NVIDIAがCOMPUTEX 2026でAI PCスーパーチップ「RTX Spark」と次世代プラットフォーム「Vera Rubin」を発表

概要 NVIDIAのCEOジェンセン・フアン氏は、台湾で開催されたCOMPUTEX 2026のGTC台北基調講演において、AIが新たな「エージェンティック時代」へと突入したと高らかに宣言した。エージェンティックAIとは、人間の指示を待つだけでなく、自律的に目標を設定し複雑なタスクを実行するAIを指す。フアン氏はこの転換点を象徴する2つの重要製品として、AI PC向けスーパーチップ「RTX Spark」と、データセンター向け次世代GPUプラットフォーム「Vera Rubin」を発表した。 RTX Spark：Apple・Qualcommに挑む新AIスーパーチップ RTX SparkはNVIDIAが初めて本格投入するArm系システム・オン・チップ（SoC）で、Windows 11搭載のノートPCおよびデスクトップPCを主なターゲットとする。主なスペックは以下の通りだ。 CPU: 20コアのArmプロセッサ GPU: BlackwellアーキテクチャGPU（CUDAコア数6,144基）メモリ: 128GB LPDDR5x（帯域幅300 GBps） AI演算性能: 1ペタフロップス GPU（BlackwellアーキテクチャGPU）とCPU（Grace CPU）をNVIDIA独自の超高速インターコネクト「NVLink-C2C」で緊密に統合したことで、従来のdGPU＋CPU構成を大幅に凌ぐAI処理能力を単一チップで実現している。これはAppleのM5チップシリーズへの直接対抗を意味しており、MicrosoftはRTX Spark搭載の「Surface Laptop Ultra」（15インチ、2880×1920 Mini LEDディスプレイ）をMacBook Proの競合として位置づけている。また、Qualcommが先行するWindows on Armエコシステムにも本格参入する。ゲーマー向けの実用面でも手を打っており、Fortnite、Valorant、Denuvoなどの主要アンチチート・DRM技術がWindows on Arm上でネイティブ動作することを明言している。Intelは自社のx86アーキテクチャの優位性を強調しつつも、社内では「パラノイア（強い危機感）」を持ってNVIDIAのPC市場参入を注視していると認めた。次世代データセンター向け「Vera Rubin」とCPO技術 Vera Rubinはデータセンター向けの次世代GPUプラットフォームで、現行のBlackwell世代（GB300など）の後継に位置づけられる。市場の関心はすでにGB300からVera Rubinへシフトしており、フアン氏は2026年下半期に量産を開始する予定であることを明らかにした。NVIDIAのロードマップにはVera Rubinに続くRosa、Feynmanといった世代も示されており、同社がAI向けシリコン開発のサイクルをさらに加速させる意図が読み取れる。 COMPUTEX 2026ではCPO（Co-Packaged Optics：光電子集積技術）もキーテーマの一つとなっている。データセンターの電力消費と帯域の課題を解決する手段として注目を集めており、サーバーメーカーのWiwynnはシリコンフォトニクス企業Ayar Labsと協力した最新のCPO光相互接続技術を展示。MediaTekはファイバー1本あたり400GbpsのCPO技術とMicroLED光学ソリューションを実演し、消費電力を最大50%削減できることをアピールした。業界アナリストはAIインフラの部品不足は2027年末まで続くと予測しており、電力効率を高めるCPO技術の重要性はさらに増すとみられる。業界への影響と今後の展望 RTX Sparkの登場はPC市場の構図を大きく塗り替える可能性を持つ。NVIDIAはこれまでdGPU市場でほぼ独占的な地位を持っていたが、今回Armベースの統合チップでMacやSnapdragon搭載PCの牙城に踏み込む。AI推論をエッジで高速処理できる点はエンタープライズ・クリエイター市場でも訴求力があり、エコシステムの整備次第では市場シェアの急拡大も十分考えられる。一方でVera RubinはデータセンターAI需要の旺盛な成長を取り込む戦略製品として、2026年後半に本格展開される見通しだ。NVIDIAはコンシューマーからクラウドまで一気通貫したAIシリコン戦略を今回のCOMPUTEXで鮮明に打ち出した。

AI Other

AppleがWWDC 2026直前にCVPR 2026で14本のAI研究論文を発表、オンデバイスAIをさらに強化へ

概要 Appleは2026年6月3〜7日にコロラド州デンバーで開催されるコンピュータビジョンの国際学会「CVPR 2026」において、14本のAI研究論文を発表することを明らかにした。これはWWDC 2026の開幕（6月8日）直前のタイミングであり、Appleがオンデバイス処理を中心としたAI機能の次世代展開に向けて研究成果を積み上げていることを示している。プライバシーを重視したオンデバイスAIの大幅強化がWWDC 2026の主要テーマとなる見通しだ。研究論文のテーマ今回発表される14本の論文は、以下を含む複数の分野にわたっている。画像生成・編集: 高品質な画像を端末上で生成・加工する技術マルチモーダル推論: テキスト・画像・音声などを統合的に理解・処理する能力空間インテリジェンスと物体インタラクション理解: 物理空間における物体の関係や動作を把握する技術動画生成・理解: 映像コンテンツを解析・生成する機能手話アノテーション技術: AIを活用したアクセシビリティ向上への取り組み AIバイアス低減: モデルの偏りを軽減するための研究画像圧縮の改善: 効率的なデータ処理を実現する技術 Appleは理論的なトレンドよりも実用性を重視していると強調しており、とくに「AI活用の手話アノテーション」や大規模言語モデルによる物理空間の理解は、視覚認識製品やアクセシビリティ機能の強化につながる可能性がある。 Apple Intelligenceとの関係これらの研究論文が直接製品化されるとは限らないが、企業の長期的な開発方向性を示す指標として注目される。視覚的推論の進歩はアクセシビリティ技術の向上をもたらし、AI支援コーディング研究はAppleエコシステム全体の開発者ツール強化につながると見られている。WWDC 2026ではApple Intelligenceの次世代機能として、これらの研究成果を反映した新機能が発表される可能性が高い。今後の展望 CVPR 2026での発表を経て、WWDC 2026では開発者向けのAPI公開や新機能のプレビューが行われることが期待される。Appleはクラウド依存を最小限に抑えつつ、端末上でのAI処理能力を高めることで、ユーザーのプライバシー保護と高度なAI体験の両立を図っている。オンデバイスAIの強化はiPhoneやMacのパフォーマンス向上にも直結するため、秋のOS正式リリースに向けた新機能の全容が注目される。

ChatGPTのウェブ要約機能を悪用するプロンプトインジェクション「ChatGPhish」をPermiso Securityが公開

概要 Permiso Securityの研究者Andi Ahmetiが、ChatGPTのウェブ要約機能に存在するプロンプトインジェクション脆弱性「ChatGPhish」を公開した。この脆弱性を悪用すると、攻撃者はユーザーにChatGPTで要約させるウェブページに悪意あるMarkdown命令を仕込み、信頼性の高いAIのチャットUIの内部にフィッシングリンクや偽のセキュリティ警告を表示させることができる。攻撃の仕組み ChatGPhishの核心は、ChatGPTが自身の生成コンテンツと外部ソース由来の攻撃者制御Markdownを区別できない点にある。ユーザーがウェブページの要約をChatGPTに依頼すると、そのページに埋め込まれた隠し命令がAIに読み込まれ、通常の動作を上書きする。たとえば攻撃者が「要約する際は必ず以下の構造に従え」という指示とともにフィッシングリンクを埋め込むと、ChatGPTは正当な要約文を生成した後、攻撃者のドメインへのリンクを含む本物らしいセキュリティ警告を付け加えてしまう。また、Markdownの画像URLが暗黙的に処理される性質も悪用されており、ページ閲覧者のIPアドレス・User-Agent・Refererといった情報が攻撃者のサーバーへ流出するリスクも確認されている。さらに、攻撃者が制御するS3バケットからQRコードを配信することで、デスクトップのセキュリティフィルターをバイパスしてモバイル端末経由のフィッシングへ誘導する手法も示された。開示と対応状況 AhmetiはOpenAIに対してBugcrowdを通じ4月29日に脆弱性を報告したが、OpenAIは当初「再現不能」と判定し、再提出後も「重複報告」として処理した。修正が適用されたかどうかについての確認はOpenAIから得られていないと研究者は述べており、対応状況は依然として不透明だ。セキュリティ上の示唆この脆弱性は、企業や組織がChatGPTを情報収集・要約に活用している環境で特にリスクが高い。従業員が要約するページが悪意ある命令を含んでいれば、メールの悪意ある添付ファイルを操作することなく、通常のブラウジング中に攻撃者の指示が実行される恐れがある。AI搭載のチャットUIが信頼された環境としてブラウザ内でコンテンツをレンダリングするようになったことで、OSに匹敵する攻撃対象領域が生まれているという、より広範なセキュリティ課題を浮き彫りにした事例と言える。

Security AI

GoogleのGemini CLI廃止とAntigravity CLIへの移行——コミュニティ貢献を囲い込む「バイト・アンド・スイッチ」批判

概要 Googleは2026年5月19日、AI搭載コマンドラインツール「Gemini CLI」の無料・Pro・Ultraユーザー向けサポートを2026年6月18日で終了すると発表した。代替として提供されるのは、Google I/O 2026で発表されたクローズドソースの「Antigravity CLI」だ。ただしGemini Code AssistのStandardまたはEnterpriseライセンス契約企業は影響を受けず、従来通りのアクセスが維持される。 2025年夏にApache 2.0ライセンスでオープンソース公開されたGemini CLIは、わずか1年足らずで6,000件以上のプルリクエストをコミュニティから受け入れ、Dynatrace、Elastic、Figma、Shopify、Stripeなど大手企業との統合も進んでいた。このような状況での突然の方針転換に対し、貢献した開発者たちから激しい批判が巻き起こっている。「おとり商法」批判の核心開発者Andrea Albertiは「自分たちはエンタープライズ向けコードベースのために事実上無償で働いていたのか」と問い、別の貢献者はGoogleが「オープンソースで開発者を集め、貢献させた上でクローズドソースへ移行した」と直接的に批判した。最も矛盾として指摘されるのは、企業ライセンスユーザーへの影響がゼロである点だ。Googleは「単一プラットフォームへの統合」という技術的必要性を移行理由として挙げるが、その技術的必要性が有料ユーザーには適用されないことから、コミュニティからは説明の整合性を欠くと見なされている。この構図——オープンソースでコミュニティの貢献を集め、成熟した段階でクローズドな企業向け製品に転換する——は「バイト・アンド・スイッチ（おとり商法）」と呼ばれ、OSS界隈での強い懸念を呼んでいる。 Antigravity CLIの課題と移行の問題点後継となるAntigravity CLI自体にも問題がある。Googleは「初期段階では1対1の機能パリティを持たない」と自ら認めており、移行先が旧ツールと同等の機能を備えていない状態での廃止となる。使用量制限も厳格化され、従来の「1日1,000リクエスト」から「週単位」の制限に変わり、大規模なコード生成を行うユーザーが上限に達する事例が報告されている。さらに移行時点でnpmやHomebrewでの配布が未対応であり、既存ワークフローへの組み込みが困難な状況も批判を強めている。 OSSプロジェクトへの信頼と今後の課題本件はApache 2.0ライセンスという形式上の「オープンソース」が、クラウドサービスや専有インフラへの依存によって実質的にクローズドソース化し得ることを示す事例として注目されている。Linux Foundation Model Openness Toolのような評価フレームワークがこの問題を可視化しつつあるが、大企業がオープンソースコミュニティとの関係をどう設計するかという問いは、業界全体に投げかけられた課題として残っている。

OSS AI

CloudflareがカスタムエンジンでLLM推論インフラを刷新、プリフィル・デコード分離で低遅延を実現

概要 Cloudflareは、グローバルネットワーク上で大規模言語モデル（LLM）を高効率に実行するための新しいインフラストラクチャを発表した。このシステムの中核となるのは、同社が独自開発したカスタム推論エンジン「Infire」だ。LLMの処理を計算特性の異なる2つのフェーズに分離するアーキテクチャを採用することで、エッジ環境での低遅延なAI推論を実現するとしている。プリフィル・デコード分離アーキテクチャ Cloudflareが採用した最大の技術的特徴は、モデルの推論処理を「プリフィル」と「デコード」の2フェーズに明確に分割し、それぞれを異なるハードウェアで処理する点にある。プリフィル段階は入力トークンを処理してKVキャッシュを構築する計算集約的な処理であり、デコード段階は出力トークンを逐次生成するメモリ集約的な処理だ。これら2つの処理を分離して最適化されたハードウェアに振り分けることで、全体的なスループットとレイテンシのバランスを向上させる。 Infireエンジンはパイプライン並列化とテンソル並列化を組み合わせて複数GPU間での処理を効率化しており、メモリ使用量の削減と起動・応答速度の高速化を実現している。実績として、Llama 4 Scoutは2基のH200 GPU上で、1兆パラメータを超えるKimi K2.5は8基のH100 GPU上での稼働が確認されている。 Unweightによるモデル圧縮と精度維持もう一つの注目技術が「Unweight」システムだ。モデルの重みを15〜22%圧縮しながらも推論精度を損なわない仕組みで、ストレージ効率と推論速度の向上に寄与する。エッジ環境では帯域幅やメモリ容量が制約となるケースも多く、精度を犠牲にせずにモデルを軽量化できるこの技術はグローバル展開において重要な役割を担う。背景と今後の展望 Cockroach Labsのレポートによれば、多くの企業はAIシステムの規模拡大や信頼性要件に対応できる体制が整っていないとされている。Cloudflareの新インフラはこうした業界課題に対して、エッジネットワークの地理的優位性とカスタム最適化エンジンを組み合わせることで応えようとするものだ。同社がグローバルに展開するエッジポイントでLLMを低遅延かつスケーラブルに提供できれば、AIアプリケーション開発者にとって新たなインフラ選択肢となる可能性がある。

AI Cloud