概要

Googleは2026年4月14日、Cloud RunのWorker Pools機能を一般提供(GA)に移行した。Worker Poolsは2025年6月にプレビュー公開されて以来、約10か月の検証期間を経ての正式リリースとなる。この機能により、これまでCloud Runが苦手としていた非リクエスト型のワークロード——Pub/SubやKafka、RabbitMQからのメッセージプル処理、継続的なバックグラウンド処理、分散LLM学習——をサーバーレス基盤の上で実行できるようになる。従来のCloud Run ServicesやJobsと比較して約40%のコスト削減が見込まれており、インフラ管理の負担軽減と運用コストの最適化を同時に実現する。

ServicesおよびJobsとの違い

Cloud Runにはこれまで「Services」と「Jobs」という2つのリソースモデルが存在したが、Worker Poolsはその第3の選択肢として加わった。主な差異は自動スケーリングの有無にある。ServicesはHTTPリクエストに応じてインスタンスを自動スケールアップ・ダウンするのに対し、Worker PoolsはHTTPエンドポイントを持たず、自動スケーリング機能も備えていない。スケーリングは手動、または利用者が用意したカスタムオートスケーラー(Kafkaのコンシューマグループラグをベースにしたスケーリングなど)によって制御する設計だ。エンドポイントが不要な分、攻撃面が減りセキュリティ面でも有利となる。また、Direct VPC接続により、ロードバランサーを介さずVPCネットワーク内のリソースへ直接通信できる点も特徴のひとつだ。

主要なユースケースとGPUサポート

Worker Poolsが特に適しているシナリオは、プルキューやメッセージブローカーを介した非同期処理だ。Kafkaコンシューマ、Pub/Subプル、RabbitMQといったメッセージングシステムとの組み合わせが典型的な利用例として挙げられる。さらに注目すべきは、2025年9月のプレビューを経て今回のGAと同時期に正式提供となったGPUサポートだ。NVIDIA RTX PRO 6000 Blackwell GPUを含む各種GPU構成がWorker Poolsで利用可能となり、分散LLM学習やAI推論の継続的バックグラウンド処理といった用途でも活用できる。翌4月15日にはCloud Run向けリモートMCPサーバー機能もGAを迎えており、AIエージェント開発基盤としてCloud Runの役割が拡大していることがうかがえる。

今後の展望

Worker Poolsの登場により、Cloud RunはHTTPサービスのホスティングという枠を超え、データパイプラインや機械学習基盤をフルマネージドのサーバーレス環境で構築するための選択肢として本格的に検討できるようになった。Kubernetesクラスタや専用VMを維持することなく、スケーラブルな非同期処理基盤を構築できる点は、特に運用チームの規模が小さい組織にとって大きな恩恵となる。カスタムスケーラーとの組み合わせにより、ワークロードに応じた柔軟なキャパシティ制御も可能であり、今後のエコシステムの成熟が期待される。