概要
Anthropicは2026年4月7日、サイバーセキュリティ分野で卓越した能力を発揮する新AIモデル「Claude Mythos Preview」のプレビュー版を発表した。同モデルは同社の新サイバーセキュリティイニシアティブ「Project Glasswing」の一環として開発されたものだが、その能力の高さゆえに悪意ある攻撃者に利用された場合の危険性を考慮し、Apple・Google・Microsoft・Nvidia・AWSといった限られたハイプロファイルな企業パートナーへの提供にとどめている。一般公開は当面見送られた。
高いサイバーセキュリティ能力と悪用リスク
Claude Mythos Previewは「防御的なサイバーセキュリティ業務」を主な用途として設計されており、既存のモデルを大きく上回る脆弱性検出・解析能力を持つとされる。Anthropicは同モデルのハッキング能力が非常に強力であると認めており、もし悪用されれば大規模なサイバー攻撃を可能にするリスクがあると説明している。このような判断から、同社は一般向けのリリースを控え、信頼できるセキュリティ研究パートナーに限定した形でのプレビュー提供という慎重なアプローチを選択した。
Project Glasswingとサイバーセキュリティへの取り組み
Project Glasswingは、AIを活用したサイバーセキュリティ研究の加速を目的としたAnthropicの取り組みである。ソフトウェアの脆弱性を自動的に発見・分析することで、企業や研究機関がセキュリティ上の問題を攻撃者より先に修正できるよう支援することが狙いだ。限定パートナーにはApple・Google・Microsoft・Nvidia・AWSのほか、Broadcom・Cisco・CrowdStrike・Palo Alto Networksなど計12社が名を連ね、さらに約40の組織にもアクセスが提供されている。各パートナーはMythosを活用した防御的セキュリティ研究の実施が期待されている。
今後の展望
Anthropicは今後、Mythos Previewで得られた知見やフィードバックをもとに安全策を強化しつつ、提供範囲の段階的な拡大を検討するとみられる。AIの能力が高度化するなかで、強力なモデルをいかに安全かつ責任ある形で展開するかという課題は、業界全体にとって重要な問いとなっている。同社の慎重な姿勢は、AIの安全性を優先するAnthropicの基本方針を改めて示すものといえる。