Claude Mythos Previewとは
Anthropicは「Claude Mythos Preview」と名付けた新世代の汎用フロンティアモデルを開発した。このモデルはサイバーセキュリティ分野で突出した能力を持ち、主要なオペレーティングシステムやWebブラウザを横断して数千件ものゼロデイ脆弱性(未知のセキュリティ欠陥)を特定済みだという。英国のAIセキュリティ研究所によるテストでは、単一サイバータスクでは同世代のモデルと同等の性能を持ちながら、複数ステップをチェーンして完全な侵入シナリオへと組み立てる能力では他モデルを上回り、サイバーレンジ演習を端から端まで完走した初のモデルと評価されている。Anthropicはこの強力な能力を理由に、Mythosを一般向けには公開しないと判断している。
米政府への事前ブリーフィング
Anthropicの共同創業者Jack Clarkは4月中旬に開かれたSemafor World Economy Summitで、同社がMythosのリリース前にトランプ政権高官に対してモデルの全能力——攻撃・防御双方のサイバー用途を含む——をブリーフィングしたことを認めた。報道によれば、JDバンス副大統領とスコット・ベッセント財務長官は主要テック企業のCEOと面会し、AI安全保障とサイバー攻撃への対応策を議論した。さらに別途、ベッセント財務長官とジェローム・パウエルFRB議長がJPモルガン・チェース、ゴールドマン・サックス、シティグループ、バンク・オブ・アメリカ、モルガン・スタンレーといった大手銀行のCEOを緊急招集し、Mythosのサイバーセキュリティリスクへの対応とモデルのテストを促したと伝えられている。
一方で、AnthropicはClaudeを連邦政府調達から排除しようとするトランプ政権を訴訟中でもあり、Clark氏はこの複雑な関係について「政府と訴訟を戦いながら、同時にブリーフィングを続けた理由」を説明したという。政府のCISA(サイバーセキュリティ・インフラセキュリティ庁)の予算削減が進む中、Mythosが提起するリスクへの対応能力が損なわれるとの懸念も広がっている。
Project Glasswingによる英国金融機関への展開
Anthropicはモデルの危険性を考慮して設けた管理下でのアクセスプログラム「Project Glasswing」を通じ、約40〜50の選定された機関にMythos Previewへの限定的なアクセスを提供している。4月16日にはAnthropicが英国の金融機関への提供を今後1週間以内に開始すると発表した。
英国では、イングランド銀行の「Cross Market Operational Resilience Group」が今後2週間以内に予定されている次回会合の議題にMythosを加え、主要銀行・保険会社・取引所の幹部に対してサイバーセキュリティ上の意味合いをブリーフィングする予定だ。英金融行動監視機構(FCA)、英財務省(HM Treasury)、国家サイバーセキュリティセンター(NCSC)も協調して対応にあたる。英国のAIセキュリティ研究所はすでにモデルを評価済みであり、その結果がブリーフィングの基礎資料となる見込みだ。
強力なサイバー能力を巡る課題
Mythosの登場は、強力なAIが金融システムや重要インフラへの攻撃に悪用されるリスクを改めて浮き彫りにしている。米英両国の政府・規制当局が足並みをそろえて金融機関への周知を急ぐ姿は、AIの能力曲線に対する従来の安全管理の枠組みが追いついていないことを示している。Anthropicが一般公開を見送りながらも政府と金融機関を巻き込んだ管理下での展開を選んだProject Glasswingのアプローチは、今後の高リスクAIモデルのリリース戦略における一つのモデルケースとなる可能性がある。