NEWS

Anthropicが強すぎて公開できないAI「Mythos」を発表。何すごいのかを解説。

Anthropicが4月7日、「Claude Mythos Preview」という新しいAIモデルを発表した。

ただし、一般公開はしない。

理由は「強すぎるから」。

セキュリティ特化で作られたこのモデルは、主要なOS(WindowsやmacOS等の基本ソフト)やブラウザ(Chrome、Firefox等)から数千件のゼロデイ脆弱性(まだ誰も気づいていないセキュリティ上の穴)を自力で発見した。しかも完全に自律的に。

これはちょっと衝撃的なニュースだった。

ベンチマークが「ちょっと上がった」レベルじゃない

まず数字を見てほしい。前世代のClaude Opus 4.6と比較した主要ベンチマーク(AIモデルの性能を測る標準テスト)。

ベンチマーク Opus 4.6 Mythos Preview
SWE-bench Verified(コーディング能力) 80.8% 93.9% +13.1pt
SWE-bench Pro(高難度コーディング) 53.4% 77.8% +24.4pt
USAMO 2026(数学オリンピック) 42.3% 97.6% +55.3pt
GPQA-Diamond(大学院レベルの科学問題) 94% 飽和
Humanity’s Last Exam(専門家向け超難問) 53.1% 64.7% +11.6pt
OSWorld(PC操作の自動化) 72.7% 79.6% +6.9pt

今までのモデル更新は「2〜3ポイント上がりました」みたいな話が多かった。Mythosは桁が違う。

数学オリンピックのテスト(USAMO)で42%→97%。ほぼ満点。高難度のコーディングテスト(SWE-bench Pro)も53%→77%と大幅に上がっている。

そしてサイバーセキュリティベンチマークでは、Opus 4.6の66.6%に対してMythosは83.1%。16.5ポイントの差。
(参考:Anthropic – Mythos Preview System Card

17年間見つからなかったバグを、AIが見つけた

具体例がすごい。

Mythos PreviewはFreeBSD(サーバー用のOS)の中に潜んでいた17年前のリモートコード実行の脆弱性(外部から遠隔でプログラムを勝手に実行できる穴)を、完全自律で発見して、さらに実際に攻撃まで成功させた。

この脆弱性は、NFS(ネットワーク上でファイルを共有する仕組み)を使っているサーバーに対して、認証なしでインターネット越しにroot権限(管理者権限)を奪えてしまうという重要なもの。17年間、誰も気づかなかった。

さらに、CTF(サイバーセキュリティの腕試し競技)のベンチマーク「Cybench」では、35の課題すべてを100%の成功率で解いている。全問正解。人間のセキュリティ専門家でもこれは難しい。
(参考:The Hacker News

なぜ公開しないのか。Anthropicが危惧していること

では、なぜこれほどの性能を持つモデルを一般公開しないのか。

Anthropicが具体的に懸念しているのは、このモデルが攻撃にも使えてしまうということ。

象徴的なデータがある。前世代のOpus 4.6は、見つけた脆弱性を実際にエクスプロイト(攻撃コード)にする成功率がほぼ0%だった。数百回試して2回しか成功しない。

Mythosは同じ実験で181回成功した。さらに29回はレジスタ制御(CPUの内部制御を奪う、攻撃の最終段階)まで到達している。

「脆弱性を見つける」だけでなく「実際に攻撃する」能力が桁違いに上がった。これが公開できない最大の理由。

防御に使えば強力な味方になるけど、攻撃に使われれば史上最強のハッキングツールにもなる。Anthropicはそのリスクを取れないと判断した。

12社に限定提供

Anthropicはこのモデルを「Project Glasswing」というプロジェクトで、パートナー企業に限定提供している。

  • クラウド基盤: AWS、Google、Microsoft
  • セキュリティ企業: CrowdStrike、Palo Alto Networks、Cisco、Broadcom
  • テック大手: Apple、NVIDIA、JPMorgan Chase
  • オープンソース: Linux Foundation

この顔ぶれには理由がある。インターネットのインフラを支えている企業ばかり

AWS・Google・Microsoftはクラウド(インターネット上のサーバー基盤)そのもの。CrowdStrikeやPalo Alto Networksは世界中の企業のセキュリティを守っている。Linux Foundationはオープンソース(誰でも使える公開ソフトウェア)の基盤。

これらの企業が自社製品やインフラの脆弱性をMythosで洗い出し、パッチ(修正プログラム)を当てる。「同じレベルの能力を持つAIが悪用される前に、防御側が先に重要システムを守る」というのがProject Glasswingの狙い。
(参考:Anthropic – Project Glasswing

一般公開はあるのか

これだけの性能なら「いつ使えるようになるのか」と気になる人も多いと思う。

Anthropicの公式見解はこう。「Mythos Previewの一般公開は予定していない。ただし、最終的にはMythosクラスのモデルをユーザーが安全に大規模展開できるようにすることが目標」

つまり、今のMythosそのものは出さないけど、同等の性能を持つモデルを安全に使える仕組みを作ってから出すということ。いつになるかは明言されていない。

予測市場のPolymarket(賭けによる未来予測プラットフォーム)では、2026年6月までに一般公開される確率が45%と見積もられているが、実際はどうなるかわからない。(参考:The New Stack

Mythosが示す「これからのAI」の姿

このモデルの登場で、業界からさまざまな声が上がっている。代表的なものを挙げる。

  • 「防御側がAIで追いつかないと終わる」: AI セキュリティ企業Knosticの創業者Gadi Evron氏は「攻撃者にはすでにAI能力が使える。防御側も同じものを使わなければ追いつけない」と警鐘を鳴らしている
  • 「エージェント型AIが最大の脅威に」: Dark Readingの調査では、サイバーセキュリティ専門家の48%が「2026年の最大の攻撃ベクトル(攻撃手段)はエージェント型AI」と回答。ディープフェイクを抜いて1位
  • 「公開プロセスに透明性がない」: 一部の研究者からは「52社の大企業に独占させる判断を、誰がどういう根拠で下したのか。公開の議論も独立した監視もなかった」という批判も出ている
  • 「実はオープンモデルでもできる」: AIセキュリティ研究機関AISLEは「Mythosが発見した脆弱性の多くは、公開されている小型モデルでも検出可能だった」と指摘。Mythosの能力が過大評価されている可能性も
  • 「政府が動き始めた」: 米国のベッセント財務長官が大手金融機関を招集し、AIの急速な発展に関する緊急会議を開催。サイバーセキュリティへの影響が国家レベルの議題になっている

また、AWSはAmazon Bedrock(AWSのAI基盤サービス)で、Google CloudはVertex AI(GoogleのAI基盤)で、それぞれMythos Previewの提供を即座に開始した。クラウド大手がこれほど速く対応したこと自体が、このモデルの重要性を示している

また、Anthropicの「まず数億人に影響するインフラ企業に先に使わせる」という慎重な公開方針は、今後の高性能AIモデルの公開における新しいスタンダードになるかもしれない
(参考:Security Magazine

AIの「使い方の分岐」が始まった

自分がこのニュースで一番考えたのは、AIの公開ルールが変わり始めているということ。

今まではシンプルだった。強いモデルを作ったら公開する。GPT-4もClaude 3もGeminiも、そのサイクルで出てきた。

Mythosはそのルールを破った最初のケースだと思う。

今後はこういう流れになりそう。汎用AI(ChatGPTやClaude)は引き続き公開される。みんなが使える。

でもセキュリティ、軍事、医療のような領域では「公開しないAI」が当たり前になるかもしれない。能力が高すぎて、誰でも使える状態にするとリスクの方が大きくなるから。

攻撃側がAIを使うなら、防御側もAIで対抗するしかない。

「AIが強すぎて公開できない」という判断が出てきたこと自体が、2026年のAI業界を象徴するニュースだと思う。


AI LIFEコミュニティでは、こうしたAI業界の最新動向をキャッチアップしながら、実践的な活用方法を共有しています。
AI LIFEコミュニティについて詳しく見る

Author

松原 潤

松原 潤

官公庁→大手向けITコンサル→SIer→中小企業向けITコンサルを経験。 現在はAIコミュニティ「AI LIFE」を運営しつつ、DX/業務改善、CRM・Web・データ活用を支援。 生成AIと自動化で“売上アップ×工数削減”を実現するのが得意です。