Anthropicが史上最強AI「Claude Mythos」を発表――あまりに危険すぎて一般公開できない異例の判断

齋藤竹紘2026年4月11日Claude

2026年4月7日、AI開発企業Anthropicが前代未聞の発表を行いました。自社史上最も高性能なAIモデル「Claude Mythos Preview」を完成させたにもかかわらず、一般には公開しないというのです。「強すぎるから出せない」——AI業界でこんな判断が下されたのは初めてのことです。

各社がしのぎを削って最新モデルを競うように公開する中、なぜAnthropicはあえてブレーキを踏んだのか。その理由を知ると、AIの進化がいよいよ新しいフェーズに入ったことを実感します。

ベンチマークが示す「次元の違い」

Claude Mythos Previewは、Anthropicがこれまで提供してきたHaiku・Sonnet・Opusという3階層の上に新設された「Capybara（カピバラ）」ティアに属するモデルです。社内で秘密裏に開発が進められていましたが、3月末にAnthropicのCMSの設定ミスにより約3,000件のファイルが流出し、その存在が明らかになりました。

公表されたベンチマークのスコアは衝撃的です。ソフトウェアのバグ修正能力を測るSWE-bench Verifiedでは93.9%、数学オリンピック（USAMO 2026）では97.6%を記録しました。現行最上位のClaude Opus 4.6がUSAMOで42.3%だったことを踏まえると、「改善」ではなく「カテゴリそのものが違う」と表現するのが適切です。GPT-5.4を含む他社のどのモデルと比較しても二桁の差をつけており、まさに不連続的な進化といえます。

サイバーセキュリティ能力が「危険すぎる」理由

Anthropicが一般公開を見送った最大の理由は、このモデルのサイバーセキュリティ能力にあります。

Mythos Previewは、テスト期間のわずか数週間で主要なOS（Windows、macOS、Linux）とブラウザすべてにおいて数千件のゼロデイ脆弱性を自律的に発見しました。最も古いものはOpenBSDに27年間潜んでいたバグで、ビデオソフトウェアの16年もののバグは過去に500万回もの自動テストをすり抜けていたものです。

さらに驚くべきは、Linuxカーネルの複数の脆弱性を自動的に連鎖させ、一般ユーザー権限からマシンの完全制御まで権限昇格を成功させたことです。Firefoxに対しては181件の有効なエクスプロイトを自律作成しました。Opus 4.6が同じテストでわずか2件だったことと比較すると、能力の飛躍は桁違いです。

しかもこれらはすべて、人間が初期プロンプトを与えた後は一切介入なしで達成されています。あるAnthropicのエンジニアは、セキュリティの専門知識を持たないまま「リモートコード実行のバグを一晩で探して」と指示したところ、翌朝には完全に動作するエクスプロイトが完成していたといいます。

Project Glasswing――「守り」のために限定公開

Anthropicはこの能力を封じ込めるのではなく、「守り」に活用する道を選びました。それが「Project Glasswing」です。名前の由来は透明な羽を持つ蝶で、「目に見えにくいソフトウェアの脆弱性」を比喩しています。

参加するのはAmazon、Apple、Google、Microsoft、Nvidia、CrowdStrike、JPMorgan Chase、Cisco、Broadcom、Palo Alto Networks、Linux Foundationなど12の創設パートナーに加え、重要なソフトウェアインフラを維持する約40の組織です。Anthropicはこの取り組みに最大1億ドル（約150億円）の利用クレジットを提供し、クレジット消化後は入力100万トークンあたり25ドル、出力100万トークンあたり125ドルで提供されます。

参加企業は自社システムとオープンソースソフトウェアの脆弱性スキャンにMythosを活用し、90日以内に成果を業界全体に共有する義務を負います。Anthropicは発見した脆弱性の詳細について暗号学的ハッシュを公開しており、パッチが適用され次第、具体的な内容を開示する方針です。

AIが「攻撃の実行者」になった現実

この判断の背景には、すでに現実に起きた事件があります。

2025年9月、Anthropicは中国政府系とみられるハッカーグループがClaude Codeを悪用し、テック企業、金融機関、政府機関など約30の組織に対してサイバー攻撃を仕掛けていたことを検知しました。AIを「アドバイス役」としてではなく、攻撃の「実行者」として使った初の組織的キャンペーンとされています。Anthropicは10日間の調査を経てアカウントを停止し、被害組織に通知しました。

CrowdStrikeの2026年脅威レポートによれば、AIを活用した攻撃は前年比89%増加しています。CrowdStrikeのCTOは「脆弱性の発見から悪用までの時間が、かつての数カ月から数分に短縮された」と警告しています。

Anthropic自身の葛藤――「最高のアライメント」と「最大のリスク」

興味深いのは、Anthropicが244ページに及ぶ過去最長のシステムカードを公開し、Mythosを「史上最もアラインメントが取れたモデル」であると同時に「史上最大のアライメント関連リスクを持つモデル」と評価していることです。失敗の頻度は低いが、失敗した場合の影響が格段に大きいという意味です。

また、自動化されたAI研究開発の閾値は超えていないとしつつも、「過去のどのモデルよりも自信を持てない」と率直に認めています。まれに「無謀な破壊的行動」や意図的な情報隠蔽が観察された事例もあったと報告されています。

OpenAIの安全チーム問題やGoogleのAI倫理部門の混乱が記憶に新しい中、Anthropicのこの透明性は業界に一石を投じるものです。もちろん、「公開しないことで逆に注目を集める巧みなマーケティングだ」という見方もあります。しかしいずれにせよ、史上最高性能のAIモデルがアプリ開発ではなくセキュリティバグのスキャンに使われているという事実は、AI産業の転換点を象徴しています。

まとめ――AI開発は「出したもの勝ち」の時代が終わる

Claude Mythosの登場は、AIの能力が「便利なツール」のレベルを超え、社会インフラの安全性を左右する存在になったことを明確に示しました。「作れるから出す」のではなく「作れても出さない」という判断が、今後のAI開発の標準になるかもしれません。

90日後に公開されるProject Glasswingの成果報告が、次の大きな節目になるでしょう。AIの進化を追いかけている方は、ぜひ注目しておいてください。

※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談（30分）も実施中ですので、お気軽にお問い合わせください。 https://uruchikara.jp/contact/

齋藤竹紘

齋藤 竹紘（さいとう・たけひろ）
株式会社オルセル代表取締役／「うるチカラ」編集長

Experience｜実務経験
2007年の株式会社オルセル創業から 17 年間で、EC・Web 領域の課題解決を
4,500 社以上 に提供。立ち上げから日本トップクラスのEC事業の売上向上に携わり、
“売る力” を磨いてきた現場型コンサルタント。
Expertise｜専門性
技術評論社刊『今すぐ使えるかんたん Shopify ネットショップ作成入門』（共著、2022 年）ほか、
AI × EC の実践知を解説する書籍・講演多数。gihyo.jp
Authoritativeness｜権威性
自社運営メディア
「うるチカラ」で AI 活用や EC 成長戦略を発信し、業界の最前線をリード。
運営会社は EC 総合ソリューション企業株式会社オルセル。
Trustworthiness｜信頼性
東京都千代田区飯田橋本社。公式サイト alsel.co.jp および uruchikara.jp にて
実績・事例を公開。お問い合わせは
info@alsel.co.jp まで。

投稿者: 齋藤竹紘

齋藤 竹紘（さいとう・たけひろ） 株式会社オルセル代表取締役／「うるチカラ」編集長 Experience｜実務経験 2007年の株式会社オルセル創業から 17 年間で、EC・Web 領域の課題解決を 4,500 社以上 に提供。立ち上げから日本トップクラスのEC事業の売上向上に携わり、 “売る力” を磨いてきた現場型コンサルタント。 Expertise｜専門性 技術評論社刊『今すぐ使えるかんたん Shopify ネットショップ作成入門』（共著、2022 年）ほか、 AI × EC の実践知を解説する書籍・講演多数。gihyo.jp Authoritativeness｜権威性 自社運営メディア「うるチカラ」で AI 活用や EC 成長戦略を発信し、業界の最前線をリード。運営会社は EC 総合ソリューション企業株式会社オルセル。 Trustworthiness｜信頼性 東京都千代田区飯田橋本社。公式サイト alsel.co.jp および uruchikara.jp にて実績・事例を公開。お問い合わせは info@alsel.co.jp まで。齋藤竹紘のすべての投稿を表示