本文へスキップ
爆速開発部
Claude

Claude Mythosとは?史上最強といわれるAIモデルの性能と現状を徹底解説

投稿日 最終更新日 読了約14分 閲覧数355

Anthropic が2026年4月7日に公式発表した非公開モデル、それが Claude Mythos です。本記事は2026年5月時点の公開情報をベースに、Mythosの位置づけ・性能・提供スキーム・日本企業の動向までを整理します。

Mythosはモデル名、Capybaraはtier名

日本語記事で混同が目立つ点を最初に整理します。Mythosはモデルの呼称Capybaraはtierの呼称です。Anthropicの公式表記では、これまで Opus / Sonnet / Haiku の3 tierで提供されてきたClaudeシリーズに、今回新たに Capybara tier が4番目として追加されました。Claude Mythos PreviewはこのCapybara tierに属する最初のモデルという位置づけになります。

公式の正式名称は 「Claude Mythos Preview」 です。「Preview」が付くのは、一般提供(GA)を前提としていないためです。詳細は Anthropic公式のMythos Previewページ を参照してください。

Claude Mythosが非公開のままである理由

Anthropicが Mythos の一般提供を行わないと明言している理由は、攻撃能力の突出にあります。「攻撃に強すぎるから出せない」という、フロンティアAIの歴史上きわめて珍しい判断です。

  • サイバー攻撃補助能力が突出しており、悪用リスクが従来モデルの比ではない
  • AnthropicのResponsible Scaling Policy(RSP)で定義する「AI Safety Level 3 (ASL-3)」相当を超える懸念
  • 一般API公開のセーフガード設計が、現時点の評価で「不十分」と内部判定された

これはAnthropicがフロンティア最上位モデルの一般提供を明示的に否定した初の事例です。GPT-5やOpus 4.7はAPIで広く利用できる一方、Mythosは「触れないモデル」として設計されています。

Project Glasswingという受け皿

完全非公開ではなく、限定された防御目的の用途には開放されています。その枠組みが Project Glasswing です。Anthropicは攻撃能力で突出したモデルを、防御側の手元にだけ置く設計を選びました。

> Mythos represents a step change in cyber capability. We are not making it generally available, but we are working with a small set of defenders who can use it to harden critical infrastructure.(Anthropic公式 より)

Claude Mythos提供の枠組み|Project Glasswing

Project Glasswingは、Mythosを限定提供するための枠組みです。2026年5月時点では3層構造になっています。

対象規模アクセス開始
Launch 12Anthropicと11のローンチパートナー(クラウド・半導体・セキュリティベンダー中心)12社2026年4月7日
追加組織追加の重要インフラ防御組織計約40組織まで拡大予定2026年5月以降順次
政府機関等UK AISI / US AISI / 各国規制当局非公開評価目的で随時
Launch 12(厳密にはAnthropic + 11パートナー)には Amazon・Apple・Broadcom・Cisco・CrowdStrike・Google・JPMorgan Chase・Linux Foundation・Microsoft・NVIDIA・Palo Alto Networks が並びます。金融はJPMorgan Chaseのみで、クラウド・半導体・セキュリティベンダー中心の構成です。日本企業はこのLaunch 12には含まれていません

利用条件と価格設定

Project Glasswing参加企業に対する利用条件は、通常のAnthropic APIとは別建てです。価格は Input $25 / Output $125 per million tokens。Opus 4系(Input $15 / Output $75)から約5倍の水準で、防御用途に絞った高単価ラインになっています。提供は Claude API・Amazon Bedrock・Google Cloud Vertex AI・Microsoft Foundry 経由で行われます。

  • 重要インフラ防御または国家安全保障に資する用途であること
  • Anthropicとの個別契約(NDAを含む)の締結
  • 利用ログのAnthropic側保持と監査受け入れ
  • 攻撃用途への転用禁止(違反時は即時アクセス停止)

Anthropicは参加組織に対して 最大$100M相当のMythos Preview利用クレジット を提供することも公表しています。

90日報告書のスケジュール

Anthropicは透明性確保の一環として、Mythos運用開始から90日以内の報告書公開を公約しています。発表日(2026年4月7日)から90日後は 2026年7月6日前後。報告書では Glasswing 参加企業の活用事例・検出された脆弱性の傾向・運用上の問題点が公開される予定です。

Claude Mythos|日本企業のアクセス状況

ここが日本の読者にとって一番気になる論点です。2026年5月時点で、日本企業はLaunch 12には1社も含まれていません。ただし、5月以降にアクセス権を獲得する動きが複数表面化しています。

3メガバンク+NECの動向(2026年4月〜5月)

日付動き出典
2026年4月23日NEC×Anthropicが戦略的協業を発表(Claude/Claude Codeを約3万人規模で展開、国内企業初のAnthropicグローバルパートナー)NEC公式リリース
2026年4月24日片山金融相が3メガ銀・日銀・金融庁トップと会合。官民共同作業部会を設置(『日本版Project Glasswing』構想)各紙報道
2026年5月13日Bessent米財務長官の訪日を経て、日米財務当局間でメガバンクのMythosアクセス調整が進展Bloomberg報道
2026年5月中作業部会の参加団体拡大(IT・ネット金融業界への拡張を検討)各紙報道
2026年5月末(予定)三菱UFJ・三井住友・みずほの3行がProject Glasswing経由でMythosアクセス開始予定Bloomberg他
日米の財務当局がMythosアクセスを政府間調整の議題に乗せた、という点が特異な部分です。通常のクラウドAIサービスでは起き得ないレベルの調整が、Mythosでは現実に動いています。

NEC協業の意味

NEC は2026年4月23日の発表で、NECグループ約3万人規模でのClaude / Claude Code展開と、Anthropicのグローバルパートナーシップ締結を公表しました。日本企業として初のAnthropicグローバルパートナーという肩書きです。協業は金融・製造・自治体向けの業種特化AIソリューション共同開発、SOC(セキュリティオペレーションセンター)への組み込み、CoE(Center of Excellence)の設立にまたがります。

ただし、これはあくまで通常のClaude(Opus / Sonnet / Haiku系)の話で、Mythos へのアクセスが含まれるかは現時点で公表されていません。NEC自体がSOCを運営する重要インフラ事業者である点を踏まえると、将来的にProject Glasswingへの参加余地はあると見られますが、確定情報ではありません。

Claude Mythosの性能|Opus 4.7との比較

ここからはMythosの性能データを整理します。一次情報は Anthropic公式UK AISI評価レポート の公開分です。

ベンチマーク比較表

ベンチマークMythosOpus 4.7Opus 4.6
SWE-bench Verified93.9%87.6%82.1%
SWE-bench Pro77.8%64.3%53.4%
Terminal-Bench 2.082.0%
USAMO 202697.6%(1位) ※1公表値なし公表値なし
OSS-Fuzz相当ベンチ tier-5 ※210件0件0件
サイバー攻撃補助能力突出(評価上限超)
※1:USAMO 2026では2位モデルとの差が2.4ポイント ※2:Anthropicの内部OSS-Fuzz相当ベンチ(約1,000レポジトリ対象)でMythosのみがtier-5(完全な制御フロー乗っ取り)のエクスプロイトを10件生成。Sonnet 4.6・Opus 4.6は同tierで0件。

SWE-bench Verifiedで Mythosは93.9%、Opus 4.7は87.6%。コード生成タスクで6ポイント以上の差です。SWE-bench Pro、Terminal-Bench 2.0でもMythosが一段上。「攻撃能力に振り切った」と表現される根拠は、これらの数値とOSS-Fuzz相当ベンチでの圧倒的な差に表れています。

サイバー攻撃補助能力の具体例

Anthropicの公式発表によると、Mythosには次のような能力が観測されています。

  • 主要OS・主要Webブラウザを含む広範なソフトで、数千件のゼロデイ脆弱性を発見(Anthropicが過去数週間で確認)
  • FreeBSDで17年間気づかれなかった遠隔コード実行(RCE)脆弱性 CVE-2026-4747 を完全自律で発見・悪用し、サーバの完全な制御権を獲得した事例を公表
  • UK AISI評価で、多段階攻撃の計画立案能力が突出(評価レポートにて報告)

Claude Mythos vs OpenAI Daybreak|戦略比較

Anthropicの戦略の特異性を際立たせるのが、OpenAIの Daybreak との比較です。両社はフロンティア最上位モデルに対して、ほぼ正反対のアプローチを取っています。

観点Claude Mythos (Anthropic)Daybreak (OpenAI)
提供方針非公開・限定(Project Glasswing)API一般提供
価格Input $25 / Output $125 per million tokens通常API水準
セーフガード利用企業をAnthropicが個別審査利用規約+自動モデレーション
透明性90日報告書を公約(2026年7月6日前後公開予定)モデルカード公開
想定ユーザー重要インフラ防御企業+政府機関全API利用者

Anthropicの社会貢献コミットメント

Mythos発表と同時にAnthropicは、オープンソースセキュリティ団体(Linux Foundationの Alpha-Omega などを含む)への $4Mの直接寄付 と、Project Glasswing参加組織への 最大$100Mのusage credits 提供を公表しました。「攻撃力で振り切ったモデルを作った企業として、オープンソース防御エコシステムにも責任を持つ」というメッセージです。

Anthropic公式 のサイバーセキュリティ関連発表は、今後も90日サイクルで更新される見込みです。

Claude MythosのFAQ

よくある質問

Q.Claude Mythosは個人開発者でも使えますか?
A.

使えません。Project Glasswingへの参加企業のみがアクセス可能で、参加には重要インフラ防御または国家安全保障に資する用途・Anthropicとの個別契約が必要です。

Q.Mythosの一般提供(GA)はいつですか?
A.

2026年5月15日時点で一般提供の予定はありません。Anthropicは「Mythosを一般提供しない」と明言しており、フロンティア最上位モデルの提供を明示的に否定した初の事例です。

Q.日本のメガバンクが本当に使えるようになるのですか?
A.

2026年5月13日のBloomberg報道では、Bessent米財務長官訪日後の日米財務当局調整を経て、三菱UFJ・三井住友・みずほの3行が2026年5月末にProject Glasswing経由でアクセス開始予定と報じられています。

Q.Launch 12にはどんな企業が入っていますか?
A.

Amazon・Apple・Broadcom・Cisco・CrowdStrike・Google・JPMorgan Chase・Linux Foundation・Microsoft・NVIDIA・Palo Alto Networks(Anthropicと合わせて12)です。金融はJPMorgan Chaseのみで、クラウド・半導体・セキュリティベンダーが中心の構成です。

Q.Capybara tier の他モデルはいつ出ますか?
A.

2026年5月15日時点で公表されていません。Mythos PreviewがCapybara tier最初のモデルですが、後継モデルのスケジュールは未発表です。

Q.NECがMythosを使えるようになるのですか?
A.

2026年4月23日のNEC×Anthropic協業発表では、Claude/Claude Codeの社内展開・業種特化AI共同開発が中心で、Mythos提供は明言されていません。NEC自体がSOCを運営する重要インフラ事業者である点を踏まえると将来的なProject Glasswing参加余地はありますが、確定情報ではありません。

Q.Mythosの90日報告書はいつ出ますか?
A.

Anthropicは2026年4月7日発表から90日以内の公開を公約しており、2026年7月初旬(7月6日前後)が見込みです。

Q.Mythosのコード生成性能はOpus 4.7とどれくらい違いますか?
A.

SWE-bench Verifiedで Mythos 93.9% / Opus 4.7 87.6% で約6ポイント差です。一般的なWeb開発・バックエンド実装ではOpus 4.7で実務上ほぼ困りません。Mythosの優位はサイバー攻撃補助系タスクに集中しています。

まとめ|Claude Mythosは最高モデルが示す新しいAIの可能性

この記事ではClaude Mythosの位置づけ・性能・提供スキーム・日本企業の動向を整理しました。要点を再掲します。

  • Claude Mythosは2026年4月7日にAnthropicが公式発表した非公開フロンティアモデル
  • 一般公開はなく、Project Glasswing(Anthropic+11ローンチパートナー、最大40組織まで拡大)経由で重要インフラ防御組織のみが利用可能
  • SWE-bench Verified 93.9%でOpus 4.7(87.6%)を上回るが、優位はサイバー攻撃補助系に集中
  • 90日報告書は2026年7月6日前後の公開予定

2026年7月初旬に公開予定の90日報告書と、5月末の3メガバンクのアクセス開始以降の動向に注目しながら、今後もAIに関する最新情報を追いかけていきましょう。

監修者
黒田 真次郎
監修者プロフィール
黒田 真次郎

AppTime株式会社 代表取締役:システム開発・DX支援
HOJOJO株式会社 取締役CTO:技術戦略・プロダクト開発

関西学院大学大学院(MBA課程)にて、経営管理の高度な知見を統合。

〜主な経歴〜
2017年に個人事業主として独立。エンジニアとして数多くのシステム開発を
手掛けた後、2018年にAppTime株式会社を設立し、代表取締役に就任。
現在は自社の経営のみならず、HOJOJO株式会社の取締役CTO(最高技術責任者)も兼任。技術の「便利さ」だけでなく、LLM・機械学習をはじめとする先端技術を活かし、企業のコストカットや「利益創出」に直結させるという、実益重視のコンサルティングを展開している。

単なるIT導入に留まらない、経営層・役員の意思決定に資する「経営×IT」の架け橋として、次世代のDXリテラシー向上を支援している。

爆速開発部編集部 A爆速開発部メンバー

この記事は役に立ちましたか?

コメント

まだコメントはありません。最初のコメントを書いてみませんか?

コメントを残す

送信されたコメントは編集者の承認後に表示されます。メールアドレスは公開されません。 は必須項目です。

公開されません