Anthropic「Claude Fable 5」全公開、Opusの上に立つ最上位AIをEC事業者はどう使うべきか

投稿日: カテゴリー Claude

AIモデルの最上位がまた一段引き上げられました。AnthropicはClaude Fable 5を一般公開し、これまで一部の組織にしか開放していなかった「Mythosクラス」の能力を、有料プランやAPIから誰でも使えるようにしました。同時に、より制限の少ない上位版のMythos 5も限定的に発表されています。EC運営の現場で生成AIをどこまで任せられるのか、その線引きが今回大きく動いたというのが第一印象です。本記事では発表内容を一通り押さえたうえで、日本の中小・零細EC事業者にとっての意味を整理します。

何が起きたのか:Opusの上に新しい階層ができた

今回の核心は、単なる順当なバージョンアップではなく、Anthropicが従来のOpusより上位の能力階層を一般公開に持ち込んだことです。Fable 5は「Mythosクラス」と呼ばれるモデルで、Anthropic自身が「これまで一般公開したどのモデルの能力をも上回る」と説明しています。ほぼすべての能力ベンチマークで最先端を示し、タスクが長く複雑になるほど従来モデルとの差が開くとされています。Claude 5世代の最初のモデルにあたる位置づけです。

このMythosクラスは4月に「Mythos Preview」として登場したものの、サイバーセキュリティ面の懸念から、重要インフラ事業者など限られた組織にしか開放されていませんでした。今回はその同じ基盤に新しい安全装置を組み合わせることで、一般公開に踏み切ったという流れです。Fable 5とほぼ同じ中身で一部の制限を外した「Mythos 5」も同時に発表されましたが、こちらは政府連携のProject Glasswingのパートナーや一部の研究者に限定されています。名称の違いは安全装置の有無に由来し、Fableはラテン語のfabula、すなわちMythosと同根の「語られるもの」という意味から取られています。

価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、Mythos Previewの半額以下に設定されました。開発者はAPIで claude-fable-5 を指定して利用できます。

どれくらい賢くなったのか:領域別に見る実力

抽象的な「すごい」では判断できないので、公表された具体例を領域ごとに見ておきます。

ソフトウェア開発では、決済大手のStripeが初期テストで数カ月分の作業を数日に圧縮したと報告しています。5,000万行という巨大なRubyのコードベース全体の移行を、本来チームで2カ月以上かかる作業を1日で完了させたとのことです。コーディングの品質を測るCognitionのFrontierCodeでも、中程度の処理量の設定でも最高スコアを記録したとされ、トークン効率も改善しています。

ナレッジワークの面では、金融分野の上級者向け推論ベンチマークで最高スコアを記録し、文書ベースの推論やグラフ・表の読み取りで大きく伸びたと説明されています。あるパートナー企業は、複雑で長時間の分析タスクで初めて90%を超え、Opusから10ポイントの上積みだったと述べています。表計算の処理でも、別の検証で同等の作業をOpus 4.8より25〜30%速く終わらせたという報告がありました。

画像認識も最先端に達したとされ、詳細な科学図表から正確な数値を抽出したり、スクリーンショットだけからWebアプリのソースコードを再構築したりできると説明されています。従来モデルが補助ツールを与えても苦戦していたゲームを、画像入力だけの最小構成でクリアした例も示されました。

記憶と長文処理の面では、数百万トークンに及ぶ長時間タスクで集中を保ち、自分のメモを使って出力を改善できるとされています。あるデッキ構築ゲームでファイルベースの永続的な記憶を与えたところ、性能の伸びがOpus 4.8の3倍に達したと報告されています。

ライフサイエンスでは、上位版のMythos 5を使って創薬プロセスの一部を約10倍に加速し、タンパク質設計のタスクで熟練の人間と同等以上の成果を出したとされています。ゲノミクス研究では、1週間以上のほぼ自律的な作業で、138種の動物のデータを使ったモデルを設計・訓練し、科学誌に掲載された最近のモデルを100分の1の小ささで上回ったと説明されています。EC事業者には直接関係しない領域ですが、AIが長時間の専門作業を自律的に回せるようになったことの象徴として押さえておく価値があります。

EC運営の視点で翻訳すると、商品データの一括処理、売上CSVの分析、広告レポートの読み解きといった「数字を扱う長めの作業」ほど、AIに任せたときの安定度が上がるということです。楽天RMSの商品分析CSVを前年と突き合わせる昨対比レポートや、Amazonのビジネスレポートのカテゴリ別集計など、繰り返し発生する作業を1回の指示で最後まで走り切れる範囲が広がります。

一般公開の裏にある「ブレーキ」を理解する

ここが実務に最も直結する部分です。Fable 5は強力ゆえに、サイバーセキュリティ、生物・化学、モデルの蒸留という3つのリスク領域では、あえて回答をブロックし、ひとつ下のClaude Opus 4.8に処理を引き渡す仕組みが組み込まれています。Anthropicによれば、この安全装置が作動するのは平均で全セッションの5%未満で、95%以上のセッションではFable 5がそのまま応答するとされています。フォールバックが起きた場合はユーザーに通知され、Opus 4.8も十分高性能なため、完全な拒否よりはるかに良い体験になると説明されています。

3つの領域を簡単に補足します。サイバーセキュリティでは、Mythosクラスがソフトウェアの脆弱性発見や攻撃の自律実行に長けているため、悪用を防ぐ分類器を広くかけています。生物・化学では、従来は兵器関連の狭い範囲だけを止めていましたが、今回は当面、生物・化学に関するほとんどの質問をOpus 4.8に回す広めの設定にしています。蒸留は、Fable 5の能力を抜き取って安全装置のない競合モデルを訓練しようとする試みへの対策です。

安全装置の堅牢性については、外部のバグバウンティで1,000時間を超える検証でも万能なジェイルブレイクは見つからず、外部のレッドチームも長時間タスクでは突破に至っていないとされています。一方で英国のAI安全研究機関が短期間の検証で部分的な進展を見せたとも正直に記されており、完全な防御は不可能としつつ、突破を遅く高コストにすることを目標に掲げています。Anthropicは安全性を優先して装置を厳しめに調整したと明言しており、無害なリクエストが誤って引っかかる可能性も認めたうえで、今後誤検知を減らしていくとしています。

もうひとつ実務上の注意点があります。Mythosクラスのモデルでは、ビジネス向け利用のデータについて30日間の保持が必須になりました。Anthropicはこのデータを新モデルの学習には使わず、安全監視以外の目的にも使わないとし、アクセスの記録や30日後の削除といった保護策を設けたと説明しています。機密性の高い顧客情報や仕入れ条件を扱う場合は、社内の運用ルールを一度確認しておく価値があります。

顧客の評価と提供スケジュール

早期アクセスした企業からは、CursorBenchで最先端、長期的なコーディングタスクで従来を上回る自律性と信頼性、法務のレッドライン業務で現行モデルと同等以上、といった評価が並んでいます。共通するのは、単発の賢さよりも「長く走り続ける作業の信頼性」を評価する声が多い点です。

提供形態は段階的です。今日からPro・Max・Team・Enterpriseの各プランでFable 5が追加費用なしで使えますが、これは6月22日までの扱いです。6月23日以降は利用にクレジットが必要になり、容量に余裕ができ次第、標準プランに戻す予定とされています。需要が高く読みにくいための慎重な措置で、変更は事前に告知するとしています。試すなら、この無料で使える期間が判断材料を集める好機です。

日本のEC事業者はどう向き合うべきか

現実的な活用方針を3つ挙げます。第一に、いきなり全業務をAIに移すのではなく、「長くて単調だが間違えたくない作業」から試すことです。昨対比の売上分析、商品名やキャッチコピーのSEO最適化、広告の除外リスト作成といった、手順が定型化できる仕事ほど効果が見えやすくなります。

第二に、回答の事実確認は引き続き人が担うという前提を崩さないことです。モデルが賢くなっても、価格や在庫、薬機法に関わる表現などの最終チェックは店舗側の責任です。AIの出力をたたき台とし、検証の工程を必ず挟む運用が安全です。

第三に、コストの感覚を持つことです。APIで使う場合、出力が長いほど課金が積み上がります。商品説明文の大量生成のような用途では、どの作業に最上位モデルを使い、どこは下位モデルで十分かを切り分けると、費用対効果が大きく変わります。賢いモデルが出たからすべてをそれに任せる、という発想が最適とは限りません。

長い目で見れば、AIに任せられる作業の範囲が一段広がったことは、人手の限られた中小EC事業者にとって追い風です。重要なのは、話題性に流されず、自社のどの業務がこの性能向上の恩恵を最も受けるのかを見極めることだといえます。

引用:https://www.anthropic.com/news/claude-fable-5-mythos-5

スラッグ:anthropic-claude-fable-5-ec-ai-2026

※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/


【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)


よくある質問(FAQ)

Claude Fable 5とは何ですか?

AnthropicがOpusの上位に位置づけた最上位の「Mythosクラス」モデルで、Claude 5世代の最初のモデルにあたります。2026年6月9日に一般公開され、ほぼすべての能力ベンチマークで最先端を示し、タスクが長く複雑になるほど従来モデルとの差が開くとされています。価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、開発者はAPIで claude-fable-5 を指定して利用できます。

Claude Fable 5とMythos 5の違いは何ですか?

両者はほぼ同じ中身ですが、安全装置の有無が異なります。Fable 5は新しい安全装置を組み合わせて一般公開されたモデルで、Mythos 5は一部の制限を外した上位版です。Mythos 5は政府連携のProject Glasswingのパートナーや一部の研究者に限定提供されています。名称はラテン語のfabula(語られるもの)に由来し、Mythosと同根の言葉から取られています。

Fable 5の安全フォールバックとはどんな仕組みですか?

サイバーセキュリティ、生物・化学、モデルの蒸留という3つのリスク領域では、Fable 5があえて回答をブロックし、ひとつ下のClaude Opus 4.8に処理を引き渡します。Anthropicによれば作動するのは平均で全セッションの5%未満で、95%以上のセッションではFable 5がそのまま応答します。フォールバックが起きた場合はユーザーに通知されます。

日本のEC事業者はClaude Fable 5をどの業務から使うべきですか?

昨対比の売上分析、商品名やキャッチコピーのSEO最適化、広告の除外リスト作成といった、長くて単調だが間違えたくない定型作業から試すのが現実的です。楽天RMSの商品分析CSVの昨対比やAmazonビジネスレポートのカテゴリ別集計など、繰り返し発生する作業を1回の指示で最後まで走り切れる範囲が広がります。回答の事実確認は引き続き人が担う前提を崩さないことが重要です。

Claude Fable 5は無料で試せますか?

2026年6月22日まではPro・Max・Team・Enterpriseの各プランで追加費用なしで利用できます。6月23日以降は利用にクレジットが必要になり、容量に余裕ができ次第、標準プランに戻す予定とされています。無料で使えるこの期間が、自社のどの業務に効くかを見極める判断材料を集める好機です。



投稿者: 齋藤竹紘

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。

お問い合わせ