Claude Sonnet 5の1Mトークンで商品データを一括分析|レビュー・在庫・売上を丸ごと投入

投稿日: カテゴリー Claude

1Mトークンの一括分析とは、100万トークン規模の商品データをまとめてAIに渡し、分割せず一度で読み解かせる手法のことです。

Claude Sonnet 5が標準で100万トークンの文脈を持ったことで、EC運営のデータ分析の前提が変わりました。これまでは「AIに渡すデータを絞る」のが常識でしたが、Sonnet 5では「まず丸ごと渡して、AIに絞らせる」ほうが速い場面が増えています。レビュー数百件、商品マスタ数千行、数か月ぶんの売上明細を分割せずに投入し、傾向と打ち手を一度に引き出す。本記事では、この一括分析を楽天・Amazon・Shopifyの現場でどう回すかを、投入するデータの作り方から具体的なプロンプト、費用の見積もりまで通しで解説します。

なぜ「分割しない分析」が効くのか

従来のAI分析でつまずく最大の原因は、入力の分割でした。文脈の上限が狭いと、レビューを100件ずつに区切って渡し、区切りごとに要約を取り、最後に要約同士をつなぐ、という多段の作業が必要でした。この過程で、区切りをまたぐ傾向が見えなくなり、要約の要約でニュアンスが落ちます。現場で繰り返し見るのは、分割のせいで「季節をまたいだ不満の変化」や「特定ロットに集中する初期不良」といった、期間全体を見ないと気づけないパターンを取り逃す失敗です。

100万トークンの文脈は、この分割そのものを不要にします。日本語はおおむね1文字1〜2トークンを消費するため、100万トークンはおよそ数十万文字、粗く見て60万文字前後に相当します。数百件のレビュー全文、あるいは数千行の商品マスタの主要列をまとめて渡せる規模です。分割がなくなると、AISは全期間・全商品を一つの視界で見渡せるようになり、「Aという不満はBの商品群にだけ出る」といった横断的な発見が取り出しやすくなります。直近の支援案件で観測したのは、分割をやめただけで、これまで見落としていた同梱物起因のクレームがまとまって浮かび上がった例でした。

もう一つの利点は、往復の消滅による時間短縮です。分割して何度も投げ直す運用では、1回の分析に半日かかることも珍しくありませんでした。一括投入なら、データを整えて一度渡すだけで初稿の分析が返ります。標準モデルでこれができる意味は大きく、上位プランを契約していない店舗でも、まず無料や個人向け有料プラン(月額20米ドル前後が目安)の範囲で試せます。導入の詳細な変更点はClaude Sonnet 5の完全ガイドにまとめています。

投入するデータの整え方

一括分析の成否は、渡すデータの整形で半分決まります。乱雑なコピーをそのまま貼るより、列を絞って構造を保つほうが精度が上がります。レビューなら「日付・星・本文・商品名」の4列、売上なら「日付・商品名・数量・単価・チャネル」の5列、商品マスタなら「商品管理番号・商品名・カテゴリ・価格・在庫」の主要列に絞ると、無駄なトークンを使わず要点だけを渡せます。

楽天RMSからはCSVで商品データやレビューを書き出せます。Amazonはセラーセントラルの各種レポート、Shopifyは管理画面のエクスポートが元データになります。いずれもExcelで不要列を落としてから貼るのが手早い方法です。5,000社支援の中で何度も再現したパターンとして、列を絞らずに全項目を渡した結果、トークンばかり消費して肝心の分析が薄くなる例が挙げられます。渡す前に「この分析に本当に要る列はどれか」を一度考える工程が、費用と精度の両方を守ります。

データ量が100万トークンに収まるかの目安も持っておくと安心です。レビュー1件を平均100文字とすると、5,000件でおよそ50万文字、トークンにして75万前後です。これなら1回で収まります。もし超える場合は、期間や商品を区切るのではなく、まず主力商品や直近半年に対象を絞るのが実務的です。全件を無理に詰めるより、意思決定に効く範囲へ的を絞るほうが、結果の使い勝手が良くなります。

列の並び順にも小さな工夫があります。AIは先頭に近い列を手掛かりにしやすいため、分析の軸にしたい列を左に置くと結果が安定します。レビュー分析なら「商品名・星・日付・本文」の順にすると、商品ごと・評価ごとの集計が取りやすくなります。売上分析なら「チャネル・商品名・日付・数量・単価」とすると、チャネル別の視点が最初に立ちます。細かい話に思えますが、同じデータでも列順で結果の粒度が変わることは現場でしばしば経験します。整形の段階で「何を軸に見たいか」を列順に反映しておくと、後の手直しが減ります。

もう一点、渡すデータには見出し行を必ず残してください。列名がないと、AISは数値の意味を推測で補うため、単価と数量を取り違えるような誤りが起きやすくなります。見出し行を1行付けるだけで、この種の取り違えは大きく減ります。楽天RMSやAmazonのレポートは標準で見出し付きのCSVが出るため、余計な加工をせず、不要列を落とすだけで十分な場合が多いです。整形は凝りすぎず、列を絞る・見出しを残す・軸列を左に置く、この3点を守れば実務では足ります。

一括分析で使う3本のプロンプト

ここでは、レビュー・売上・在庫の3領域それぞれに対する一括分析プロンプトを3本紹介します。宣言どおりこの章で3本を実装します。いずれもClaudeの画面に整形済みデータを貼って使います。

1本目は、レビュー全文から商品改善とページ改善のテーマを取り出す用途です。

以下は当店の複数商品に付いた過去のレビュー全文です(列:日付・星・本文・商品名)。
1. 不満テーマを上位7つに分類し、各テーマの件数割合と、どの商品名に偏るかを示してください
2. テーマごとに、商品ページ・同梱物・配送・梱包のどこを直すと減らせるか具体策を挙げてください
3. 高評価レビューから、商品ページに転用できる好意的な表現を10個抜き出してください
データ:
{整形済みレビューを貼り付け}

2本目は、数か月ぶんの売上明細から、伸びと失速の要因候補を洗い出す用途です。売上は複数要因が絡むため、AIには断定ではなく仮説を出させ、人が検証する運用が向いています。

以下は当店の売上明細です(列:日付・商品名・数量・単価・チャネル)。
1. 売上が伸びた商品と落ちた商品を各5つ挙げ、変化の大きさを数値で示してください
2. それぞれの変化について、考えられる要因を最大3つ、データで検証可能なものだけ挙げてください
3. 楽天・Amazon・自社などチャネル別に、傾向の違いがあれば指摘してください
データ:
{整形済み売上明細を貼り付け}

3本目は、商品マスタ全体から在庫と表記の問題を洗い出す用途です。マスタは行数が多いほど人手のチェックが破綻しやすく、一括分析が効きます。

以下は当店の商品マスタです(列:商品管理番号・商品名・カテゴリ・価格・在庫)。
1. 商品名の表記ゆれ(全角半角・単位・型番の書き方)を検出し、統一案を示してください
2. 在庫が閾値{値}を下回る商品と、在庫過多が疑われる商品をそれぞれ列挙してください
3. 同一カテゴリ内で価格が外れ値になっている商品を指摘してください
データ:
{整形済み商品マスタを貼り付け}

これら3本を組み合わせると、レビュー・売上・在庫という店舗運営の三大データを、同じモデルで横断的に見られます。ある食品ジャンルの中規模店舗の事例では、レビュー分析で見つかった「梱包への不満」と、売上分析で見えた「リピート率の低下」が同じ商品群でつながり、梱包改善が優先課題だと定まりました。バラバラに見ていたら結びつかなかった判断です。

一括分析をさらに活かすには、出力の形式を指定するのが有効です。単なる文章ではなく、「テーマ名・件数割合・推奨アクション・優先度」を項目立てで返すよう頼むと、そのまま社内の改善タスクに落とせます。楽天とAmazonの両方を回している店舗で観測されたのは、この項目立て出力を週次のミーティング資料にそのまま貼り、担当者が優先度順に着手する運用が定着した例でした。分析して終わりにせず、次の行動につながる形で出させることが、一括分析を業務に根づかせる鍵になります。加えて、前回の分析結果を次回の入力に添えて「前回から改善したか」を問うと、施策の効果検証にも使えます。データを渡す、傾向を得る、打ち手を決める、結果を再投入して確かめる、という循環を回せるのが、広い文脈を持つモデルの本領だと考えます。

一括分析でありがちな失敗と回避策

1つ目の失敗は、AIの出した数値をそのまま実数として信じることです。件数割合や変化率はあくまで推定であり、桁を間違える場合もあります。回避策は、重要な数字は元データで裏取りし、AIの出力は「当たりをつける地図」として使うことです。

2つ目の失敗は、機密性の高いデータの扱いを軽視することです。顧客の氏名や連絡先を含むデータをそのまま貼るのは避けるべきです。回避策は、個人を特定できる列を削ってから渡すことと、社内の情報取扱ルールに沿って運用することです。アパレル系の単一店舗で試したケースでも、分析に要るのは購買傾向であって個人情報ではないため、氏名列を落としても分析の質は変わりませんでした。

3つ目の失敗は、一度の分析で結論を出そうとすることです。一括分析は当たりをつけるのが得意で、原因の断定は不得意です。回避策は、AIが挙げた仮説を人が絞り込み、必要なら追加のデータで検証する二段構えにすることです。

4つ目として挙げたいのが、分析対象を広げすぎて論点がぼやける失敗です。全商品・全期間を一度に見ようとすると、指摘が総花的になり、どこから手を付ければよいか分からなくなります。回避策は、問いを一つに絞ることです。「今月、返品率が上がった原因はどこにあるか」「どの商品群のレビューが最近悪化したか」のように、答えるべき問いを先に決めてからデータを渡すと、出力が一気に実用的になります。広い文脈を扱えることと、広く問うことは別物で、むしろ絞った問いに対して広いデータを当てるときに一括分析はもっとも威力を発揮します。店舗運営の現場感覚では、良い分析は良いデータ整形と良い問いの掛け算で決まり、モデルの性能はその土台があって初めて活きるものだと感じます。

費用と工数の目安

費用はトークン量で決まります。導入価格(2026年8月31日まで)は入力100万トークンあたり2米ドル、出力100万トークンあたり10米ドルです。仮にレビュー5,000件(約75万トークン)を入力し、分析結果を1万文字ほど(出力2万トークン前後)受け取ると、1回あたりの概算は入力1.5米ドル+出力0.2米ドルで2米ドル弱です。月に数回回しても数百円から千円台に収まる計算で、削減できる工数と比べれば十分に見合います。実際の消費は用途で変わるため、最初の数回は実測して見積もりを補正してください。

工数面では、データ整形の初期作業に半日ほど、テンプレートが固まれば1回の分析は数分から十数分で回せるようになります。従来の分割分析で半日かかっていた作業と比べれば、時間の圧縮は大きいと判断します。

今後の展望と独自考察

一括分析が当たり前になると、EC運営の意思決定サイクルが週次から日次へ縮む可能性があります。これまで月末にまとめて見ていたレビューや売上を、必要なときに丸ごと投げて即座に傾向を得られるためです。競合が月次でしか振り返らないなか、日次で打ち手を回せる店舗は、季節商品やトレンド商品で先手を取りやすくなります。

長文処理はSonnet 5だけの専売特許ではありません。他社も広い文脈を打ち出しており、用途によって使い分ける時代になっています。モデルの比較や使い分けは、Claude Opus 4.8のEC活用記事や、Claude Sonnet 5の低価格化を伝えた記事も参考になります。重要なのは、特定モデルに固定するより、整形済みデータという資産を持ち、そのときの最良モデルに載せ替えられる体制を保つことだと考えます。

よくある質問

1Mトークンで何件くらいのレビューを渡せますか

1件平均100文字とすると、おおむね5,000件前後まで一度に渡せる計算です。超える場合は主力商品や直近半年に絞るのが実務的で、無理に全件を詰め込む必要はありません。

AIが出した数値は信用できますか

件数割合や変化率は推定値です。当たりをつける用途には有効ですが、重要な数字は元データで裏取りしてください。AIの出力は地図であって、実測の代わりにはなりません。

個人情報を含むデータを渡しても大丈夫ですか

氏名や連絡先など個人を特定できる列は削ってから渡してください。分析に必要なのは購買傾向であり、個人情報を落としても分析の質はほとんど変わりません。

楽天とAmazonのデータを混ぜて分析できますか

できます。チャネル列を付けておけば、チャネル別の傾向差も同時に指摘させられます。両モールを回している店舗ほど、横断で見ることの価値が大きくなります。

最初の一歩は何をすればよいですか

主力商品のレビューを「日付・星・本文・商品名」の4列に整え、1本目のプロンプトで一度分析してみることです。ここで得た当たりを、売上や在庫の分析へ広げていくのが進めやすい順序です。


著者:齋藤竹紘(株式会社オルセル 編集長/5,000社以上のEC支援実績/書籍3冊)


※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/


【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)


投稿者: 齋藤竹紘

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。

お問い合わせ