フランスのMistral AIが2026年6月23日、文書読み取りモデルの新版Mistral OCR 4を公開しました。第三者が用意した600件超の実文書を匿名で比較する人手評価で、競合のOCR・文書AIすべてに対して平均72%の勝率を記録したと発表しています。請求書や納品書、商品スペック表など「紙とPDFの山」を抱える日本のEC事業者にとって、バックヤード業務の自動化を一段押し上げる材料になりそうです。本記事ではOCR 4で何が変わるのか、そしてEC現場での使いどころを整理します。

何が発表されたか:精度と「構造化」の両取り
TestingCatalogによると、OCR 4は単に文字を読み取るだけでなく、文書内の各ブロックの位置を示すバウンディングボックス、見出し・表・数式・署名といったブロック種別の分類、そして領域ごとの信頼度スコアを同時に返します。読み取った文字を「どこに、どんな役割で、どれくらいの確信度で」配置されているかまで構造化して出力する点が、従来のテキスト変換型OCRとの大きな違いです。
精度面では、公開ベンチマークのOlmOCRBenchで85.20と最高スコアを獲得し、OmniDocBenchでも93.07を記録したとしています。対応言語は10の言語グループにまたがる170言語で、Mistralは日本語を含む希少・低リソース言語で競合が精度を落とす領域でも高い精度を保つと説明しています。ベンチマークの数値には採点上の限界がある点をMistral自身が注記しており、最終判断は自社の文書で検証してほしいと添えています。この姿勢自体は、過度な誇張を避ける現実的なものと受け止められます。
価格はAPIで1,000ページあたり4ドル、バッチ処理なら2ドル、ノーコードのDocument AIで5ドルです。PDF・DOC・PPT・OpenDocumentに対応し、API、Mistral Studio、Amazon SageMaker、Microsoft Foundryから利用でき、データを社外に出したくない企業向けに単一コンテナでの自社内運用も選べます。
日本のEC事業者にとっての論点
EC運営の裏側は、いまだに紙とPDFの処理に時間を取られています。仕入先からの請求書・納品書、メーカー支給の商品スペックシート、卸の在庫表、海外サプライヤーからの英語・中国語のインボイスなど、定型化しづらい書類が日々流れ込みます。OCR 4が返す構造化データは、こうした書類から「金額」「品番」「数量」といった項目を機械的に抜き出し、会計や在庫管理、商品マスタへ流し込む処理に向いています。信頼度スコアがあるため、確信度が低い箇所だけ人が目視する運用に切り替えれば、全件チェックの工数を大きく減らせます。
越境ECを手がける事業者には、170言語対応と希少言語での精度が効いてきます。中国・東南アジアの仕入書類や、現地語の証明書類をそのまま読み取れれば、翻訳と転記の二度手間が減ります。Mistralは金融QAの事例で従来比およそ8分の1のコスト、17分の1の遅延を実現したという顧客の声を紹介しており、1日数百枚規模で書類を処理する事業者ほど、コスト差が積み上がる構造です。
自社内運用が選べる点も見逃せません。取引先の機微な情報や顧客の本人確認書類を外部APIに送りたくない場合でも、コンテナを自社環境に置けばデータを外に出さずに処理できます。
今後の展望と初動アクション
まず試すべきは、自社で最も件数が多い定型書類を1種類選び、10〜20枚で読み取り精度を検証することです。OCR 4は同じ文書でも会社ごとにフォーマットが異なるため、ベンチマークの数値ではなく自社の実物で測るのが近道です。次に、抽出項目を会計ソフトや在庫システムへ渡すまでの流れを小さく作り、信頼度スコアでの仕分けルールを決めます。いきなり全業務へ広げず、月末の請求書処理や新商品の登録など、効果が見えやすい一工程から始めるのが現実的です。
なお現時点では国内クラウドや国産ツールへの組み込み状況は要確認です。まずはAPIやMistral Studioで小さく試し、既存の業務システムとどうつなぐかを並行して検討するとよいでしょう。
まとめ
Mistral OCR 4は、高精度・多言語・構造化出力・低コストを一度に押し出した文書AIです。日本のEC事業者にとっては、請求書や越境ECの多言語書類といった「人手で読んでいた紙仕事」を機械に任せる現実的な選択肢が増えたといえます。導入そのものより、どの一工程から自動化するかの設計が成果を分けます。
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
引用元: TestingCatalog
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。