アリババが新しいAIモデル「Qwen3.7-Plus」を公開しました。画面を見て理解し、人の代わりにクリックやコマンド操作まで自分でこなす「自律エージェント」型のマルチモーダルモデルで、技術メディアのThe DecoderはGUI操作や長期タスクの計画立案でGPT-5.4やClaude Opus 4.6 Max、Gemini 3.1 Proを上回るベンチマーク結果を伝えています。EC事業者にとっては、管理画面の定型作業をAIに任せる未来が一歩近づいた発表です。
何が発表されたか:画面を見て自分で操作するAI
Qwen3.7-Plusの最大の特徴は、視覚理解とエージェント機能を1つのモデルに統合した点です。画面に表示された内容を認識し、UIのクリック操作とコマンドライン操作を同じ処理ループの中で実行できる「ハイブリッド対話型エージェント」として設計されています。動画の理解や運転シーンの分析にも対応すると説明されています。
The Decoderが紹介したデモでは、11時間以上にわたって自律的にアプリ開発を進め、1万行を超えるコードを生成したほか、macOSの株価アプリをSwiftUIで再現実装し、API連携やテスト実行まで行ったとされています。さらにクラウドコンソールを操作して最も安いサーバーインスタンスを自動で購入・設定するデモも示されました。人が逐一指示しなくても、目的を伝えれば画面を見ながら一連の作業を進める方向を狙ったモデルだと言えます。
価格はQwen3.7-Plusが100万トークンあたり入力0.40ドル・出力2.40ドルで、上位のQwen3.7-Maxより入力で約6倍、出力で約3倍安い設定です。現時点ではAlibaba Cloud Model Studio経由で提供されるプロプライエタリモデルで、オープンウェイトでは公開されていません。Anthropic APIのプロトコルに対応し、Claude CodeやQwen Codeといった既存ツールと互換性を持つ点も実務での導入しやすさにつながりそうです。

日本のEC事業者にとっての論点
画面を見て操作できるエージェントは、ネットショップ運営の定型作業と相性がよい技術です。たとえば楽天市場のRMSやAmazonセラーセントラル、Shopify管理画面での商品登録、在庫数の更新、受注ステータスの確認といった「決まった画面で決まった手順を繰り返す」作業は、本来こうしたエージェントが最も得意とする領域です。商品画像や管理画面のスクリーンショットを認識できるマルチモーダル性能は、画像中心のEC業務とも噛み合います。
一方で、現時点でそのまま自社の管理画面に接続して任せるのは時期尚早です。Qwen3.7-Plusは科学的推論を測るMedXpertQA-MMではGemini 3.1 Proに劣り、純粋なロジック処理のベンチマークでも競合に及ばない弱点が報告されています。AIが画面を誤認識して意図しない操作をするリスクも残ります。また楽天市場やAmazonは外部ツールによる自動操作に規約上の制約があるため、自動化の対象は規約の範囲内で完結する作業に絞る必要があります。日本語対応の精度や国内データセンターでの提供有無も、本格導入の前に要確認の項目です。
今後の展望と初動アクション
EC事業者がいま取るべき動きは、過度な期待でも様子見でもなく、自社業務の棚卸しです。第一に、毎日繰り返している管理画面の定型作業を洗い出し、どこが自動化候補かをリスト化しておくと、エージェントが実用域に入ったときにすぐ着手できます。第二に、Qwen3.7-Plusのようなモデルは画像とテキストを同時に扱えるため、商品ページの画像チェックやレビュー分類など、まずはリスクの低い補助業務から試すのが現実的です。第三に、楽天やAmazonの規約と照らし、自動操作が許される範囲を事前に整理しておくことが、後のトラブル回避につながります。
AIモデルの進化は猛烈な速度で続いており、自律エージェントの精度は今後さらに上がる見込みです。特定のモデルに依存せず、ChatGPTやClaude、Geminiも含めて自社業務に合うものを比較検討する姿勢が、これからのEC運営では重要になります。
まとめ
Qwen3.7-Plusは、画面を見て自分で操作する自律エージェント型のマルチモーダルAIです。GUI操作や長期タスクで主要モデルを上回る結果が示された一方、推論面の弱点や規約上の制約も残ります。日本のEC事業者は、いますぐ全業務を任せるのではなく、自動化候補の棚卸しとリスクの低い領域での検証から着実に備えるのが賢明です。
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
引用元: The Decoder
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。