Googleが、低コストの主力モデルGemini 3.5 Flashに「Computer Use(コンピュータ操作)」機能を標準で組み込みました。これまで専用モデルでしか使えなかった、AIが画面を見て理解し、ブラウザやデバイスを自分で操作する能力が、ふだん使いのモデルで利用できるようになったということです。EC事業者にとっては、商品登録や受注処理といった画面操作中心の定型業務を、AIエージェントに任せられる現実味が一段増した発表だと受け止めています。
何が起きたか:専用モデルから主力モデルへ「画面操作」が降りてきた
The Decoderの報道によると、今回のアップデートでGemini 3.5 Flashはコンピュータ・ブラウザ・モバイル端末を自律的に見て、理解し、操作できるようになりました。従来この画面操作は独立したGemini 2.5世代のモデルでしか提供されていませんでしたが、それが主力のFlashに統合された形です。関数呼び出し、検索、地図といった既存ツールと組み合わせることで、開発者はブラウザ・モバイル・デスクトップをまたいで動くエージェントを作り、ソフトウェアテストやオフィス業務の自動化に使えるとされています。
性能面では、画面操作の標準ベンチマークであるOSWorldでGemini 3.5 Flashが78.4を記録しました。これは前世代のGemini 3 Flash(65.1)やGPT-5.4 mini(72.1)を上回る数字です。一方で上位帯を見ると、GPT-5.5が78.7、Anthropicのモデルでは最上位のOpus 4.8が83.4で先行し、Sonnet 4.6が78.4、Gemini 3.1 Proが76.2となっています。Flashは「最上位ではないが、低コスト帯としては十分に高い操作精度」という位置づけだと読み取れます。利用はGemini APIとGemini Enterprise Agent Platform経由で、BrowserbaseのデモとGitHubの参照実装も公開されています。
日本のEC事業者にとっての論点:定型業務の自動化とセキュリティ
EC運営の現場には、画面を見ながらの手作業が大量に残っています。楽天市場・Amazon・Shopify・Yahoo!ショッピングのそれぞれの管理画面に同じ商品情報を入れ直す、受注リストを開いてステータスを更新する、店舗ページの表示崩れを目視でチェックする、といった作業です。こうした「APIが整っていない、または画面操作のほうが早い」業務こそ、画面を見て操作できるAIエージェントが効いてくる領域です。低コストのFlashに標準搭載されたことで、これまでコストが見合わなかった反復作業まで自動化の検討対象に入ってきます。
ただし、見落としてはいけないのがセキュリティです。Googleは間接的なプロンプトインジェクション(外部のWebページや文章に仕込まれた不正な指示にAIが従ってしまう攻撃)への対策として、敵対的学習に加えて2つの企業向けセーフガードを用意したと説明しています。1つは重要な操作や取り消せない操作の前にユーザー確認を求めるもの、もう1つはインジェクションを検知すると自動でタスクを止めるものです。EC業務では顧客の個人情報や決済画面、出荷指示など「取り消せない操作」が日常的に発生します。AIエージェントに画面操作を任せるなら、確認ステップを必須にする、サンドボックス環境で動かす、人間の監督と権限制限を組み合わせる、というGoogleの推奨はそのまま守るべき前提になります。
今後の展望と初動アクション
まず試すべきは、失敗しても被害が小さい業務からの検証です。商品ページのリンク切れや表示確認、競合店舗の価格モニタリングなど、読み取り中心で取り消し不能な操作を伴わないタスクなら、安全に精度を見極められます。次に、確認ステップを挟める範囲で受注・在庫更新の補助に広げ、決済や個人情報を扱う操作は当面は人間の最終確認を残す設計が現実的です。コスト面では、最上位モデルでなくFlash帯で78.4の操作精度が出る点が重要で、月数百件規模の定型作業でも採算が合う可能性があります。自社のどの業務が「画面操作で完結し、かつ取り返しがつく範囲か」を棚卸しすることが、最初の一歩になります。
まとめ
画面操作能力が低コストの主力モデルに降りてきたことで、EC業務自動化の現実的な選択肢が広がりました。日本のEC事業者は、読み取り中心の安全なタスクから検証を始め、取り消せない操作には必ず人間の確認とアクセス制限を残す、という慎重な順番で取り入れていくのが得策です。
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
引用元: The Decoder
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。