Googleが2026年6月9日、リアルタイム音声翻訳モデル「Gemini 3.5 Live Translate」を公開しました。70以上の言語、2,000以上の言語の組み合わせに対応し、話し手の声のトーンやピッチを保ったまま、文の終わりを待たずに逐次翻訳していくのが特徴です。すでに開発者向けAPIとGoogle AI Studio、Google Meet、Google翻訳アプリで利用が始まっており、越境ECやインバウンド対応を抱える日本のEC事業者にとって、言語の壁が実務レベルで一段下がるアップデートといえます。本記事では発表の事実関係と、EC事業者が押さえるべき論点を整理します。
Gemini 3.5 Live Translateで何が変わったのか
The Decoderの報道によると、Gemini 3.5 Live Translateは音声から音声へのリアルタイム翻訳に特化したモデルです。従来の音声翻訳は「話し終わってから訳が出る」逐次通訳型が主流でしたが、本モデルは文末を待たずに翻訳を進めるため、会話のテンポを崩しにくい設計になっています。
主な特徴は次のとおりです。まず、話されている言語を自動検出するため、事前に「英語から日本語へ」といった設定をする必要がありません。次に、話者の声のトーン・話す速さ・ピッチを翻訳後の音声にも反映するため、機械的な読み上げ感が抑えられています。さらに、生成されたすべての音声にはGoogleのAI生成コンテンツ識別技術であるSynthIDの透かしが埋め込まれており、AI音声であることを後から検証できる仕組みです。
提供チャネルは4つあります。開発者向けにはGemini Live APIのプレビューとして提供され、モデルIDは gemini-3.5-live-translate-preview です。ブラウザ上ではGoogle AI Studioからすぐに試せます。ビジネス用途ではGoogle Meetにビジネス向けプレビューとして組み込まれ、一般ユーザー向けにはGoogle翻訳アプリ(Android・iOS)にも展開されます。
実用例としては、東南アジアの配車サービス大手Grabが、ドライバーと乗客のコミュニケーションにこのモデルをテスト中と報じられています。多国籍の利用者を相手にする現場で、リアルタイム音声翻訳が実地検証の段階に入ったということです。
一方で制約も明記されています。公式ドキュメントによると、入力は音声のみでテキスト入力には非対応、強いアクセントや似た言語同士では言語検出の精度が落ちる場合があり、翻訳音声の声の一貫性やバックグラウンドノイズの処理にも課題が残るとされています。
日本のEC事業者にとっての論点
このアップデートがEC実務に効くのは、大きく3つの場面です。
1つ目は越境ECのカスタマーサポートです。海外顧客からの問い合わせ対応は、これまでテキストの自動翻訳でなんとか回している事業者が大半でした。音声のリアルタイム翻訳が実用水準に近づけば、ビデオ通話や電話での返品交渉・配送トラブル対応など、テキストでは伝わりにくいやり取りを母国語同士で行える可能性が出てきます。ShopifyやAmazonのグローバル販売で英語圏以外の市場(スペイン語圏・東南アジアなど)に出ている店舗ほど恩恵が大きいはずです。
2つ目は海外サプライヤー・パートナーとの商談です。Google Meetにビジネス向けプレビューとして組み込まれた点は見逃せません。中国・東南アジアの工場や卸との仕入れ交渉、海外モールの担当者とのミーティングで、通訳を挟まずに会話のテンポを保ったまま商談できるなら、調達のスピードと精度が変わります。すでにGoogle Workspaceを使っている事業者は、追加投資なしでプレビューを試せる立ち位置にいます。
3つ目はインバウンド対応です。実店舗を併設するEC事業者や、観光地で店舗運営をしながらECも展開する事業者にとって、Google翻訳アプリへの搭載は店頭接客の選択肢を増やします。70言語対応であれば、英語・中国語以外の来店客への接客もカバー範囲に入ってきます。
ただし、現時点ではいずれのチャネルもプレビュー段階であり、強いアクセントへの弱さやノイズ処理の課題が公式に明記されている点は織り込むべきです。クレーム対応のような誤訳が致命傷になる場面でいきなり本番投入するのではなく、まずは社内の定型的なやり取りで精度を見極めるのが現実的です。
今後の展望とEC事業者の初動アクション
初動としてまず取り組みやすいのは、Google AI Studioでの試用です。ブラウザからモデルを選ぶだけで動作を確認できるため、自社の商材や想定顧客の言語で翻訳品質を確かめられます。日本語と英語、日本語と中国語など、自社の取引で実際に使う言語ペアで試すのが先決です。
次に、Google Workspaceを契約している事業者は、Google Meetのビジネス向けプレビューの提供状況を管理コンソールで確認しておくとよいでしょう。海外との定例ミーティングがある事業者なら、社内打ち合わせで一度試してから商談に投入する、という段階を踏めます。
中期的には、ライブコマースの多言語化という応用も視野に入ります。日本語で配信しながら海外視聴者にリアルタイムで音声翻訳を届ける構成が技術的に可能になれば、越境ECの販売チャネル設計そのものが変わります。Gemini Live APIが開発者プレビューとして公開されている以上、こうした組み込みを試す国内外のスタートアップが出てくるのは時間の問題です。
なお、生成音声にSynthID透かしが入る仕様は、AI音声の利用を顧客に開示する流れを後押しします。接客やサポートにAI翻訳音声を使う場合は「AIによる自動翻訳を使用しています」と明示する運用をセットで設計しておくと、後々のトラブルを避けられます。
まとめ
Gemini 3.5 Live Translateは、70言語のリアルタイム音声翻訳をAPI・Google Meet・翻訳アプリの3ルートで一気に実用圏へ持ち込む発表です。プレビュー段階ゆえの精度制約はあるものの、越境ECのサポート・海外調達の商談・インバウンド接客のいずれかを抱える日本のEC事業者なら、まずGoogle AI Studioで自社の言語ペアの品質を確かめておく価値があります。言語の壁を前提にしてきた業務フローを見直すタイミングです。
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
引用元: The Decoder
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。