Gemini 3.5 Live Translateとは、70以上の言語を自動検出し、話しながらほぼ同時に音声を翻訳するGoogleのモデルです。
越境ECで一番後回しにされてきたのが、音声での接客と問い合わせ対応でした。チャットや商品ページの多言語化は進んでも、電話・ビデオ商談・ライブ配信の場面では言語の壁がそのまま残っていたためです。2026年6月9日に発表されたGemini 3.5 Live Translateは、この空白を埋める可能性を持っています。相手が話し終わるのを待たず、数秒遅れで訳した音声を返し続ける仕組みは、これまでの「一文ずつ翻訳」型とは体験がまるで違います。この記事では、越境ECの現場で音声接客をどう組み替えられるか、具体的な導線とプロンプトまで踏み込んで整理します。
発表から見える2026年の音声翻訳の到達点
Google公式ブログによると、Gemini 3.5 Live Translateは音声から音声へ、ほぼリアルタイムで70以上の言語を翻訳します。特徴は、話者の抑揚・話す速さ・声の高さを保ったまま、途切れずに訳した声を生成する点です。旧来のツールが一文の完了を待ってから訳していたのに対し、このモデルは話し始めた瞬間から翻訳を走らせ、数秒遅れで追いかけます。
利用できる場所は3つに整理されています。無料のGoogle翻訳アプリ、ビデオ会議のGoogle Meet、そして開発者向けのGemini Live APIです。Google Meetの音声翻訳は従来5言語しか扱えませんでしたが、70以上の言語に広がり、1つの会議で2000を超える言語の組み合わせに対応するとされています。配車サービスのGrabは、ドライバーと旅行者が乗車時に近リアルタイムで意思疎通できるよう、このモデルを検証していると紹介されています。
越境ECの文脈に引き寄せると、意味は明確です。これまで多言語の電話・ビデオ接客には通訳の手配か、片言の英語での対応か、あるいは対応そのものの見送りしか選択肢がありませんでした。音声のリアルタイム翻訳がアプリと会議ツールと開発APIの3面で同時に使えるようになったことで、店舗規模を問わず音声接客を試せる土台ができたことになります。現場感覚では、これまで「英語対応スタッフがいないから海外電話は取らない」と決めていた店舗ほど、変化の幅は大きくなります。
数字の面でも補足しておきます。従来5言語だったMeetの音声翻訳が70言語超へ広がったという事実は、対応可能な市場の幅がそのまま十数倍に増えることを意味します。ただし全言語で品質が均一とは限らないため、主要販売国の言語での実地検証が前提になる点は要確認です。
越境ECの音声接客に落とし込む実装手順(プロンプト4本)
ここからは、Gemini 3.5 Live Translateとテキスト側のGeminiを組み合わせ、越境ECの音声接客を組み立てる手順を示します。音声翻訳そのものは会議ツールやアプリが担うため、EC事業者が用意すべきは「翻訳された会話を、正しい商品情報と接客トーンに乗せる台本と後処理」です。以下のプロンプトは4本、いずれもテキスト生成側で使います。
(用途タイトル:多言語音声接客の台本づくり)
あなたは越境ECの多言語カスタマーサポート設計の専門家です。
以下の商品について、音声接客で使う想定問答の台本を作成してください。
条件:
1. 対象言語は{対象国と言語}
2. 電話・ビデオ商談でそのまま読み上げられる話し言葉にする
3. 想定質問を「サイズ・素材」「配送と関税」「返品」「支払い方法」の4カテゴリで各3問
4. 回答は1問あたり2〜3文、誇大表現と断定的な効能表現は使わない
5. 日本語の原文と、対象言語の訳文を左右で対応させる
商品情報:
- 商品ジャンル:{ジャンル}
- 主要スペック:{素材・サイズ・容量}
- 配送条件:{送料・関税負担・納期}
- 返品条件:{期間・条件}
音声翻訳は言い回しの機微を落とすことがあります。台本を先に固めておくと、翻訳越しでも要点がぶれません。
(用途タイトル:通話後の要約と対応漏れチェック)
あなたは越境ECのサポート品質管理担当です。
以下は音声翻訳を介した接客通話の文字起こしです。
次の形式で通話後メモを作成してください。
1. 顧客の要望を3行以内で要約
2. 約束した内容(価格・納期・返品可否)を箇条書き
3. 未回答・要確認事項をリスト化
4. 次のアクションと担当への引き継ぎ文
文字起こし:
{通話の文字起こしテキスト}
翻訳を挟む通話は、聞き違いや訳の揺れが残りがちです。通話直後に要点を機械で固定しておくと、後日の言った言わないを防げます。
(用途タイトル:多言語FAQへの転用)
あなたは越境ECのコンテンツ担当です。
以下の接客通話メモ10件をもとに、多言語FAQの原稿を作成してください。
条件:
1. 頻出質問を出現回数の多い順に整理
2. 各質問に対する回答を{対象言語}と日本語で併記
3. 商品ページに載せる前提で、話し言葉を書き言葉に整える
4. 誇大表現・薬機法や景表法に触れる表現を避ける
通話メモ:
{メモを貼り付け}
音声接客で拾った生の疑問は、そのまま多言語FAQの一次資料になります。問い合わせを資産化する導線として有効です。
(用途タイトル:ライブ配信の多言語進行台本)
あなたは越境ライブコマースの構成作家です。
以下の商品で、音声リアルタイム翻訳を使う前提の30分ライブ進行台本を作ってください。
条件:
1. オープニング・商品紹介・実演・質疑・クロージングの5部構成
2. 翻訳が追いつきやすいよう、1文を短く区切る
3. 数字(価格・在庫・クーポン)は口頭とテロップの両方で示す指示を入れる
4. 対象言語:{対象国と言語}
商品情報:
{ジャンル・特徴・価格・在庫・クーポン}
リアルタイム翻訳は長い文ほど遅延と誤訳が増えます。台本の段階で一文を短く設計しておくのが、ライブ運用での定石です。
音声翻訳接客でつまずく3つの失敗と回避策
第一の失敗は、翻訳品質を過信して数字を口頭だけで伝えることです。価格・関税・納期・クーポンコードといった数字は、翻訳の揺れが致命傷になります。回避策は、数字は必ず画面共有やテロップ、チャット欄に文字でも出す運用に固定することです。直近の支援案件で観測したのは、口頭のみの価格提示で「聞いていた額と違う」という齟齬が起きやすいという点でした。
第二の失敗は、対応言語を欲張って主要国の検証を飛ばすことです。70言語超に対応するとはいえ、販売比率の高い国の言語で実地テストをしないまま本番投入すると、微妙なニュアンスのずれがクレームにつながります。回避策は、売上上位2〜3か国の言語に絞って通話テストを重ね、台本とFAQを固めてから対応言語を広げる順序です。
第三の失敗は、通話記録を残さず属人化させることです。音声接客は形に残りにくく、担当が抜けると品質が一気に落ちます。回避策は、前節のプロンプトで通話ごとに要約・約束事項・要確認をテキスト化し、多言語FAQへ回す仕組みを最初から作ることです。
KPI設計と費用の目安
音声翻訳接客のKPIは、対応可能言語数だけで測ると失敗します。追うべきは、海外からの問い合わせ応答率、通話からの受注転換率、そして通話後の対応漏れ件数です。現場感覚では、これまで取れなかった海外電話・ビデオ相談に応答できるようになること自体が最初の成果で、応答率の改善が受注に先行して現れます。
費用面では、Google翻訳アプリとGoogle Meetの音声翻訳は個人向けには無料枠から使えますが、業務での本格運用や独自アプリへの組み込みはGemini Live APIの従量課金が前提になります。API単価は用途と処理量で変わるため、実額は公式の料金ページで都度確認する必要があります。テキスト処理側のGeminiやChatGPTの有料プランは月20米ドル前後が目安です。まずは無料枠のアプリとMeetで通話テストを回し、受注転換の手応えを見てからAPI組み込みへ進む段取りが、投資を絞る現実的な順序です。テキスト側のコスト設計はGemini 3.5 Flashのコスト解説もあわせて参照してください。
今後の展望とEC事業者への影響
音声のリアルタイム翻訳が標準機能になると、越境ECの競争軸は「多言語で商品ページを作れるか」から「多言語で会話して売れるか」へ移ります。テキストの多言語化はすでにコモディティ化しつつあり、差がつくのは有人・半自動の音声接客をどれだけ運用に載せられるかです。開発者向けにAgora、Fishjam、LiveKit、Pipecat、Vision Agentsといったプラットフォームが実装を支える体制も整いつつあり、独自の音声接客アプリを組む敷居は下がっています。
商品購入の導線がAIエージェント経由に広がる流れのなかで、音声接客はエージェントが拾いきれない「迷っている顧客の背中を押す」領域を担います。越境の音声接客を早めに型にした店舗は、テキスト最適化に留まる競合との差を接客体験でつけられます。Googleのショッピング導線の変化と合わせて捉えたい場合はGoogleのユニバーサルカートとエージェント型購買も参考になります。
よくある質問
Gemini 3.5 Live Translateは無料で使えますか
無料のGoogle翻訳アプリとGoogle Meetの音声翻訳から試せます。業務システムへの組み込みや大量処理はGemini Live APIの従量課金が前提で、実額は公式料金ページで確認してください。
何言語に対応していますか
70以上の言語を自動検出して翻訳します。Google Meetでは1つの会議で2000を超える言語の組み合わせに対応するとされています。ただし言語ごとの品質差は要確認で、主要販売国での実地テストを推奨します。
電話やビデオ商談でそのまま使えますか
Google Meetでの利用が想定されており、ビデオ商談には適しています。一般の電話回線での利用は環境依存のため、まずはMeetやアプリでの通話テストから始めるのが安全です。
翻訳の遅延はどのくらいですか
話者から数秒遅れて訳した音声を返し続ける設計です。一文を短く区切るほど遅延と誤訳が減るため、台本段階で短文化しておくと安定します。
越境ECの最初の一歩は何ですか
売上上位の1〜2か国に絞り、無料のアプリとMeetで通話テストを行うことです。台本と通話後メモをテキスト化し、多言語FAQへ回す仕組みを同時に作ると資産になります。
テキストの多言語対応もこのモデルで足りますか
Live Translateは音声翻訳が主眼です。商品ページやFAQのテキスト整備はテキスト側のGeminiやChatGPTと役割分担するのが実務的です。
著者:齋藤竹紘(株式会社オルセル 編集長/5,000社以上のEC支援実績/書籍3冊)
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。