商品動画の制作コストが桁違いに下がる可能性が出てきました。TechCrunchが2026年6月11日に報じたところによると、インドのEC向け動画ツール企業Avataar AIが、動画生成AIモデル「Varya」を発表しました。価格は1秒あたり0.48ルピー(約0.005ドル)で、VeoやKling、Luma、Runwayといった既存の動画生成AI(1秒あたり0.10ドル以上)のおよそ20分の1です。商品動画やSNS広告素材を大量に作りたい日本のEC事業者にとっても、動画生成コストの相場が崩れ始めるサインとして見逃せないニュースです。
何が起きたか:蒸留技術で「45秒で5秒動画」を実現
Varyaは、Alibabaが公開しているオープンモデル「Wan 2.2」をベースに、蒸留(distillation)と呼ばれる軽量化技術で高速化した動画生成AIです。TechCrunchの報道によれば、性能の目安は次の通りです。
5秒の720p動画を生成するのにかかる時間は45秒で、ベースとなったWan 2.2の1,230秒に対して大幅に短縮されています。生成に必要な処理ステップ数はWan 2.2の50ステップに対しVaryaは4ステップで、約10倍の高速化をうたっています。価格はホスティングサービス経由で1秒あたり0.48ルピー(約0.005ドル)に設定されており、既存の主要動画生成AIの約20分の1という水準です。
開発元のAvataar AIは、もともとEC向けの商品動画生成ツールを手がけてきた企業で、Peak XV(旧Sequoia Capital India)が出資しています。今回のVaryaは、インド政府が約12億ドルを投じるAIイニシアティブ「India AI Mission」の選定スタートアップ12社の一社として開発されたもので、政府公式リポジトリのAI Koshでモデルの重みとトレーニングデータが公開される点も特徴です。HiggsfieldやAdobe Fireflyとのパートナーシップも検討されていると報じられています。
Peak XVのマネージングディレクターであるラジャン・アナンダンはTechCrunchの取材に対し、「現在のAI動画モデルは、インドで人口規模の利用をするには高すぎる。コストこそがインドのAI普及の最大の鍵だ」と述べています。
もう1つの特徴が「文化的な対応力」です。Varyaはインドの祭り、料理、衣装、建築様式を認識するよう調整されており、テキストプロンプトまたは参照画像から、現地の文脈に合った動画を生成できるとされています。グローバル標準のモデルが苦手とする「ローカルらしさ」を正面から狙った設計です。
日本のEC事業者にとっての論点:動画素材の単価が崩れ始める
このニュースを日本のEC事業者の目線で見ると、論点は3つあります。
第一に、商品動画・広告動画の制作単価の低下です。これまで動画生成AIをECの実務に使う場合、ネックは生成コストと速度でした。たとえば15秒の縦型広告素材を10パターン作ると、1秒0.10ドルのモデルでも生成だけで15ドル、試行錯誤を含めれば数十ドルかかります。Varyaの価格水準ならその20分の1で済む計算で、「商品ごとに動画を作る」「ABテスト用にバリエーションを量産する」という運用が現実的になります。楽天市場の商品ページ動画、Amazonのスポンサーブランド動画広告、InstagramリールやTikTokの広告素材など、動画の出し先は増え続けており、素材量産のコスト構造が変わるインパクトは小さくありません。
第二に、価格競争の波及です。VaryaはWan 2.2というオープンモデルの蒸留で作られており、同じ手法は他社にも再現可能です。モデルの重みとトレーニングデータが公開されることで、低価格な動画生成APIが今後各国で増えることが予想されます。OpenAIのSoraやGoogleのVeoのような高品質路線と、「そこそこの品質を圧倒的低価格で」という路線の二極化が進めば、EC実務で使うのは後者で十分というケースも多いはずです。
第三に、「文化的対応」というローカライズの方向性です。Varyaがインドの祭りや衣装を学習しているように、日本市場向けには日本の季節行事や商習慣(お歳暮、福袋、年末セールなど)を理解した動画生成が求められます。日本語圏向けに調整されたモデルが登場すれば、越境ECやインバウンド向け商材の動画制作にも応用が広がります。逆にいえば、現時点の海外モデルに日本的な文脈の動画を期待しすぎないほうがよい、という判断材料にもなります。
今後の展望と初動アクション
Varya自体は当面インド市場向けで、日本のEC事業者がすぐに使えるサービスではありません。エンタープライズ顧客向けの提供が予定されている段階であり、日本語プロンプトへの対応品質も現時点では要確認です。
そのうえで、いま取れる初動は次の通りです。まず、自社の動画制作コストを「1秒あたりいくら」で把握しておくことです。外注制作費、既存の動画生成AIの利用料を秒単価に換算しておけば、低価格モデルが登場したときに乗り換え判断がすぐにできます。次に、動画生成AIを使う前提でのワークフロー設計です。商品画像から動画を起こす、というVaryaやAvataarの基本機能は、すでにRunwayやKlingでも試せます。少額で試して「どの商品カテゴリなら動画AIで十分か」の見極めを始めておくと、コスト破壊が日本に波及したときに一気にスケールできます。最後に、オープンモデル系の動向のウォッチです。Wan 2.2系の蒸留モデルは今後も登場が見込まれ、セルフホストできる体制がある事業者なら、生成コストをさらに下げる選択肢になります。
まとめ
Avataar AIのVaryaは、動画生成AIの価格を約20分の1に引き下げ、生成速度も大幅に高速化したモデルとして登場しました。日本のEC事業者への直接的な提供はまだ先ですが、「動画素材を量産する前提のEC運営」が成立するコスト水準が見え始めています。自社の動画制作コストを秒単価で把握し、小さく試し始めることをおすすめします。
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
引用元: TechCrunch
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。