マイクロソフトと中国の3大学が、生成AIの中身(モデルの重み)を一切いじらず、AIに渡す「スキル文書」というテキストファイルだけを自動でチューニングして性能を引き上げる手法「SkillOpt」を発表しました。米メディアThe Decoderによると、最新モデルGPT-5.5で6つのベンチマーク平均およそ23ポイントの改善を確認したとされています。AIを業務で使うEC事業者にとっても示唆の大きい話なので、要点を整理します。
何が起きたか:モデルを凍結し「スキル文書」だけを鍛える
SkillOptは、対象のAIモデル本体は凍結(変更しない)したまま、AIに渡す指示書にあたる「スキル文書」を学習可能なパラメータのように扱う点が特徴です。スキル文書は300〜2,000トークンほどの短いmarkdownテキストで、いわば作業手順書にあたります。
仕組みはこうです。本体とは別の「最適化役」のAIが、エージェントの実行ログを読み、繰り返し起きる失敗パターンと成功パターンを見つけ、スキル文書への限定的な修正案を出します。修正は保持しておいたテスト用データで検証し、成果が確認できたものだけを採用します。これを4ラウンドほど繰り返し、1ラウンドあたり採用される修正は1〜4件程度に絞られます。
論文の著者らは、ディープラーニングの考え方をテキストの世界に対応づけたと説明しています。修正できる量の上限を学習率に、ラウンドごとの縮小をスケジューラに、却下された修正を負の学習例に見立てる、という発想です。元論文はarXiv(2605.23904)で公開されています。

なぜ重要か:表計算など実務タスクで効き、スキルは使い回せる
注目すべきは効果が出た領域です。改善幅が最も大きかったのは表計算シートの編集タスクで、定型的だが手順の多い実務作業ほど効きやすいことを示しています。さらに、大きなモデルで鍛えたスキル文書が小さなモデルの性能も底上げし、別の作業環境でも再学習なしで通用したと報告されています。
これはEC事業者のAI活用と地続きの話です。ChatGPTやClaudeを商品説明文の作成、レビュー分析、問い合わせ対応などに使う際、多くの現場ではすでに「指示プロンプト」や「スキルファイル」を作り込んでいます。SkillOptが示したのは、その指示書こそが性能の伸びしろであり、しかも勘ではなく実行ログから体系的に磨けるという方向性です。高価なモデルを乗り換えなくても、手元の手順書を整えるだけで品質が上がる余地があるわけです。
今後の動き:プロンプトは「書いて終わり」から「育てる資産」へ
SkillOptはあくまで研究段階の手法で、誰でもすぐ使えるツールとして公開されたわけではない点は要確認です。ただ、考え方そのものは今日から取り入れられます。
EC事業者がまず取れる初動は、AIへの指示を毎回その場で書き捨てるのをやめ、商品登録用・接客用などタスク別に手順書として保存して再利用することです。次に、AIの出力で起きた失敗(誤った価格表記、薬機法に触れる表現など)をログとして残し、その都度スキル文書に「やってはいけないこと」を追記して改訂していきます。プロンプトを一度きりの入力ではなく、改訂履歴を持つ業務資産として扱う姿勢が、これからのAI運用の差になりそうです。
まとめ
SkillOptは、モデルを変えずにmarkdownの指示書を自動で鍛えるだけでGPT-5.5を平均23ポイント改善した研究です。EC事業者にとっての学びは明確で、AIの成果を分けるのは最新モデルへの乗り換えだけでなく、日々の指示書をどれだけ磨き込み資産化できるかにあるという点です。
※うるチカラでは、生成AIの導入支援から運用最適化まで、貴社のEC事業に合わせたカスタマイズ提案を行っています。無料相談(30分)も実施中ですので、お気軽にお問い合わせください。
https://uruchikara.jp/contact/
引用元: The Decoder
【監修】齋藤竹紘(株式会社オルセル代表 / 19年・5,000社のEC支援実績)

株式会社オルセル代表取締役 / うるチカラ編集長。19年・5,000社以上のEC支援実績を持ち、楽天市場・Amazon・Yahoo!ショッピング・Shopify・Shopee越境ECの実装ノウハウを保有。AI×ECに関する書籍を3冊執筆。「現場で使えるAI実装」を一次情報として発信しています。