arXiv (AI)AI
タスク観察前のエージェントメモリ構築:Prepingフレームワークの提案
PREPING: Building Agent Memory without Tasks
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
AIエージェントが新しい環境に導入される際、実行するべきタスクに関する具体的な経験がない状態から始まる「コールドスタート問題」は、その性能を大きく制限する要因となってきました。従来、エージェントのメモリは、事前に用意されたデモンストレーションからオフラインで構築するか、実運用後の相互作用からオンラインで構築されていました。しかし両者とも、目標環境でのタスク経験がない初期段階では効果を発揮しにくいという課題を抱えていました。
このような背景の中、研究チームはPrepingという新しいフレームワークを提案しています。このアプローチの革新的な点は、実際のタスクを観察する前に、自己生成した合成的な練習を通じて手続き的メモリを構築できるという考え方にあります。ただし、単純な合成相互作用では不十分で、何を練習し何をメモリに保存するかを制御しなければ、合成タスクは冗長化・実行不可能化し、メモリの品質が急速に低下してしまいます。
Prepingの中核は提案者メモリと呼ばれる構造化制御状態であり、これが今後の練習を形作ります。提案者(Proposer)はこの状態に基づいて合成タスクを生成し、実行者(Solver)がそれを実行し、検証者(Validator)が記憶に適したトラジェクトリを判定するとともに、将来の提案をガイドするフィードバックを提供します。AppWorld、BFCL v3、MCP-Universeでの実験結果から、Prepingはメモリなしのベースラインを大幅に上回り、オフライン・オンライン経験から構築された強力なプレイブック手法と競争力のある性能を実現しました。さらに重要なのは、AppWorldでは$2.99\times$、BFCL v3では$2.23\times$低い配置コストを達成したという点です。詳細な分析によれば、主な効果は合成データの量だけでは説明できず、実行可能性・冗長性・カバレッジに対する提案者側の制御と、選別的なメモリ更新の組み合わせにより実現されていることが明らかになりました。