arXiv (AI)AI
ANNEAL:統治されたシンボリックパッチ学習によるLLMエージェントの適応
ANNEAL: Adapting LLM Agents via Governed Symbolic Patch Learning
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
大規模言語モデル(LLM)を基盤とするエージェントは個別の実行エラーから回復できますが、タスク実行方法を定義するプロセス知識——オペレータスキーマ、前提条件、制約——が修復されないままでは、同じ障害に何度も失敗してしまいます。既存の自己進化型アプローチはプロンプトやメモリ、モデルの重みを更新することで対応してきましたが、タスク実行方法をエンコードするシンボリック構造を直接修復するものは存在せず、安全な本番導入に必要なガバナンス保証を提供するものもほぼありません。
今回発表されたANNEALは、ニューロシンボリックエージェントの新たなアプローチです。基盤モデルの重みを変更することなく、繰り返される障害をプロセス知識グラフの統治されたシンボリック編集に変換します。その中核メカニズムであるFailure-Driven Knowledge Acquisition(FDKA)は、責任のあるオペレータを特定し、制約付きLLM生成を通じてタイプ付きパッチを合成し、複数次元のスコアリング、シンボリックガードレール、カナリアテストを通じて提案を検証してからコミットします。受け入れられたすべての編集は完全な由来情報と決定論的なロールバック機能を備えています。
4つのドメインと27の複数シード実行全体で、ANNEALは永続的な構造的修復をコミットする唯一の評価システムです。ReActやReflexionといった強力なベースラインは高い一話限りの回復を達成しますが、繰り返される障害に対して72~100%の保留中失敗率を保持しています。これに対しANNEALは、テスト対象の繰り返される障害設定でこれを0%に削減します。アブレーション研究により、FDKAを削除するとすべての構造的修復が消失し、成功率が最大26.7ポイント低下することが確認されました。これらの結果は、統治されたシンボリック修復が、永続的な障害排除のための重み水準およびプロンプト水準の適応に対する補完的なパラダイムを提供することを示唆しています。