arXiv (AI)AI
Skim:Webエージェントの高速化と効率化を実現する投機的実行フレームワーク
Skim: Speculative Execution for Fast and Efficient Web Agents
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
現在のWebエージェントは、タスク自体の複雑さに関わらず、フロンティアモデルの推論、ブラウザレンダリング、ReAct風のプランニングを毎ステップ適用することで、高いコストが発生しています。しかし、Skimという新たなフレームワークの開発によって、この状況に変化がもたらされようとしています。
Skimの核となる観察は、目的に特化したWebサイトが安定したURL パターン、回答形式、タスク間のマッピングを持つという点です。同じタイプのクエリであれば、これらのパターンは繰り返し現れるため、ほとんどのクエリはこれらの重い処理コンポーネントを完全にバイパスできます。Skimはオフラインプロファイラーを使用してサイトごとにこれらのパターンを一度キャプチャします。実行時には、各クエリをテンプレートにマッチングさせ、目的のURLを合成し、小規模モデルで回答を抽出します。
軽量なベリファイアは、各高速パスの出力をクエリとスキーマに対して検証し、稀な誤推測が発生した場合には、完全なエージェントにカスケードします。その際、高速パスの最終URLからウォームスタートすることで、上流のトラジェクトリプログレスを保持します。WebVoyager、AgentOccam、BrowserUseの3つのバックボーンエージェントを使用した標準的なWebエージェントベンチマークで、Skimはタスクあたりの中央値コストを1.9倍削減し、レイテンシを33.4%削減しながら、精度低下がないことが確認されています。