arXiv (Robotics)AI
低解像度一人称視点映像を用いた行動クローニングによる能動的知覚
Behavior Cloning for Active Perception with Low-Resolution Egocentric Vision
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
ロボット工学における知覚と制御の統合は、現実的な作業遂行において重要な課題である。本研究は、行動クローニング(behavior cloning)という機械学習手法が、構造化されたオブジェクト探索タスクにおいて能動的知覚(active perception)を実現するのに十分であるかを検証している。研究の対象となるのは、手首に装着された一人称視点RGB カメラを備えた低コストのロボットアームである。このロボットは、部分的にしか見えていない植物をセンタリングするためにリポジショニングし、その後にグラスプ信号を発動する必要があり、この過程で将来の観察を改善するような行動を必要とする。
モデルは低解像度RGB画像から直接ジョイント命令を予測し、クローズドループ制御下で動作する。研究の重要な知見は、低解像度の一人称視点映像でも信頼性の高いタスク完了に十分であるということだ。さらに、相対的なジョイント変位(relative joint deltas)の予測が、絶対ジョイント位置予測よりも大幅に優れたパフォーマンスを示すことが実証された。
これらの結果は、視覚的に根拠付けられた能動的知覚が、行動クローニングから再現可能な設定において自発的に出現しうることを示唆している。本研究の成果は、限定的なセンサー入力と計算資源でも実用的なロボット制御が可能であることを示し、現場での低コストロボット導入への道を開くものとして注目される。