arXiv (ML)AI
分子の分布外汎化を再考する:ターゲット指向のソース選択アプローチ
Rethinking Molecular OOD Generalization via Target-Aware Source Selection
この記事についてAIに質問する →
日本語要約青い用語にマウスを合わせると解説が表示されます
AI創薬において、分子の性質を極端な分布外(OOD)シナリオの下で堅牢に予測することは、極めて重要な課題となっています。従来のスキャフォルド分割プロトコルは、微視的な意味的重複を十分に阻止できず、モデルのショートカット学習を招き、真の外挿能力を過大評価させてしまいます。一方、従来のドメイン適応手法は、異なるソースライブラリを盲目的に整列させると、トポロジカルノイズが生じ、ネガティブトランスファーを引き起こすため、極端な構造的シフトの下では性能が低下してしまいます。
これらの課題に対処するため、研究チームはSCOPE-BENCHと呼ぶ新しいベンチマークを提案しました。このベンチマークは、物理化学的記述子空間における明示的なクラスタレベルの分割に基づいており、従来のスキャフォルド分割では見逃されていた微視的な意味的重複を適切に検出することができます。同時に、POMA(Policy Optimization for Multi-source Adaptation)というフレームワークも開発されました。POMAsは知識転移を検索-合成-適応のパイプラインとして定式化するもので、ラベル付きのソーススキャフォルドの中から構造的に未ラベルターゲットに近いものをプロキシターゲットとして特定し、強化学習ポリシーによって指数関数的に大きな候補プールから最適なソース部分集合を適応的に選択します。その後、マクロな位相的スケールとミクロな薬効団スケールの両方で二重スケール領域適応が実施されます。
評価結果によると、最先端の3D分子モデルの予測誤差はSCOPE-BENCHで最大8.0倍、平均5.9倍増加することが明らかになりました。これに対してPOMAsは、様々なバックボーン構造にわたって、平均絶対誤差で最大11.2%の低減を達成し、平均相対改善率は6.2%に及びます。このアプローチにより、AI創薬における分子予測の信頼性が大幅に向上することが期待されています。