アダプタ不要のファインチューニング手法:3D基盤モデルの調整
arXiv cs.CV / 2026/3/26
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、データが少ない(few-shot)状況で3Dポイントクラウド基盤モデルの適応性を向上させるための、アダプタ不要のファインチューニング手法であるMomentum-Consistency Fine-Tuning(MCFT)を提案する。
- MCFTは、事前学習済みエンコーダの一部のみをファインチューニングし、表現のドリフトや過学習を抑えるために運動量に基づく一貫性制約を適用することで、全量ファインチューニングと比べて改善を図る。
- このアプローチは元のモデルのパラメータ数を維持し、標準的なタスクヘッド以外の新たな学習可能コンポーネントを追加しない。そのため、アダプタ型のPEFTで一般的な推論時のレイテンシ増加を回避できる。
- 2つの拡張も提案される:より強力なfew-shot性能のためにラベルなしデータを活用する半教師ありバリアント、構造化された層の削除により計算効率を高めるプルーニングベースのバリアントである。
- オブジェクト認識およびパーツセグメンテーションのベンチマークでの実験により、一貫した改善が示される(例:5-shotで+3.30%、半教師あり学習で最大+6.13%)。さらに、計算資源が限られた環境での導入にも現実的に対応可能である。