TSegAgent: ジオメトリ認識を取り入れたビジョン-言語エージェントによるゼロショット歯列分割

arXiv cs.CV / 2026/3/23

📰 ニュースModels & Research

要点

  • TSegAgentは歯科分析を純粋なデータ駆動の認識タスクではなく、ゼロショット幾何推論として再定義します。
  • 汎用基盤モデルの表現力と、歯科解剖学から派生した明示的な幾何学的帰納バイアスを組み合わせ、タスク特異的な訓練を伴わずに歯の個体と同定を推定できるようにします。
  • 歯列の構造的制約(歯列アーチの組織化や体積的関係など)をエンコードすることで、あいまいなケースの不確実性を低減し、特定の形状分布への過学習を抑制します。
  • 実験結果は、低い計算コストとアノテーションコストで正確な分割と識別を実証し、未知の歯科スキャンへの強い一般化性能を示します。

要旨:口腔内でスキャンされた3Dモデルからの自動歯のセグメンテーションと識別はデジタル歯科における基本的な問題ですが、ほとんどの既存のアプローチは密にアノテーションされたデータセットで訓練されたタスク固有の3Dニューラルネットワークに依存しており、その結果、アノテーションコストが高く、未知のソースからのスキャンへの一般化が制限されます。したがって、私たちはTSegAgentを提案します。これにより、歯科分析を純粋なデータ駆動の認識タスクとしてではなくゼロショット幾何推論問題として再定式化することで、これらの課題に対処します。核となるアイデアは、汎用ファウンデーションモデルの表現能力と、歯科解剖学に由来する明示的な幾何学的帰納バイアスを組み合わせることです。歯科固有の特徴を学習する代わりに、提案されたフレームワークは多視点の視覚抽象化と幾何学に基づく推論を活用して、タスク固有の訓練なしで歯のインスタンスと同定を推定します。歯列の構造的配置および体積関係といった構造的制約を明示的にエンコードすることにより、曖昧なケースにおける不確実性を低減し、特定の形状分布への過学習を緩和します。実験結果は、この推論志向の定式化が低い計算コストとアノテーションコストで正確かつ信頼性の高い歯のセグメンテーションと同定を実現し、多様でこれまで見たことのない歯科スキャンに対しても高い一般化性能を示すことを示しています。