AITP:マルチモーダル大規模言語モデルによる交通事故の責任分担推定
arXiv cs.LG / 2026/4/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文では、事故動画の検出や説明にとどまらず、交通事故の責任分担推定(TARA)を目的としたマルチモーダル大規模言語モデル「AITP(Artificial Intelligence Traffic Police)」を提案している。
- AITPは、Multimodal Chain-of-Thought(MCoT)による多段の因果・推論と、Retrieval-Augmented Generation(RAG)による交通規則の統合によって、法規に根ざした推論能力を高めている。
- 併せて、10個の関連する交通事故推論タスクを統合したデカスロン形式のベンチマーク「DecaTARA」を提示しており、67,941本の注釈付き動画と195,821件のQAペアを含む。
- 実験では、責任分担推定に加えて、交通事故検出(TAD)および交通事故理解(TAU)でも最先端の性能が報告され、「推論駆動型のマルチモーダル交通分析」への新たな方向性を示している。



