VERIA：長尾分布の3D物体検出のための、検証中心のマルチモーダル・インスタンス拡張

arXiv cs.CV / 2026/3/26

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、運転シーン向けデータセットにおける長尾分布の3D物体検出のために、検証中心で画像を起点とするマルチモーダル拡張フレームワーク「VERIA」を提案する。

Abstract

運転データセットにおける長い裾（ロングテール）分布は、3D知覚にとって根本的な課題です。まれなクラスはクラス内多様性が大きい一方で、利用可能なサンプルはその変動空間をまばらにしかカバーできません。コピー＆ペーストやアセットライブラリに基づく既存のインスタンス拡張手法は、まれなクラスへの露出を改善しますが、きめ細かな多様性やシーン文脈への配置の面ではしばしば制限があります。私たちは、オフ・ザ・シェルフの基盤モデルを用いて同期したRGB--LiDARのインスタンスを合成し、逐次的な意味的および幾何学的検証でそれらを厳選する、画像を起点としたマルチモーダル拡張フレームワークVERIAを提案します。この検証中心の設計は、より実際のLiDAR統計に合致するインスタンスを選びやすく、かつクラス内変動の幅をより広くカバーする傾向があります。段階的な収率分解は、パイプライン信頼性のログベースの診断を提供します。nuScenesおよびLyftにおいて、VERIAはLiDAR単独およびマルチモーダルの両設定で、まれなクラスの3D物体検出を改善します。コードは https://sgvr.kaist.ac.kr/VERIA/ で公開しています。

米ハイパーライトとUMC、光電融合向け「TFLN」量産 AI省電力に

日経XTECH

ロブスターに沸いたNVIDIAのGTC 2026、OpenClawでAI業界激震

日経XTECH

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

日経XTECH

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

日経XTECH

AIによる「同質化のわな」から抜け出せるか、技術戦略責任者が議論

日経XTECH

VERIA：長尾分布の3D物体検出のための、検証中心のマルチモーダル・インスタンス拡張

要点

Abstract

関連記事

米ハイパーライトとUMC、光電融合向け「TFLN」量産 AI省電力に

ロブスターに沸いたNVIDIAのGTC 2026、OpenClawでAI業界激震

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

生成AIで従来型インフラは限界に、IOWN APNで距離と遅延の壁を克服

AIによる「同質化のわな」から抜け出せるか、技術戦略責任者が議論

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer