位相データ解析(TDA)に適したCAD/3D点群データセット[P]

Reddit r/MachineLearning / 2026/4/29

💬 オピニオンSignals & Early TrendsTools & Practical Usage

要点

  • 著者は、位相データ解析(TDA)を3D点群の前処理・特徴抽出として、標準的な点群前処理法と比較する研究向けに適した3D点群(またはCAD/メッシュ)データセットを探しています。
  • クラスは主に位相的な構造の違い(例:穴・ループ・空洞の数)によって分かれていることが望ましく、そうすることでTDAが下流の分類に対して意味のある信号を持てるようにしたいと述べています。
  • 評価は、ノイズや点の削除/サブサンプリング、微小な変形、スケーリング/回転、合成的な外れ値や破損などの摂動を加えたうえで、前処理後の下流モデルの分類精度に基づいて行う予定です。
  • 著者は、各クラスに600件以上のサンプルがあるか、あるいは十分な数のCAD/メッシュモデルから多数の点群サンプルを生成できることを好み、二値分類でも十分だとしています。
  • コミュニティに対し、既存データセットに加えて、CADリポジトリ、合成データセット生成器、あるいはそのようなクラス対を抽出できるベンチマークの提案を求めています。

みなさんこんにちは、

小規模な研究/レポート作業のために、適切な3D点群データセットを探しています — あるいは、そこから点群をサンプリングできるCAD/メッシュデータセットがあればそれでも構いません。

目的は、さまざまな摂動(例として以下のような)下で、前処理/特徴抽出手法としてトポロジカル・データ解析(TDA)を、より標準的な3D点群の前処理手法と比較することです:

  • ガウスのジッター/ノイズ
  • ランダムな点の削除/サブサンプリング
  • 小さな変形
  • スケーリング/回転
  • 外れ値またはその他の合成的な破損

比較は、前処理の後における下流モデルの分類精度に基づいて行います。

必ずしも多くのクラスは必要ありません。二値分類データセットでさえ十分です。重要なのは、クラス同士がそれぞれトポロジカルな構造で異なっていること、できれば穴/ループ/空洞の数が異なっていることです。そうすることで、TDAが検出すべき意味のあるシグナルを持てます。

たとえば、次のようなものです:

  • 球/ボールのような物体 vs トーラス/リングのような物体
  • 充実した物体 vs トンネルを持つ物体
  • ハンドルや穴の数が異なる物体

理想的には、各クラスには多数のサンプル(600+)が含まれているか、あるいは十分な数のCAD/メッシュモデルがあり、そこから多数の点群をサンプリングできることです。

この説明に合うデータセットをご存じの方はいらっしゃいますか? さらに、CADリポジトリ、合成データセット生成器、あるいはこのようなクラス対を抽出できるベンチマークデータセットの提案もいただけると嬉しいです。

ありがとうございます!

submitted by /u/generalbrain_damage
[link] [comments]