LiTo: 表面ライトフィールドのトークン化

arXiv cs.CV / 2026/3/12

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

LiTo法は、表面ライトフィールドのサンプルをコンパクトな潜在空間へエンコードすることにより、オブジェクトの幾何と視点依存の外観を共同でモデリングする3D潜在表現を導入します。
RGB-Dデータを表面ライトフィールドのサンプルとして活用し、複雑な照明下での鏡面ハイライトやフレネル反射などの視点依存効果を捉えます。
単一入力画像を条件として潜在分布を予測する潜在フローマッチングモデルを訓練し、入力の照明と材料に一貫した外観を持つ3Dオブジェクトの生成を可能にします。
実験では、既存手法より高い視覚品質と入力忠実度を示します。

要約: 私たちは、オブジェクトの幾何と視点依存の外観を共同でモデリングする3D潜在表現を提案します。従来の多くの研究は、3D幾何の再構成または視点非依存の拡散外観の予測のいずれかに焦点を当てており、現実的な視点依存効果を捉えるのが難しいです。私たちのアプローチは、RGB-D画像が表面ライトフィールドのサンプルを提供するという事実を利用します。表面ライトフィールドのランダムなサブサンプルを、コンパクトな潜在ベクトルの集合にエンコードすることにより、幾何と外観を統一された3D潜在空間に表現することを学習します。この表現は、複雑な照明条件下での鏡面ハイライトやフレネル反射といった視点依存効果を再現します。さらに、この表現上で潜在フロー・マッチングモデルを訓練して、その分布を単一の入力画像で条件付けて学習し、入力の照明と材料に一貫した外観を持つ3Dオブジェクトの生成を可能にします。実験では、私たちのアプローチが既存手法より高い視覚品質とより良い入力忠実度を達成することを示しています。

[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし

Reddit r/MachineLearning

私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法

Dev.to

完全ガイド: AIでお金を稼ぐ方法

Dev.to

AIでポートフォリオを分析して53/100を取得 — どうやって85点以上に改善したか

Dev.to

脱メチル化

Dev.to

LiTo: 表面ライトフィールドのトークン化

要点

関連記事

[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし

私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法

完全ガイド: AIでお金を稼ぐ方法

AIでポートフォリオを分析して53/100を取得 — どうやって85点以上に改善したか

脱メチル化

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer