TRELLIS.2の画像→3DがMac(Apple Silicon)で動作可能に——NVIDIA GPU不要

Reddit r/LocalLLaMA / 2026/4/20

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • TRELLIS.2(画像から3Dを生成するMicrosoftのモデル)の移植版が公開され、Apple SiliconのMac上でNVIDIA GPUなしでもローカル実行できるようになった。
  • 元のCUDA専用拡張(flex_gemm、flash_attn、o_voxel、cumesh、nvdiffrast)をPyTorch MPS向けに再実装し、疎3D畳み込み、メッシュ抽出、疎トランスフォーマ用注意機構、ボクセルサンプリング等のバックエンドを置き換えた。
  • M4 Pro(24GB)環境で、1枚の写真から約40万頂点のメッシュを約3.5分で生成でき、テクスチャベイクはMPS GPUにより約18秒で完了する。
  • H100ほど高速ではないものの、クラウド不要でオフライン動作し、コストを抑えられる点が強調されている(GitHubリポジトリも提示)。

MicrosoftのTRELLIS.2を、PyTorch MPS経由でApple Silicon上で動作するように移植しました。元の実装は、5つのCUDA専用でコンパイルされた拡張(flex_gemm、flash_attn、o_voxel、cumesh、nvdiffrast)に依存しており、Macに相当するものがありません。

代替バックエンドをゼロから作成しました:

- 純粋なPyTorchによる疎な3D畳み込み(flex_gemmの置き換え)

- 空間ハッシングを使ったPythonメッシュ抽出(o_voxel内のCUDAハッシュマップ演算の置き換え)

- 疎なトランスフォーマー向けのSDPAアテンション(flash_attnの置き換え)

- MPS上でtorch.grid_sampleによるGPUアクセラレーションされた三線形ボクセルサンプリング

単一の写真から、M4 Pro(24GB)で約3.5分ほどで約400Kの頂点メッシュを生成します。テクスチャベイクは、MPS GPUアクセラレーションを使うと約18秒です。H100ほど速くはありませんが、Cloudコストゼロでオフライン動作します。

Repo: https://github.com/shivampkumar/trellis-mac

submitted by /u/sk_dastaan
[リンク] [コメント]