TRELLIS.2 image-to-3D now runs on Mac (Apple Silicon) - no NVIDIA GPU needed

Reddit r/LocalLLaMA / 4/20/2026

📰 NewsDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

Key Points

  • TRELLIS.2(画像から3Dを生成するMicrosoftのモデル)をApple SiliconのMac上で動かす移植版が公開され、NVIDIA GPUなしでローカル実行できるようになった。
  • 元のCUDA専用拡張(flex_gemm、flash_attn、o_voxel、cumesh、nvdiffrast)を、PyTorch MPS向けに再実装し、疎3D畳み込み、メッシュ抽出、疎トランスフォーマ用注意機構、ボクセルサンプリング等のバックエンドを置き換えた。
  • M4 Pro(24GB)環境で、1枚の写真から約40万頂点のメッシュを約3.5分で生成でき、テクスチャベイクはMPS GPUにより約18秒で完了する。
  • H100ほど高速ではないものの、クラウド不要でオフライン動作し、かかるコストを抑えられる点が強調されている(GitHubリポジトリも提示)。

I ported Microsoft's TRELLIS.2 to run on Apple Silicon via PyTorch MPS. The original depends on five CUDA-only compiled extensions (flex_gemm, flash_attn, o_voxel, cumesh, nvdiffrast) that have no Mac equivalent.

Wrote replacement backends from scratch:

- Pure-PyTorch sparse 3D convolution (replacing flex_gemm)

- Python mesh extraction using spatial hashing (replacing CUDA hashmap ops in o_voxel)

- SDPA attention for sparse transformers (replacing flash_attn)

- GPU-accelerated trilinear voxel sampling via torch.grid_sample on MPS

Generates ~400K vertex meshes from a single photo in about 3.5 minutes on M4 Pro (24GB). Texture baking takes about 18 seconds using MPS GPU acceleration. Not as fast as H100 but works offline with zero Cloud cost.

Repo: https://github.com/shivampkumar/trellis-mac

submitted by /u/sk_dastaan
[link] [comments]