オープンソースのAI 3D界隈を追っていると、3つの名前が繰り返し登場します:Microsoft ResearchのTRELLIS、TencentのHunyuan3D、そしてStability AIのStable Fast 3Dです。3つとも画像から3Dを生成する基盤モデルで、いずれもオープンソース化または研究フレンドリーなライセンスで公開されており、同じ問題に対して根本的に異なるアプローチを取っています。
この比較では「唯一の勝者」を装うつもりはありません。正しいモデルは、何を作っているか、どのトレードオフを受け入れられるかによります。それぞれを正直に見ていきましょう。
なぜこの比較が重要か
MeshyやTripoのようなクローズドソースのサービスは優れた製品ですが、AI 3D生成が実際にどう動いているのかを理解したい、あるいはその上に構築したい場合、オープンな基盤モデルを見る必要があります。TRELLIS、Hunyuan3D、Stable Fast 3Dは3つの異なる哲学を代表しています:構造化潜在表現、2段階拡散、そして純粋な速度です。クローズドサービスが裏で何をやっていようと、ほぼ確実にこの3つのいずれかの変種か派生です。
TRELLIS(Microsoft Research、2024年後半)
TRELLISは構造化潜在表現を導入し、ジオメトリと外観を分離し、同じ潜在空間から複数の出力フォーマット——Gaussian Splatting、メッシュ、放射輝度場——をサポートします。この柔軟性は珍しいものです。多くのモデルは1つの表現にコミットしますが、TRELLISは下流ツールに合うものをデコードできます。
ジオメトリ品質こそTRELLISが本当にリードする部分です。表面はシャープで、トポロジーは箱から出した状態でも使いやすく、凹のディテールは競合モデルよりも生成過程で生き残ります。2025年に洗練されたTRELLIS.2リリースでは収束性が向上し、テクスチャ忠実度が改善され、曖昧な視点のための単一画像priorも強化されました。
難点:TRELLISは重いです。快適な推論には16–24 GBのVRAMが必要で、生成は速度最適化された競合より遅いです。リアルタイムのクリエイティブツールを作るなら、その遅延は問題になるかもしれません。ゲームエンジンに納品するアセットを生産するなら、待つ価値があります。
参考まで:HiGen3Dの写真-to-3Dパイプラインは内部でTRELLIS.2を使っています。主な理由はジオメトリ品質と車両への対応——歴史的に弱いモデルが微妙な曲率やホイールアーチで破綻するカテゴリーです。
Hunyuan3D(Tencent、2024–25)
Hunyuan3Dは2段階拡散アプローチを取ります:まずDiffusion Transformer (DiT) が形状を生成し、次に別のテクスチャ拡散段階がそれを塗ります。この分離には実利があります。形状段階は外観に気を取られずジオメトリだけに集中でき、テクスチャ段階は独立に差し替えやファインチューンが可能です——同じ形状バックボーンからスタイライズドとフォトリアルの両方の出力が欲しい場合に有用です。
Hunyuan3Dは豊かなテクスチャディテールを持つ実世界の物体で特に強い:日用品、食品、布地、装飾品など。テクスチャは鮮やかで高解像度に仕上がり、TRELLISが基盤ジオメトリで勝っても、純粋な視覚的魅力ではしばしばTRELLISを上回ります。
Hunyuan3Dが少し弱いところ:人工物の構造的対称性(2つの拡散段階の継ぎ目が最終結果に漏れることがある)、そして2段階パイプラインはシングルパス手法より全体的に遅いです。ライセンス条件もバージョン間で変化しているので、商用リリースする場合は最新のリリースノートを確認してください。
Stable Fast 3D(Stability AI、2024)
Stable Fast 3Dはその名の通り:速度最優先。現代のGPUで推論は1秒以内に終わります。タイポではありません——これは数十秒や数分のレベルで考えるTRELLISやHunyuan3Dとは根本的に異なる設計ポイントです。
その速度のためにStable Fast 3Dは忠実度を犠牲にします。ジオメトリは柔らかく、細部は滑らかに、テクスチャは他の2つより低解像度です。これは仕上げツールではなく、イテレーションツールです。コンセプトを50通り試して最良のものを選びたいなら、Stable Fast 3Dのループタイムは無敵です。ヒーローアセットが必要なら、後で遅いモデルで再生成すればよい。
純粋なモデル速度がクリエイティブワークフローをどう変えるかについては、AIでスケッチから3Dへの記事を参照してください。そこでは高速イテレーションこそが本質です。
比較軸
- ジオメトリ品質:TRELLIS > Hunyuan3D > Stable Fast 3D
- テクスチャ品質:Hunyuan3D > TRELLIS > Stable Fast 3D
- 速度:Stable Fast 3D(サブ秒)≫ TRELLIS(秒)≈ Hunyuan3D(秒)
- VRAM:Stable Fast 3D(8 GB)< Hunyuan3D(12–16 GB)< TRELLIS(16–24 GB)
- 出力フォーマット:TRELLISはGaussian / mesh / radiance fieldsをサポート;Hunyuan3Dはテクスチャ付きメッシュ;Stable Fast 3Dはテクスチャ付きメッシュ(GLB)
- ライセンス:3つとも寛容または研究フレンドリーなライセンスですが、商用条件は異なります——出荷するバージョンの現行LICENSEを必ず読んでください
使い分け
- ゲーム対応ヒーローアセット、車両、クリーンなジオメトリが必要なもの:TRELLISまたはTRELLIS.2。
- フォトリアルな日用品、ECサイト、装飾品:Hunyuan3D。
- 高速プロトタイピング、コンセプト探索、リアルタイムクリエイティブツール:Stable Fast 3D。
重要なのは、これらは相互排他的ではないこと。本格的なパイプラインなら、アイデア出しにStable Fast 3D、勝ち残ったコンセプトを最終アセットとしてTRELLISまたはHunyuan3Dで再生成、という構成もあり得ます。実例はインディー開発者向けAI 3Dアセットパイプラインを参照してください。
これからの方向
次の波はすでに見えています。マルチ画像条件付け——同じ物体の複数視点をモデルに与える——は背面再構成を劇的に改善し、TRELLIS.2のフォークでは既に出荷されています。動画-to-3Dは短いクリップをテクスチャ付きメッシュに変換し、AI生成と古典的なフォトグラメトリの境界線をぼかします。ネイティブGaussian Splatting出力も成長中——最終納品が焼き込みGLBであってもNeRF隣接のレンダリングに有用です。
比較をスキップして何か生成したい場合、HiGen3Dジェネレーターは車両チューニング済みパイプラインでTRELLIS.2をラップしています。あるいはコミュニティギャラリーで他の人が作ったものを見ることもできます。クローズドソースサービスを含むより広い市場視点は2026年ジェネレーターまとめをご覧ください。