2026年に実在する物体の3Dモデルが必要なら、真剣に検討すべき選択肢は2つです:100枚の写真を撮ってフォトグラメトリで処理するか、AIジェネレーターに1枚の写真を渡して30秒待つか。どちらもGLBファイルを出力します。どちらもUnity、Unreal、Blenderに入れられます。しかしそこへ至る経路は全く異なり、両者の選択は多くの人が思うより重要です。
この記事では各方法が実際にどう動くか、数学がどこで破綻するか、特定の仕事にどちらが正しい選択かを順に見ていきます。
フォトグラメトリの仕組み
フォトグラメトリは測定技術です。物体の周りを歩きながら、あらゆる角度から50〜150枚のオーバーラップする写真を撮ります。RealityCapture、Metashape、Polycamなどのソフトが画像間のマッチング特徴点を見つけ、structure-from-motionでカメラ位置を解き、密な点群を三角測量します。点群はメッシュ化され、メッシュは清掃され、写真はテクスチャとして再投影されます。
ターンテーブル上の小さな物体なら撮影は15分ほど。まともなワークステーションでの処理時間は、低解像度プレビューで20分、8Kテクスチャを焼き込んだ高解像度スキャンなら数時間から数日。大型の物体——建物、記念碑、地形——となるとドローン測量とオーバーナイトのレンダーファームの領域に入ります。
出力は幾何的に忠実です。カメラが捉えた凹凸、傷、表面のディテールがすべてメッシュに乗ります。ノギスで測れば現実と数字が一致します。
AI 3D生成の仕組み
AI 3D生成は測定を完全にスキップします。数百万の3Dアセットでトレーニングされたニューラル拡散モデルが1枚の画像を見て、もっともらしい3Dメッシュがどうあるべきかを予測します。これは推測です——しかし非常に情報に基づいた推測で、モデルは車、椅子、動物、プロップが3次元でどう見えるかを内在化しています。
全工程は単一のGPUで約30秒。PBRマップ、ノーマル、クリーンなトポロジー付きのテクスチャ化GLBを得られます。ワークフローの段階的な解説は写真を3Dモデルに変換する方法を参照。
興味深いのは、AIが物体の裏側を発明する点です。フォトグラメトリはカメラが見たものしか示せません。AIジェネレーターは1枚の3/4正面ショットから、カテゴリ事前知識をもとに後部、底部、隠れたジオメトリを幻覚しながら完全なモデルを返します。
フォトグラメトリが勝つ場面
- 最大の幾何精度——測量、エンジニアリング、ミリ単位が重要な用途
- ユニークな実世界の物体——特定の彫刻、特定の考古学的発見、祖母の骨董の花瓶
- 文化遺産の保存——その遺物そのものを捕捉する必要があり、もっともらしいバージョンでは不可
- 大規模環境——地形、建物外観、映画VFX用の実在ロケーション
- 検証可能な来歴——モデルが実物から来た証拠をクライアントが必要とする場合
AI 3Dが勝つ場面
- 速度——30秒 vs 数時間〜数日
- 写真が1枚しかない——拾った画像、スクショ、単一の商品ショット
- 一般的なオブジェクトカテゴリ——モデルが熟知している車両、家具、武器、汎用プロップ
- リグなし、ブースなし、ライトなし——スマホカメラで撮れるものなら十分
- 隠れ面の再構築——正面写真から完全な360モデルが必要な場合
- ゲーム対応トポロジーを最初から——AIによるUnity用車モデル参照
コスト比較
フォトグラメトリは時間かお金のどちらかを要求します。本格的なワークステーション(RTX 4090、64 GB RAM)にRealityCaptureかMetashapeのライセンスで、最初の1枚を撮る前に$4000を超えます。Polycamのようなクラウドサービスはスキャン単位か月額課金。そしてオペレーターの時間——撮影、写真整理、マスキング、リトポロジー——が本当のコスト;単一オブジェクトのクリーンスキャンは熟練作業で半日です。
AI 3D生成は公共料金に近い感覚です。HiGen3Dの料金はクレジット制:1回の生成は数セントの計算コスト、無料枠もあります。手元のハードウェアはスマホ1台。市場のツール比較は2026年のジェネレーター比較を参照。
出力品質とトポロジー
フォトグラメトリは極めて密なメッシュ——多くの場合数百万ポリゴン——と、どんな光でも素晴らしく見える写真的テクスチャを出します。欠点:トポロジーは三角形のスープ。ゲーム対応のクアッドジオメトリへのリトポは独立した工程で、モバイルではアグレッシブなデシメーションが必要。モバイルゲーム向けの3Dモデル最適化がその道筋を扱います。
対照的にAI 3D生成は、ゲームアセットでトレーニングされているため低いポリゴン数(通常10k〜80k三角形)とクリーンなトポロジーを出します。PBRマップは焼き付け済み。テクスチャは理想光下の真のフォトグラメトリほどフォトリアルではありませんが、ほとんどのリアルタイム用途では差は無関係——そしてAIからのPBRテクスチャは作業量のごく一部で90%まで到達させてくれます。
ユースケースを並べて
- ゲーム開発(インディー)——AIがほぼ毎回勝つ。インディー向けAI 3Dパイプライン参照。
- ゲーム開発(AAAヒーローアセット)——少数のシグネチャプロップにフォトグラメトリ、それ以外の背景にAI
- 建築ビジュアライゼーション——敷地はフォトグラメトリ、埋めの家具と装飾はAI
- EC商品ビューア——SKUがユニーク(フォトグラメトリ)かテンプレート的(AIの方が速く安い)かによる
- 研究と測量——フォトグラメトリ一択
- 個人プロジェクト、プロトタイプ、ムードボード——AI
結論
これらのツールは競合ではありません。互いを補完しあい、正解は通常両方を同じプロジェクトの異なる部分にです。物体を多角度から撮影でき幾何的真実が重要ならフォトグラメトリ。写真が1枚で使えるモデルが速く必要ならAI。
2026年のほとんどのゲーム開発者とクリエイターにとって日常の作業馬はAI生成で、フォトグラメトリは現実を正確に捕捉しなければならない少数のケースに残されています。手元にある任意の写真で生成を試してみて結果がどれだけ近いか確認し、それからコミュニティギャラリーで他の人が1枚の画像から何を作っているか見てみてください。