WebARコンテンツ制作における最大のボトルネックのひとつが「3Dモデルの制作コスト」です。高品質な3Dモデルの制作には数週間から数ヶ月の時間と、数十万円以上のコストがかかることが多く、WebAR導入の障壁となってきました。しかし2024〜2025年にかけて、テキストや画像から3Dモデルを自動生成する生成AIツールが急速に進化し、WebAR制作のコスト・スピードを大きく変えつつあります。本記事では、生成AI×WebARの最前線を解説します。
生成AI×3Dモデルの現状と課題
テキストから3Dモデルを生成するAI技術は、OpenAIが2023年にPoint-E・Shap-Eを公開したことで一般的な関心を集め始めました。その後、Stability AI・Luma AI・Meshy・TripoSRなど複数の企業・研究機関がより高品質なモデルをリリースし、2025年時点では「ビジネス利用に耐える品質」のモデルを生成できるツールが登場しています。
ただし、現状の生成AIによる3Dモデルには課題が残っています。第一に内部構造や細部の造形精度が人手制作に比べて劣る場合があります。第二にテクスチャの品質(特にPBRマテリアル)が不安定です。第三に生成されたモデルのポリゴン数が多すぎてWebARでそのまま使用できないことが多く、最適化作業が必要です。
主要ツール比較表
| ツール名 | 入力 | 品質 | GLB出力 | 料金 | WebAR適性 |
|---|---|---|---|---|---|
| Meshy | テキスト/画像 | ★★★★ | 対応 | 無料プランあり(有料:$20〜/月) | 高(最適化機能あり) |
| TripoSR | 画像1枚 | ★★★ | OBJ→変換必要 | 無料(OSS) | 中(後処理が必要) |
| Shap-E(OpenAI) | テキスト/画像 | ★★ | 対応 | 無料(OSS) | 低(品質が不安定) |
| Luma AI Genie | テキスト | ★★★★ | 対応 | 無料プランあり | 高(PBR品質が高い) |
| Rodin(Hyper3D) | テキスト/画像 | ★★★★★ | 対応 | $10〜/月 | 非常に高 |
生成→最適化→WebAR化の実際のワークフロー
Step 1:3Dモデルの生成
Meshyを例にとると、商品の写真を複数枚(正面・側面・背面)アップロードするか、テキストプロンプトを入力すると、数分でGLB形式の3Dモデルが生成されます。生成された初期モデルのポリゴン数は5万〜30万ポリゴン程度であることが多く、WebARの推奨上限(1〜5万ポリゴン)を超えています。
Step 2:品質確認と再生成
生成されたモデルをBlenderやモデルビューアーで確認し、形状の崩れ・テクスチャの歪み・スケール感のおかしさがないかチェックします。「realistic」「highly detailed」「product photography style」などのキーワードを追加すると品質が向上することが多いです。
Step 3:最適化(ポリゴン削減・テクスチャベイク)
Blenderのデシメートモディファイアを使ってポリゴン数を削減(目標:2万ポリゴン以下)し、テクスチャをベイクして1024×1024または2048×2048のテクスチャにまとめます。GLTFpackなどのCLIツールを使ってdraco圧縮を適用すると、ファイルサイズを50〜80%削減できます。
Step 4:WebARへの組み込みとテスト
最適化したGLBファイルをWebサーバーに配置し、model-viewerまたはAFrameに読み込みます。iOS用のUSDZはReality Converterを使ってGLBから変換できます。最後にiOS Safari・Android Chromeの実機で動作・表示品質を確認して完成です。
品質・著作権の注意点
生成AI×WebARで注意すべき点が2つあります。まず品質について、生成AIで作成した3Dモデルは「一見きれいに見えても細部が破綻している」ことがあります。特にWebARで実物大表示する場合は、実機での確認を必ず行ってください。
著作権については、2025年時点で生成AIによる3Dモデルの著作権帰属は各国で整備途上です。特定の既存製品・キャラクターを模倣した3Dモデルの生成は商標権・不正競争防止法の観点からリスクがあります。
2026年の展望
2026年に向けて、スマートフォンのカメラで物体をスキャンするだけでWebAR対応の3Dモデルが自動生成される「スキャン→AR」のシームレスなワークフローが実用化されます。次に、テキストプロンプトから直接WebARページを生成する「AR生成AI」が登場し、ノーコードでのWebARコンテンツ制作が一般化します。さらに、リアルタイムNeRF技術により、写真から生成した高品質な3Dシーンをブラウザ上のWebARで表示できるようになります。
よくある質問
多くの場合、そのままでは使えません。生成AIで作成したモデルはポリゴン数が多すぎたり、テクスチャが最適化されていないため、Blenderなどで最適化作業が必要です。ただしMeshyなどの一部ツールは「WebAR向けLOD生成」機能を搭載しており、最適化作業を省略できるケースが増えています。
2025年時点のMeshy無料プランでは、月200クレジット(テキスト→3D生成で約5〜10モデル)が利用できます。GLB形式でのダウンロードも無料プランで対応しています。ただしテクスチャ品質や最大解像度に制限があるため、商用利用では有料プラン($20/月〜)の利用が推奨されます。
現時点では「生成AI×デザイナーによる仕上げ」のハイブリッドアプローチが最もコストパフォーマンスが高いです。生成AIでベースとなる3Dモデルを素早く作り、専門デザイナーが細部の修正・テクスチャ調整・最適化を行う方式です。フルスクラッチでの3Dモデル制作と比べて制作コストを40〜60%削減できるケースが報告されています。