Workflow
3D世界生成模型
icon
搜索文档
混元3D世界模型1.0 lite版本发布,消费级显卡就能跑
量子位· 2025-08-15 10:05
腾讯混元3D世界生成模型HunyuanWorld 1.0技术框架 - 核心功能为通过单句或单图输入生成360度全景3D世界,并支持沉浸式漫游[1][3][5] - 技术路径以全景图为桥梁分层实现3D生成,先通过2D技术生成无边界断裂的全景图,再拆分为天空/背景/前景等语义图层并标注深度转化为3D结构[9][11][15][16] - 采用点云缓存与视频扩散技术实现长距离场景无缝漫游,并优化双模式压缩存储以适应VR/游戏开发场景[18] 显存优化技术突破 - 初始版本需26GB显存,通过动态FP8量化技术将显存需求降至17GB以下(减少35%),适配消费级显卡[19][20][25] - SageAttention量化技术将Transformer注意力计算改用INT8,推理速度提升2倍且精度损失<1%[28][29] - Cache算法通过自动化搜参优化冗余时间步,显著提升推理效率[33] - 优化后全景代理生成显存从23.14GB降至13.80GB,世界分层从25.51GB降至16.17GB(4090显卡可运行)[32] 行业对比优势 - 生成质量优于开源竞品:画面清晰度/推理速度(分钟级vs小时级)/3D引擎兼容性/可编辑性全面领先[37][38][39] - 相比谷歌Genie3可生成可编辑3D mesh而非视频,且开源并提供单卡部署量化版本[41] - 技术方案兼容传统CG/3D工业生产管线,支持3DGS方案,实用价值高于闭源demo模型[42] 应用场景与开源生态 - 生成内容可导出为标准3D mesh格式,无缝接入游戏引擎/影视制作/物理仿真等二次创作[6][39] - 已全面开源并部署于GitHub/Hugging Face平台,提供技术报告与在线体验入口[43][44]
腾讯正式发布并开源业界首个的3D世界生成模型
快讯· 2025-07-27 01:55
腾讯AI技术发布 - 腾讯在WAIC期间的腾讯AI论坛上正式发布并开源业界首个3D世界生成模型——混元3D世界模型1.0 [1] - 该模型允许用户通过输入一句话或一张图在几分钟内生成可漫游的3D世界 [1] - 模型能够输出标准化3D资产,大幅缩短生产周期 [1] 腾讯未来技术规划 - 公司透露未来将有大量模型陆续开源 [1] - 即将开源的模型包括端侧混合推理大语言模型和多模态理解模型 [1]