Workflow
混元3D Studio
icon
搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-07 13:45
核心观点 - 文章以周度关键词形式梳理了全球AI领域在芯片、模型、应用、科技及观点等多个维度的最新动态 展现了行业快速迭代与多元化竞争的格局 [2][3][4] 芯片进展 - 亚马逊发布了新的AI训练芯片Trainium4 反映了云服务巨头在自研AI芯片领域的持续投入 [3] 模型发布与迭代 - 中国公司密集发布或更新大模型 包括DeepSeek的DeepSeek V3.2、华为的openPangu-R、阿里的Qwen3-Learning以及字节的豆包手机助手 显示国内AI模型竞争激烈 [3] - 国际模型方面 Mistral AI发布了Mistral 3 OpenAI则提及了“企鹅家族模型”和“忏悔训练”等新概念或技术方向 [3] 应用与产品创新 - 多家公司推出了AI视频生成与编辑工具 如腾讯的混元3D Studio、昆仑万维的Mureka V7.6、生数科技的Vidu Q2、Runway的Gen-4.5以及快手的可灵AI视频O1 表明视频生成是当前AI应用的热点 [3] - AI应用向硬件和垂直领域渗透 例如理想汽车的AI眼镜Livis、瞳行科技的AI助盲眼镜、Harmonic Math的AI数学家以及Anuttacon的AnuNeko [3][4] - 营销与广告是AI落地的重要场景 腾讯举办了广告算法大赛 OpenAI则发生了广告代码泄漏事件 [3] 前沿科技动态 - 机器人、航天与无人机领域出现AI相关进展 包括众擎的T800机器人、蓝箭航天的朱雀三号火箭以及影石的360无人机A1 [4] 行业观点与洞察 - 人才与组织成为关注焦点 红杉美国提及AI人才评估 斯坦福大学发布了《现代软件开发者》报告 Anthropic提出了“灵魂文档”概念 [4] - 行业对AI发展路径与影响进行反思 OpenAI讨论了AI三年演进 Ilya Sutskever对Scaling定律进行澄清 吴恩达警示训练设施可能存在泡沫 [4] - 商业应用与价值创造受到重视 Stripe探讨了AI定价策略 a16z分析了Sora的留存率 Anthropic和麦肯锡分别关注生产力提升和人机利益共同体 [4] - 中国市场受到关注 Hugging Face指出中国是模型初创公司的首选市场之一 [4]
平安证券(香港)港股晨报-20251201
平安证券(香港)· 2025-12-01 03:52
港股市场回顾 - 恒生指数收报23831点,下跌145点或0.61%,盘中低见23730点[1] - 恒生中国企业指数收报9656点,下跌47点或0.49%[1] - 大市成交额进一步缩减至827.99亿港元[1] - 港股通录得净流入资金4.84亿港元,其中沪市净流入2.83亿,深市净流入2.01亿[1] - 板块方面,本地地产、软件、5G概念板块跌幅靠前,黄金股逆市走强[1] - 上周五(报告发布前)恒生指数跌0.34%报25858.89点,月跌0.18%[1] - 恒生科技指数上周五涨0.02%报5599.11点,月跌5.23%[1] - 上周五大市成交1462.04亿港元,南向资金净买入27.27亿港元[1] - 机器人概念股集体走强,广汽集团、越疆双双大涨逾10%[1] - 科网股表现平淡,阿里健康跌超3%,部分保险股下跌,中国太平跌3%[1] 美股市场动态 - 上周五美国三大股指全线收涨,道指涨0.61%,标普500指数涨0.54%,纳指涨0.65%[2] - 万得美国科技七巨头指数涨0.36%,脸书涨超2%,微软涨逾1%,英特尔涨超10%[2] - 存储芯片涨价传闻不断,全球DRAM市场出现供不应求态势,512GB存储较上月上涨近500元[2] - 黄金股表现强劲,泛美白银涨超7%,科尔黛伦矿业涨逾6%,美国黄金涨超5%[2] - 中概股多数上涨,希尔威金属矿业涨超8%,霸王茶姬涨逾6%[2] 市场展望与配置建议 - 南下资金保持规模净流入,11月份港股通合计净流入1219亿港元[3] - 科技自立自强仍是未来港股演绎的核心主线之一,相关板块龙头公司有望迎来中长期发展机遇[3] - 以中国资产为核心的港股配置价值再度凸显,建议关注四大方向[3] - 方向一:人工智能及应用、半导体、工业软件等新质生产力科技板块[3] - 方向二:仍属较低估值和较高股息的各细分行业央国企龙头公司板块[3] - 方向三:受益于美联储降息预期且中报业绩继续较好表现的上游有色金属板块[3] - 方向四:受益于“人工智能+”赋能的科网板块及各行业龙头公司[3] - 报告举例,其今年四次推荐的港股中兴通讯于上周录得11%的周度涨幅[3] 市场热点与行业动态 - 伦敦基本金属多数上涨,LME期锡涨3.31%报39300.00美元/吨,整周累计上涨6.52%[8] - LME期铜涨2.16%报11175.50美元/吨,整周累计上涨3.69%[8] - 受益于AI数据中心及新能源电动车需求,全球铜金属供给出现紧平衡,价格涨幅明显[8] - 建议关注铜金属矿业和冶炼龙头公司:中国有色矿业(1258.HK)、洛阳钼业(3993.HK)[8] - 阿里巴巴董事长蔡崇信提出,AI竞赛的赢家关键不在于拥有最好的模型,而在于应用得最好[8] - 具有社交通信优势及核心壁垒的科网龙头有望显著受益于自建大模型赋能的消费者端应用[8] - 建议关注相关平台公司和AI服务器供应商:阿里巴巴(9988.HK)、中兴通讯(0763.HK)[8] 本周重点推荐公司 - 推荐公司:中国软件国际(0354.HK)[9] - 公司是大型综合性软体与信息服务商,为全球客户提供“端到端”IT服务[9] - 公司与华为密切合作,在智能汽车、云服务等产品线实现供应全覆盖,并深度参与华为鸿蒙系统开发[9] - 2024年公司实现营收169.51亿元,同比下降1%;净利润5.13亿元,同比下降28.1%[9] - 2025年上半年实现收入85.07亿元,同比增长7.3%;经调整净利润2.8亿元,同比增长11.9%[9] - 2025年上半年全场景AI业务实现收入6.56亿元,同比增长130%,其中鸿蒙AIoT与数字孪生收入2.87亿元,同比增长278%[9] - Wind一致预期公司2025年归母净利润为6.8亿元人民币,对应当前股价PE约为19倍[9] - 报告给出目标价5.75港元,止损价4.75港元[9] 重点公司信息摘要 - 腾讯(00700.HK)斥资近6.36亿元回购103.9万股,其混元3D Studio升级至1.1版本[11] - 中芯国际(00981.HK)终止出售中芯宁波股权[11] - 比亚迪(01211.HK)在港推出中型纯电轿车SEAL 6,入门版售价15.8万元[11] - 美团(03690.HK)第三季度转亏,预计第四季度经营亏损趋势延续,Q3营收955亿元,研发投入增长31%至69亿元[11] - 宇华教育(06169.HK)全年纯利9.3亿元人民币,按年上升1.33倍[11] - 上海电气(02727.HK)与宇树科技合作,共同探索机器人领域新机遇[11] 新股资讯 - 纳芯微(2676.HK):半导体行业,招股价116港元,招股截止日2025年12月3日[12] - 卓越睿新(2687.HK):教育服务行业,招股价62.26-76.1港元,招股截止日2025年12月3日[12] - 遇见小面(2408.HK):餐饮连锁行业,招股价5.64-7.04港元,招股截止日2025年12月2日[12] - 天域半导体(2658.HK):半导体行业,招股价58港元,招股截止日2025年12月2日[12] 重点公司股价表现(截至2025年11月28日) - 科网公司:腾讯控股(700.HK)近1个月跌6%,近1年涨51%;阿里巴巴(9988.HK)近1个月跌12%,近1年涨83%[14] - 新能源车:比亚迪(1211.HK)近1个月跌6%,近1年涨12%;广汽集团(2238.HK)最新交易日大涨16.6%,近1个月涨25%[14] - 医药消费:中国生物制药(1177.HK)近1年涨111%;药明生物(2269.HK)近1年涨108%[14] - 美股科技:英伟达(NVDA.US)近1个月跌15%,近1年涨29%[14]
夸克AI眼镜发布,搭载阿里千问;OpenAI前首席科学家Ilya:大模型“大力出奇迹”见顶,AI正重回“科研时代” | AI周报
创业邦· 2025-11-30 03:18
AI硬件与终端产品进展 - 夸克发布搭载阿里千问大模型的AI眼镜,采用高通AR1旗舰芯片与恒玄BES2800芯片双芯设计,亮度达4000 nits,支持0.6秒极速抓拍、3K视频录制及超分超帧后4K输出,配备五麦克风阵列与可换电双电池系统[4] - 智元机器人远征A2完成106.286公里跨省行走,创吉尼斯世界纪录,其本体硬件性能与平衡算法趋于成熟,为大规模商用奠定基础[18][19] - Vionbotics推出行业首款可量产立面清洁机器人,机身仅550mm,适配复杂场景,消毒率达99.9%[23][24] - 谷歌DeepMind挖角波士顿动力前CTO Aaron Saunders,由其担任硬件工程副总裁,推动Gemini AI成为通用机器人控制平台[6][11] 大模型技术演进与市场动态 - OpenAI前首席科学家Ilya Sutskever指出当前大模型依赖数据堆砌的范式已触瓶颈,AI发展需回归科研时代,重点转向赋予模型持续学习与自我纠正能力[5] - 马斯克称xAI旗下Grok 5模型有10%概率实现AGI,强调实时数据是实现人类级推理的关键[12] - Anthropic发布升级版Claude Opus 4.5模型,增强代码编写、财务分析及复杂代理能力,并接入微软Microsoft Foundry[14] - 中国开源AI模型下载量占比达17%,首次超越美国的15.8%,DeepSeek与阿里千问成为主要贡献者[28] - OpenAI预计2030年ChatGPT付费用户数将达2.2亿,付费用户占比从当前5%提升至8.5%[31] 产业生态与战略布局 - 雷军提出"所有产业都值得用AI重做一遍",以小米汽车工厂AI检测为例,效率提升10倍、精度提升5倍,预计人形机器人将在5年内大规模应用于工厂与家庭[9] - 谷歌与Meta洽谈价值数十亿美元的AI芯片供应协议,计划自2027年起向Meta数据中心提供TPU,若成功可能夺取英伟达年收入的10%份额[12] - 英伟达CEO黄仁勋要求员工全面使用AI自动化任务,反对减少AI使用的管理倾向,并透露公司工程师已采用AI编程工具Cursor[13] - AMD CEO苏姿丰认为AI算力需求"永无止境",到2030年AI与数据中心市场规模将达1万亿美元,强调投资不足比过度投资更危险[32] 投融资与市场预测 - 全球AI领域本周披露融资事件22起,总融资规模49.14亿元人民币,早期阶段项目占比达18个[34] - 国内AI融资集中于广东与北京各5起,无问芯穹以4.5亿元人民币A+轮融资成为本周最高金额交易[37][40] - 海外AI融资总额37.71亿元人民币,人形机器人研发商Apptronik获3.31亿美元A+轮融资[48][49] - 贝恩预测2035年全球人形机器人年销量乐观情形下超1000万台,市场规模达2600亿美元,规模化替代需满足成本下降与关键技术成熟等条件[33]
雷军:所有产业都值得AI再做一遍;摩尔线程发布MUSA新版本丨AIGC日报
创业邦· 2025-11-29 01:08
AI产业融合与市场前景 - 雷军认为人工智能将深刻影响所有传统产业,提出“所有产业都值得用AI做一遍”的核心观点[2] - 预计人工智能与传统产业深度融合将开启万亿级大市场,需产业链伙伴携手合作[2] - 小米汽车工厂通过AI视觉大模型实现2秒内完成大压铸件检测,效率是人工的10倍,精度是人工的5倍以上[2] - 预计未来5年人形机器人将大面积在小米工厂上岗,家庭需求市场更大[2] AI技术产品迭代与升级 - 摩尔线程发布Torch-MUSA v2.7.0版本,一个月内连续完成两次更新,增强AI模型训练与推理支持[2] - 腾讯混元3D Studio升级至1.1版本,接入美术级3D生成大模型混元3D PolyGen 1.5,支持游戏开发、动画制作等场景[2] - 昆仑万维发布Mureka V7.6和Mureka O2模型,在音乐性、编曲能力、音质质感等多维度实现显著提升,响应速度和推理效率大幅增强[2] AI产业生态与数据服务 - 提供AI、汽车、智能制造等行业日报、图谱和报告等数据服务[5] - 涵盖2万+LP数据、10万+基金数据、1万+专精特新小巨人企业等全生命周期数据[7] - 推出“睿兽Ai智能体验”服务,聚焦AI新路径和极智新范式[8]
腾讯混元3D Studio升级
每日经济新闻· 2025-11-28 04:13
公司产品更新 - 腾讯混元3D Studio升级至1.1版本 [1] - 新产品接入了最新的美术级3D生成大模型混元3D PolyGen 1.5 [1] 产品功能与应用 - 利用PolyGen 1.5可生成更专业的3D资产 [1] - 目标用户为游戏美术师、3D设计师和开发者 [1] - 应用场景包括游戏开发、动画制作和VR内容落地 [1]
海马云与腾讯云签署战略合作协议,共建AIGC内容创作平台新生态
搜狐财经· 2025-11-19 08:55
合作事件概述 - 11月18日,安徽海马云科技股份有限公司与腾讯云正式签署战略合作协议,双方将在AIGC内容创作、3D生成技术及云计算基础设施等领域开展深度合作 [1] - 海马云宣布其AIGC图形音视频工作流开发和API服务平台RunningHub全面接入腾讯混元3D模型 [1] 海马云公司业务与平台 - 海马云是一家GPUaaS实时云渲染平台服务商,为实时云渲染及AI推理提供平台底座,基于高性能GPU软硬一体化的端到端平台能力,面向企业提供云游戏、云XR、云手机等全栈服务 [3] - 其核心产品RunningHub是全球领先的AIGC图形音视频工作流开发和API服务平台,汇集全球超140个国家超10万名开发者 [3] 合作带来的技术提升与优势 - 用户可通过RunningHub API调用腾讯混元3D进行创作,平台整体创作体验与内容生产能力迎来显著跃升 [3] - 结合混元3D与RunningHub的生态优势,用户可实现对3D生成过程的高精度、可控性操作,显著降低创作者在建模阶段的技术门槛与时间成本 [3] - 平台接入混元3D后大幅提升三维资产的生成效率与质量,支持用户快速生成高精度、可直接使用的三维模型,适用于游戏角色、VR场景、3D打印等创作场景 [4] - 混元3D的智能补全能力与RunningHub的ComfyUI工作流相结合,帮助用户实现从概念到成品的自动化生产流程 [4] - 平台打通2D与3D内容生成链路,为多模态内容创作带来更大自由度与表达力 [4] 腾讯混元3D模型技术进展 - 腾讯发布混元3D 3.0模型,新一代模型在建模精度上较上一版本提升了3倍,人物造型与复杂细节的生成效果显著增强 [6] - 腾讯同时推出面向3D专业生产管线的一站式工具“混元3D Studio”,覆盖从概念设计到动作系统的全流程,旨在解决传统3D开发中流程繁复、制作成本高等难题 [6] - 混元3D Studio工具旨在大幅提升3D内容的生产效率,助力游戏开发、动画制作、工业设计等产业场景实现更高质量的创作与落地 [6] 腾讯云AI业务生态 - 腾讯云AI产品已服务超过1000家互联网头部企业 [6] - 腾讯云通过覆盖基础设施、模型平台与场景化组件的一体化“云+AI”全栈产品能力,为AIGC、内容创作、推荐优化等关键场景提供技术支撑 [6] - 腾讯云帮助企业加速AI应用落地,助力互联网行业构建更加高效、可持续的AI应用生态 [6]
都怪AI让游戏供给井喷,玩家都不够用了
36氪· 2025-10-20 23:31
游戏行业供给与需求的结构性失衡 - 游戏行业出现结构性错配,面临供过于求的局面 [1] - 2024年Steam平台发布游戏数量达18626款,较2020年的9656款增长93% [4] - 玩家面临过多游戏选择,而开发者则陷入竞争激烈的“军备竞赛” [4] 人工智能对游戏开发的影响 - AI成为导致行业结构性失衡的最大变量,未来善于使用AI的开发者可能比资深程序员更有效率 [4] - Valve已将AI嵌入游戏制作流程,其新作《Deadlock》利用ChatGPT提供的代码架构解决在线匹配问题 [5] - AI已从提供美术、音乐资产升级为全流程介入游戏开发的主角,例如腾讯推出的混元3D Studio覆盖从概念设计到动作系统的全流程 [7] - AI工具链的普及显著降低了游戏开发门槛,导致创意作品数量达到前所未有的水平 [7] 游戏玩家市场格局 - 全球游戏玩家规模已覆盖60%的人口,增长乏力 [12] - 全球20%的玩家贡献了近一半的游戏支出,呈现“少数玩家驱动多数消费”的格局 [12] - 游戏消费主要集中于北美和欧洲,两地合计占全球游戏支出的46%,而玩家增长引擎的亚洲、中东及非洲地区消费贡献不高 [12] - 服务型游戏(GaaS)如《Dota 2》、《PUBG》、《CS2》等长期占据主导地位,使新游戏面临更严峻的竞争环境 [9] 市场环境下的商业挑战 - 游戏供给充沛但消费趋于停滞,对行业并非好兆头 [12] - 即使获得极高评价的游戏也可能无法取得商业成功,例如《无主星渊》 [12] - 游戏同质化问题加剧竞争,例如《Wildgate》因类似《盗贼之海》的游戏过多而面临挑战 [14] - 当前的供给过剩并非粗制滥造的结果,而是优质供给丰富的表现 [15]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-09-27 02:33
芯片领域 - 联发科发布天玑9500芯片[3] - a16z等机构关注AI算力竞赛与未来发展趋势[3] - 高通推出骁龙系列AI芯片[3] 算力与智能体 - 无问芯穹提出智能体蜂群概念[3] 模型技术进展 - DeepSeek发布V3.1终极版模型[3] - 美团推出LongCat-Flash-Thinking模型[3] - 百度发布Qianfan-VL模型[3] - 阿里推出Qwen3-Omni模型[3] - Meta开发代码世界模型[3] 应用产品发布 - Chrome集成Gemini AI助手[3] - Notion发布Notion 3.0版本[3] - 腾讯推出混元3D Studio[3] - 阿里发布Wan2.2-Animate应用[3] - Luma AI推出Ray3推理视频模型[3] - ElevenLabs发布Studio 3.0[3] - 小米开发MiMo-Audio语音模型[3] - OpenAI推出计算密集型新产品[4] - 谷歌提出Deep Research范式[4] - 可灵发布2.5视频模型[4] - Kimi推出Agent会员服务[4] - 清华大学发布MiniCPM-V 4.5[4] - 腾讯推出ima鸿蒙电脑版[4] - 智元机器人发布GO-1通用具身基座[4] - 谷歌推出AI画板工具[4] - 阿里发布Wan2.5系列[4] - 快手推出可灵2.5 Turbo[4] - 秘塔AI推出Agentic Search[4] - Suno发布V5模型[4] - Niantic开发AR眼镜游戏[4] - 谷歌推出神经操作系统[4] - 生数科技发布Vidu Q2[4] - 夸克推出造点AI[4] - 阶跃AI推出AI桌面伙伴[4] - 智源研究院发布RoboBrain-Audio[4] - 京东开源JoyAgent[4] 科技前沿 - Retro研究"逆龄大脑药"[4] - Arc研究所开发AI生成基因组技术[4] - Skild AI研发机器人控制系统[4] 资本动态 - 英伟达投资OpenAI[4] 行业事件 - 麻省理工科技评论评选35岁以下科创35人[4] 行业观点 - OpenAI提出Codex最佳实践和图像生成发展观点[4] - Nano Banana发表行业观点[5] - OpenAI进行LLM第一性思考[5] - 未知机构研究心理学增强AI技术[5] - 宇树科技探讨技术瓶颈[5] - Google Cloud发布AI创业者报告[5] - OpenAI出版《丰盛的智能》[5] - 陶哲轩关注社群现象[5]
港股科技50ETF(159750)盘中拉升,阿里巴巴:积极推进3800亿的AI基础设施建设!
格隆汇· 2025-09-24 03:29
市场表现 - 恒生指数低开高走 芯片和互联网板块领涨 ASMPT涨幅超过6% 阿里巴巴-W和中芯国际涨幅超过3% [1] - 港股科技50ETF(159750)上涨0.68% 盘中成交额超过6000万元 近8个交易日资金连续净流入约2.5亿元 [1] 公司动态 - 阿里巴巴CEO吴泳铭在2025云栖大会提出"超级人工智能"概念 认为智能化革命将远超想象 通用人工智能将放大人类智力并解放人类潜能 [1] - 阿里巴巴计划推进3800亿AI基础设施建设 并计划追加更大投入 [1] - 百度AI搜索月活再次登顶国内第一 [1] - 腾讯推出专业级AI 3D工作台混元3D Studio AI能力全面开放并适配主流国产芯片 [1] - 美团首款AI Agent产品"小美"开始公测 搭载自研模型LongCat-Flash-Chat 可实现外卖下单、餐厅推荐等本地生活服务体验 [1] - Kimi-K2-0905 RooCode在开源榜单排名第一 [1] 投资动向 - Ark Investment Management旗下ETF近期向中概股投资约2100万美元 涉及阿里巴巴、百度等头部互联网企业 [2] - ARKF和ARKW两只ETF共买入99090股阿里巴巴股票 总价值超1600万美元 这是Cathie Wood四年来首次买入阿里巴巴等中国科技股 [2] - Ark对阿里巴巴的首次投资可追溯到2014年 但2021年9月后未见投资记录 最新投资可能标志其重新扩大在中国互联网领域的投资 [2] 行业观点 - 银河证券认为科技发展大时代已至 科技行业上中下游齐发展 推动我国经济新旧动能转换有望超预期 科技消费将是新质生产力发展应用的重要方向 [2] - 兴业证券指出港股互联网行情在中报业绩期"利空出尽"后将重新走牛 TMT板块估值合理偏低 在成长板块中性价比高 下半年AI科技有望迎来更多突破 [2] 指数表现 - 港股科技50ETF跟踪港股科技指数(931674) 为全市场唯一覆盖"中国十大科技股"的港股科技类指数 对AI产业链有更广泛覆盖 [3] - 港股科技指数(CNY)自基日2014年12月31日至2025年9月19日累计涨幅131.68% 同期恒生科技指数涨幅109.81% [3]
腾讯用AI把美术管线重新做了一遍,混元3D Studio架构曝光
量子位· 2025-09-22 11:16
核心观点 - 腾讯混元3D Studio是一个专为3D设计师、游戏开发者和建模师打造的专业级AI工作台 通过集成七大核心技术模块实现从概念设计到动画生成的全流程自动化 将3D资产生产周期从几天缩短至分钟级 [3][4][6] 核心技术模块 组件拆分 - 利用连通性分析和语义分割算法自动拆解复杂模型为功能独立组件(如步枪的弹匣、枪管和枪托) 支持独立编辑和动画制作 [9] - 采用原生3D分割模型P³-SAM进行部件检测 包含特征提取器、三个分割头和IoU预测头 通过FPS生成点提示和NMS合并冗余掩码 [14][15][18] - 提出可控扩散框架X-Part 基于部件级提示和语义特征扰动实现有意义的部件分解 在多个基准测试中达到最优表现(CD1指标0.11 Fscore-0.1达0.80 Fscore-0.5达0.71) [21][25][26] 可控图像生成 - 支持文本或图像输入生成多视图设计图 专用A-Pose标准化模块确保角色骨架姿势一致性 风格迁移模块匹配目标游戏美术风格 [9][32] - 图像风格化模块通过三元组训练数据(输入参考图像 风格类型 风格化3D设计图)实现写实图像与风格化作品的精确映射 [33][34] - 姿态标准化模块采用分辨率递进训练(512×512至768×768) 结合SFT和DPO微调提升生成图像在面部、复杂服饰等细节的保真度 [40][41] 高保真几何生成 - 基于Hunyuan3D框架 包含ShapeVAE变分编码解码结构和DiT扩散模型 通过21层Transformer堆叠(含MoE子层)提升模型容量 [43][45][46] - 支持单视图/多视图图像条件生成 引入包围盒条件控制(编码高宽长为条件向量)和多视图图像条件约束(通过LoRA适配层合成多视角视图) [47][49][51] - 采用流匹配目标训练 将高斯噪声映射到形状潜变量 实现高效高质量采样 [47] 低模拓扑生成 - 采用自回归模型PolyGen从高模点云预测低模拓扑顶点和面 通过Blocked and Patchified Tokenization(BPT)方法提升训练推理效率 [57][59][60] - 网络结构包含点云编码器(Perceiver架构)和Hourglass Transformer解码器 采用截断训练策略(4k面序列片段)和滚动缓存推理 [60] - 基于拓扑感知掩码的DPO后训练 通过边界边比(BER)、拓扑分数(TS)和豪斯多夫距离(HD)指标优化网格质量 [61][62][63] 语义UV展开 - 提出SeamGPT框架 通过自回归方式生成艺术家风格裁切缝 将曲面裁切问题建模为序列预测任务 [71][72] - 采用交叉熵损失和KL散度损失训练 结合随机缩放(0.95-1.05区间)、顶点抖动和旋转等数据增强技术 [73] - 在Bowl(0.49)、Ball(0.31)等多个模型上达到最优平均分数(1.95)优于Xatalas(1.98)、FAM(8.52)等方法 [74][75] 纹理生成与编辑 - 将2D扩散模型扩展为几何条件多视角生成模型 支持文本和图像引导的PBR材质编辑(包括基础色、金属度、粗糙度和法线贴图) [77][80][81] - 基于8万份高质量PBR材质数据集训练 采用MoE架构自适应处理图像输入(通过CLIP相似度判断几何匹配度) [81][83][84] - 创新性适配3D VAE框架压缩多域材质数据 实现4K分辨率纹理合成 [95] 绑骨蒙皮与动画特效 - 分人形角色动画(基于22关节模板骨骼)和通用角色动画(自回归骨骼生成+几何拓扑感知蒙皮)两条处理路径 [97][98][99] - 显式融合骨骼特征、顶点特征和拓扑关系 提升蒙皮精度和稳定性 [99] - 支持姿势标准化(转换任意姿势为T型姿势)和动作重定向 输出可直接用于Unity或Unreal Engine的可驱动动画资产 [99][105] 系统集成与输出 - 通过统一资产图协同管理各模块输出元数据 实现参数化控制和增量式更新 无需全量重算 [103][104] - 最终输出可根据目标游戏引擎规范配置导出 支持专业流水线应用 [105]