AI 3D
搜索文档
97年文科生干出全球最强AI 3D大模型
混沌学园· 2025-12-08 11:57
公司创始人背景与行业地位 - 公司创始人是SIGGRAPH 50年历史上第一位也是迄今唯一一位登上大会主题演讲舞台的中国人,与英伟达黄仁勋等行业领袖同台[1] - 创始人是MiniMax 001号员工,后转身专注于AI 3D领域[2] - 创始人带领团队在两年内完成三轮融资,每轮融资额为数亿元人民币,公司估值稳居全球AI 3D大模型公司之首[3] - 创始人出生于1997年,不到两年时间带领团队将3D大模型Tripo系列从技术原型推向千万级用户[5] 公司技术与产品进展 - 公司核心产品Tripo系列3D大模型可实现8秒图文生3D,并率先验证了3D Scaling Law,模型参数达到200亿,将3D生成式AI推入“IMAX时代”[5] - 公司专注于打造世界最领先的AI 3D大模型[5] - 公司认为3D是世界的本质,是最真诚、最真实、信息量最大的内容媒介,是通往AGI更本质的路径[21][23] - 与语言大模型不同,3D大模型的核心区别在于技术路径与领域迁移,其构建需要深度融合人工智能、计算机视觉与图形学三个领域的复合型人才[38][39] - 3D大模型发展面临高质量3D数据严重匮乏的挑战,因为互联网上主要流通的是3D信息的“压缩包”(文字、图片、视频)[40] - 公司技术发展速度超出预期,原以为需四五年才能进入3D管线并超过人类水平,但现在短短两三年已基本做到[51] 公司商业化与用户数据 - 截至2025年8月,公司的年度经常性收入达到1200万美元,处于行业领先地位[5] - 公司拥有约500万专业用户,其中80%以上来自海外[5] - 在To B端,公司服务超过4万家中小企业和约700家大企业[5] - 公司的落地场景主要分为四大类:内容创作(游戏、动画、影视等)、工业设计、展示展览(电商、广告、教育等)以及新兴行业(具身智能、数字孪生、元宇宙等)[52] 公司愿景与创业理念 - 公司的终极愿景是打造“3D版TikTok”,即一个以3D UGC为核心的生态平台,让每个人都能实时交互地活在自己最爱的世界[4][32] - 创业的核心理念是“让富有创意的人专注于创意本身”,通过AI技术将动画、游戏等产业从劳动密集型升级为真正的创意产业[11][12] - 公司认为信息传播是一个从压缩(文字、图片、视频)到解压缩(3D)的过程,随着互联网技术成熟,人们将直接消费最真实、信息密度最大的3D内容[18] - 创业驱动力源于一个明确的“钉子”(需求),即创作者无法零门槛、零成本实时创作3D内容,因此需要打造“锤子”(AI 3D大模型工具)来解决[45] - 公司认为3D形式与可交互性天然绑定,能提供以“我”为核心的“主体性”沉浸体验,这与通过文字、图片、视频进行“移情”的旁观者体验有本质区别[24][25][27] 行业认知与市场判断 - 创始人认为当时行业盲目跟风投入AGI或语言大模型是情绪化的产物,并不理性[17] - 从3D到视频、图片再到文字,是一个信息密度逐渐降低、信息逐渐失真的压缩过程[17] - 视频生成等技术存在一致性、记忆时长等“幻觉”问题,本质在于其没有真实的3D世界作为基础,是在“说谎”[22] - 文字、图片、视频内容因创作工具(如打字法、手机摄像头)的普及已成为大众艺术(UGC),而3D或可交互内容目前仍是“精英的艺术”,全球相关专业人员可能不到100万[28] - AI 3D大模型有望成为大众级创作工具,打破3D内容创作的门槛,从而催生海量3D UGC内容和平台[32] - 行业早期面临人才稀缺、数据匮乏、资源不足等挑战,但近两年随着AI、3D成为显学,大量资源和资金投入已形成良性循环[41] 创业历程与团队 - 创始人创业想法源于在商汤科技时期的经历,曾尝试用AI技术制作动画但盈利有限,后观察到游戏与元宇宙结合的市场潜力[15][16] - 公司创业初期,全球范围内尚无真正意义上的AI 3D大模型,仅有海外科技巨头的早期尝试和相关论文[43] - 公司采取“先大模型,后工具”的路径,在创业之初便专注于3D大模型研发,而非先开发前端工具[34][35] - 创始人通过寻找合作伙伴和信任的团队(如CTO梁鼎、首席科学家曹岩培)来弥补自身技术背景的不足,并对团队实现目标的能力抱有强烈信心[42][43] - 创始人认为当前最大的难题并非技术或市场,而是在充满噪音和诱惑的时代保持耐心与定力,坚持长期主义[53] 创始人哲学与思维方式 - 创始人拥有国际关系学和经济学双学位,并热衷于研究神学,其思考方式深受功利主义哲学家边沁和密尔的影响,核心是追求“最大化幸福的总和”[6][55][56] - 创始人将创业方向分为三类:快速扩散资源型、延长生命型、以及提升当下体验型(如迪士尼),其本人更倾向于第三种[57] - 创始人认为,让人能够选择自己最极致的体验至关重要[58] - 创始人自认为是“理念型创业者”,选择做事的标准是方向与意义,而非个人是否擅长[61][62]
「善友探索流」第三期|融资数亿的97年创始人宋亚宸,做3D抖音
混沌学园· 2025-12-03 11:57
公司概况与愿景 - 公司VAST致力于让AI“重新生成三维世界”,而非仅生成视频,其AI 3D工作台Tripo Studio可将传统需专业人士十几个小时完成的3D建模缩短至约6分钟 [4] - 公司的终极愿景是打造一个“3D版UGC平台”,让每个人都能像发抖音一样轻松生成3D内容,最终在三维世界中拓宽人类的幸福边界 [13][22] - 创始人宋亚宸(1997年出生)拥有跨学科背景,热爱内容创作,其个人兴趣与对市场空白的洞察是创业的重要动机 [7][8][17][18][19] 技术产品与突破 - 公司核心产品Tripo能基于文字或图片一键生成带完整材质的三维模型,可直接用于游戏、动画、虚拟空间 [5] - 2024年9月发布的Tripo 3.0模型参数达到两百亿级别,标志着AI 3D从“玩具”进入深层工作流,其生成模型的价值占比从10%跃升至50%甚至更高 [30][31] - 技术实现了从生成粗糙几何体到生成带贴图、材质甚至能自动绑定骨骼的可用模型的跨越,正致力于打造完整的创作流程闭环 [31][32][33] 市场表现与商业化 - 截至2025年7月,公司年度经常性收入(ARR)达到1200万美元,是AI 3D领域收入最高的公司之一 [12] - 2024年8月,公司月收入已达约200万美元,并保持增长 [38] - 公司工具已服务全球近500万专业建模师和超过4万家企业 [37] 融资历程与市场地位 - 公司成立三年已完成三轮融资,每轮融资金额均达“数亿人民币”级别,估值位居全球AI 3D大模型公司之首 [11][38] - 2024年6月完成数千万美元Pre A+轮融资,由北京市人工智能产业投资基金领投,靖亚资本跟投 [9] - 历史投资方包括绿洲资本、达晨财智、春华创投、英诺天使基金、水木清华校友种子基金等多家知名机构 [10] 行业影响与范式变革 - AI 3D被视为一场“能力平权”的革命,将3D创作从少数精英技能转变为像打字、拍照一样的大众能力,其核心价值不是“降本增效”而是创造新的生产力范式 [43][44][60] - 该技术有望重塑多个行业:例如实现“3D菜单”提升消费体验、实现个性化定制使设计边际成本归零、通过虚拟样品迭代为制造业(如义乌外贸)降低“开模”风险 [47][48][49][50][51][52][54][55][56][57][58][59] - 在AI 3D赛道上,中国被认为是全世界最领先的,这得益于该领域早期高投入、小市场、非共识但未来高速增长的特征 [61][62] 市场教育与用户生态 - 早期市场教育依赖于与创作者“玩在一起”,通过创作者比赛等方式培育社区,早期用户使用不完美的工具创作出惊艳作品并自发分享,形成了宝贵的“自来水”传播效应 [34][35][36] - 公司没有庞大的销售团队,其增长动力部分来自于用户社区的自发推广和口碑 [34][36]
凡拓数创伍穗颖:自主研发AI 3D解决方案,助力国潮走向世界
21世纪经济报道· 2025-11-26 08:12
公司发展历程 - 公司于2002年创立 赶上了大湾区基建的黄金时代 用3D技术构建多个城市的数字底座 [2] - 2010年作为广州亚运会数字图像独家供应商 负责近千条宣传片制作 开闭幕式动画预演及全场馆虚拟交互平台数字视觉工作 成功实现从单一可视化技术提供商到综合数字化解决方案服务商的转型 团队规模突破千人 [2] - 2012年获得中国科创首轮融资 历经新三板挂牌与创业板转板筹备 最终于2022年成功登陆深交所 [2] 技术研发与产品战略 - 2016年二次创业成立广州虚拟动力网络技术有限公司 专注AI惯性视觉算法与动作捕捉设备研发 三年后将产品推向市场 [2] - 2020年众筹研发自主Ai3D软件 目前其数字孪生解决方案已广泛应用于智能制造 水利水务 能源电力等领域 [2] - 2025年联合大湾区顶尖科研力量 携手北京大学深圳研究院等机构 共同打造全栈自研的具身智能数据训练与仿真平台 以助力跨越周期 构筑第三增长曲线 [3] 市场定位与文化愿景 - 公司深耕文化行业二十余年 积累了顶尖的美术设计与文化理解能力 [3] - 结合扎实的Ai3D核心技术 开发出多款引领市场的文化产品 [3] - 致力于打造Ai3D文化场景 助力国潮走向世界 [3]
VAST完成数千万美元新融资,他说模型即产品不是真正的产品
暗涌Waves· 2025-06-10 04:57
融资与行业认知 - VAST完成数千万美元Pre-A+轮融资 由北京市人工智能产业投资基金领投 靖亚资本跟投 [1] - 创始人认为行业普遍将AI生成3D视为"模型即产品"的路径是错误的 3D领域目前是PGC生态而非UGC生态 [6][8] - 3D创作者需要的是AI原生工作台而非单纯生成模型 类似程序员使用Cursor而非VS Code [9][10] 产品战略与进化路径 - 发布Tripo Studio一站式3D工作台 提供完整AI工作流 可将模型从80分优化到95分 [10] - 产品进化路径:模型即产品→一站式AI 3D工作台→3D美图秀秀→3D版抖音 [14][16] - 当前重点服务专业消费者(Pro-C) 而非直接面向UGC用户 [12][13] - "3D美图秀秀"将降低创作门槛 让无基础用户零门槛创作可消费内容 [14][15] 行业应用与案例 - 为《燕云十六声》开发"万物太极"玩法 将生成时间从几十秒压缩到几秒 [20] - 3D打印市场潜力巨大 生成技术将潜在用户从几千万扩展到几十亿 [21][22] - 柔性化生产应用场景广泛 包括首饰/鞋服/家居/玩具等多个领域 [22][23] - 可实现小单快返和按需生产(POD)模式 帮助电商平台更好表达用户需求 [23] 竞争格局与差异化 - 面对腾讯/字节等大厂竞争 但已在产品/工程/商业化方面领先 [18] - 大厂采取"先看见再相信"策略 而创业公司是"先相信再看见" [18][27] - 与大厂存在合作关系 而非单纯竞争关系 [19] 用户教育与市场前景 - 00后/05后对3D接受度高 无需额外教育 [24] - 3D内容将先于专用硬件普及 类比网络小说早期发展历程 [26][27] - 预计3-5年内将出现"3D版抖音" 比原先预期的5-10年更乐观 [17] 团队与文化 - 公司办公地点始终围绕清华 吸纳大量清华毕业生 [3] - 创始人保持对3D作为下一种内容形态的坚定信仰 [3][29] - 吸引人才的核心在于共同愿景而非物质条件 [28][29]