合成数据

搜索文档
中信证券:短期建议关注具身模型行业的资本布局者及数据采集卖铲人
第一财经· 2025-08-25 00:58
模型架构发展 - 大语言模型、大型视觉模型与动作模型融合是当前架构主旋律 [1] - 基于扩散模型的流匹配算法在短期逐渐占据主导地位 [1] 数据战略竞争 - 强资本开支企业以真实数据采集为突破口构建竞争壁垒 [1] - 合成数据及互联网数据因规模化与泛化属性成为重要价值底色 [1] - 数据样方理念持续兴起 预训练及后训练需与数据属性有机结合 [1] 技术赋能方向 - 世界模型对合成数据和策略评判具备规模化赋能潜力 [1] 投资关注重点 - 短期建议关注具身模型行业资本布局者及数据采集卖铲人 [1] - 长期维度建议关注云计算及算力提供者 [1]
院士孵化,机器人合成数据公司获合肥国资A轮融资丨早起看早期
36氪· 2025-08-22 00:21
公司融资与背景 - 公司完成A轮融资 由合肥高投领投 合肥创新投 安徽省创投 科大硅谷基金 青岛西海岸人才生态产业集团跟投 帕累托森林担任独家融资财务顾问[5] - 所融资金将用于合成数据生成技术 持续学习框架及世界模型的研发 加快在自动驾驶 工业场景与具身机器人领域的应用[5] - 公司成立于2019年 由2000年图灵奖得主姚期智院士孵化 总部位于合肥高新区[5] - 公司已完成四轮融资[5] 业务与产品 - 公司专注数据采集-数据处理-仿真训练闭环工具链[4][5] - 推出三大核心产品 数据采集系统Oasis Rover 数据平台Oasis Data 仿真系统Oasis Sim[5] - 服务自动驾驶 机器人及工业数字孪生三大场景[5] - 高保真仿真与合成数据软件产品是主要创收产品 客户以车企和研究院所为主[10] - 已与10余家头部车企与工业企业达成合作[10] 行业痛点与解决方案 - 工信部要求L3+车型完成1000万公里等效测试 传统人工建模100万公里需6个月 成本高昂且极端场景覆盖率不足[7] - 核电 港口等工业场景面临数字孪生精度低 跨场景适配成本高的痛点[7] - AI训练中人工标注数据存在局限 效率难以匹配需求增长 成本较高 数据量增加时标注质量可能下降[7] - 公司通过合成数据技术解决行业痛点 AI训练数据组合将从99%真实数据+1%合成数据转向1%真实数据牵引+99%合成数据主导[7] 核心技术 - 持续学习框架通过真实数据种子→多智能体动态对抗→自主泛化迭代闭环 实现场景真实性 挑战性与多样性[8] - 依赖Oasis Rover设备采集相关时序数据 将仿真环境元素建模为对抗智能体进行动态博弈 自主生成海量泛化场景 场景难度可随算法性能调整[8] - 世界模型融合多种技术 构建几何-物理-语义一致的数字孪生系统 包括环境动态建模 多智能体交互预测及虚实融合校准等环节[10] - 在与某头部汽车公司合作中 基于上述技术的合成数据使自动驾驶算法测试效率提升210万倍[10] 技术应用与验证 - 合成数据技术在自动驾驶领域覆盖传统路测难以触及的场景[10] - 在工业场景模拟设备老化与故障演化 提升调度算法效率[10] - 在机器人领域复用相关技术模拟物理交互 拓展应用场景[10] 财务表现与增长 - 去年公司营收成倍增长[10] - 预计今年在去年基础上实现数倍增长目标[10] 团队构成 - 公司现有团队80人 其中研发团队10%是美国宾夕法尼亚大学 加州大学洛杉矶分校等海外顶级名校博士[11] - 核心成员多具备计算机 物理学等相关专业背景 在自动驾驶 人工智能 仿真建模等领域拥有深厚积累[11] - 创始人兼CEO杨子江为美国宾夕法尼亚大学博士 现任中科大教授 发表数十篇CCF A类论文 担任IEEE自动驾驶标准组副主席[11] - 顾问团队包括Moshe Vardi院士等 形成产学研结合的研发体系[11]
英伟达回应美国政府向特许对华出口AI芯片征收15%“交易许可税”;OpenAI CEO呛声马斯克丨AIGC日报
创业邦· 2025-08-13 00:07
英伟达对华AI芯片出口政策 - 美国政府向英伟达特许对华出口的AI芯片H20 GPU征收15%营收作为交易许可费 最初要求20% 经协商降至15% [1] - 英伟达回应称遵守美国政府规则 将继续在规则范围内为全球客户提供服务 [1] OpenAI与马斯克争议 - OpenAI CEO Sam Altman转发马斯克帖文 希望对其操纵X平台行为展开反调查 [2] - Altman引用2023年媒体文章 指控马斯克曾施压推特团队提升自己推文权重 [2] 英伟达机器人技术进展 - 推出NVIDIA Omniverse库和Cosmos世界基础模型 加速机器人解决方案开发 [3] - 新技术由RTX PRO服务器和DGX Cloud支持 可开发数字孪生 生成合成数据 构建物理AI智能体 [3] 华为AI推理技术创新 - 发布UCM推理记忆数据管理器 以KV Cache为中心的推理加速套件 [4] - 技术可扩大推理上下文窗口 实现高吞吐低时延 已在中国银联三大业务场景试点应用 [4]
英伟达、宇树、银河通用问答:未来10年机器人如何改变世界
21世纪经济报道· 2025-08-11 22:20
行业趋势与市场潜力 - 计算机和IT产业过去三四十年主要影响"信息空间",规模约5万亿美元,而全球产业总量超过100万亿美元,更大的价值在于触达物理世界的"原子"领域(如交通、制造、物流、医疗)[1] - 人工智能的出现使机器具备"物理智能"能力,计算机力量将进入100万亿美元的物理世界市场,机器人是实现这一跃迁的桥梁[1] - 中国在人工智能领域具备独特优势,全球近一半人工智能研究人员和开发者在中国,拥有无可匹敌的电子制造能力和大规模制造业基础[2] - 人形机器人市场潜力巨大,预计未来每三年产值乘10,头部企业从1000台增长到10万台,单价几十万元可达1000亿元产值,超过工业机械臂总产值[4] - 未来10年机器人市场可能超越当前所有工业机器人量,再往后10年可能超越汽车手机市场的万亿规模[4] 技术发展与创新 - 推动机器人发展和物理AI落地需要构建三类计算机:嵌入机器人本体的计算机(如Jetson Thor)、AI工厂计算机(如DGX、HGX系统)、仿真计算机[2] - 合成数据是推动具身智能快速落地的关键,真实世界数据仅占训练数据的1%,其余99%为合成数据[3] - 人形机器人设计本质由若干关节电机串联而成,未来通用AI成熟后硬件要求会越来越低,制造人形机器人可能像组装电脑一样简单[3] - 仿真平台(如Isaac Sim)可优化机器人运动与操控能力,Isaac Lab系统实现快速策略迭代[2] - 灵巧手研发是重点,已开发约20自由度的灵巧手,目标让机器人执行日常任务而非展示性动作,未来1-2年实现自然交互[3] 企业合作与产品进展 - 宇树科技和银河通用与英伟达合作,银河通用G1 Premium人形机器人首批搭载NVIDIA Jetson Thor,在工业码垛、拆垛等场景表现优异[2] - 宇树科技新型人形机器人R1部署英伟达全栈机器人技术,通过仿真平台优化能力[2] - 宇树科技去年推出9.9万元人形机器人,今年新版本售价约3.9万元,支持外观定制,预计年底前完成量产[3] - 宇树科技发布A2机器狗,自重37千克,持续负载30千克,空载续航20公里[3] - 银河通用与英伟达合作下一代人形机器人项目,从轮式形态转向纯双足设计,基于OpenWBT_Isaac平台进行数据采集与遥控控制[3] 商业化路径与展望 - 机器人规模化部署需要顶层算力与仿真能力构建技术底座、成本可控且可量产的硬件工程、合成数据驱动的大规模训练体系[4] - AI与机器人技术将像电力与蒸汽机的发明一样,推动人类文明迈向新高度[4] - 通用机器人将成为下一个价值数万亿美元、数万亿元人民币市场的革命性产品,核心要素包括机器人本体和具身智能模型[3]
AI浪潮下,具身智能的崛起与数据瓶颈
钛媒体APP· 2025-08-11 03:48
具身智能行业现状 - 国内外科技大厂纷纷布局具身智能领域,数亿级融资频繁 [1] - 世界机器人大会(WRC 2025)展示200余家企业的产品落地能力,包括宇树科技Unitree G1机器人拳击赛、银河通用机器人Galbot零售场景应用等 [1] - 行业技术路径从大语言模型(LLM)向多模态模型(VLA)演进,推动机器人复杂交互能力 [4] 具身智能技术定义 - 具身智能通过实体产品(如机器人)实现"感知-行动"学习,模拟人类与环境交互的决策能力 [2] - 与非具身智能(如AlphaGo)相比,具身智能强调物理世界实践性学习,而非纯数据驱动的概念性学习 [2] - 上海交通大学教授卢策吾提出"第三人称智能"与"人类视角智能"的区分框架 [2] 数据瓶颈与挑战 - 行业面临多模态数据稀缺问题,主因是采集成本高(需视觉/触觉/力觉等传感器)和规模不足 [5][7] - 数据孤岛现象严重:企业间数据格式不统一且因隐私/成本拒绝共享,导致重复投入和资源浪费 [8] - 合成数据使用比例达80%-90%(具身智能领域),显著高于自动驾驶的30%-40% [10] 合成数据应用 - 合成数据通过Sim-to-Real技术模拟虚拟环境,成本比真实数据低且无需人工标注 [9] - 局限性包括可能生成不合理场景,环境细节差异(如光照)易导致AI行为偏差 [12] - 当前主流策略是"合成数据为主+真实数据为辅",需对齐时空维度以优化训练效果 [12] 商业化前景 - 人形机器人被视为具身智能最佳载体,但量产落地仍需数年时间 [12] - 训练成本和生产成本过高是制约商业化进度的核心因素 [12] - 行业仍处训练阶段,未来生产力将决定竞争格局 [12]
事关人形机器人,英伟达、宇树科技、银河通用罕见同框发声,信息量很大
21世纪经济报道· 2025-08-10 23:56
行业趋势与市场前景 - 物理AI将连接信息世界与物理世界,打开100万亿美元规模的物理产业市场[4] - 人形机器人产值预计每三年增长10倍,10年内市场规模将超越工业机械臂(当前1000亿元),20年内或达万亿级[14][29] - 中国具备发展优势:全球近50%AI人才集中、电子制造能力领先、大规模测试场景丰富[4][34] 技术突破与产品进展 - 英伟达提出三类关键计算机:机器人本体计算机(如Jetson Thor)、AI工厂计算机、仿真计算机[5] - 宇树科技人形机器人R1售价降至3.9万元,支持定制并计划年底量产;A2机器狗负载30kg续航20km[6] - 银河通用G1 Premium搭载Jetson Thor,工业场景搬运速度接近人类水平[5][18] 仿真与数据驱动 - 合成数据占比达99%,是具身智能落地的核心[6][28] - 仿真技术可解决高危场景训练难题(如自动驾驶避让儿童),但需提升速度与成本效益[8][20] - 英伟达通过AI加速仿真(Cosmos项目)、环境数字化、物理参数生成三路径缩小Sim2Real差距[21][22][23] 商业化挑战与路径 - 硬件成本非主要障碍,核心瓶颈在于具身智能模型的泛用性与实用性不足[11][12] - 工业场景优先落地:搬运/码垛技术接近商用,分拣效率仍需突破[18][19] - 家用领域受限于伦理安全要求,普及周期更长[17] 企业战略与合作 - 英伟达Jetson Thor提升神经网络计算能力与传感器数据处理带宽,专为复杂机器人任务优化[15][33] - 宇树科技探索视频生成模型作为世界模型,谷歌成果验证该方向潜力[24][25] - 银河通用聚焦抓取/移动/放置三大能力,目标识别技术依赖合成数据驱动[29][31]
事关人形机器人,英伟达、宇树科技、银河通用罕见同框发声,信息量很大
21世纪经济报道· 2025-08-10 23:49
物理AI与机器人产业趋势 - 计算机产业过去主要影响信息空间,规模约5万亿美元,而物理世界产业规模超100万亿美元,人工智能将连接两者并释放更大价值[3][5] - 中国具备发展物理AI的独特优势:全球近50%的AI研究人员和开发者集中在中国,拥有顶尖电子制造能力和大规模测试场景[5][32] - 英伟达提出推动机器人发展的三类关键计算机:机器人本体计算机(如Jetson Thor)、AI工厂计算机(DGX/HGX系统)、仿真计算机[5] 人形机器人商业化进展 - 宇树科技人形机器人R1售价从9.9万元降至3.9万元人民币,支持定制化并计划年底量产,硬件成本已非核心障碍[6][12] - 银河通用预计人形机器人产值每三年增长10倍,头部企业销量将从1000台增至10万台,产值突破1000亿元并超越工业机械臂市场[7][14] - 当前限制规模化部署的核心是具身智能模型泛用性不足,而非硬件能力[12][27] 仿真技术与合成数据应用 - 仿真技术是训练安全可靠机器人系统的唯一选择,可模拟罕见或高风险场景(如自动驾驶避让儿童)[8][9] - 银河通用99%训练数据为合成数据,仅1%来自真实世界,合成数据是加速具身智能落地的关键[7][26] - 英伟达通过提升仿真精度、AI辅助生成虚拟环境、现实世界数字化三方向缩小仿真与现实差距[19][20][21] 关键技术突破方向 - Jetson Thor相比前代产品显著提升计算能力,支持复杂神经网络推理和高带宽传感器数据处理[15] - 视频生成模型作为"世界模型"驱动机器人动作的探索取得进展,谷歌最新成果验证该方向潜力[22][23] - 多模态大模型发展受限于数据不足,文本-图像-动作配对数据稀缺,仿真技术可缓解数据瓶颈[25][26] 行业应用场景展望 - 工业场景中搬运和分拣是机器人优先落地领域,银河通用机器人搬运速度已接近人类水平,预计年底部署数十台[17][18] - 家庭场景普及面临伦理和安全挑战,技术成熟周期将长于工业领域[16] - 通用机器人需突破目标识别、定位和抓取三大能力,解锁千亿级市场空间[27][29] 中国机器人生态优势 - 中国在AI人才储备、硬件制造、场景测试方面形成独特闭环生态,助力企业快速迭代[5][32] - 宇树科技自主开发20自由度灵巧手,目标1-2年内实现自然交互(如无需适配的倒水指令)[7] - 银河通用下一代纯双足机器人基于OpenWBT_Isaac平台,强化移动与操作能力[8]
英伟达、宇树、银河通用问答全文:未来10年机器人如何改变世界
21世纪经济报道· 2025-08-10 14:45
物理AI与机器人产业趋势 - 物理AI将连接信息世界与物理世界,打开100万亿美元市场空间[1][2] - 中国具备独特优势:全球近50%AI人才、完整电子制造产业链、大规模测试场景[2] - 人形机器人产值预计每三年增长10倍,10年内或超越工业机械臂千亿规模[12][27] 英伟达技术布局 - 构建三类关键计算机:机器人本体嵌入式(Jetson Thor)、AI工厂(DGX/HGX)、仿真系统[2] - Jetson Thor突破性提升神经网络推理能力,支持复杂传感器数据处理[14] - 仿真技术三大发展方向:提升物理精度、AI辅助环境生成、现实世界数字化[19][20] 企业商业化进展 - 宇树科技人形机器人价格从9.9万降至3.9万元,年底实现量产[3] - 银河通用G1 Premium搭载Jetson Thor,工业搬运效率接近人类水平[3][17] - 合成数据占比达99%,成为具身智能模型训练核心[4][26] 关键技术突破方向 - 具身智能模型泛化能力是当前最大瓶颈,硬件成本已非主要障碍[10] - 移动+抓取+放置三能力突破将打开千亿级应用场景[27] - 视频生成模型作为世界模型的探索取得初步成效[22][23] 行业生态与合作 - 中国形成人才-制造-场景协同优势,加速物理AI落地[32] - 英伟达与生态伙伴共同攻克Sim2Real差距问题[21] - 轮式与双足形态将长期并存,双足提供更高通用性[29][30] 应用场景展望 - 工业场景优先突破:汽车工厂搬运/码垛闭环预计年底部署[17] - 家庭场景面临伦理安全挑战,普及周期更长[16] - 医疗等高精度领域依赖仿真数据确保可靠性[5][6]
数据困局下的具身智能,谁能率先破局?
机器之心· 2025-08-10 01:30
数据困局下的具身智能 - 具身智能面临真实数据严重不足的挑战,目前多数机器人基础模型仅依赖不足1%的真实操作数据,导致物理常识缺失和泛化能力受限[5] - 行业对数据类型选择存在分歧:真实数据能反映物理交互但采集成本高,合成数据成本低且易扩展但存在"domain gap"问题[6][7] - 真实数据派代表Levine指出,模型能力提升会放大仿真与现实的差异,削弱泛化能力,认为只有真实数据才能实现通用具身智能[7] - 合成数据派代表王鹤提出需要上万亿token规模数据,但当前最大数据集仅百万级别,认为具身智能爆发必须依赖合成数据先行[8] - 合成数据应用案例:GraspVLA模型通过十亿级合成数据预训练+少量真实数据微调,已在零售、导航场景实现商业部署[8] 技术路线之争 - 遥操作成为真实数据主要采集方式,依赖人类示范支持模仿学习,但面临控制效率与扩展能力的平衡问题[9] - Sim2Real技术路径依赖合成仿真数据,优势在于可控性强、成本低,适合大规模预训练与策略泛化[9] - 多模态遥操作系统探索语言+手势+触觉融合,可能降低人类操控门槛[1] 商业模式创新 - OpenAI董事会主席Bret Taylor批判"按token计费"模式,认为市场终将选择"按成果付费"[2] - 提出"应用AI"是创业方向,"长尾Agent公司"可能取代传统SaaS[2] - Sierra公司正在实践结果导向的商业模式,探索AI编程新范式[2] 行业动态 - Skild AI最新进展聚焦解决真实数据不足问题,倡导融合多样化数据尤其是大规模视频数据[5] - 本期通讯包含30项AI&Robotics要事,其中国内8项、国外9项、技术13项[2]
创客中国杭州大赛总决赛“新”意十足
杭州日报· 2025-08-07 03:26
获得一等奖的"电子专用高端超细金属粉末国产化"项目,就是新材料领域的"新秀"。路演一结束, 杭州新川新材料有限公司创始人谢上川就被一群人围堵住,有创投机构、银行、媒体等。 新川新材料近年来在核心技术上取得了重要突破,公司的产品——电子专用高端超细金属粉末,是 电子行业不可或缺的核心基础材料,广泛应用于手机、电脑、AI服务器等高端电子元器件上。 谢上川介绍,公司在关键材料如用于MLCC(陶瓷电容)内电极的200纳米以下高端成品镍粉上实 现了国产化突破,解决了关键"卡脖子"问题。"金属粉末颗粒度越小越均匀,陶瓷电容才能做得更小, 手机等设备才能更轻薄。"他解释,这有力推动了电子行业向小型化、精细化、智能化发展。 8月6日,第十届"创客中国"暨"浙江好项目"中小企业创新创业大赛杭州赛区总决赛在萧山区举行。 25个创新项目展开比拼,最终,"电子专用高端超细金属粉末国产化"和"便携移动式五轴加工机器人"分 别获得企业组、创业组一等奖。 作为杭州创新创业领域的重要赛事,这场大赛"新"意十足,很有看头。 "新",首先在于新生力量踊跃。今年大赛的323个报名项目中,约三分之一是2023年之后成立的新 公司、新团队。此外,"9 ...