通用人工智能
搜索文档
宇树科技IPO辅导完成,拟境内首次公开发行股票并上市
是说芯语· 2025-11-15 02:03
IPO进展 - 中信证券已完成对宇树科技股份有限公司首次公开发行股票并上市的辅导工作,并认为公司已具备成为上市公司应有的治理结构、会计基础和内部控制[2] - 公司正在积极推进IPO筹备工作,并预计在2024年第四季度提交上市申请文件,若成功将成为中国近年来规模最大、知名度最高的本土科技公司上市之一[3] 公司业务与产品结构 - 公司专注于民用机器人领域,致力于将高性能通用型机器人应用于民用领域的不同行业[4] - 以2024年为例,公司产品收入结构为:四足机器人约占65%,人形机器人约占30%,组件产品约占5%[4] - 四足机器人约80%应用于研究、教育和消费领域,剩余20%用于工业领域如检查与消防;人形机器人完全用于研究、教育和消费领域[4] 新产品与技术突破 - 公司于10月20日正式发布新一代全尺寸仿生人形机器人Unitree H2,身高180厘米,体重70公斤[6] - H2机器人的全身自由度(关节数量)从前代H1的19个大幅提升至31个,增幅达63%,主要新增关节集中于上肢与躯干,显著增强了动作的灵活性与精细度[6] - 该产品设计目标为“为安全和友好地服务大家而生”,标志着人形机器人正从“能动的机器”向“能用的伙伴”转型[6] 行业趋势与技术观点 - 随着人工智能技术发展到一定水平,机器人对硬件性能的依赖将逐渐降低,AI算法足够先进时,机器人无需复杂机械结构也能完成精细操作[6][8] - 现代AI算法对硬件误差、噪声及一致性的容忍度已显著提高,更能适应存在间隙、摩擦不均等问题的硬件环境,但短期内高性能硬件仍是保障机器人稳定运行的关键[8] - 具身智能的实现被认为非常接近甚至已是AGI级别,AGI能够实现人类所需的各种任务,是人类的终极发明[8] - 2025年人形机器人订单需求旺盛,当前是参与历史性突破的关键时刻[6][8]
Dexmal原力灵机两轮融资近10亿元,CEO来自清华“姚班”
搜狐财经· 2025-11-14 05:40
融资情况 - 公司完成近10亿元A+轮及A轮融资,A+轮由阿里巴巴独家投资,A轮由蔚来资本领投,洪泰基金、联想创投、锡创投和正景基金跟投,老股东君联资本超额追投、启明创投和九坤创投追投 [2] - 资金主要用于智能机器人软、硬件技术研发与落地 [2] - 公司成立8个月以来累计完成3轮融资,投资方包括联想创投、启明创投、君联资本、九坤创投等知名机构 [4] 公司背景与团队 - 公司成立于2025年3月,是一家专注于具身智能软硬件技术研发与落地的创新型公司 [2] - 公司CEO唐文斌为清华大学"姚班"出身、首届"Yao Award"金牌得主,同时也是旷视科技联合创始人兼CTO [2] - 核心团队兼具AI顶尖学术背景和10余年AI原生产品规模落地经验,具备"算法+硬件+场景"复合基因 [2] - 团队在AI物流机器人领域积累了丰富的落地经验,凭借智慧物流机器人技术和柔性仓库自动化产品优势推动行业智能化升级 [2] 技术产品与研发进展 - 公司自主研发端到端多模态具身智能大模型MMLA,深度融合多传感器、大语言模型、视觉语言模型、视觉语言动作模型与世界模型的底层能力,实现跨场景、跨任务、跨构型的智能泛化 [3] - 已开源基于PyTorch的VLA工具箱Dexbotic,为从业者提供一站式科研服务 [3] - 推出机器人开源硬件产品DOS-W1,大幅降低机器人使用门槛,提升维护和改造便利性 [3] - 联合Hugging Face发布全球首个具身智能的大规模真机评测平台RoboChallenge [3] - 在AI学术顶会发表论文十余篇,代表作Real-time VLA和MemoryVLA获得学界认可 [3] 行业认可与竞赛成绩 - 参加CVPR 2025协作智能Workshop核心赛事RoboTwin,在第一轮仿真平台赛中斩获并列第一 [4] - 参加ICRA2025全球机器人视触融合挑战赛,荣获"纯触觉操控"和"触觉传感器设计"两个赛道金牌 [4] - 夺冠多项全球顶级赛事证明公司具身智能大模型算法的创新性和领先性 [4] 未来发展方向 - 公司将加速具身智能领域的算法驱动、硬件设计与场景闭环的协同创新,加快通用人工智能在物理世界的落地 [4] - 公司使命为打造智能的、有用的、可信赖的机器人,让生活更美好 [4]
2025第二届中关村具身智能机器人应用大会——全流程解码,共赴产业爆发盛宴
机器人大讲堂· 2025-11-13 15:00
大会概况 - 2025年第二届中关村具身智能机器人应用大会将于11月19日在北京中关村国家自主创新示范区会议中心举行 [1][6][19] - 大会汇聚超过400位顶尖科学家、企业家与政府代表,旨在搭建从实验室创新到产业级落地的价值桥梁 [1] - 活动核心共识为“前沿技术破局、产业生态共生”,致力于破解行业瓶颈、激活产业动能 [1][3] 议程设置与核心议题 - 开幕式设置技术成果发布、具身智能机器人应用大赛颁奖典礼及两大产业园区的专属招商与扶持政策推介 [16] - 上午报告论坛主题为“具身智能学术前沿与技术突破”,由清华大学、北京航空航天大学等顶尖院校学者分享算法迭代到产业变现的完整链路 [8][17] - 圆桌论坛以“赛场到市场的蝶变”为主题,探讨中关村具身智能机器人大赛如何赋能产业,破解成果转化最后一公里难题 [9][10][17] - 下午议程聚焦“具身智能产业突破变革”与“产业生态与场景应用”,由千寻智能、宇树科技等企业负责人分享通用智慧劳动力、类人交互等实战经验 [10][18] - 投资视角环节由英诺天使基金管理合伙人刘怀宇分享具身智能的投资逻辑 [11][18] 参与方与展示内容 - 大会演讲嘉宾包括来自清华大学鲁继文教授、北京通用人工智能研究院刘航欣主任、北京大学王鹤助理教授等学术界代表 [8] - 企业参与方涵盖伟景智能、睿尔曼智能、灵心巧手、元客视界、因时机器人等产业链各环节公司 [10][11][18] - 大会同步联动13家行业知名企业与大赛获奖团队举办产品展览,集中展示灵巧操作机器人、核心部件等前沿成果 [18]
李飞飞最新长文火爆硅谷
量子位· 2025-11-11 00:58
文章核心观点 - 空间智能是人工智能的下一个前沿领域,其核心在于构建能够理解、推理、生成并与物理世界交互的“世界模型”,这将推动AI实现从处理抽象知识到理解物理现实的质的飞跃 [1][6][28] - 当前以大语言模型为代表的AI在空间智能方面存在根本性局限,无法像人类一样进行空间推理、物理规律预测和连贯的世界生成 [22][23][24] - 具备空间智能的世界模型必须拥有三项核心能力:生成性(创造物理一致的世界)、多模态(处理图像、视频、动作等输入)、交互性(预测世界随互动演变的状态) [5][31] - 空间智能的应用潜力巨大,将彻底革新创造力(如叙事、游戏设计)、机器人技术、科学发现、医疗和教育等多个领域 [4][27][51] 空间智能的定义与重要性 - 空间智能是支撑人类认知的脚手架,驱动着人类的推理、规划及与世界互动的方式,体现在日常动作(如停车、接钥匙)和极端情况(如消防员救援)中 [14][15][20][21] - 人类通过空间智能推动文明进步,历史案例包括埃拉托色尼计算地球周长、珍妮纺纱机的发明、DNA双螺旋结构的发现 [18][19] - 空间智能是人类想象力与创造力的基石,从原始洞穴壁画到现代电影、电子游戏,都依赖于以空间为根基的想象 [17] 当前AI在空间智能方面的局限 - 多模态大语言模型虽具备初步空间感知能力,但在估计距离、方向、大小等任务上表现不佳,无法进行“心智旋转”或预测基本物理规律 [23] - 顶级AI擅长阅读、写作和模式识别,但在对物理世界的表征或交互上存在根本性局限,生成的视频常在几秒后失去连贯性 [23][24] - AI缺乏人类整体性理解世界的方式,即同时理解物体在空间上的关系、语义意义及现实重要性 [25] 世界模型的核心能力与构建挑战 - **生成性**:模型需能生成具有几何、物理与动态一致性的虚拟世界,其输出应允许生成显式、可观测的世界状态,并保持时间上的连贯 [31][32][33] - **多模态**:模型需能处理图像、视频、深度图、文本指令、手势、动作等多种形式的输入,并以多样的方式输出 [34][35][36][37] - **交互性**:当动作或目标作为输入时,模型需能生成与世界先前状态、物理规律相一致的下一个状态,未来甚至能预测下一步行动 [38] - 构建世界模型面临巨大技术壁垒,因其需要协调语义、几何、动力学与物理等远比语言复杂的多维规则 [39][40][41][42] World Labs的研究进展与方向 - 公司致力于世界模型的基础性突破,研究方向包括定义新的通用训练任务函数、利用大规模图像视频数据、开发新的模型架构与表征学习 [43][44] - 开发了基于帧的实时生成模型RTFM,以空间为基础的帧作为记忆形式,实现高效实时生成并保持一致性 [45] - 推出了Marble的早期版本,这是全球首个可通过多模态输入生成并保持一致性3D环境的世界模型,旨在让用户探索和构建创意世界 [46] 空间智能的应用潜力 - **创造力**:工具如Marble平台将空间表达能力赋予电影人、游戏设计师等,使其能快速创造、迭代三维世界,实现多维叙事体验 [51][52][53] - **机器人**:空间智能是实现具身智能的关键,将使机器人能理解、导航并与世界交互,中期目标是完善感知与行动的闭环 [54][55][60] - **科学**:具备空间智能的系统可模拟实验、验证假设,探索从深海到外星的环境,变革气候科学、材料研究等领域的计算建模 [56] - **医疗**:AI可通过多维建模加速药物研发,辅助影像诊断,支持环境感知式监护系统,并发挥机器人在辅助医护方面的潜力 [56] - **教育**:能实现沉浸式学习,让抽象概念可感知,学生可多维探索细胞或“亲历”历史,专业人士可在仿真环境中练习技能 [57] 行业影响与未来愿景 - 空间智能模型将推动造世界的权力从专业团队扩展到个体创作者、教育者,结合VR/XR设备带来全新的沉浸与互动体验 [59] - 世界模型生成的仿真数据将极大促进机器人学习,缩小模拟与现实的差距,使其能在海量状态和环境中学习 [60] - 未来的创新将来自多样化的机器人设计(如纳米机器人、软体机器人),世界模型需对环境与机器人感知进行一体化建模 [60] - 该技术旨在增强而非取代人类,目标是让AI成为拓展人类能力、加速发现、放大关怀的力量,提升生命价值 [47][50][57][62][63]
突发!英特尔首席技术官跳槽
是说芯语· 2025-11-11 00:29
高层人事变动 - 英特尔首席技术官萨钦·卡蒂于11月11日正式宣布离职并加入OpenAI [1] - 萨钦·卡蒂在OpenAI将负责基础设施相关岗位 投身于通用人工智能计算基础设施打造工作 [1] - 英特尔首席执行官陈立武将亲自接管并领导公司的人工智能业务 以确保平稳过渡 [5] 萨钦·卡蒂在英特尔的职责 - 萨钦·卡蒂在英特尔任职期间担任高级副总裁、首席技术官及人工智能官 并兼任网络和边缘集团总经理 [3] - 其职责覆盖英特尔整体人工智能战略制定和人工智能产品路线图规划 [3] - 还统筹英特尔实验室运营、公司与初创企业及开发者生态系统的合作事宜 以及网络和边缘集团的管理工作 [3] 萨钦·卡蒂的背景 - 拥有麻省理工学院电气工程与计算机科学博士学位 本科就读于孟买理工学院电气工程专业 [4] - 加入英特尔之前是斯坦福大学电气工程与计算机科学教授 在无线通信和网络领域有开创性研究 [4] - 曾联合创立Kumu Networks公司 研发自干扰消除技术 并创办专注移动网络优化人工智能解决方案的Uhana公司 后者被VMware收购 [4] - 是电信行业公认的领军人物 曾联合主持O-RAN联盟技术指导委员会 推动开放智能无线接入网络的普及 [5]
西安交大丁宁:大模型是“智能基建”,资本与技术融合重塑AI版图
21世纪经济报道· 2025-11-10 23:12
行业宏观定位 - 当前处于以人工智能和大数据为代表的第四次工业革命,人工智能有望成为未来世界不可或缺的核心技术 [1] - 2022年底ChatGPT的出现标志着人工智能发展的转折点,开启了大模型的产业化竞争 [2] 大模型技术演进趋势 - 大模型发展从早期盲目追求参数量扩张回归理性,转向注重结构设计、训练方法和数据质量 [2] - 模型性能提升遵循“规模法则”,即参数量、算力和数据规模增加与性能提升呈幂律关系,但成本能耗等因素促使行业转向结构创新和精细训练 [2] - 模型正从单模态(仅文本)向图像、语音、代码等多模态融合演进,使AI能感知和生成来自不同世界的信息 [2][3] - 训练方式从“预训练+监督微调”向持续学习和参数高效微调演化,目标是用更少算力实现更快适配,推动AI从技术突破走向可负担的产业落地 [3] - 主流大模型仍以Transformer架构为基础 [3] 技术与资本互动关系 - 资本是技术的放大器,技术是资本的倍增器,大模型训练前期成本极高,需资本介入才能形成高质量基础模型 [1][4] - 没有技术洞见和研发积累,资本也难以真正驱动产业升级 [4] 全球竞争格局与中国现状 - 美国在头部企业、算力中心和生态层面仍领先 [4] - 中国在人工智能领域论文数量占全球41%,专利数全球占比达到69% [4] - 算力是制约中国AI发展的关键瓶颈,模型“幻觉”、表达精度不足、产业链协同难等问题仍待突破 [4] 未来发展方向 - 多模态融合,即文字、图像、语音、传感数据全面打通 [4] - 大规模与轻量化并行,在追求能力极限的同时推动端侧部署 [4] - 发展具身智能,使AI与物理世界交互,催生机器人新生态 [4][5] - 探索通用人工智能(AGI),使其具备通用认知和自学习能力,成为长期目标 [5] - 超级智能是更前瞻的概念,指超过最有天赋人类的系统,目前仍处于理论探讨阶段 [5]
超节点:算力发展深水区的新引擎
36氪· 2025-11-10 11:16
国家战略与政策导向 - “十五五”规划明确算力为数字经济时代新质生产力核心要素,提出到2030年实现智算中心算力规模全球第一的目标[1] - “东数西算”工程构建起覆盖八大国家枢纽节点和十大数据中心集群的算力网络,并进入2.0时代,要求建设全国一体化算力网络,实现高效算力调度与绿色低碳运营[1][2] 超节点技术架构与优势 - 超节点作为“东数西算”2.0时代关键技术,采用Scale Up架构,通过超高密度机柜设计整合CPU、GPU、DPU等异构计算资源,并配合全浸没式液冷系统,将PUE值降至1.05以下[2] - 超节点具备内存语义能力,可降低组网复杂度,其依托NVLink、PCle等技术,时延达百纳秒级,远低于Scale Out架构的10微秒时延[3] - 在阿里云张北超级数据中心测试中,超节点架构使AI训练效率提升40%,同时降低35%的总体拥有成本[3] - 超节点通过全互联架构将有效算力利用率(MFU)提升50%以上,解决了传统集群因通信延迟导致40%计算资源空闲的问题[6] 全球及中国算力产业格局 - 行业预测2025年全球算力基础设施投资规模将突破5200亿美元,同比增长55%[4] - 美国通过“企业主导+政府赋能”模式进行全球化扩张,中国则在“东数西算”战略下形成互联网公司与电信运营商“双轨”并进模式[4] - 中国在智能算力与区域枢纽布局上快速崛起,华为等厂商通过异构众核架构与光-电混合互联技术构建自主可控算力体系[4] - 中科院计算所研究显示,采用超节点架构可使国产AI芯片集群效能达到国际先进水平的85%以上[7] 产业发展挑战与结构性矛盾 - 我国数据中心年耗电量已占全社会用电量2%以上,单机架功率密度长期徘徊在8-15kW区间,难以满足AI大模型训练的指数级算力需求[2] - 现存结构性矛盾包括东西部供需失衡、跨枢纽网络延迟掣肘实时业务西迁、智算服务软硬协同不足造成资源效能低下、绿色技术规模化部署滞后[4] 应用场景与商业模式创新 - 超节点为AI训练、金融分析、工业仿真等高算力需求场景开辟新路径[1] - 全球首个商用智算昇腾超节点在中国电信粤港澳大湾区(韶关)算力集群发布上线,新型高速总线架构天然适配混合专家模型(MoE),提升大模型训练和推理性能[7] - 超节点推动“算力即服务”(CaaS)模式,使中小企业可通过API接口按需调用算力,无需自建数据中心[7] - 超节点架构天然支持“东数西训”模式,并与5G边缘计算融合,催生“云边端”协同新生态[8] 未来技术演进方向 - 随着光子计算、存算一体等技术融合,超节点有望向纳秒级时延与EB级算力演进,成为通用人工智能(AGI)时代的基础设施底座[8]
广东人形机器人首登十五运开幕式,如何奏响跨时空乐章?
21世纪经济报道· 2025-11-09 13:44
公司技术展示与突破 - 优必选人形机器人Walker S2在第十五届全运会开幕式上成功演奏古乐器青铜句鑃,展示了高精度操作能力 [1] - 机器人实现了毫米级敲击精度,每次敲击误差不超过2毫米,协同误差控制在2毫秒内 [2] - 公司运用全自研类人眼双目视觉系统及手眼标定、运动学标定等核心技术,并搭建结合人体动捕数据的强化学习模型进行训练 [2] - 此次表演的技术专项升级,包括大量仿人仿真模拟,使机器人演奏形态更贴近人类 [2] 技术应用与产业化 - 该系列机器人已在比亚迪、吉利等汽车工厂执行智能质检、智能搬运任务,并与AGV、无人物流车等设备协同提升产线效率 [3] - 公司在人形机器人精细化操作、重复性劳动执行、群体协作及L4级无人物流车等多智能体协同方面积累了丰富经验 [3] - 开幕式上展示的精准控制技术将为智能制造领域的产业化突破铺路 [2] - 除表演外,优必选机器人还作为服务机器人参与了赛事颁奖、嘉宾接待及展示工作 [3] 行业生态与战略愿景 - 此次展示是广东机器人产业链协同的体现,凸显了广东在机器人赛道的核心壁垒与产业优势 [3] - 公司计划通过拉动上下游生态,为广东乃至大湾区打造万亿级产业集群注入动力 [3] - 公司战略聚焦于以人形机器人作为提升智能的最佳形态,助力人工智能迈向通用人工智能时代 [3]
全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了
机器之心· 2025-11-09 11:48
文心5.0 Preview模型性能表现 - 百度文心最新模型ERNIE-5.0-Preview-1022在LMArena文本竞技场排名中取得1432分,位列全球并列第二、国内第一[2] - 该模型得分与OpenAI的gpt-4.5-preview-2025-02-27及Anthropic的claude-opus-4-1-0805、claude-sonnet-4-5-20250929三大国外顶级模型持平[2] - 在创意写作任务中排名第一,在复杂长问题理解任务中排名第二,在指令遵循任务中排名第三[5] 模型核心能力实测分析 - 在创意写作测试中,模型以“情绪价值”和“灵感合伙人”为切入点,其营销方案立意和措辞优于对比模型[13][14] - 在复杂长问题理解测试中,模型在客服场景下能提供准确信息并补充直观感受细节,展现超越简单检索的服务意识[23] - 在指令遵循测试中,模型能准确理解并执行多层、反直觉的复杂约束指令,包括回避特定词汇和使用自我审计元指令[33][34][37][39] 百度AI全栈技术布局 - 公司构建了“芯片-框架-模型-应用”四层全栈AI技术布局,形成从算力到算法的技术闭环[41] - 框架层飞桨深度学习平台已更新至v3.2版本,截至2025年9月生态开发者达2333万,服务企业76万家[41] - 芯片层自研昆仑芯三代万卡集群已于今年年初点亮,旨在为大模型训练与推理提供算力支持[42] - 应用层通过文心大模型构建产品矩阵,覆盖内容、搜索、办公、开发等多元场景[42] 行业竞争格局与影响 - LMArena平台通过真实用户对模型输出的偏好投票形成动态排名,其榜单结果更贴近实际使用场景[4][5] - 百度文心系列模型此次排名结果强化了其在全球通用智能模型竞争格局中第一梯队的地位[4] - 行业内观点认为这可能反映出中国AI技术体系正从“技术追赶”向“能力引领”阶段过渡[43]
Nature子刊:清华大学×广州医科大学合作推出呼吸系统疾病专用的AI大模型——MedMPT
生物世界· 2025-11-09 04:06
研究背景与模型概述 - 研究旨在解决通用人工智能模型在应对临床实践中的多模态和复杂任务时面临的独特挑战[2] - 研究团队开发了名为MedMPT的模型,这是一个专为临床呼吸系统疾病应用设计的、基于Transformer架构的视觉-语言预训练模型[2][4] - MedMPT模型通过154274对胸部计算机断层扫描(CT)图像和放射报告进行训练[4] 模型能力与技术特点 - MedMPT在统一框架内从多模态医疗数据中学习,包括CT图像、放射报告、人口统计学信息、实验室检测以及药物关系[6] - 模型采用自监督学习来获取医学见解,能够处理多模态临床数据,并支持与临床工作流程契合的各种临床任务[6] - 相比其他大模型,MedMPT能够根据多模态信息,给出更全面、个性化的用药建议[10] - 模型支持人类-AI协作生成放射报告[14] 模型性能与应用前景 - MedMPT在医疗领域始终优于最先进的多模态预训练模型,在各种临床任务中取得了显著提升[6] - 大量分析表明,MedMPT能够有效挖掘医疗数据的潜力,兼具数据和参数效率,并为决策提供可解释的见解[6] - 模型能够获取多模态医疗数据的整体表示,并在临床工作流程中的众多下游任务中发挥作用,使其更符合临床实践[16] - 人类专家评估表明了MedMPT在现实世界中的适用性,人机协作是改进临床工作流程和确保高质量患者护理的有前途的方法[16]