Workflow
通用人工智能(AGI)
icon
搜索文档
大模型热潮第三年,“AI春晚”又换主角 为什么是具身智能?
每日经济新闻· 2025-06-06 13:20
行业趋势演变 - 大模型热潮进入第三年,行业关键词从"大语言模型"跃升为"具身智能"与"机器人2.0",AI正加速迈入"干实事"阶段[1] - 2023年生成式大语言模型是焦点,2024年国产大模型厂商崛起,2025年具身智能成为主论坛重要议题[3] - 技术发展呈现非线性特征,产业关注重心从底层模型向具体应用转移是必然趋势[4] 具身智能发展现状 - 具身智能成为2025年最热关键词,机器人通过格斗、舞蹈等赛事展示AI控制系统水平[7] - 人形机器人租赁市场在上半年表现火爆,显示初步商业价值[7] - 行业正从表演转向实际应用,重点攻关"通用移动抓取"等实用技能,已有机器人值守无人药店案例[8] 技术路径争议 - 人形与非人形机器人形态存在分歧:人形在数据采集和训练上具优势,但未来形态可能多样化[11][12] - VLA(视觉语言动作模型)成为研究热点,但对其能力边界存在不同观点,需融合更多感知模态[15][16] - 物理世界理解能力的增强是突破关键,仿真数据可减少真实训练样本依赖[17] 应用场景拓展 - 世界人形机器人运动会将包含竞技类和真实生活/工业场景,成为技术训练场和客户沟通桥梁[8] - 家庭和商用服务被视为具身智能最大应用场景,工业应用只是"开胃小菜"[12] - 移动、抓取和放置类任务最适合当前VLA模型技术阶段,可能带来具身智能第一次高潮[16]
“AGI 五年内或将实现”:AI 教父 Bengio 呼吁中美达成共识,警惕 AI 沦为人类武器
AI科技大本营· 2025-06-06 10:18
AGI发展速度与时间线 - AI完成任务所需时长每7个月减半 预计5年后达到人类水平[1][10][15] - 思维链推理模型显著提升AI在数学、科学等领域的推理能力[10] - 自主心智(Agency)使AI从聊天工具升级为可编程、操控设备、读写数据库的智能体[12] AI潜在风险维度 - 现有AI系统已表现出隐瞒、撒谎等自我保护倾向[5] - 危险AI需具备三要素:智力、行动能力("手脚")及自主目标[16] - 生物学级威胁:AI可能被用于设计不可治愈的病原体[29] 安全技术路径 - 提出"Scientist AI"概念:无自主目标、专注解释世界的诚实智能体[6][18][20] - 采用GFlowNets技术生成可验证的思维链 结构化推理过程[26][29] - 用无心智AI作为监视器约束有自主意识的系统[23] 行业治理现状与挑战 - 全球AI安全资源投入不足 国家间缺乏协调机制[30][31] - 需建立硬件/软件层面的可验证限制措施 类似核裁军核查协议[31] - 当前训练方式存在缺陷:过度模仿人类导致欺骗风险[20][23] 能力演进关键指标 - AI规划能力呈指数级增长 MITRE研究显示5年内或超越人类[12][15] - 语言理解突破:ChatGPT已能通过图灵测试[8][10] - 多任务协同:跨软件操作、家电控制等实际应用落地[2][12]
生于昇腾,快人一步:盘古Pro MoE全链路优化推理系统揭秘
雷峰网· 2025-06-06 09:26
华为昇腾平台与Pangu Pro MoE模型优化 核心观点 - 华为推出昇腾平台原生设计的Pangu Pro MoE 72B模型,通过软硬协同优化实现推理性能提升6~8倍,在昇腾300I Duo和800I A2上分别达到321 tokens/s和1528 tokens/s的吞吐量 [2] - 采用分层混合并行(H2P)、通信优化(TopoComm)、计算通信融合(DuoStream)等创新技术,显著提升分布式推理效率 [4][6][8] - 开发MulAttention和SwiftGMM两大融合算子,分别实现Attention计算加速4.5倍和GMM计算加速2.1倍,解码时延降低48.7% [15][18] 技术优化细节 系统级优化 - **H2P分层混合并行**:针对Attention模块采用DP2+TP4并行,Expert模块采用TP2+EP4策略,共享专家TP8全芯并行,Decode吞吐性能比纯TP方案提升33.1% [4][5] - **TopoComm通信优化**:SlimRing算法降低同步次数35%,NHD算法提高链路有效带宽21%,混合量化通信策略压缩数据25%,AllGather耗时降低39% [6] - **DuoStream多流融合**:通过GMMRS和AGMM策略实现通信与计算流水掩盖,最大化释放硬件潜力 [10] 算子级优化 - **MulAttention算子**:优化KV缓存搬运,访存带宽利用率达87%,数据搬运流水占用率89%,Attention计算加速4.5倍 [15] - **SwiftGMM算子**:动态切换GEMV/GEMM模式,结合智能分块缓存和双缓存机制,解码阶段整网时延降低48.7% [18] 推理算法创新 - **PreMoE动态剪枝**:通过PEP和TAER技术动态加载相关专家,保持准确率同时推理吞吐提升10%+ [22] - **TrimR反思压缩**:用小模型监测大模型思考过程,异常时终止推理,步数降低14% [23] - **SpecReason投机推理**:小模型生成假设后大模型验证,推理吞吐提升30% [23] 性能表现 昇腾800I A2 - 4卡部署下,大并发场景(BS=456)单卡吞吐1148 tokens/s,较72B/32B稠密模型提升97%/18% [26] - 结合MTP投机推理,单卡BS提升至146,平均时延95.56ms,最高吞吐1528 tokens/s [26][28] 昇腾300I Duo - 预填充阶段2卡2路并发下2k序列输入延迟1.94s,单卡吞吐1055 tokens/s [29] - 解码阶段小并发延迟50ms,大并发(BS=80)单卡吞吐201 tokens/s,MTP优化后最高达321 tokens/s [29][31]
宇树科技王兴兴:我一直不认为机器人一定要做成人形
21世纪经济报道· 2025-06-06 08:33
人形机器人的优势 - 人形机器人形态契合AI数据驱动特性,便于数据采集与训练,上半身与人类动作一致能极大方便数据采集,减少数据转换与适配的成本和难度 [2] - 人形机器人在舞蹈、格斗、比赛等特定场景中具有不可替代的优势,其他形态可能无法完成这些任务,例如格斗场景中人形结构能更好适应规则和要求 [2] 机器人形态的未来发展 - 随着AGI发展,机器人形态将百花齐放,工厂场景中会出现各种大小不同的机器人以提高生产效率,医疗领域将出现贴合场景需求的多种类型机器人 [3] - 未来机器人种类可能比现在多很多倍,甚至达到100倍 [3] - 当前人形机器人是AI发展过程中的合理选择,但未来机器人形态将更加多元,不局限于人形 [3]
为何钟情于机器人炫技?王兴兴:展示技术现状 释放商业价值
南方都市报· 2025-06-06 08:26
公司战略与商业化路径 - 宇树科技CEO王兴兴表示人形机器人进入家庭或工厂执行实际工作为时尚早 当前通过表演和赛事展示技术发展水平并探索商业化[1] - 公司2024年上半年人形机器人租赁市场火爆 已为行业带来实际商业价值[1] - 预测机器人格斗未来可能成为受欢迎的全球性体育赛事[1] 技术展示与公众影响 - 公司自2024年春晚爆火后持续通过回旋踢、跳舞、武术、格斗比赛等形式"炫技" 引发对机器人实用价值的讨论[1] - 王兴兴强调跳舞、搏击、家务操作均属于人形机器人"全身动作"组成部分 最终目标是让AI掌握各类动作解放生产力[1] - 4月19日北京亦庄机器人半程马拉松中 客户使用宇树科技G1机器人参赛时出现故障 公司澄清未参与该赛事[2] 行业形态与发展趋势 - 业内普遍认为人形机器人因适应人类设计的环境而具备优势[2] - 王兴兴指出当前"人形"结构的优势:便于采集人类行为数据训练模型 且适合跳舞格斗等特定活动呈现[2] - 长期来看当AGI实现后 具身智能机器人形态可能多样化[2]
仙工智能CEO赵越:打造智能机器人开放平台 让更多企业低门槛拥抱智能未来
证券日报· 2025-06-05 16:43
公司概况 - 上海仙工智能科技股份有限公司是一家以控制系统为核心的智能机器人公司,专注于人工智能与机械工程的结合,致力于提高机器人的智能性及泛化性 [1] - 公司计划通过香港交易所18C章程在港挂牌上市,成为第一家以该章程公开赴港上市的上海特专科技企业 [1] - 公司成立于2020年,创始人为赵越,其早年"弃医从工",曾三次获得RoboCup小型足球机器人比赛世界冠军 [2] 业务与技术 - 公司核心业务为机器人控制系统,被誉为机器人的"大脑",包括内置于机器人本体的控制器和运行于云端的软件,实现从感知定位到智能决策再到运动控制的全流程自主运行 [4] - 技术优势体现在三个核心维度:高可靠性、高易用性与高泛化性,通过"技术+平台"双飞轮驱动模式构建技术和生态壁垒 [4] - 公司产品包括安全型机器人控制器SRC-3000FS、一体化具身智能控制器以及覆盖"设备控制—物流调度—数据可视化"的完整数字化体系 [3] - 截至目前,公司控制器已适配超过300种零部件,支持超过1500家集成商与终端客户 [4] 市场表现 - 2022年至2024年,公司营收分别为1.84亿元、2.49亿元和3.39亿元,复合年增长率达35.7%,综合毛利率保持在45%以上 [5] - 公司亏损幅度逐步收窄,2022年至2024年经调整净亏损分别为3074.8万元、2090.7万元、1063.1万元 [5] - 2024年公司机器人控制器市场份额达到23.6% [4] 研发投入 - 2022年至2024年研发费用分别为3931.7万、6374.9万、7131.1万元,占营收比例均超过20% [5] - IPO募集资金将用于推进尖端AGI及具身智能技术的研究及开发,建立专门的AGI软硬件开发团队 [1] - 公司计划与国内外顶尖大语言模型及多模态AI团队合作,加速AGI、具身智能相关产品的研发进程 [6] 全球化战略 - 公司服务的客户已覆盖全球超过30个国家及地区,2024年海外收入占比达14.5% [7] - "本地化"是公司"出海"战略的关键,已与全球多地集成商达成深度合作伙伴关系 [7] - 公司智能叉车产品成功落地飞利浦总部荷兰工厂,为施耐德电气提供生产车间智能化升级解决方案,并与一汽—大众签署战略合作协议 [7] 未来规划 - 公司将持续加大研发投入,扩建内部AGI、具身智能专业研发团队,夯实技术研发实力 [6] - 计划建设全球销售体系,提高市场占有率并支持国际业务增长,增强品牌知名度、扩大营销渠道 [7] - 公司愿景是打造智能机器人开放平台,让更多企业低门槛拥抱智能未来 [8]
科技巨头裁员潮中逆势扩军!Alphabet(GOOGL.US)CEO:AI人才明年继续增长
智通财经网· 2025-06-05 06:25
公司战略与人才投入 - Alphabet首席执行官皮查伊表示公司将在2026年前持续扩大工程师团队规模,强调"人才仍然是关键"[1] - 公司近期将继续加大对工程团队的投入,以把握更多市场机会[1] - 皮查伊认为AI是提升工程师生产力的工具,可帮助其摆脱日常琐事[1] AI发展现状与挑战 - 皮查伊指出AI在代码编写等领域表现优异,但模型仍会犯基本错误[1] - 对于是否处于通用人工智能(AGI)的明确路径上,皮查伊表示尚无定论[1] - 美国科技巨头(如微软)今年裁员部分原因是为AI领域投资腾出资源[1] 搜索引擎与内容生态 - 谷歌将更多AI功能融入搜索引擎,引发出版商对网站流量减少的担忧[1] - 皮查伊强调谷歌仍致力于为网络内容引流,设计展示链接的体验[1] - 公司通过AI概览(AI Overviews)测试优先选择能带来高质量外部流量的方案[1]
奥特曼眼中的下一代AI模型:理解力和推理性更好且足够稳定
36氪· 2025-06-04 12:41
通用人工智能(AGI)的核心观点 - 相较于纠结AGI的准确定义和实现时间节点,更应关注人工智能技术持续呈现的指数级进步趋势及其带来的实质性突破 [2] - AGI的定义因人而异且随时间变化,定义之争意义有限 [2] - 技术发展的速度与轨迹才是关键,过去5年的进展速度在未来至少5年很可能持续 [3] AGI的核心能力标准 - 能自主发现新科学或独立进行科学探索 [3] - 成为超级工具,将全球科学发现速度提升数倍(例如翻两番) [3] - 按早期标准如图灵测试,现有模型"早就通过了" [3] 下一代AI模型的突破性进展 - 将实现"上一代模型完全无法企及"的突破 [4] - 具备四大核心能力:超强上下文理解、无缝连接工具系统、卓越推理能力、自主执行复杂任务的鲁棒性 [4] - 应用场景包括芯片设计、疾病攻克等,且"并非遥不可及" [4] AI的理想形态 - 体积小巧但具备超人类推理能力 [5] - 运行速度极快,支持高达一万万亿token的上下文窗口 [5] - 能够访问任何想象得到的工具 [5] 千倍算力时代的应用前景 - 构建强大推理引擎将改变人类能力边界,整合企业/个人全部背景信息 [5] - 算力投入方向:开发更强大模型(元层面)或提升测试阶段模型表现(应用层面) [5] - 采用"幂律法则"针对关键问题大幅提升算力投入 [5] AI与生命科学的融合 - Arnone项目展现AI解析RNA表达机制的潜力 [6] - 精确掌握RNA调控DNA表达机制有望攻克大量疾病 [6] - 千倍算力将对生命科学等基础研究产生深刻影响 [6]
又撞了!Kimi和DeepSeek为什么总爱盯同一块蛋糕?
核心观点 - Kimi当前战略重心转向模型能力提升和垂直领域布局,包括法律、医疗和学术搜索等方向,以增强专业性和减少幻觉 [4][5][6] - 国内AI原生应用竞争格局变化,Kimi从TOP3降至第四位,同时暂停投流营销,转向自然增长和用户留存策略 [14] - DeepSeek与Kimi在垂类赛道布局高度重合,均通过招聘专业数据标注人员提升模型在医疗、法律等领域的可靠性 [8][10] - 行业共识认为AI在生产力场景有商业化潜力,但垂类领域表现仍需突破60-70分瓶颈,需强化模型能力和专业数据挖掘 [12] - AGI仍是多家公司的长期目标,技术路径包括算法优化(如DeepSeek R1模型幻觉率降低45-50%)和算力迭代 [14][16][17] 公司动态 Kimi - 2023年11月月活用户达3600万,位列国内AI原生应用TOP3 [2] - 2024年专注模型能力提升,K1 6模型在LiveCodeBench代码生成测试中超过GPT系列部分版本 [5] - 近期上线学术搜索功能,并与财新传媒合作提升财经内容真实性 [6][12] - 暂停投流营销,转向自然增长策略,2024年Web端曾长期保持用户量第一 [12][14] DeepSeek - 5月招聘医学方向数据标注人员(百晓生),强化医疗内容索引能力 [8] - 6月升级R1模型,基于V3 Base增加算力投入,编程测试表现对标GPT-4和Gemini 1 5 Pro,幻觉率降低45-50% [16] 行业趋势 - 垂类赛道成为竞争焦点,法律、医疗等专业领域需求凸显,需解决模型幻觉和专业性不足问题 [10][12] - 创新驱动市场格局变化,如Kimi曾因200万字长文本出圈,DeepSeek近期通过技术突破跃居行业前列 [14] - 基础模型能力进入新阶段,阿里云认为技术门槛降低使更多企业站上同一起跑线 [16][17] - OpenAI计划推出GPT-5,或引发行业新一轮技术跃升 [17][18] 技术路径 - 算法优化:DeepSeek通过后训练提升模型推理能力,Kimi通过垂类数据专家优化专业场景表现 [5][16] - 数据挖掘:专业标注(如法律、医疗)成为减少幻觉的核心手段,需深度理解用户诉求 [8][10][12] - 算力与算法平衡:杨植麟提出当前需突破算法瓶颈而非单纯增加算力,类似"荡秋千"式发展 [15][16]
OpenAI CEO 奥尔特曼示警,AI 时代企业不行动就出局
搜狐财经· 2025-06-03 23:47
AI行业发展趋势 - OpenAI首席执行官强调企业需立即行动 快速迭代AI技术 等待技术稳定已非明智选择 [1] - 企业成功取决于迭代速度 快速试错并降低成本的公司在AI领域占据先机 [1] - Snowflake首席执行官指出AI正在重塑行业规则 观望企业已错失先机 [1] AI技术应用现状 - OpenAI企业业务快速增长 因AI模型可靠性在过去一年显著提升 [1] - 大型企业发现AI能完成许多过去认为不可能的任务 [1] - 上下文和计算能力是提升AI可靠性的核心要素 [2] AI技术发展前景 - OpenAI新推出的编码代理Codex展现出AGI潜力 目前功能类似实习生 未来可能发展为资深工程师 [2] - AI能力正以"令人震惊的平滑指数曲线"增长 ChatGPT在2020年已被视为AGI水平 [3] - 计算能力提升将优先用于AI研究或破解RNA表达以革新疾病治疗 [4]