Workflow
MoonBit编程语言
icon
搜索文档
沈向洋解读AI演进五大维度!IDEA研究院发布“万物可抓取”模型,GPU渲染器打破国外垄断
量子位· 2025-11-23 01:00
文章核心观点 - 机会不仅来自技术本身,更来自理解技术如何改变智能载体、交互方式、计算架构与数据,从而重新分布能力、资源与价值[1][19] - 智能演进可从五个维度梳理:算法范式、智能载体、交互范式、计算架构、数据,为创新者提供识别机会的思考框架[1][5] 算法范式维度 - AI算法从监督学习阶段演进至强化学习阶段,未来将迈向自主学习阶段[3][4] - 监督学习阶段构筑表达与生成能力,强化学习阶段引入因果与执行能力[3] 智能载体维度 - 关注点从语言和多模态模型转向世界模型与具身模型[7] - 智能载体从抽象符号空间迈向物理空间[8] 交互范式维度 - 人机交互经历命令行、图形界面、搜索、推荐到自然交互的范式迁移[11] - 自然交互分层为被动响应、交互式执行、具备提议能力的主动模式,交互方式从文本扩展至语音、手势及脑机接口[12] 计算架构维度 - 计算架构从通用走向专用、从单一走向多元[14] - GPU刺激深度学习爆发,但能耗与成本攀升,推动推理、端侧、强化学习等专用芯片涌现[14][15] 数据维度 - 数据从模拟世界的静态教材变为探索世界的动态反馈,再变为归纳世界的验证假设证据[17] - 数据从人类数据枯竭转向合成数据兴起,再转向AI主动探索获取实验数据,从限制模型能力的约束变为推动AI主动学习的工具[17] 未来个体与组织 - 个体能力被AI放大,多环节协作任务可由单个个体端到端完成[21] - 组织重心从管控转向定义问题、融合个体协作,未来CEO或变为首席氛围官[22][23] 创新项目成果 - DINO-X Grasp模型实现万物可抓取,精准识别物体、预测抓取点位,结合深度信息还原三维结构指导机械臂操作[25][29] - 模型不挑设备与场景,在4090显卡上实现10帧/秒实时推理速度,兼容主流深度相机与机械臂,支持移动端运行[31][32][41] - 已应用于招商局集团港口集装箱验残、桥梁螺钉检测等场景,并与美团机器人研究院合作[33][34] - MoonBit编程语言为AI时代设计,首个原生提供AI助手的语言,性能超越Java近10倍,代码体积比Rust小30%[37] - 用户从去年2.6万增至超10万,预计2026年底达100万,已有北美云厂商付费客户[38] - Smart渲染器打破美国Arnold等公司垄断,支持英伟达、AMD、国产GPU及苹果芯片,实现秒级实时渲染[43][46][48] - 已被《流浪地球》特效制作方MoreVFX、《哪吒》制作方光线动画等顶级公司使用[49]