前OpenAI、DeepMind研究员领衔，50+位专家谈AI编程、Agent与具身智能，2025全球机器学习技术大会议程首发！

大会概况 - 2025全球机器学习技术大会将于10月16-17日在北京威斯汀酒店举行汇聚50余位重量级嘉宾聚焦AI从技术突破到产业落地的硬核攻坚战 [1][3] - 大会设置12大核心专题包括大语言模型技术演进智能体工程多模态与世界模型 AI赋能软件研发大模型应用开发 GenAI产品创新具身智能行业落地实践开源模型与框架大模型系统架构 AI基础设施及算力优化 [3] - 大会旨在穿透技术喧嚣直击产业落地要害提供AI全栈作战地图导航 [3][4] 智能体与多智能体系统 - 京东零售开源多智能体协作框架OxyGent 将工具模型和智能体抽象为可插拔模块支持开发者灵活组合构建高扩展性系统具备全链路决策追溯能力 [37][38] - 智谱AI展示LLM Agent在软件工程领域的应用使大语言模型能自主规划调用工具并完成复杂任务 [55][57] 多模态大模型技术 - 理想汽车推出MindGPT-4o-Audio实时语音对话模型实现全双工低延迟端到端交互支持边听边说语音知识问答多角色高表现力生成及外部工具调用 [14] - 360人工智能研究院研发FG-CLIP模型突破传统CLIP整体语义优先导致的细节缺失瓶颈在保证高并发低延迟前提下显著提升图文对齐精度 [16][17][19] - 小红书应用多模态大模型于搜索业务覆盖以图搜图图片搜索视频搜索及多模态AI搜索四大场景并深入内容理解及RAG系统实践 [33] - 昆仑万维推出Skywork-r1v系列多模态思维链推理模型实现文本推理能力向视觉任务迁移 r1v3模型推理速度提升6倍 MMMU达76.0 接近人类初级专家水平 [42] 大模型训练与部署优化 - 百度开源文心4.5系列大模型分享ERNIEKit和FastDeploy在精调与高效推理中的技术突破 [25][27][29] - 清华大学研发端侧高效模型MiniCPM 通过稀疏注意力 UltraClean数据策略 BitCPM三值量化及CPM cu推理引擎在端侧芯片实现5倍以上推理加速 [49] 计算机视觉与OCR技术 - 百度飞桨推出PaddleOCR 3.0系列包括新一代通用文字识别模型PP-OCRv5 文档解析工具PP-StructureV3及OCR+LLM关键信息抽取方案PP-ChatOCRv4 [46] - 国星宇航分享AI视觉算法产品落地经验涵盖从实验室原型到亿级用户产品的全周期研发聚焦数据工程优化模型轻量化部署及算法性能与用户体验平衡 [24] 自动驾驶与具身智能 - 驭势科技应用AI大模型突破L4级自动驾驶"99分困局" 推动多场景全天候真无人驾驶商业化落地 [61] - 网易伏羲机器人将具身智能技术应用于工程机械智能化构建基于远控设备的具身智能数据闭环开发端到端挖掘机自动装车模型 [53] AI安全与可靠性 - 中国电信研究院聚焦AI安全与治理剖析大模型时代安全风险伦理挑战及治理方案 [5][7][8][9] - 北京邮电大学研究不确定性建模从校准方法三类不确定性来源分析到消减策略提升AI模型在复杂场景中的可靠性和安全性 [66][69] 嘉宾阵容 - 大会汇聚产学研顶尖力量包括奇点智能研究院清华大学新浪微博中国人民大学群核科技清程极智哔哩哔哩阿里淘天腾讯混元字节跳动小红书百度智谱AI等机构专家 [73]