Workflow
前OpenAI、DeepMind研究员领衔,50+位专家谈AI编程、Agent与具身智能,2025全球机器学习技术大会议程首发!

大会概况 - 2025全球机器学习技术大会将于10月16-17日在北京威斯汀酒店举行 汇聚50余位重量级嘉宾 聚焦AI从技术突破到产业落地的硬核攻坚战 [1][3] - 大会设置12大核心专题 包括大语言模型技术演进 智能体工程 多模态与世界模型 AI赋能软件研发 大模型应用开发 GenAI产品创新 具身智能 行业落地实践 开源模型与框架 大模型系统架构 AI基础设施及算力优化 [3] - 大会旨在穿透技术喧嚣 直击产业落地要害 提供AI全栈作战地图导航 [3][4] 智能体与多智能体系统 - 京东零售开源多智能体协作框架OxyGent 将工具 模型和智能体抽象为可插拔模块 支持开发者灵活组合构建高扩展性系统 具备全链路决策追溯能力 [37][38] - 智谱AI展示LLM Agent在软件工程领域的应用 使大语言模型能自主规划 调用工具并完成复杂任务 [55][57] 多模态大模型技术 - 理想汽车推出MindGPT-4o-Audio实时语音对话模型 实现全双工低延迟端到端交互 支持边听边说 语音知识问答 多角色高表现力生成及外部工具调用 [14] - 360人工智能研究院研发FG-CLIP模型 突破传统CLIP整体语义优先导致的细节缺失瓶颈 在保证高并发低延迟前提下显著提升图文对齐精度 [16][17][19] - 小红书应用多模态大模型于搜索业务 覆盖以图搜图 图片搜索 视频搜索及多模态AI搜索四大场景 并深入内容理解及RAG系统实践 [33] - 昆仑万维推出Skywork-r1v系列多模态思维链推理模型 实现文本推理能力向视觉任务迁移 r1v3模型推理速度提升6倍 MMMU达76.0 接近人类初级专家水平 [42] 大模型训练与部署优化 - 百度开源文心4.5系列大模型 分享ERNIEKit和FastDeploy在精调与高效推理中的技术突破 [25][27][29] - 清华大学研发端侧高效模型MiniCPM 通过稀疏注意力 UltraClean数据策略 BitCPM三值量化及CPM cu推理引擎 在端侧芯片实现5倍以上推理加速 [49] 计算机视觉与OCR技术 - 百度飞桨推出PaddleOCR 3.0系列 包括新一代通用文字识别模型PP-OCRv5 文档解析工具PP-StructureV3及OCR+LLM关键信息抽取方案PP-ChatOCRv4 [46] - 国星宇航分享AI视觉算法产品落地经验 涵盖从实验室原型到亿级用户产品的全周期研发 聚焦数据工程优化 模型轻量化部署及算法性能与用户体验平衡 [24] 自动驾驶与具身智能 - 驭势科技应用AI大模型突破L4级自动驾驶"99分困局" 推动多场景全天候真无人驾驶商业化落地 [61] - 网易伏羲机器人将具身智能技术应用于工程机械智能化 构建基于远控设备的具身智能数据闭环 开发端到端挖掘机自动装车模型 [53] AI安全与可靠性 - 中国电信研究院聚焦AI安全与治理 剖析大模型时代安全风险 伦理挑战及治理方案 [5][7][8][9] - 北京邮电大学研究不确定性建模 从校准方法 三类不确定性来源分析到消减策略 提升AI模型在复杂场景中的可靠性和安全性 [66][69] 嘉宾阵容 - 大会汇聚产学研顶尖力量 包括奇点智能研究院 清华大学 新浪微博 中国人民大学 群核科技 清程极智 哔哩哔哩 阿里淘天 腾讯混元 字节跳动 小红书 百度 智谱AI等机构专家 [73]