Workflow
MiniCPM
icon
搜索文档
AI大模型厂商加速导入硬件入口,端侧AI产业链投资机遇可期 | 投研报告
中国能源网· 2025-09-17 03:18
大模型技术发展趋势 - 全球主流大模型通过算法优化与数据积累实现快速迭代 核心表现为能力增强与推理效果优化两大维度[2] - 2024年2B参数量的大模型MiniCPM能力与2020年GPT-3 175B大模型能力接近[1][2] - 大模型压缩和量化技术不断提升 知识密度持续增大 终端搭载模型能力值逐步增强[2] 端云协同架构演进 - 大模型规模化扩展需依赖云端和终端协同工作 通过云端搭配终端进行AI计算工作负载分流[1][2] - 端云协同带来成本 能耗 性能等方面优化[1][2] - AI处理发展重心有望逐步从云端向手机 PC等终端载体转移[1][2] 终端硬件生态布局 - 谷歌Gemini入驻三星 可通过分享屏幕和相机画面进行即时互动[3] - 阿里与荣耀达成AI战略合作 覆盖出行导航 旅游服务 本地生活 移动办公 电商购物 电影演出等多个核心服务场景[3] - 苹果发布Apple Intelligence系统 高阶AI功能预计2026年春季推出[3] 终端硬件技术升级 - SoC集成NPU提升本地算力 存储向高带宽低延迟演进[5] - 散热技术从石墨片向超薄VC均热板演进 电池往高容量高效率方向升级[5] - 快充功率有望进一步提升[5] 市场规模与形态创新 - 2025年中国AI手机市场份额预计达到30%左右[3] - 端侧AI终端形态从AI向各类产品发散 AI眼镜偏向视觉交互 AI耳机偏向音频交互[5] - OpenAI计划打造创新AI硬件[5]
前OpenAI、DeepMind研究员领衔,50+位专家谈AI编程、Agent与具身智能,2025全球机器学习技术大会议程首发!
AI科技大本营· 2025-08-29 10:06
大会概况 - 2025全球机器学习技术大会将于10月16-17日在北京威斯汀酒店举行 汇聚50余位重量级嘉宾 聚焦AI从技术突破到产业落地的硬核攻坚战 [1][3] - 大会设置12大核心专题 包括大语言模型技术演进 智能体工程 多模态与世界模型 AI赋能软件研发 大模型应用开发 GenAI产品创新 具身智能 行业落地实践 开源模型与框架 大模型系统架构 AI基础设施及算力优化 [3] - 大会旨在穿透技术喧嚣 直击产业落地要害 提供AI全栈作战地图导航 [3][4] 智能体与多智能体系统 - 京东零售开源多智能体协作框架OxyGent 将工具 模型和智能体抽象为可插拔模块 支持开发者灵活组合构建高扩展性系统 具备全链路决策追溯能力 [37][38] - 智谱AI展示LLM Agent在软件工程领域的应用 使大语言模型能自主规划 调用工具并完成复杂任务 [55][57] 多模态大模型技术 - 理想汽车推出MindGPT-4o-Audio实时语音对话模型 实现全双工低延迟端到端交互 支持边听边说 语音知识问答 多角色高表现力生成及外部工具调用 [14] - 360人工智能研究院研发FG-CLIP模型 突破传统CLIP整体语义优先导致的细节缺失瓶颈 在保证高并发低延迟前提下显著提升图文对齐精度 [16][17][19] - 小红书应用多模态大模型于搜索业务 覆盖以图搜图 图片搜索 视频搜索及多模态AI搜索四大场景 并深入内容理解及RAG系统实践 [33] - 昆仑万维推出Skywork-r1v系列多模态思维链推理模型 实现文本推理能力向视觉任务迁移 r1v3模型推理速度提升6倍 MMMU达76.0 接近人类初级专家水平 [42] 大模型训练与部署优化 - 百度开源文心4.5系列大模型 分享ERNIEKit和FastDeploy在精调与高效推理中的技术突破 [25][27][29] - 清华大学研发端侧高效模型MiniCPM 通过稀疏注意力 UltraClean数据策略 BitCPM三值量化及CPM cu推理引擎 在端侧芯片实现5倍以上推理加速 [49] 计算机视觉与OCR技术 - 百度飞桨推出PaddleOCR 3.0系列 包括新一代通用文字识别模型PP-OCRv5 文档解析工具PP-StructureV3及OCR+LLM关键信息抽取方案PP-ChatOCRv4 [46] - 国星宇航分享AI视觉算法产品落地经验 涵盖从实验室原型到亿级用户产品的全周期研发 聚焦数据工程优化 模型轻量化部署及算法性能与用户体验平衡 [24] 自动驾驶与具身智能 - 驭势科技应用AI大模型突破L4级自动驾驶"99分困局" 推动多场景全天候真无人驾驶商业化落地 [61] - 网易伏羲机器人将具身智能技术应用于工程机械智能化 构建基于远控设备的具身智能数据闭环 开发端到端挖掘机自动装车模型 [53] AI安全与可靠性 - 中国电信研究院聚焦AI安全与治理 剖析大模型时代安全风险 伦理挑战及治理方案 [5][7][8][9] - 北京邮电大学研究不确定性建模 从校准方法 三类不确定性来源分析到消减策略 提升AI模型在复杂场景中的可靠性和安全性 [66][69] 嘉宾阵容 - 大会汇聚产学研顶尖力量 包括奇点智能研究院 清华大学 新浪微博 中国人民大学 群核科技 清程极智 哔哩哔哩 阿里淘天 腾讯混元 字节跳动 小红书 百度 智谱AI等机构专家 [73]
(活力中国调研行)北京何以成为中国“人工智能第一城”?
环球网资讯· 2025-06-17 14:07
北京人工智能产业发展现状 - 2024年北京人工智能企业突破2400家,核心产业规模近3500亿元,均占全国一半 [1] - 北京拥有全国重点实验室21家,集聚了全国超40%的顶尖人才 [1] - 建设首批23家人工智能领域北京市重点实验室,聚焦大模型、具身智能、人工智能安全等方向 [1] - 建设4家人工智能领域新型研发机构,产出全球首个原生多模态大模型Emu等国际领先原创成果 [1] 政策支持与创新能力 - 北京出台具身智能三年行动计划、科技赋能文化专项行动、人工智能+新材料等产业政策 [2] - 产出全球首款光训练芯片等成果,夯实人工智能创新底座 [2] - 建设北京市人工智能算力互连技术创新中心,布局全国首款64卡超节点算力服务器 [2] - 备案上线大模型132款,全国第一,重点企业发布豆包、GLM、可灵、Vidu、MiniCPM等国内领先通用基础大模型 [2] 基础设施与数据资源 - 2024年新增算力8620P,累计智能算力规模超3.3万P [2] - 建设国内首个数据基础制度先行区,发布中文互联网语料库CCI4.0 [2] - 上线北京人工智能数据运营平台,汇聚通用、行业数据集180余个、数据总量超2000TB [2] 国际合作与生态建设 - 联合外交部举办北京首届国际人工智能研讨班,35个发展中国家代表参与 [3] - 成功举办2025年智源大会,线下注册观众8000多人,线上观看开幕式直播达205万人,覆盖全球超过30个国家和地区 [3] - 持续打造全球"开源之都",落实《全球人工智能治理倡议》 [4] 未来发展规划 - 前瞻布局具身智能、AI+生命健康、AI for Science等前沿交叉领域 [3] - 加快培育光计算芯片、类脑智能等颠覆性技术 [3] - 构建"一委一业、一区一品"应用发展格局,推进大模型产品落地应用 [3] - 加大市区两级人工智能产业基金直投力度,建设人工智能领域人才高地 [4]
端侧小模型跑出大能量:北京AI破壁之路
北京日报客户端· 2025-06-16 08:03
在清华科技园科建大厦3楼,面壁智能联合创始人、CEO李大海的办公室中央挂着一幅大型拼图,一艘船在风雨中劈波斩浪。 这已是李大海来到中关村的第23年。 2006年,从北京大学数学系毕业后,李大海加入谷歌中国,成为创始员工之一,并先后参与了云云网、豌豆荚、知乎的创业。2023年,一场大模型掀起的技 术风暴席卷而来,时任知乎CTO的李大海决定投身其中。当年4月,在李大海的推动下,知乎完成了对面壁智能的独家天使轮投资。 看好面壁智能,是因为其创始人、青年科学家刘知远是国内首批开展大模型研究的研究者之一。2020年12月,刘知远团队发布了全球第一个中文开源大模 型"CPM",这一项目也是后来中国奠基性大模型"悟道"的前身。两年后,刘知远发起成立面壁智能。 投资一家优秀的大模型企业,对李大海来说绝非终点。大模型掀起的汹涌浪潮让他兴奋得难以入睡。"这是一场堪比蒸汽机改变世界的大变革!"一次次在深 夜爬起来看代码、追踪大模型前沿进展的李大海,决定从大厂高管转身,再次创业。2023年6月,李大海出任面壁智能CEO。 今年3月30日,面壁智能 CEO 李大海出席中国电动汽车百人会,宣布面壁将进军智能座舱领域。 彼时,大模型领域激 ...
面壁智能完成新一轮亿级融资
搜狐财经· 2025-05-21 02:37
融资动态 - 公司完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 [1] - 2024年以来已连续完成3轮融资 显示资本市场对其技术路线的高度认可 [1] 技术突破 - 2024年9月发布MiniCPM 3 0模型 4B参数性能超越GPT-3 5 [1] - 2024年8月发布MiniCPM-V 6模型 8B参数实现20B以下多模态理解3项SOTA 达到GPT-4V水平 [1] - 2025年1月发布MiniCPM-o 2 6模型 8B规模实现全模态实时交互 [1] - 形成全模态/多模态/基座模型完整矩阵 持续刷新端侧大模型能力边界 [1] 市场表现 - MiniCPM系列获评2024年Hugging Face"最多下载、最受欢迎中国大模型" [1] - 平台累计下载量突破1000万次 [1] 商业化落地 - 推出全球首个车端纯端侧智能助手"小钢炮超级助手cpmGO" [2] - 参与研发最高人民法院"法信法律基座大模型" [2] - 与清华大学合作推出AI学生成长助手"清小搭" 覆盖全校本科生 [2] 战略规划 - 本轮融资将用于构筑技术/产品壁垒 加速行业赋能与生态拓展 [2] - 推动"端侧大脑"在千行百业规模化应用 [2]
面壁CEO李大海:物理世界要实现AGI,一定是通过端侧智能 | 中国AIGC产业峰会
量子位· 2025-05-09 05:00
核心观点 - 未来物理世界实现AGI必须通过端侧智能,因为只有将智能部署在终端设备上才能实现最灵敏的感知、最及时的决策和最完美的应对 [1][8][30] - 大模型知识密度是智能的核心指标,知识密度越高智能越强,高知识密度模型在端侧最具价值 [8][18] - 端侧智能具有隐私保护、成本优势和全天候响应等独特优势,是未来智能设备发展的关键方向 [27][29][30] 公司发展历程 - 面壁智能2019年all in大模型,2022年8月正式成立,2023年9月发布首个千亿级GPT-3.5水平模型并获得网信办安全备案 [14] - 2023年底开始聚焦端侧智能,2024年1月发布全球首个端侧全模态8B模型,3月推出纯端侧模型驱动的面壁小钢炮超级助手产品 [19][22] - 目前端侧模型已在汽车、机器人、手机、智能可穿戴设备等多个场景落地 [3][31] 技术突破 - 提出"密度定律",发现大模型知识密度每3.3个月翻一番,知识密度与芯片制程类似,直接影响模型智能水平 [18] - 开发出全球首个端侧全模态8B模型,可在iPad上流畅运行,看听说能力达到GPT-4o水平 [19] - 面壁小钢炮超级助手具备端上不依赖网络的全天候指令响应和主动环境感知能力 [24][25] 行业认知 - DeepSeek成功源于三个"高密度":团队密度(顶尖人才聚集)、组织密度(目标高度一致)、高资源密度(充足研发投入) [10][11][12] - 端侧智能在汽车场景优势显著:不受网络限制、避免隐私泄露、降低带宽成本 [27] - GUI Agent产品通过端侧模型实现屏幕行为理解,保证用户隐私同时具备强泛化能力 [29] 产品布局 - MiniCPM模型已拓展至手机、具身智能、AIPC、智能可穿戴设备等主流场景 [3] - 面壁小钢炮超级助手率先在汽车场景落地,实现感知-决策-执行三位一体 [22][26] - 规划让每个设备都具备智能,包括离线的翻译机等新型智能终端 [32]
AI不靠“闭门造神”,海内外一线专家共探智能新纪元,GOSIM AI Paris 2025圆满收官!
AI科技大本营· 2025-05-08 00:23
开源与AI融合趋势 - 开源和开放标准正逐步成为推动人工智能发展的核心力量,企业和用户越来越需要透明、安全且可信的系统[5] - Linux基金会正在推动一项专为AI模型设计的新型许可证OpenMDW,涵盖模型架构、数据集、参数、文档与工具[7] - 开源AI的成功不仅源于代码本身,更来自于一个中立、开放且富有活力的社区[5] 大模型技术发展趋势 - 多模态统一架构成为重要方向,Meta的BLT架构展示了这一方向的可行性,2025年有望诞生具突破性的统一模型[3] - 高效注意力机制快速发展,包括线性注意力、动态稀疏注意力和混合注意力等[3] - 二阶优化正逐步应用于大规模训练场景,未来将在提升训练效率和模型泛化能力方面扮演关键角色[3] - 后训练阶段成为关键环节,在特定任务优化中发挥越来越重要的作用[6] AI基础设施演进 - Docker Model Runner可实现本地化GPU推理,加速AI应用落地[12] - Kubetorch在ML模型执行与部署流程中展现高效性与可调试性[12] - RAGFlow通过开源手段解决数据质量差、语义匹配低等难题,提升企业级RAG系统表现[13] - WGML基于Rust与WebGPU构建轻量化、高性能的GPU推理框架[13] AI应用与智能体发展 - OAKS架构以知识图谱和AI记忆系统为核心,强调开放式生态对智能体成长的意义[16] - OpenManus通过增强推理规划和跨环境运行能力,为LLM智能体应用拓展新可能性[16] - CAMEL框架深入研究智能体社群行为与协作机制[17] - Agentic Search为智能体的信息获取与决策提供新思路[17] 具身智能前沿进展 - Unitree开源G1类人机器人的运行数据集,支持多种开源解决方案[19] - 将语言模型接入机器人,通过手势、声音与表情实现人工共情[20] - 新型数据采集框架支持跨任务、跨环境的机器人泛化学习[20] - "大脑-小脑协同"框架融合高层认知推理与快速低延迟运动响应[20] 开源模型实践案例 - Qwen系列模型在多语言理解与生成任务中实现能力突破[9] - LUCIE-7B模型实现从训练代码到数据集全开放[10] - MiniCPM展示小模型在效率和性能上的平衡优势[10] - Llama 4在具身智能场景中展现自主决策与人机协作潜力[28] PyTorch生态创新 - TorchCodec优化解码流程,使视频和音频数据高效转换为PyTorch张量[27] - vLLM扩展大语言模型推理,借助多加速器部署与量化技术提升性能[27] - DeepSpeed在极大规模模型训练的计算、通信和I/O优化方面发挥作用[30] - Lightning Thunder将PyTorch代码编译为优化的分布式代码[30]