NEO原生多模态模型架构
搜索文档
AI产业跟踪:商汤发布并开源NEO原生多模态模型架构,实现视觉、语言深层统一
国泰海通证券· 2025-12-10 08:53
报告行业投资评级 * 该报告为产业跟踪资讯类报告,未提供明确的行业投资评级 [1] 报告的核心观点 * 报告核心观点为跟踪并呈现人工智能产业的最新发展趋势与动态,涵盖行业政策、企业合作、产品发布及前沿技术突破等多个层面,展现了产业活跃的生态和快速的技术迭代 [1] 根据相关目录分别进行总结 1. AI 行业动态 * 2025脑机接口大会将于12月4日至5日在上海开幕,最大亮点为首创聚焦情绪感知、疲劳监测等4条细分赛道的脑机接口竞技赛,旨在推动技术从实验室走向产业化应用 [5] * 工业和信息化部电子信息司于12月1日组织召开座谈会,就筹备中国人工智能终端行业协会听取意见,与会单位一致认为需加快推动协会筹备工作,以助力产业高质量发展 [6] * 优必选与卓世科技签署战略合作协议,聚焦“行业模型+具身智能”方向,计划在2031年之前达成**1万台**机器人部署 [7] * 小红书已完成对AI搜索产品“点点”开发主体上海生动诗章科技有限公司的全资收购,将其纳入集团体系 [8] 2. AI 应用资讯 * 理想汽车发布首款AI眼镜Livis,实现跨界突破,该眼镜重量**36克**,模拟日常使用可连续工作**18.8小时**,配备**1200万像素**镜头,并可通过语音指令与汽车联动 [9] * 字节跳动豆包团队发布豆包手机助手技术预览版,该助手整合了针对屏幕内容提问、智能修图、一键多软件安装及跨平台比价下单等多项功能 [10][11] * 蚂蚁通用AI助手“灵光”升级上线闪游戏功能,支持用户通过自然语言描述,最快**30秒**生成一个可修改的闪游戏 [12] * 高德地图发布“AI停车雷达”功能,通过空间智能感知与AI视觉分析技术,实现对城市道路车位占用情况的分钟级推演与动态可视化,已在北京覆盖全市**数万个**道路停车位 [13] 3. AI 大模型资讯 * 火山引擎发布豆包语音识别模型2.0,其上下文整体关键词召回率提升**20%**,支持多模态视觉识别,并新增对日语、韩语等**13种**海外语种的精准识别 [14] * 商汤科技发布并开源全新多模态模型架构NEO,该架构从底层原理出发进行多模态深层次融合,旨在实现性能、效率和通用性的全面提升 [15] * 阿里巴巴更新图片生成及编辑模型Qwen-Image,新模型在图像编辑中维持了更高一致性,并已首发接入千问APP供用户无限次免费使用 [16] * DeepSeek同步推出DeepSeek-V3.2和DeepSeek-V3.2-Speciale两款正式版本模型,标志着开源模型与闭源商业模型的性能差距进一步缩小 [17] 4. 科技前沿 * 腾讯发布EdgeOne Pages正式版,这是国内首个边缘全栈开发平台,旨在让开发者能快速构建Web项目,实现“即刻上线,轻松出海” [18] * 何恺明团队推出Improved MeanFlow (iMF),解决了原始模型在训练稳定性等问题,在ImageNet 256×256基准测试中,其iMF-XL/2模型在单步函数评估中取得了**1.72**的FID成绩,相较于原始MF提升了**50%** [19][20] * 中国科学技术大学研究团队利用光镊囚禁的量子基态单原子,首次忠实地实现了“反冲狭缝”量子干涉思想实验,证明了海森堡极限下的互补性原理 [21] * 蓝箭航天自主研发的朱雀三号遥一可重复使用液氧甲烷运载火箭成功发射入轨,该火箭箭体直径**4.5米**,全箭长**66.1米**,具备垂直返回回收与再利用能力 [22]