Workflow
大语言模型
icon
搜索文档
独角兽的致命软肋:拆解斑马智行招股书,阿里上汽深度绑定,独立性成最大考题
搜狐财经· 2025-08-21 06:08
上市申请与业务概况 - 斑马智行于2025年8月20日正式向港交所主板递交上市申请 联席保荐人为德意志银行、中金公司与国泰君安国际 [1] - 公司2024年实现营收8.24亿元人民币 核心业务为智能座舱解决方案 [1] - 公司是中国仅有的两家全自研汽车操作系统第三方供应商之一 [1] 技术优势与市场地位 - 公司是中国唯一将系统级操作系统解决方案、AI全栈端到端架构与车载平台服务三大核心技术整合为统一方案的企业 [1] - 截至2025年6月底 解决方案覆盖60家主机厂的超800万辆汽车 服务范围延伸至全球14个国家 [1] - 2016年推出中国首款互联网汽车并首创语音交互主导的座舱设计理念 [3] - 2023年发布"元神AI"系统 首次将大语言模型深度植入车载环境 [3] - 第三方评测机构IDC的2025年报告显示 该系统在车辆控制、驾驶辅助等场景表现位列中国九大汽车AI企业之首 [3] 股东结构与客户依赖 - 上汽集团作为控股股东 2022-2024年贡献营收占比分别为54.7%、47.4%、38.8% 2025年一季度占比达47.48% [4] - 阿里巴巴通过多个实体合计持股约44.72% 上汽集团通过嘉兴瑞佳等持股平台保持重要股东地位 [4] - 2022-2024年向阿里巴巴采购额占比分别为53.5%、58.4%及54.7% 2025年一季度采购占比54.7% [4] 运营调整与行业竞争 - 2025年7月启动组织优化 媒体报道裁员比例或超30% 公司回应实际调整比例约10% [5] - 2024年采购成本占总成本约65% 高度依赖外部供应商提供硬件产品 [5] - 中国智能座舱软件市场规模年增速超19% 参与者包括传统Tier1供应商、科技巨头与主机厂自研团队 [5] - 2024年员工薪酬支出同比增长23% 但人才流失率仍高于行业均值 [5] 发展战略与挑战 - 子公司斑马智驾2025年5月删除"道路机动车辆生产"经营资质 距离2023年11月获得自动驾驶路测资质不足两年 [5] - 需平衡股东协同与独立性 将研发投入转化为更稳健的营收增长 [6] - 面临华为、百度等竞争对手的挑战 需持续锻造不可替代的核心能力 [5][6]
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度,推理能力刷新纪录
36氪· 2025-08-21 03:55
模型发布与策略 - 字节跳动Seed团队在Hugging Face和GitHub发布Seed-OSS系列模型 采用Apache-2.0开源协议 可免费用于学术研究和商业部署 [2] - 模型命名呼应OpenAI的GPT-OSS系列 开源策略类似 未直接开源核心商业模型豆包 而是基于内部技术打造面向开源社区的版本 [2] 核心技术特性 - 原生支持512K上下文窗口 是主流开源模型DeepSeek V3(128K)的4倍 预训练阶段构建非后期插值实现 [3] - 引入"思考预算"机制 通过设定token数量控制模型思考深度 支持512至16K token的预算设置 [3] - 采用360亿参数稠密模型架构 非MoE 包含64层网络 隐藏层维度5120 词汇表大小155K [5][6] - 使用RoPE位置编码 GQA注意力机制 RMSNorm归一化和SwiGLU激活函数 [5][6] 性能表现 - 知识理解:MMLU-Pro达65.1分(超越Qwen2.5-32B-Base的58.5分) TriviaQA达82.1分 [7] - 推理能力:BBH基准测试87.7分 刷新开源模型记录 [7] - 数学能力:GSM8K达90.8分 MATH达81.7分 [7] - 代码能力:HumanEval达76.8分 MBPP达80.6分 [7] - 指令微调版本Seed-OSS-36B-Instruct在AIME24数学竞赛题达91.7分 仅次于OpenAI OSS-20B [8] - 训练数据效率:仅用12T token训练 低于同规模模型15T+的数据量 [9] 团队背景与开源生态 - 字节Seed团队成立于2023年 定位为打造业界最先进AI基础模型 覆盖大语言模型/多模态/AI基础设施 [10] - 已开源项目包括:8B代码生成模型Seed-Coder 多模态模型BAGEL 实验性语言模型Seed Diffusion 训练框架VeOmni 同声传译模型Seed LiveInterpret [12] - 提供两个版本基座模型:包含合成指令数据版本(性能更强)和不包含版本(更纯净)供研究社区选择 [6]
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录
量子位· 2025-08-21 02:36
模型发布概况 - 字节跳动开源360亿参数大模型Seed-OSS-36B 采用Apache-2.0协议 支持免费学术研究与商业部署 [1][4] - 模型命名呼应OpenAI的GPT-OSS系列 基于内部技术专为开源社区打造 未直接开源商业模型豆包(Doubao) [3][4] 核心技术特性 - 原生支持512K上下文窗口 是主流开源模型DeepSeek V3.1(128K)的4倍 预训练阶段直接构建非后期插值实现 [5][6][7] - 引入思考预算(Thinking Budget)机制 通过设定token数量(建议512整数倍)控制模型思考深度 适应简单任务快速响应或复杂任务深度推理 [9][10][12] - 采用成熟架构设计:360亿参数稠密模型(非MoE) 64层网络 隐藏层维度5120 词汇表155K 集成RoPE/GQA/RMSNorm/SwiGLU技术 [13] 性能表现 - 知识理解:MMLU-Pro达65.1分(超越Qwen2.5-32B-Base的58.5分) TriviaQA获82.1分 [16] - 推理能力:BBH基准87.7分刷新开源记录 数学能力GSM8K达90.8分 MATH达81.7分 [17] - 代码能力:HumanEval得分76.8 MBPP达80.6 指令微调版在AIME24数学竞赛获91.7分仅次于OpenAI OSS-20B [18][19] - 训练效率:仅用12T token达成性能 低于同规模模型15T+数据量 [20] 团队技术布局 - Seed团队成立于2023年 定位"打造最先进AI基础模型" 覆盖大语言模型/多模态/AI基础设施领域 [21] - 已开源项目包括:8B代码生成模型Seed-Coder(自主管理训练数据) 多模态模型BAGEL(处理文本/图像/视频) 实验性语言模型Seed Diffusion(离散状态扩散技术) 训练框架VeOmni(PyTorch原生全模态分布式) 同声传译模型Seed LiveInterpret(低延迟音色复刻) [22][23][24][25] 生态影响 - 模型发布于Hugging Face与GitHub平台 强化国产开源基座模型阵营 [4][26] - 提供含合成指令数据(高性能)与无合成数据(高纯净度)双版本 满足研究社区差异化需求 [14]
上半年“增收不增利”,要打造行业AI Agent的佳发教育称“AI相关产品规模未达预期”
每日经济新闻· 2025-08-20 23:51
财务表现 - 公司2025年上半年营收为2.73亿元,同比增长5.03%,归母净利润为4078.16万元,同比下降4.60%,扣非后净利润为3906.12万元,同比下降6.78% [1] - 公司出现"增收不增利"情况,计划半年度不分红送股 [2] - 营业成本同比增长20.94%,远高于营收5.03%的同比增幅 [2] - 一季度营收同比下滑51.82%至0.55亿元,归母净利润转亏为-0.1亿元;二季度营收同比增长49.23%至2.19亿元,归母净利润同比增长40.3%至0.51亿元 [2] 业务分拆 - "教育考试标准化考点产品及整体解决方案"营收约1.54亿元,同比下滑11.93%,毛利率同比下滑0.47个百分点 [2] - "智慧教育产品及整体解决方案"营收约9458.29万元,同比增长66.55%,但毛利率同比下降15.07个百分点至28.8% [2] 成本与费用 - 摊销员工持股计划费用约788.88万元,对净利润影响金额约为670.54万元 [2] 战略布局 - 公司全面接入DeepSeek大模型,构建适配"考、教、管、评、学、研"全场景的垂类教育智能体应用基座 [3] - AI相关产品国产化程度提升,但仍处于市场储备和拓展初期,业务规模未达预期 [3] 股东变动 - 四川发展证券投资基金管理有限公司增持约17.8万股,尹回增持约3.26万股,庞玉学新进前十名股东 [3]
理想VLA到底是不是真的VLA?
理想TOP2· 2025-08-20 15:38
技术架构分析 - 理想MindVLA采用基于大语言模型(LLM)的主干网络,实现多模态信息整合(视觉、激光雷达、语言、地图、定位等),并通过LLM输出决策后转换为控制轨迹[1] - 技术路径属于狭义的VLA(Vision-Language-Action)架构,与传统的E2E+VLM模型存在显著差异[1] - 系统采用串行神经网络结构,决策通过扩散模型生成更稳定的轨迹[3] 场景性能表现 防御性驾驶 - 在无遮挡十字路口可实现快速稳健行驶,有遮挡路口会根据剩余距离实现G值可调的丝滑减速[1] - 相比E2E+VLM模型(需特定模块强制减速),VLA减速过程更自然且无漏检/虚警现象[1][2] 拥堵场景处理 - 高架拥堵时能主动选择向左变道规避右侧持续加塞车辆,体现场景理解能力[2] - 传统E2E+VLM模型在该场景仅触发绕行逻辑,缺乏深度推理能力[2] 非标车道控制 - 在1.5-2.5倍宽度的匝道中自动选择居中行驶,彻底消除E2E模型常见的"画龙"现象[3] - 扩散模型生成的轨迹具有更好的中短时序稳定性[3] 复杂路径规划 - 面对50米内需连续变3车道的场景,VLA会坚决选择直行触发导航重规划[4] - E2E模型在该场景可能冒险变道或被动触发重规划[4] 能力边界评估 - 语音交互功能基于LLM实现,具备基础语音和记忆能力[4] - 高维度选路能力显著提升,底层控制更稳健[4] - 当前仍属L2级辅助驾驶,需随时准备接管[4][5] - 在杭州部分场景(三点式掉头、语义理解)表现优于FSD,但控车细节仍存差距[5] 技术迭代优势 - 采用MoE架构和工程优化,分场景并行迭代效率高于传统端到端模型[4] - 关键信息提取延迟控制在15-20米范围,满足防御性驾驶需求[4] 现存问题 - 偶发交通信号误判(如将主路红灯误判为辅路信号)[5] - 存在跟随前车错误决策的案例需人工接管[5] 硬件配置 - 测试系统搭载于2022款双OrinX计算芯片平台[6]
斑马智行递表港交所 为中国最大的以软件为核心的智能座舱解决方案供应商
智通财经· 2025-08-20 13:49
公司上市与市场地位 - 斑马智行向港交所主板递交上市申请 德意志银行 中金公司 国泰君安国际为联席保荐人 [1] - 公司是中国最大的以软件为核心的智能座舱解决方案供应商 按2024年收入计算排名第一 按解决方案搭载量计算亦排名第一 [3] - 公司是中国仅有的两家完全自研汽车操作系统的第三方供应商之一 唯一一家无缝整合系统级操作系统解决方案 AI全栈端到端解决方案和汽车平台服务三大核心支柱的厂商 [3] 技术能力与行业认可 - 斑马智行的大语言模型能力在九家中国顶级汽车AI公司中排名第一 在车辆控制 驾驶 娱乐 出行 商务 生活方式和社交互动等多个真实场景的表现均领先同行 [3] - 公司凭借自研的汽车操作系统与全栈元神AI架构 协助主机厂打造智能汽车 实现自然语音控制和个性化车舱体验 [3] 行业增长前景 - 全球智能汽车销量预计从2024年5800万辆增长至2030年8650万辆 复合年增长率6.9% [4] - 中国智能汽车中大语言模型渗透率预计从10%提升至40% [4] - 中国智能座舱解决方案市场规模预计从2024年1290亿元人民币增长至2030年3274亿元人民币 复合年增长率16.8% [5] - 基于软件的座舱解决方案市场预计从2024年401亿元人民币增至2030年1149亿元人民币 复合年增长率达19.2% [5] 财务表现 - 2022年收入8.05亿元人民币 2023年8.72亿元人民币 2024年8.24亿元人民币 [5] - 2024年截至3月31日止三个月收入1.68亿元人民币 2025年同期1.36亿元人民币 [5] - 2022年年度亏损8.78亿元人民币 2023年8.76亿元人民币 2024年8.47亿元人民币 [5] - 2024年截至3月31日止三个月亏损2.04亿元人民币 2025年同期亏损15.82亿元人民币 [5] - 2025年截至3月31日止三个月出现其他无形资产减值损失184.099亿元人民币 [6]
新股消息 | 斑马智行递表港交所 为中国最大的以软件为核心的智能座舱解决方案供应商
智通财经网· 2025-08-20 13:49
公司概况与市场地位 - 斑马智行向港交所主板递交上市申请 联席保荐人为德意志银行、中金公司及国泰君安国际 [1] - 公司定位为智能座舱解决方案的全球先驱及领导者 致力于将汽车转变为智慧伙伴 聚焦人车互动主要入口 [3] - 凭借自研汽车操作系统与全栈元神AI架构 协助主机厂实现自然语音控制和个性化车舱体验 [3] - 按2024年收入计算是中国最大以软件为核心的智能座舱解决方案供应商 按解决方案搭载量计算排名第一 [3] - 中国仅有两家完全自研汽车操作系统的第三方供应商之一 唯一整合系统级操作系统、AI全栈端到端解决方案和汽车平台服务三大核心支柱 [3] - 大语言模型能力在九家中国顶级汽车AI公司中排名第一 车辆控制、驾驶、娱乐等多场景表现领先同行 [3] 行业前景与市场规模 - 全球智能汽车销量预计从2024年5800万辆增长至2030年8650万辆 复合年增长率6.9% [4] - 中国智能汽车大语言模型渗透率预计从10%提升至40% [4] - 中国智能座舱解决方案市场规模预计从2024年1290亿元人民币增长至2030年3274亿元人民币 复合年增长率16.8% [5] - 基于软件的座舱解决方案市场预计从2024年401亿元人民币增至2030年1149亿元人民币 复合年增长率19.2% [5] 财务表现 - 2022年收入8.05亿元人民币 2023年8.72亿元人民币 2024年8.24亿元人民币 [5] - 2024年截至3月31日止三个月收入1.68亿元人民币 2025年同期1.36亿元人民币 [5] - 2022年亏损8.78亿元人民币 2023年亏损8.76亿元人民币 2024年亏损8.47亿元人民币 [5] - 2024年截至3月31日止三个月亏损2.04亿元人民币 2025年同期亏损15.82亿元人民币 [5] - 2025年截至3月31日止三个月出现其他无形资产减值损失184.099亿元人民币 [6]
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
量子位· 2025-08-20 10:21
文章核心观点 - MEM1框架通过强化学习训练AI Agent自主管理记忆和推理 显著提升处理复杂任务时的效率和性能 [2][3][6][8][9][12][17][22] 技术原理 - 采用基于结果奖励的强化学习训练 使模型学会提取、整合和修剪信息 [12][14] - 引入内部状态<IS>作为工作记忆 实现近似常量级显存开销 [8][9][16] - 通过注意力掩码机制限制关注范围 迫使模型高效压缩历史信息 [12] 性能表现 - 7B参数MEM1模型推理速度达传统14B模型的3.5倍 [2] - 峰值上下文token数量降至传统模型的1/4 [2] - 在16目标任务测试中准确率12.3% 远超对比模型Qwen2.5-14B-Instruct的3.54%和Qwen2.5-7B+外部记忆模块的4.56% [3][17] 应用场景 - 支持多轮复杂任务处理 包括文档检索QA、开放域Web QA和多轮网购决策 [19] - 展现分问题独立存储、自适应搜索策略和任务规划能力 [20] - 在长程环境交互任务中保持上下文稳定 避免线性增长 [16] 行业意义 - 为处理长推理上下文挑战提供新思路 替代传统外部记忆模块方案 [22] - 实现端到端训练 降低工程复杂度并提升效果可控性 [12][22] - 论文已被COLM 2025 RAM workshop收录为口头报告 [3]
网宿科技2025上半年净利润同比增长25.33% 海外市场开拓进展显著
全景网· 2025-08-20 03:17
财务表现 - 2025年上半年实现营业收入23.51亿元 同比增长2.19% [1] - 归属于上市公司股东的净利润达3.73亿元 同比增长25.33% [1] - 经营活动现金流量净额为3.76亿元 同比增长52.41% [1] 业务发展 - 安全业务收入64,671.22万元 同比增长13.96% [1] - 剥离MSP业务并出售CloudswayPte.Ltd股权以优化业务结构 [1] - 设立迪拜子公司推进东南亚、中东等海外市场布局 [1] 技术创新 - 发布大模型安全深度评估服务 提供AI应用一站式安全解决方案 [2] - 升级新一代边缘AI平台 构建"资源-模型-服务-应用"四层能力矩阵 [2] - 开发边缘AI网关、边缘模型推理及边缘AI应用核心产品 [2] 行业认可与治理 - 网宿安全在2025年IDC MarketScape中国智能安全访问服务边缘厂商评估中位列领导者类别 [2] - 实施2025年限制性股票激励计划 产生股份支付成本6,558.23万元 同比增加1,910.36万元 [2]
英伟达发布小语言模型Nemotron-Nano-9B-v2;印度研发400纳米机器人,“钢铁防线”实现牙齿脱敏丨AIGC日报
创业邦· 2025-08-20 00:08
人工智能模型技术进展 - 阿里通义千问推出图像编辑模型Qwen-Image-Edit 基于20B参数模型开发 实现图片文字精准编辑功能[1] - 英伟达发布开源小语言模型Nemotron-Nano-9B-v2 在基准测试中取得同类最佳性能 支持在单个A10 GPU上运行[2] - 淘天集团推出3B多模态大模型CombatVLA 在3D动作游戏战斗任务中成功率超越GPT-4o和人类玩家 具备秒级响应和高分辨率感知能力[3] 游戏AI技术应用 - CombatVLA模型可生成AoT解释并解析Python代码指令 在黑神话悟空和只狼游戏中实现实时战术推理[3][4] - 模型通过按键操作控制游戏角色 包括生命恢复键"r" 技能键"1" 闪避键"space"等具体指令执行[4] - 在敌人攻击时执行闪避操作 在非攻击时段执行轻攻击或蓄力攻击 蓄力0.607秒可增加伤害值[4] 医疗纳米技术创新 - 印度科研团队开发400纳米机器人CalBot 通过外部磁场操控在牙本质小管内形成300-500微米封堵层[4] - 纳米机器人涂层可阻隔冷热刺激 实现类似牙釉质的牙齿保护效果 从根本上解决牙齿敏感问题[4] 创投数据分析平台 - 睿兽分析平台覆盖17万+活跃企业 包含2万家投资价值企业和50+国家高新技术企业[6] - 平台包含10万+基金数据 2万+LP数据 1万+专精特新小巨人企业 提供1400+行业标签体系[6] - 提供全生命周期投资追踪 涵盖人形机器人 商业航天 AGI等热门赛道行业图谱[5][6]