Workflow
大模型
icon
搜索文档
美腾科技:基于大模型推理能力开发智慧调度指挥中心产品,可实现生产参数实时调节等功能
证券日报· 2025-12-17 14:13
公司核心产品与技术进展 - 公司选煤行业专有大模型“知煤大师”具备工艺流程、煤质特性、生产管理等关键领域的深度分析与预测能力 [2] - 公司通过行业知识图谱建设、选厂数字孪生系统搭建,并利用开源模型(如阿里千问、DeepSeek等)持续提升优化大模型性能 [2] - 2025年,公司将基于大模型推理能力开发智慧调度指挥中心产品,可实现生产参数实时调节、故障自动诊断等功能 [2] 行业应用与市场拓展 - 该技术可推动选煤厂智能化高级阶段建设,通过人机联动与智能管控提升效率 [2] - 以上产品和模式可同步拓展至选矿等领域 [2] - 未来,根据公司业务的发展,将拓展更多的工业应用场景 [2]
腾讯升级大模型研发架构 引入前OpenAI研究员姚顺雨任要职
新浪财经· 2025-12-17 13:57
公司战略与组织架构调整 - 腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化其大模型的研发体系与核心能力 [1] - 任命Vinces Yao(姚顺雨)为首席AI科学家,同时兼任AI Infra部和大语言模型部负责人,其背景为清华和普林斯顿大学毕业,曾任OpenAI研究员,是OpenAI首批智能体产品Operator与Deep Research的核心贡献者 [1] - AI Infra部负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理服务等核心技术 [2] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [2] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦AI战略布局,提升研发效率 [2] 公司人才与产品进展 - 近期混元团队加速招募AI人才,来自大厂、AI六小虎的数位核心员工已加入腾讯,以支撑高强度的技术攻坚 [2] - 混元旗舰模型TurboS是业界首个基于混合线性注意力机制落地的超大规模MoE模型,自年初发布后保持每月一个版本的迭代速度 [3] - 腾讯于12月5日推出最新旗舰模型混元2.0,并于今日发布世界模型1.5,该模型系国内首个开放体验的实时世界模型 [3] 行业竞争动态 - 不仅腾讯AI提速,字节跳动、阿里巴巴等大厂年内AI战略决心明确,重磅动作频频 [3] - 字节跳动旗下豆包手机受关注,其火山引擎FORCE原动力大会预计将发布豆包大模型新品 [3] - 阿里巴巴已成立千问C端事业群,由原智能信息与智能互联两个事业群合并重组而来,包含千问APP、夸克、AI硬件、UC、书旗等业务,首要目标是将千问打造成一款超级APP,成为AI时代用户的第一入口 [3] 行业发展趋势与竞争关键 - 国内大厂正围绕算力设施层、模型层、应用层全面发力 [4] - AI应用层面的竞争不会简单收敛为大厂之间的较量,随着算力和基础模型能力普及,行业差异化的关键转向围绕具体使用场景与行业工作流程构建可持续的竞争力壁垒,这类能力是第三方独立厂商最具价值且最难被规模化复制的竞争优势 [4]
“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路
搜狐财经· 2025-12-17 13:49
公司战略与愿景 - 小米于2025年12月17日举办“人车家全生态合作伙伴大会”,标志着其AI研发走向“正规军化”和“极客化”的新阶段[2] - 公司新任MiMo团队负责人罗福莉(前DeepSeek核心成员)提出了新的AGI梦想,认为真正的智能需从交互中产生,目标是“推演整个世界的运作逻辑,打造一个虚拟宇宙”,而不仅仅是打造程序[2] - 该团队的核心职责是主导大模型研发,通过高效推理与智能体技术,推动AI从“语言交互”跨越到“物理世界”,以赋能小米的“人车家全生态”战略[7] 模型发布与核心特点 - 公司开源了新一代面向智能体的基座模型MiMo-V2-Flash,该模型总参数为309B,但通过MoE架构仅激活15B参数[3][11] - 模型具备高效推理能力,结合MTP技术,生成速度达到150 tokens/秒,带来约2.5倍加速,旨在解决车机、助手等端侧交互对延迟的敏感问题[3] - 模型采用创新的Hybrid SWA长文本架构,支持256K长上下文,并通过固定KV缓存降低硬件压力,在代码生成上刷新了SOTA[4] - 模型追求极高的性价比,后训练阶段采用MOPD技术,用极低的计算量(不到标准流程1/50)复刻教师模型性能,旨在降低大规模部署成本[5] 技术架构与性能优势 - 模型架构围绕“极致推理效率”设计,核心创新之一是采用Hybrid Attention结构,其中Sliding Window Attention与Full Attention的比例约为5:1[16][17] - 核心创新之二是挖掘MTP潜力,在推理时使用三层MTP进行加速并行Token验证,实现了2.2到2.6倍的推理加速,单请求吞吐达150~155 Tokens/秒[16][19] - 在性能与成本平衡上,MiMo-V2-Flash相比DeepSeek-V3.2推理速度提升约3倍,相比Gemini 2.5 Pro推理成本低20倍,实现了低成本与高速度[15] - 在公开评估榜单上,该模型的代码和智能体能力已进入全球开源模型Top 1-2行列,性能超过或与总参数量为其2-3倍的DeepSeek-V3、Kimi、Qwen等模型相当[11][12] 训练范式革新 - 公司提出了MOPD训练范式,其核心在于On-Policy,依赖稠密的令牌级奖励进行监督学习,能高效地将各领域专家能力蒸馏到学生模型上[20] - 该范式学习效率极高,通过简短的几十步就能完成能力蒸馏,并且当学生模型超越教师时,可尝试进行自我迭代提升[21] 行业视角与AI发展路径 - 从生物进化视角看,智能发展遵循“控制身体与环境互动→强化学习→模拟未来→掌握语言”的路径,而当前大模型的发展是“倒叙”的,先学会语言,再补齐思考和物理世界模拟能力[8] - 大模型智能首先在语言领域爆发,是因为语言是人类思维与世界认知的“有损压缩”,模型通过降低损失函数的学习过程,本质上是压缩了人类数十亿年对世界的认知同构[9] - 行业下一阶段的关键是让AI从“语言模拟器”转变为能与世界共存的智能体,这需要两大潜能:从“回答问题”到“完成任务”的全模态感知能力,以及构建理解物理规律的“物理模型”[24] - 公司认为,AI进化的下一个起点是打造一个具备物理一致性、时空连贯性的虚拟宇宙,真正的智能是在与环境的交互中“活”出来的,而不仅仅从文本中读取[25] 当前挑战与生态赋能 - 尽管模型追求“极致效率”,但端侧AI硬件目前仍难以支撑,当前旗舰手机端侧模型的舒适区停留在3B到7B参数,MiMo-V2-Flash的15B激活参数对移动设备而言依然过高[7] - 模型目前的“高效推理”更多指在云端数据中心实现高吞吐量,对用户终端而言仍是一个重度依赖网络的“云端模型”,并未打破端侧AI的算力天花板[7] - 公司已为MiMo-V2-Flash开源所有权重,提供技术报告、API及体验Web,开发者可接入Web Coding IDE进行试用[24]
智谱通过港交所上市聆讯 冲刺“全球大模型第一股”
证券日报网· 2025-12-17 13:45
截至记者发稿,智谱方面对通过聆讯一事未予置评。 12月17日,北京智谱华章科技股份有限公司(以下简称"智谱")通过港交所上市聆讯,有望成为"全球大模 型第一股"。在业内人士看来,这标志着港股将首次迎来一家以AGI基座模型为核心业务的上市公司。 ...
Agent交卷时刻:企业如何跨越“一把手工程”信任关?|甲子引力
搜狐财经· 2025-12-17 13:21
文章核心观点 - AI Agent的价值正从技术能力转向真实的商业产出,必须深入业务、解决问题并交出可衡量的价值答卷 [2] - 2025年是推理AI Agent元年,能够自主规划与智能决策的AI Agent正成为企业的真实生产力,重点从“降本”转向“增效”,帮助企业迈向价值增长 [18] - 行业已从大模型的战争收敛到更上层应用的战争,开源模型显著降低了基础成本,使得AI Agent的爆发具备现实可行性 [25] AI Agent的价值共识与落地之困 - **价值定位**:企业应用AI Agent的核心价值不仅在于“降本增效”,更在于驱动规模化增长与营收提升,企业渴望的是真金白银的收益 [12][18] - **增效内涵**:“增效”具体体现在三个层面:1) 原有业务流程AI化与重构;2) 强化AI与现有数字化系统的集成,提升经营与决策效率;3) 激活企业的核心数据资产 [14][15] - **深层阻力**:企业落地AI Agent面临三大主要障碍:1) **信任问题**,涉及数据与应用安全性;2) **习惯问题**,改变固有工作流程需要大量推动与培训;3) **费用问题**,新的改革需要明确的预算与投入 [20][21] - **认知转变**:DeepSeek等模型的出现已经提升了企业决策者对AI的认知,当前的主要挑战在于企业是否在信任、习惯和费用方面做好了准备 [21] - **历史负担**:过往的数字化投入巨大(例如2000、3000万),但技术常处于从属地位,这构成了对当前AI应用的一定阻碍,企业主现在更希望AI能直接交付结果,重构生产力 [22][23] - **成本结构优化**:开源模型(如DeepSeek、蚂蚁百灵模型)的成熟,使得企业基于其进行精调的效果超过自研多年模型,且成本大幅降低,这是2025年成为Agent爆发元年的关键原因 [24][25] AI Agent如何真正“用起来” - **一把手工程**:企业AI数智化转型必须是一把手驱动的“一把手工程”,需要企业有决心打开业务流程,与AI公司合作共创,共同重塑价值生产链条 [26][27] - **全栈技术方案**:要真正解决客户问题,必须构建完整、全栈的技术系统,覆盖数据处理、模型训练、Agent架构设计及强化学习等技术,行业正朝此方向演进(如OpenAI的AgentKit,零一万物的Open AgentKit) [28][29][30] - **战略布局**:零一万物采用“一横多纵”战略:“一横”指打造以万智2.0为核心的企业级AI操作系统,将Agent研发门槛降至“零代码”;“多纵”指聚焦金融、政务、工业等重点行业,与灯塔客户共建场景化解决方案 [31] - **金融Agent第一性原理**:金融Agent的第一性原理是“风险可控下的价值创造”,AI必须创造可衡量的业务收益,同时严守安全、合规底线 [31][32] - **金融Agent核心特性**:金融行业对AI的核心诉求抽象为三大特性:1) **严谨性**:通过技术手段系统性压制幻觉,将其控制在业务可接受范围;2) **专业性**:要求模型与垂直领域专家判断及专业语言对齐;3) **遵从性**:对监管规则与合规红线的绝对遵守 [32][33][34] - **完整智能体构成**:真正的智能体如同完整的“人”,需要融合“大脑”(模型)、知识经验(高辨识数据)与工具(执行力),才能从助理(Copilot)跃迁为可用的“数字员工” [34] - **To B企业的价值交付**:深度原理为客户提供分层价值:**短期**解决繁琐复杂问题,缩短研发周期,提高人效比;**中期**提升整体研发管线成功率与鲁棒性,算“整体账”;**长期**提升研发创新的“斜率”,加速创新效率 [35] - **商业化闭环案例**:红熊AI通过研发开源的“记忆科学”(记忆熊)产品,让Agent拥有类人记忆能力,显著提升了业务指标:AI自助解决率大幅跃升至98.4%,通用幻觉率控制在0.2%,垂直环境下幻觉率可压缩至接近零 [36] - **未来智能体的关键能力**:实现人与智能体共创需要解决:1) **懂人**:在交互中理解人的指令;2) **懂事**:理解特定行业的Know-How;同时需具备自我学习能力、逻辑推理能力和多模态能力 [37][38][39]
“天才少女”罗福莉走向台前
华尔街见闻· 2025-12-17 12:35
核心观点 - 小米集团通过引入顶尖AI科学家罗福莉并发布其主导的MiMo大模型,旨在从传统硬件制造商转型为一家以AI驱动的智能服务公司,其核心战略是利用自身庞大的硬件生态作为物理世界入口,发展“具身智能”以构建商业护城河并寻求更高估值 [2][10][11] 公司战略与投入 - 小米集团总裁卢伟冰宣布未来五年研发投入规划达2000亿元,显示公司对AI转型的坚定决心 [2] - 公司重金引入前DeepSeek核心成员、95后科学家罗福莉担任MiMo大模型负责人,这是一次关键的技术补课与战略防御行动 [2] - 公司的目标是利用其全球最大的消费级IoT平台(连接10.4亿台设备)作为训练下一代“具身智能”的直接入口,将硬件作为载体,AI作为溢价核心 [10] 技术路线与产品 - 罗福莉为小米规划了一条“另类”技术路线:不追求“全知全能”的云端大模型,而是专注于打造“知行合一”、能与物理世界交互的“物理大脑”或智能体 [4][6] - 新发布的开源模型MiMo-V2-Flash采用MoE架构,总参数达309B,但实际运行时仅激活15B,以实现轻量化并部署于手机和汽车芯片 [5] - 该模型通过锁定128个Token的滑动窗口等工程策略,牺牲部分文采以换取极致的代码执行和工具调用效率,其展示的推理速度是对手DeepSeek-V3.2的3倍,成本仅为Gemini 2.5 Pro的二十分之一 [5] - 罗福莉认为算力和数据并非真正的护城河,小米的路线比拼的是科学研究文化和对问题的定义能力 [5] 行业背景与竞争格局 - 当前AI行业正从“规模时代”转向“研究时代”,单纯堆砌算力的边际收益递减,模型需要应用落地 [7][8] - 行业竞争维度已从“谁的模型更聪明”转变为“谁拥有物理世界的入口”,软件巨头如字节跳动、阿里、OpenAI等正积极尝试推出硬件以触碰真实世界 [9] - 高盛指出,字节跳动“豆包手机”等激进尝试,反而验证了小米等硬件巨头在AI入口生态战中的结构性优势 [11] - 行业普遍面临挑战:云端ChatBot的高昂推理成本使商业模式难以为继,同时如何在算力受限的端侧设备实现高智商推理也是一大物理挑战 [8][11] 公司面临的挑战与机遇 - 机遇在于小米本身是“物理世界的地主”,其庞大的硬件生态是其在AI时代翻盘的关键基础 [10] - 主要挑战在于必须证明其原生MiMo模型比外来的“豆包”或“ChatGPT”更好用、更听话,否则其10.4亿台设备可能沦为别人的流量入口 [11] - 公司需要让数万名习惯了传统硬件开发的工程师适应大模型时代的开发范式,这是一道现实难题 [11] - 对于小米而言,若不能在AI时代掌握核心模型,其“人车家生态”中的所有硬件可能沦为其他巨头的躯壳,这是无法接受的战略结局 [11]
腾讯大模型,变阵
36氪· 2025-12-17 12:29
腾讯AI战略与组织架构调整 - 腾讯从OpenAI挖来核心研究员Vinces Yao(姚顺雨)出任首席AI科学家,打破内部提拔传统[1] - Vinces Yao向总裁刘炽平直接汇报,而非向技术工程事业群负责人汇报,表明大模型已升级为公司级一号工程[4] - 公司成立由Vinces Yao亲自带队的AI Infra(基础架构)部和刘煜宏负责的AI Data(数据)部,将基础设施与数据管理独立建制[7] - 此次调整旨在结束内部“小作坊”和“赛马”模式,将分散的AI研发力量聚合成“集团军”,从“实验室模式”转向“大工厂模式”[6][11][16] 战略路线与行业竞争 - 挖角Vinces Yao并让其同时掌管AI基建和大语言模型部,释放出腾讯将走纯正OpenAI路线、信奉Scaling Law(规模法则)的强烈信号[5] - 公司战略从试图以应用层倒逼模型层,转向承认必须从地基开始重建,追求通用人工智能[5][6] - 在AI应用层竞争上,腾讯意识到在“快”上跑不过字节跳动的“APP工厂”模式,因此转向赌“厚”,致力于打造更厚的通用智能底座和微信搜索入口[13][15][16] - 行业对决体现为两种顶层设计:字节跳动(DeepMind背景)的“特种部队”模式赌应用与流量;腾讯(OpenAI背景)的“集团军”模式赌底座与智能深度[14][17] 人才争夺与资源投入 - 为抢夺人才,腾讯开出极其激进的薪资,普遍上浮50%为基准线,对顶级人才甚至直接开出2倍薪资[18] - 公司抢夺目标包括字节跳动、阿里巴巴以及“AI六小虎”(如Kimi、MiniMax、零一万物等)的核心员工[18] - 此举被视为大厂对创业公司的“降维打击”,利用“资金 + 算力 + 场景 + 高薪”的组合优势摘取创业公司培养的人才果实[19] 产品与市场终局 - 调整明确将构建AI搜索能力的职责划归Vinces Yao负责的大语言模型部,目标是将AI能力无缝接入微信“搜一搜”[20][21] - 公司终极目标是打造一个日活10亿级的超级AI入口,而非仅仅是一个日活几千万的聊天机器人[22] - 腾讯认为ChatBot可能是过渡形态,Search才是AI最大的落地场景,计划在未来的“AI搜索”战场上打一场翻身仗[23] - 公司拥有微信搜索这一所有对手都羡慕的独特入口,结合OpenAI级别的模型能力与高质量数据,可能形成强大竞争力[21] 技术发展重点 - 公司认识到当模型参数达万亿级别时,卡间通信与训练框架效率成为关键,因此需将算法与算力打通,极致压榨硬件性能[8][9] - 随着互联网高质量文本数据枯竭,Scaling Law面临失效,突破的关键在于获取更纯净、高质量的数据及生成合成数据[9] - 独立数据部门旨在将微信、公众号、QQ中的“数据金矿”以工业化方式清洗利用,为模型训练提供顶级“食材”[9][10]
智谱AI通过聆讯,冲刺全球大模型第一股
证券时报网· 2025-12-17 12:25
人民财讯12月17日电,记者获悉,智谱于12月17日通过港交所上市聆讯,有望成为"全球大模型第一 股"。这标志着港股将首次迎来一家以AGI基座模型为核心业务的上市公司。截至发稿,暂未能获得智 谱置评。 ...
智谱通过聆讯,港股将迎来基座模型第一股
格隆汇· 2025-12-17 12:22
智谱于12月17日通过港交所上市聆讯,有望成为"全球大模型第一股"。这标志着港股将首次迎来一家以 AGI基座模型为核心业务的上市公司。截止发稿,暂未能获得智谱置评。 ...
新股消息 | 智谱AI通过聆讯,冲刺全球大模型第一股
智通财经网· 2025-12-17 12:19
智通财经APP获悉,智谱于12月17日通过港交所上市聆讯,有望成为"全球大模型第一股"。这标志着港 股将首次迎来一家以AGI基座模型为核心业务的上市公司。截止发稿,暂未能获得智谱置评。 ...