大模型
搜索文档
一个 RAG 项目,在真实训练中是怎么被“做出来”的?
36氪· 2025-12-19 00:11
RAG技术远非简单的数据注入,而是重塑AI理解与决策的核心框架。本文深度拆解RAG项 目中的真实困境——从语料筛选、矛盾处理到结果交付,揭示为何90%的工作仍依赖人类判 断。 在之前的文章里,我花了很多篇幅讲 RAG 为什么重要。但真正走到项目现场,你会很快意识到一件 事:RAG 不是一个"加模块"的技术问题,而是一整套数据与判断体系。 很多刚接触的人会以为,RAG 项目无非就是: 给模型多喂点资料,让它照着说。 但真实情况是——真正决定 RAG 效果的,从来不是"有没有资料",而是"资料怎么被用"。 先从一个最真实的工作场景说起 在对话式 AI 助手场景中,RAG 项目面对的,通常不是"标准问答",而是这样一种结构: 模型要做的,不是简单复述材料,而是: 理解对话语境 → 判断哪些材料有用 → 整合信息 → 给出一个"对用户有帮助"的回答 从训练视角看,这本质是在做一件事:材料阅读理解 + 问题理解 + 信息整合 + 表达控制 RAG 项目里的"三件套":问题、材料、回答 如果把一个 RAG 项目拆开来看,它其实由三块内容构成,但这三块,没有一块是"天然可靠"的。 问题,本身就可能有问题 你在项目中会频繁遇 ...
“双雄”抢跑 国产大模型叩响资本市场大门
北京商报· 2025-12-18 23:24
从12月17日晚间到12月18日,大模型赛道的热门话题围绕MiniMax和智谱展开。有消息称,国内大模型 领军企业MiniMax(稀宇科技)与智谱AI均已获得中国证监会境外发行上市备案,并于本周先后通过港交 所上市聆讯,进入港股上市前的最后阶段。尽管双方暂未公开置评,港交所也还未披露招股书,但知情 人士向北京商报记者透露,面向公众层面的信息确认只是时间问题。这场IPO冲刺进入收官阶段,国产 大模型的上市竞速将迎来终局,行业淘汰赛是否同时开启? "双雄"抢跑 "智谱AI于12月17日在港参与并通过了聆讯",12月18日,知情人士向北京商报记者透露。 MiniMax亦被曝于12月17日通过了港交所聆讯,计划于2026年1月在港挂牌上市。截至北京商报记者发 稿,MiniMax和智谱对此保持沉默,港交所也尚未公布两家公司聆讯后资料集。上述知情人士表示,港 交所将在近期发布公开信息。不出意外的话,这两家公司可能成为中国内地企业赴港上市"报备制"以 来,在港过聆讯最快的案例。 近期文远知行与小马智行同步赴港聆讯,同日上市。如今,MiniMax与智谱的并肩过会,会不会复刻这 一剧本尚不可知,但从第三方视角看挑战同样显著。 ...
国产大模型叩响资本市场大门
北京商报· 2025-12-18 16:00
从12月17日晚间到12月18日,大模型赛道的热门话题围绕MiniMax和智谱展开。有消息称,国内大模型 领军企业MiniMax(稀宇科技)与智谱AI均已获得中国证监会境外发行上市备案,并于本周先后通过港 交所上市聆讯,进入港股上市前的最后阶段。尽管双方暂未公开置评,港交所也还未披露招股书,但知 情人士向北京商报记者透露,面向公众层面的信息确认只是时间问题。这场IPO冲刺进入收官阶段,国 产大模型的上市竞速将迎来终局,行业淘汰赛是否同时开启? "双雄"抢跑 "智谱AI于12月17日在港参与并通过了聆讯",12月18日,知情人士向北京商报记者透露。 MiniMax亦被曝于12月17日通过了港交所聆讯,计划于2026年1月在港挂牌上市。截至北京商报记者发 稿,MiniMax和智谱对此保持沉默,港交所也尚未公布两家公司聆讯后资料集。上述知情人士表示,港 交所将在近期发布公开信息。不出意外的话,这两家公司可能成为中国内地企业赴港上市"报备制"以 来,在港过聆讯最快的案例。 同日通过聆讯,目标均为港交所,这与不久前实现美股+港股双重主要上市的小马智行和文远知行的轨 迹相重叠。 当下同频的MiniMax和智谱,上市路径略 ...
智谱、MiniMax相继通过港交所上市聆讯
证券日报之声· 2025-12-18 15:44
上市进程与市场定位 - 智谱与MiniMax均已通过港交所上市聆讯,进入IPO最后冲刺阶段,预计最快2026年初登陆资本市场 [1] - 智谱有望成为“全球基座大模型第一股”,而MiniMax则冲刺“全球多模态大模型第一股” [1] 公司背景与融资情况 - 智谱由清华大学研究人员于2019年创立,是国内最早启动大模型研究的团队之一 [1] - 智谱已完成多轮融资,投资方包括高瓴资本、启明创投、美团、阿里、腾讯、小米等 [1] - 2025年,智谱获得多笔战略融资,包括杭州城投等超10亿元、珠海华发5亿元、成都高新区3亿元、北京人工智能基金2亿元、浦东创投与张江集团10亿元,最新估值达400亿元 [2] - MiniMax成立于2021年,于2025年7月完成近3亿美元的C轮融资,估值超40亿美元,股东包括阿里、腾讯、米哈游、高瓴、IDG、红杉中国等 [2] 业务发展与财务表现 - 截至12月,智谱面向开发者的软件工具和模型业务已获得超过1亿元的年度经常性收入,并计划将API业务收入占比提升至一半 [3] - MiniMax的营收主要来自海外市场,占比达70% [3] - MiniMax的自研多模态模型及AI原生应用已累计拥有超2.12亿名个人用户,覆盖超100个国家及地区的10万余名企业客户与开发者 [3] 技术产品与开源战略 - 智谱坚持深度自研,推出了中国首个百亿模型、开源千亿模型、对话模型、多模态模型和全球首个设备操控智能体 [4][5] - 2025年12月,智谱密集发布并开源了GLM-4.6V多模态大模型、AutoGLM智能体模型、GLM-ASR语音识别模型及智谱AI输入法 [5] - MiniMax在10月底发布了新一代开源文本大模型M2,并升级了语音模型Speech2.6和音乐模型Music2.0 [5] 海外布局与市场影响 - 智谱的AI能力已输出至马来西亚、新加坡、阿联酋、沙特等地,通过提供本地化私有硬件解决方案,在全球新兴市场建立替代逻辑 [3] - 两家公司先后通过聆讯,被认为将为大模型赛道注入新的资本动力,并加速中国AI全球品牌提升与产业链协同创新 [5]
一财主播说丨资本市场迎来大模型公司IPO热潮 MiniMax与智谱同日通过港交所聆讯 阿里腾讯加持 谁将是全球大模型第一股?
第一财经· 2025-12-18 14:46
一边是巨头加持的技术标杆,一边是高校系硬核营收,两家均暂未正面回应上市细节。谁将成为全球大 模型第一股,让我们持续关注。 MiniMax手握2.12亿全球用户、10万企业客户,阿里腾讯连续注资,估值冲40亿美元,还被黄仁勋点名 力挺。自研M2模型全球开源第一,多模态能力覆盖文本、音视频全场景。 智谱AI则由清华大学计算机系技术成果转化而来,是大模型"六小虎"之一。目前有270万API付费用户, 并预计在2025年营收实现100%以上的增长。 资本市场迎来大模型公司IPO热潮,12月17日MiniMax和智谱同日闯过港交所聆讯,"全球大模型第一 股"争夺战正式打响! ...
甲骨文股价已下跌超45%谷歌与OpenAI大模型竞争日趋白热化
新浪财经· 2025-12-18 14:44
【#甲骨文股价已下跌超45%##谷歌与OpenAI大模型竞争日趋白热化#】当地时间17日,美国甲骨文公 司一项100亿美元的数据中心项目遭主要出资方蓝猫头鹰撤资。受此影响,其股价隔夜跌约5.4%,自9 月历史高点以来累计跌幅超45%。这一动态引发市场对AI热潮的谨慎情绪,隔夜美股科技板块承压,英 伟达跌3.8%、谷歌母公司Alphabet跌3.2%、博通跌4.5%。同日,谷歌官宣推出新模型Gemini 3 Flash, 主打高效低成本,不过这距上一模型Gemini 3 Pro发布仅一月,凸显谷歌与OpenAI的大模型竞争日趋白 热化。(央视财经) 来源:@华夏时报微博 ...
谷歌挑战英伟达,摩尔线程、沐曦内部人士怎么看?
第一财经· 2025-12-18 14:06
2025.12. 18 这场由巨头博弈引发的震荡,将一个核心议题推至台前:在以大模型为核心的AI时代,硬件的技术范 式是否正在从通用GPU转向专用芯片如TPU?这是否意味着一场结构性的变革已然来临? 本文字数:1632,阅读时长大约3分钟 作者 | 第一财经 刘佳 这一悬念不仅关乎国际巨头的战略布局,也紧密牵动着中国AI算力产业链的神经。作为对标英伟达、 不久前刚刚上市的中国GPU厂商代表,摩尔线程创始成员、摩尔学院院长李丰与沐曦高级副总裁孙 国梁在今日腾讯contech大会上"同框",并回应了对于两种路线的看法。 在李丰看来,争议背后其实是"通才与专才"的分工,而非简单的替代关系。 他分析,谷歌能做TPU,本质上是因为它是全栈整合公司。谷歌有强大的 Infra、基础模型与云服务 形成闭环,把模型跑在自家芯片上量身优化,实现成本性价比的最大化。"但绝大部分企业不具备这 样的垂直整合能力。" 他总结,GPU持续保持优势的原因有三个:灵活度是"甜点"、多模态时代的全功能性、生态的护城 河。 谷歌新一代AI模型Gemini 3系列的发布,在硬件领域投下一颗"重磅炸弹"——其自研TPU(张量处 理器)所展现的性能与成 ...
青云科技:公司在积极进行国际化布局
证券日报网· 2025-12-18 13:41
公司战略与业务进展 - 公司正在积极进行国际化布局,产品与服务持续向海外市场推出 [1] - 公司旗下AI算力云服务“基石智算国际版CoresHub.ai”已全面上线并开放使用,旨在为全球开发者提供低成本、高效率、高可靠的模型服务 [1] - CoresHub.ai已同步上线多款大模型,为全球AI应用开发者、企业开发团队、AIGC创作者提供更灵活、更高性能的模型调用服务 [1] 核心产品与技术影响力 - 公司的容器软件KubeSphere是在Kubernetes之上构建的企业级容器平台 [1] - KubeSphere在全球开源容器领域受欢迎程度位列第二,在全球范围内颇具技术影响力 [1] - KubeSphere已被海内外数万家用户使用 [1]
MiniMax、智谱双双过聆讯,国产大模型叩响资本市场大门
北京商报· 2025-12-18 13:23
尽管双方暂未公开置评,港交所也还未披露招股书,但知情人士向北京商报记者透露,面向公众层面的 信息确认只是时间问题。这场IPO冲刺进入收官阶段,国产大模型的上市竞速将迎来终局,行业淘汰赛 是否同时开启? 从12月17日晚间到12月18日,大模型赛道的热门话题围绕MiniMax和智谱展开。有消息称,国内大模型 领军企业MiniMax(稀宇科技)与智谱AI均已获得中国证监会境外发行上市备案,并于本周先后通过港 交所上市聆讯,进入港股上市前的最后阶段。 "双雄"抢跑 "智谱AI于12月17日在港参与并通过了聆讯",12月18日,知情人士向北京商报记者透露。 MiniMax亦被曝于12月17日通过了港交所聆讯,计划于2026年1月在港挂牌上市。截至北京商报记者发 稿,MiniMax和智谱对此保持沉默,港交所也尚未公布两家公司聆讯后资料集。上述知情人士表示,港 交所将在近期发布公开信息。 同日通过聆讯,目标均为港交所,这与不久前实现美股+港股双重主要上市的小马智行和文远知行的轨 迹相重叠。 当下同频的MiniMax和智谱,上市路径略有差异。根据公开信息,2025年6月MiniMax秘密递交港交所 IPO申请,是首个赴港申 ...
“天才少女”罗福莉亮相背后:曾被雷军亲自点将,能成小米新王牌?
搜狐财经· 2025-12-18 12:26
小米大模型战略与关键人事 - 小米MiMo大模型团队新任负责人罗福莉首次公开亮相,其因“AI天才少女”标签及此前在ACL顶级会议发表8篇论文的经历而备受关注[1] - 罗福莉于2024年11月官宣加入小米,此前有报道称小米创始人雷军开出千万年薪邀请其加入从事大模型研究[1] - 罗福莉的研究方向聚焦于下一代智能体,认为其需从“回答问题”转向“完成任务”,并具备与世界交互的能力[2] 大模型技术路径与核心观点 - 罗福莉认为当代智能体需具备高效的沟通语言,主要体现在代码能力和工具调用能力上,并需围绕推理效率重新设计模型结构[1] - 其指出AI进化的下一个关键点是能够与真实环境持续交互的物理模型,真正的智能要在交互中“活出来”[4] - 罗福莉对“物理AI”兴趣浓厚,其团队已开源跨具身基座模型MiMo-Embodied,尝试打通自动驾驶与具身智能领域[4] 小米大模型产品布局与进展 - 2024年以来,小米几乎以月为单位推进模型发布,覆盖推理、视觉、多模态、音频与具身等多个层级[2][6] - 具体模型包括:4月的推理模型MiMo,5月的多模态MiMo-VL,9月的端到端语音MiMo-Audio,11月面向家庭场景的Miloco[2] - 2024年12月16日,小米公布了MiMo-V2-Flash开源MoE模型,总参数量3090亿,活跃参数量150亿,罗福莉表示该模型实现了低成本、高速度,已初步具备模拟世界的能力[5] - 截至2024年第三季度,小米AIoT平台全球连接设备数首次突破10亿,达到10.4亿台[2] 智能家居战略与行业影响 - 小米推出智能家居未来探索方案Xiaomi Miloco,旨在让智能家居设备从“被动响应指令”走向“主动理解与服务”[6] - Miloco方案的核心优势在于用户可通过口语化表达需求,由系统自动调用工具创建智能规则,无需手动设置复杂触发条件[11] - 该方案依托自研的Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型,结合家庭摄像头实时视觉数据,让智能家居从“单一条件触发”升级到“多维度场景感知”[11] - 行业观点认为,小米Miloco这类方案能打破设备孤岛,实现靠本地大模型自动感知需求、切换场景,并保护隐私,让智能家居从“听指挥”变为“主动服务”[6] - 分析指出,智能家居领域可能出现类似AI手机的集中式操作系统,小米Miloco概念展现出通过本地化AI中枢统一调度跨品牌设备的趋势[12] 大模型与公司生态融合 - 罗福莉的加入及研究方向,与小米核心的“人、车、家”生态战略相呼应,旨在解决模型在该生态中如何理解世界并持续参与的问题[2] - 在“人、车、家”生态体系中,AI需嵌入具体业务场景,承担感知、决策与执行的角色,智能驾驶和具身智能可能成为小米大模型从“认知工具”走向“行动主体”的关键落点[5]