Workflow
大模型
icon
搜索文档
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
猿大侠· 2025-09-02 04:20
模型性能表现 - 在Agent工具调用和指令遵循等基准测试中超过DeepSeek-V3.1、Qwen3 MoE-2507及Claude4 Sonnet [3] - 编程能力与Claude4 Sonnet相当 在TerminalBench测试中表现突出 [5] - 总参数量560B 激活参数动态范围为18.6B–31.3B 低于DeepSeek-V3.1(671B/A37B)和Kimi-K2(1T/A32B) [12][13] - 在数学题测试中解答完全正确 包括全国一卷圆锥曲线问题及复杂坐标计算 [22][23][24][26][32][33][35][36][39][42][46][47][50][51] - 成功绘制生物学卡尔文循环SVG示意图 展现多模态代码生成能力 [53][54] - 准确解答迷惑性量子力学问题 识别"薛定谔的死猫"陷阱并指出与原版实验区别 [58][59][61][62][63][64][65] 技术创新架构 - 采用Zero-computation Experts与Shortcut-connected MoE双重架构 通过恒等专家映射实现动态计算分配 [13][16] - 使用新路由架构优化专家模型调用 通过MoE与密集层通信重叠执行提升效率 [14] - 引入设备级负载均衡损失和PID控制器调节路由概率 避免序列级失衡 [16] - 规模化训练采用超参数迁移+模型生长初始化策略 用14层模型堆叠成28层加速收敛 [17] - 预训练使用20T token语料 中期扩展上下文窗口至128k 后期通过多Agent合成框架进行高难度工具使用训练 [17] - 推理阶段实现多步重叠调度器 使CPU调度与GPU计算交错 单张H800 GPU生成速度超过100 tokens/s [17][20] 训练效率与成本 - 在30天内完成20T token预训练 使用上万个加速卡且训练可用率达98.48% [20] - 输出成本约为0.7美元/百万token 在560B参数规模下实现高效推理 [20] - 相比同级模型在不同上下文长度下均实现更高单GPU吞吐和单用户速度 [20] 公司AI战略布局 - 2023年通过收购光年之外团队强化大模型研发能力 王慧文以顾问身份回归后领导GN06独立AI团队 [74][76][77] - 2024年明确"主动进攻"AI战略 推出AI编程应用NoCode和代码助手CatPaw 内部AI工具调用量从10%提升至68% [81][82][85] - 2024年研发投入211亿元 规模居国内第四 过去5年累计投入超1000亿元 [83] - 三层战略架构包括AI提升员工效率(AI at Work)、产品AI化(AI in Products)和自研大模型(Building LLM) [89] - 早期布局具身智能领域 投资宇树、星海图、银河通用等头部公司 [88] - AI应用覆盖情感陪伴(Wow)、图像生成(妙刷)、餐饮推荐(问小袋)、交互问答(米鲁)等多场景 [75][78][84]
冲上热搜!美团大模型,靠「快」火了
机器之心· 2025-09-02 03:44
文章核心观点 - AI行业正从单纯追求模型性能转向注重实用性和效率 重点关注如何在保证准确性的前提下降低算力消耗和提升响应速度[1] - 美团开源的LongCat-Flash模型通过架构创新和系统优化 实现了高速推理和低成本部署 成为实用化AI的代表作[5][42][64] 模型性能表现 - 在H800显卡上推理速度超过每秒100个token 实测达到95 tokens/s[6] - 在多项测试中达到与Claude 4 Sonnet(7.40分)和DeepSeek v3.1(6.30分)相媲美的7.70分性能[8] - 每百万输出token成本仅为0.7美元 相比同类模型具有显著成本优势[15][42] 技术架构创新 - 采用混合专家模型架构 总参数量5600亿 仅激活186亿至313亿参数(平均270亿)[12] - 引入零计算专家机制 根据token重要性动态分配计算资源 减少简单token的计算浪费[19][21] - 创新快捷连接MoE(ScMoE)架构 实现通信与计算并行 降低50%的理论输出token时间[28][34] - 采用64头注意力机制(MLA) 显著减少KV缓存需求并实现压缩[47] 训练效率与稳定性 - 使用超过20万亿token训练数据 训练时间不足30天 系统可用率达98.48%[12] - 开发高效的模型扩展策略 包括超参数迁移和模型增长初始化方法[33][35] - 实施多层次稳定性套件 确保训练过程无不可恢复的损失骤增[37][39] 系统优化技术 - 设计单批次重叠(SBO)调度策略 实现四阶段流水线执行[44][45] - 采用推测解码加速技术 达到约90%的接受率[47] - 实施TV融合策略和重叠调度器 最小化内核启动开销[48] - 应用细粒度块级量化方案 优化性能-准确率权衡[50] 实际应用表现 - 首token输出延迟极低 用户体验显著改善[58] - 在智能体应用中实现单轮工具调用延迟控制在1秒以内[53] - 联网搜索功能响应迅速 并能附带引用来源确保信息可信度[61] 行业意义 - 代表AI行业从性能竞赛向实用导向转变的趋势[64] - 为预算有限的开发者和企业提供了可参考的技术路径[65] - 美团的技術投入一贯聚焦真实业务痛点 此次开源延续了其实用化技术路线[65]
金融行业大模型应用落地白皮书:AI原生开启金融智能新未来
产业信息网· 2025-09-02 03:37
算法技术突破 - 大模型算法核心跃迁从被动处理任务转向主动进化策略 金融行业作为数据密集型和计算密集型场景迎来深度变革机遇[1] - OpenAI GPT-强化长文本因果推理能力 支持10万token以上上下文 突破金融机构对超长篇幅风控/投研文档处理瓶颈[1] - Google Gemini升级多模态动态交互算法 实现文本-图表-数据实时联动 高盛用其构建动态利率走势模型[1] - AlphaEvolve通过生成式策略优化(GSO)实现模型自动迭代 国内百度文心4.5和X系列模型、DeepSeekV\R等采用多模态+长思维链推理+智能工具调用架构[1] 业务融合与模型适配 - 核心业务与AI融合深度成为金融机构核心竞争力 大模型在员工场景(知识问答/报告撰写/资料汇总)优势明显[2] - 面向客户业务场景(信贷/风控/营销)和实时场景(反欺诈/秒级授信)存在准确率低和延迟反馈问题[2] - 专精模型结合金融合规规则库与动态风险因子库 通过领域数据定制实现深度场景适配[2] - 通用大模型在金融领域存在意图理解不准确/专业知识覆盖不足/幻觉率高等短板 未达生产级要求[2] 开发工具与平台演进 - 大模型工具链从技术导向转向业务导向 通过低代码/无代码平台让金融机构快速构建业务智能体[3] - 智能体在投研/投顾/信贷决策/风险管理等核心场景持续创造价值 开发平台支持MCP/AA及SFT工具链[3] - 2025年通用模型+专精模型协同管理成为主流 工具平台降低AI使用门槛 让业务人员用AI解决问题[3] 数据与知识体系构建 - 数据飞轮将零散数据转化为可复用结构化知识 形成业务-数据-模型闭环 适配高合规/高精准/高动态要求[4] - 金融机构对数据按敏感度分级构建可信环境 通过跨模态数据整合实现内外部协同 打破数据壁垒[4] - 构建高质量向量知识库和高价值知识工程 缓解高价值数据稀疏现状 促进模型多维度系统性升级[4] 算力架构演进 - 大模型向万亿级参数演进 训练算力呈指数级增长 异构计算集群和多芯混合训练兼顾高性能与低成本[4][5] - 百亿参数模型场景单机单卡可完成推理与微调 更高算力密度机器在训练微调与复杂推理中具效率优势[5] - 千亿/万亿参数场景采用DP+EP分离的大集群部署方案 通过数据拆分与专家层分工解耦提升算力利用效率[5]
5600亿?便宜又快的龙猫大模型来了
虎嗅· 2025-09-02 03:17
美团悄悄开源了名叫"龙猫"(LongCat-Flash-Chat)的超大模型,5600亿参数,主打又快又便宜。模型 用数万个加速器,30天狂刷20万亿训练量,这波也是赢麻了! ...
业务合伙人招募来啦!模型部署/VLA/端到端方向~
自动驾驶之心· 2025-09-02 03:14
业务拓展计划 - 公司计划在国内外招募10名业务合伙人[2] - 合伙人将负责自动驾驶课程研发、论文辅导业务开发及硬件研发[2] 技术研究方向 - 重点招募方向包括大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶[3] - 涵盖具身交互、联合预测、SLAM、3D目标检测等前沿技术领域[3] - 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向也在招募范围内[3] 人才资质要求 - 要求应聘者来自QS200以内高校且具有硕士及以上学历[4] - 拥有顶级会议论文发表经历者将获得优先考虑[4] 合伙人待遇 - 提供自动驾驶行业资源共享包括求职、读博及出国留学推荐[5] - 设置丰厚的现金激励方案[5] - 提供创业项目合作与推荐机会[5]
浪人早报 | 各大车厂公布8月交付量、百度地图回应被曝强制看广告、新款Model3发布不到一月降价…
新浪科技· 2025-09-02 02:02
各大车厂8月交付量 - 理想汽车8月交付28,529辆 [3] - 蔚来交付31,305辆 同比增长55.2% [3] - 零跑汽车交付57,066辆 同比增长超88% [3] - 岚图汽车交付13,505辆 同比增长119% [3] - 小米汽车月交付量持续超过30,000辆 [3] - 小鹏汽车交付37,709辆 同比增长169% 创单月交付新纪录 [3] - 比亚迪新能源汽车销量373,626辆 其中乘用车371,501辆 纯电动乘用车199,585辆 [3] 特斯拉动态 - Model 3长续航后轮驱动版发布不足一月降价1万元 从26.95万元降至25.95万元 [5] - 特斯拉首次预告Cyber SUV模型 未公布具体参数与量产计划 [7] 科技企业动向 - 美团开源大模型LongCat-Flash-Chat 宣称在智能体任务和工具使用等领域性能比肩DeepSeek V3.1及GPT-4.1 [5] - OpenAI拟在印度建设超大型数据中心 规模至少达1吉瓦 可能成为印度最大数据中心之一 [7] - 华为宣布刘德华继续担任Mate XTs非凡大师品牌大使 延续超高端品牌战略 [6] 消费电子新品 - AirPods Pro 3预计搭载心率监测和体温监测传感器 延续健康功能发展方向 [5] 行业规范变化 - 电动自行车新国标9月1日施行 对防火阻燃和防非法改装提出更高要求 部分商家以"改装灵活"为卖点清库存旧国标车 [9]
智谱开源GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%
量子位· 2025-09-02 01:40
性能表现 - 开源模型GLM-4.5在伯克利工具使用榜单以70.85%整体准确率排名第一,超越Claude Opus 4.1的70.36% [2][3][11] - 在单轮任务中非实时准确率达86.6%,多轮任务准确率达65.62%,均保持领先水平 [3][12] - 采用MoE架构,在覆盖六大开发领域的52个实际编程任务评测中表现强劲,任务完成效果和工具调用可靠性突出 [7] 成本效率 - 运行相同任务成本仅为2.9美元,相当于Claude Opus 4.1成本207.12美元的1.4% [2][3] - 相比Grok-4模型333.24美元的成本优势显著,成本控制能力行业领先 [3][12] - 推出高性价比Claude Code套餐,价格仅为Anthropic原服务的1/7 [12] 技术特性 - 推理速度表现优异,平均延迟仅2.73秒,比Claude Opus 4.1快3倍,比GPT-5快5倍 [3][10] - 已接入Claude Code、Cline、Gemini CLI等8款主流编程工具,全面支持日常开发流程 [15] - 在前端开发、跨文件修改、全栈项目构建等场景展现卓越能力 [5] 行业地位 - 编程能力接近行业标杆Claude Sonnet 4,在编码性能方面形成直接竞争 [6][8] - 在伯克利工具调用排行榜超越Claude 4、Grok-4等知名模型,确立技术领先地位 [11] - 成为开源领域重要竞争者,在工具使用榜单上击败多款闭源模型 [2][3]
截至今年6月底我国智能算力规模达788百亿亿次/秒
人民日报· 2025-09-01 23:11
算力基础设施规模 - 截至6月底在用算力中心机架总规模达1085万标准机架 [1] - 智能算力规模达788百亿亿次/秒(EFLOPS) [1] - 存力规模超1680艾字节(EB) 较2023年增长约40% [1] 大模型与平台建设 - 已发布1509个大模型 数量位居全球前列 [1] - 中国算力平台完成10省份分平台接入 实现五大要素全面贯通 [1] - 平台注册企业用户超1000家 入驻算力服务商逾100家 [1] 平台服务能力 - 作为国家级综合平台集"供需服"于一体 [1] - 上架优质算力产品110余项 接入主流大模型及垂类模型90余个 [1] - 累计沉淀数十亿条算力监测大数据 [1]
截至今年6月底 我国智能算力规模达788百亿亿次/秒
人民日报· 2025-09-01 22:07
算力基础设施规模 - 截至6月底在用算力中心机架总规模达1085万标准机架 [1] - 智能算力规模达788百亿亿次/秒(EFLOPS) [1] - 存力规模超1680艾字节(EB)较2023年增长约40% [1] 大模型发展现状 - 已发布1509个大模型在全球位居前列 [1] 算力平台建设进展 - 中国算力平台完成10省份分平台接入实现全面贯通 [1] - 平台注册企业用户超1000家入驻算力服务商逾100家 [1] - 上架优质算力产品110余项接入主流大模型90余个 [1] - 累计沉淀数十亿条算力监测大数据 [1] 平台功能特性 - 作为国家级平台集"供、需、服"于一体 [1] - 实现不同系统、平台和工具间的兼容性与互操作性 [1]
新疆交建:子公司中新数字科技公司主要围绕智慧建造、智慧监测、智能应急、智能装备四个方面开展经营活动
每日经济新闻· 2025-09-01 15:44
公司业务布局 - 子公司中新数字科技公司围绕智慧建造、智慧监测、智能应急、智能装备四大领域开展经营活动 [2] - 人工智能及大模型技术主要为现有产品提供辅助支撑功能 [2] 技术应用方向 - 人工智能技术主要服务于智慧建造领域的应用场景 [2] - 大模型技术主要应用于智能监测系统的辅助决策支持 [2] - 智能应急系统整合人工智能技术提升响应效率 [2] - 智能装备产品线采用大模型技术增强功能特性 [2] 商业价值定位 - 人工智能技术目前处于辅助支撑阶段 尚未形成独立产品线 [2] - 大模型应用主要服务于现有四大业务板块的技术升级 [2]