AI前线 - 财报，业绩电话会，研报，新闻

AI前线

搜索文档

Open AI危？劈柴哥独家揭秘Gemini 3为何将改写AI战局：谷歌的长期主义与半年重大突破节奏

AI前线· 2025-12-01 09:27

文章核心观点 - 华尔街评论员认为谷歌通过将AI系统性地集成到其成熟的盈利业务（如搜索、广告、云服务）中，构建了比OpenAI更具可持续性的商业模式，AI行业的竞争焦点正从“拼技术”转向“拼整合能力” [2][3][42][44] - 谷歌CEO Sundar Pichai在访谈中揭示了公司基于长期主义工程和全栈式AI引擎的战略，使得Gemini系列模型得以爆发，并正在推动公司所有核心产品的同步升级 [4][6][9][11][12] - 谷歌正在执行每半年一次重大突破的紧张工程节奏，并战略性地将重心转向规模化部署，例如开发下一代轻量级Flash模型以平衡性能、速度与成本 [15][16] - 谷歌的创新文化（如微型厨房的开放式交流）和高层管理者的亲身体验（如发布日获取实时反馈）是推动其AI发展的重要因素 [18][19][21][22][25][26] - 谷歌正在押注量子计算、Waymo自动驾驶、太空数据中心（Project Suncatcher）等一系列未来技术项目，作为其下一个十年的长期增长筹码 [32][33][34][35][38] - 市场动态显示，OpenAI面临商业化与融资挑战，而谷歌的AI能力已融入其整体业务，同时谷歌在AI芯片（TPU）领域的发展也受到关注，可能成为英伟达之外的重要选择 [42][43][45][51][52] 谷歌的AI战略与长期主义 - 谷歌的AI爆发源于多年长期投入，早在2016年提出“AI-First”战略前就已进行深度铺垫，其技术底座支撑了Transformer、BERT等关键成果 [6][7][8] - 当生成式AI浪潮来临时，谷歌聚焦于构建“全栈式AI引擎”，通过整合Google Brain与DeepMind、自研TPU、扩容数据中心等举措，强化基础设施，产生“乘法效应” [9] - Gemini系列模型已成为连接搜索、YouTube、Gmail、云服务、Waymo等谷歌全家桶业务的统一智能底座，Gemini 3的发布实现了所有核心产品的“同步换脑” [10][11][12] 工程节奏与未来模型规划 - DeepMind内部形成了每半年一次重大突破的高效工程节奏，这已成为谷歌AI战略的核心韵律 [15] - 谷歌未来的战略重心是规模化部署优先于单纯追求最高性能，正在全力开发下一代Flash轻量级模型，以在性能、速度和成本间找到最优平衡，降低推理成本并覆盖更广用户 [16] - 在Gemini 2.5 Pro发布的同时，Gemini 3系列的预训练已提前启动，研究与工程以流水线方式并行，迭代节奏快于外界预期 [16] - 展望2026年，谷歌计划对“全栈式架构”的所有层面进行系统性升级 [17] 创新文化与产品反馈机制 - 谷歌许多突破性点子诞生于公司的微型厨房，那里促成了顶尖科学家和工程师之间开放、自然的高质量交流，这种氛围被视为谷歌文化的迷人之处 [18][19][21] - 公司CEO在产品发布日会通过逐条阅读和回复X平台用户反馈、查看内部实时监控数据（如QPS、流量）等方式，亲身体验并迅速判断产品表现，其判断体系结合了线上监控、团队沟通、实地走访和深度交流 [22][23][24][25][26] AI的应用影响与未来押注 - AI正在改变人们的生活方式，例如通过“Vibe Coding”（氛围编码）让普通人也能进行专业级呈现和软件创作，显著降低了技术门槛 [28][29][30][31] - 谷歌正在进行的未来式押注包括：量子计算，希望五年后能像今天的AI一样全民热议；Waymo自动驾驶，认为其拐点已经到来；以及“阳光捕捉器项目”，计划在2027年将第一批TPU送入太空建造数据中心 [32][33][34][35][37] - 类似于过去对AI、YouTube、云的长期投资，当前Flow、NotebookLM等新工具正在快速走红，可能成为谷歌下一波长期增长的起点 [38][40][41] 行业竞争与市场格局分析 - 行业正从“拼技术”迈向“拼整合能力”，能够将AI稳定嵌入成熟业务的公司将在下一阶段占据优势 [44] - 与OpenAI需要单独证明盈利和不断融资不同，谷歌（Alphabet）的AI能力已融入整体业务，企业用户更关注Gemini与Google Workspace、云平台的组合集成 [42][43] - OpenAI面临严峻挑战，市场分析其可能结局包括依赖政府贷款、被微软高价收购或引发信贷切断导致科技股暴跌 [46][47] - 在AI芯片领域，谷歌TPU经过近十年投入，最新一代Ironwood关注度因Gemini 3而升高，被视为英伟达GPU之外的重要潜力选择 [51][52] - 谷歌计划在其TPU v9 AI芯片中采用英特尔的EMIB先进封装技术，替代部分台积电方案 [50]

人间清醒 Linus：不玩 AI 编程工具，却为 Vibe Coding 点了个赞，还爆料 AI 治服了当年被他怒喷的英伟达

AI前线· 2025-12-01 09:27

AI在软件开发中的作用 - Linux创始人Linus Torvalds对AI辅助编程（vibe coding）总体持正面态度，认为其适合作为编程入门方式，但不适用于生产级代码，否则在维护层面会"糟糕透顶"[2][30][32] - 目前未使用AI辅助编码工具，但认为vibe coding能帮助新手降低计算机系统复杂度带来的入门门槛，让电脑帮助实现原本做不到的事情[5][28][29] - 将AI类比为编译器，认为其像当年从手写汇编过渡到高级语言一样提高生产力，但不会取代程序员，反而可能催生新领域需要更多软件工程师[5][34][35] Linux内核开发演进 - Linus Torvalds过去20年角色已从程序员转变为技术负责人和维护者，主要工作是引导项目方向而非亲自编写代码[3][9][10] - 开发流程出现显著变化：从主要对新想法说"不"转变为更常鼓励尝试新事物，如推动Rust语言引入内核以打破维护者惯性[12][13] - Linux内核开发重点已从新增功能转向长期维护，35年后仍在重写核心代码以提升可维护性和稳定性，每个版本有上千人参与[11][15] AI对开源社区的影响 - AI爬虫对kernelorg源码基础设施造成重大干扰，大量抓取数据给维护工作带来麻烦[4][23] - 收到由滥用AI生成的虚假错误报告和安全通告，消耗维护者时间精力，但对内核项目影响小于curl等项目[4][25] - AI热潮促使Nvidia在Linux内核领域转变为"好公民"，20年前这一情况并不成立，现在有来自Nvidia的内核维护者参与[4][21] Rust语言在内核中的进展 - Rust引入Linux内核已5年，实际代码存在3年，正在从实验品转变为内核真正组成部分，但推进速度比预想慢[3][14][15] - Rust引入引发维护者争议，包括代码格式化审阅不熟悉等问题，甚至导致个别维护者辞职，但Linus认为值得推进[13][14] - 内核每个子系统都存在类似Rust的争论，争论是开发过程和发现bug的正常部分，只是Rust受到媒体更多关注[14] 行业技术格局变化 - 认为通用CPU仍是系统最有趣部分，Linux作为基础负责维护启动用户界面等核心功能，AI加速器只是行业新宠[17][18] - GPU运行闭源微内核和CUDA软件栈与用户态商业闭源应用性质相同，内核只需在资源管理虚拟内存等关键领域深度介入[19][20][21] - 期待AI从炒作风口转变为日常现实技术，像编译器一样成为不被过度讨论的常规工具[5][24]

某车企录音曝光，周六没加班被逼离职？腾讯工作满15年可退休，一次领21个月工资；一Bug致审稿人信息全泄露，学术圈大乱｜AI周报

AI前线· 2025-11-30 05:33

学术会议数据安全事件 - OpenReview平台出现系统级漏洞，导致ICLR、NeurIPS、ACL等多个计算机顶会的双盲评审机制失效，审稿人、作者及领域主席的姓名、邮箱、单位等个人信息被泄露[3] - 该漏洞允许在特定API链接中输入相关字段即可获取隐匿信息，甚至过往年份各大顶会的审稿人名单也被人爬取[3] - 漏洞引发连锁反应，有作者找到给自己论文打低分的审稿人，部分恶意打低分的审稿人在身份曝光后提高了评分，对双盲评审制度造成巨大冲击[4] 腾讯人力资源政策 - 腾讯推出“荣誉退休”方案，员工入职满15周年后可提前解锁该福利，在法定退休福利外，公司将额外提供“N+6”的一次性退休金[6] - 荣誉退休的前提是必须在腾讯以正式员工身份连续工作满15周年，且最近一次绩效考核不能落在最差一级[6] 公司高管及创始人动态 - 彭志辉（稚晖君）当选上纬新材第四届董事会董事长，其曾任职于OPPO研究院AI实验室，并通过华为“天才少年”计划加入华为，现任智元创新联合创始人、总裁、CTO，B站粉丝达283.7万[7] - 华为云进行重大组织调整，张平安由原CEO升任董事长，周跃峰接棒CEO，同时新设5大云研发产品线，此次调整源于AI时代华为云的战略定位升级[12] 人工智能与大模型战略 - 百度新设基础模型研发部和应用模型研发部，分别由吴甜和贾磊负责，均直接向CEO李彦宏汇报，旨在采取分进合击打法加强公司在人工智能方向的核心优势[8] - 百度发布原生全模态大模型文心大模型5.0，该模型在LMArena上取得文本榜全球并列第二、国内第一及视觉理解榜国内第一的成绩[8][9] - 阿里通义千问团队在注意力机制上的研究成果获NeurIPS 2025最佳论文，成为唯一获得该奖项的中国团队，该研究成果已应用于Qwen3-Next模型[29] 科技产品与研发进展 - 阿里巴巴发布夸克AI眼镜，首发S1和G1两个系列共六款单品，最低到手价分别为3799元和1899元，均搭载阿里千问AI助手，具备导航、支付、AI问答等功能[18] - 谷歌已立项两个AI眼镜项目并进入小批量试产阶段，硬件代工由富士康负责，预计最早于2026年第四季度发布[19] - 华为发布智能情感陪伴型电子宠物“智能憨憨”，售价399元，搭载华为小艺大模型，具备多模态互动体验和专属日记记忆系统[33] 企业裁员与成本削减 - 苹果公司裁撤部分销售团队，公司称此举是为了加强客户参与度，仅少数职位受影响，受影响的员工可在公司内部申请新职位[10] - 惠普宣布在全球范围内裁员约10%，即4000至6000人，目标在2028财年结束前实现每年节约10亿美元，这些资金将来自把人工智能工具应用于多个领域[13] 供应链与产业竞争 - 天风国际证券分析师郭明錤表示，英特尔有望成为苹果部分M系列处理器的先进制程代工供应商，苹果正等待英特尔于2026年第一季度推出PDK 1.0/1.1[11] - 特斯拉前全球销售主管透露，特斯拉曾拆解多款中国电动汽车并借鉴相关做法，包括零部件复用，这一做法后来在Model 3和Model Y上得到体现[14] - 台积电对前资深副总经理罗唯仁提起诉讼，指控其退休时带走2纳米、A16、A14纳米等最先进制程技术相关机密资料，并前往英特尔公司任职[20] 大模型技术突破 - DeepSeek发布DeepSeekMath-V2模型，基于DeepSeek-V3.2-Exp-Base，在IMO 2025与CMO 2024中均达到金牌水准，在Putnam 2024中取得118/120的优异成绩[31] - 硅谷创业公司Prime Intellect发布INTELLECT-3模型，该模型为拥有1060亿参数的MoE推理模型，基于GLM-4.5-Air-Base进行后训练，模型、训练框架及环境均以宽松许可证开源[25] - OpenAI推出免费的AI购物研究工具，专为ChatGPT用户在美国假日季期间提供个性化购物建议，该工具采用GPT-5 mini的新版本模型[30] 企业社会责任 - 多家科技企业捐款驰援香港大埔火灾救援，包括腾讯基金会捐款1000万港元、小米基金会捐赠1000万港元、马云公益基金会捐赠3000万港元、阿里巴巴集团捐款2000万港元、蚂蚁集团捐赠1000万港元[16]

AI前线· 2025-11-30 05:33

AI发展范式转变 - 单纯依靠算力规模扩张的"大力出奇迹"时代可能已经结束，即使资源增加100倍也未必能带来AI能力的质变[2] - AI发展正从"规模扩张时代"重新回到"研究驱动的时代"，但这次研究建立在前期积累的超大算力基础之上[16][42][45] - 当前AI进展的瓶颈已从"算力"转向"想法本身"，行业内公司数量远多于真正新颖的思路[16][60] 当前AI模型的局限性 - 现有大模型出现明显断层：在基准测试中成绩惊人，但在简单真实任务中经常翻车，智能表现脆弱[16][17] - 模型泛化能力远逊于人类，既体现在需要海量数据、样本效率极低，也体现在教授复杂任务非常困难[16][47] - 强化学习可能让模型变得过于单一目标驱动，过度聚焦评测分数反而削弱了向真实应用场景泛化的能力[16][19] 未来AI发展方向 - 实现通用人工智能可能还需要更多突破，持续学习和样本效率是常被提及的两个方向[5] - 价值函数被认为是重要发展方向，能让AI更高效地学习，预计未来会广泛应用[37][46] - 人类学习机制为AI发展提供重要启示，人类拥有强大的内部价值函数和鲁棒的学习机制[55][56] AI经济影响与部署策略 - 即使没有进一步研究突破，当前技术范式也足以产生巨大的经济和社会影响[5] - 最强大的AI部署关键在于能够把在整个经济体系中各个实例的学习结果合并起来，这种集体知识汇聚可能触发智能爆炸[16][81] - AI部署应该采用渐进式方式，让社会逐步接触和适应，而不是一次性推出完全成熟的超级智能[72][73][85] 行业竞争格局 - 行业内专家共识远多于分歧，普遍认为通用人工智能大概率会在20年内实现，而非需要100多年[5][111] - 当前AI行业公司数量多于真正新颖的思路，竞争格局呈现同质化趋势[60][113] - 随着AI能力提升，不同公司可能会在技术路径和对齐策略上逐渐收敛[115][116] 研究资源分配 - 用于研究的算力需求相对可控，AlexNet仅用2块GPU，Transformer初期实验使用8-64块GPU[61] - 大公司算力被分割到不同模态和产品线，真正用于纯研究的算力差距并不像表面数字那么大[63][66] - 研究时代需要的是思维多样性而非简单算力堆砌，思维多样性比同质化复制更重要[124]

Artificial Intelligence

Artificial Intelligence

不用上传数据了！苹果正式开源 Embedding Atlas，用 Rust+WebGPU 在桌面实现科研级数据分析

AI前线· 2025-11-29 05:32

苹果开源工具Embedding Atlas发布 - 苹果正式发布全新开源工具Embedding Atlas，支持对大规模嵌入向量进行交互式可视化与探索，专为研究人员、数据科学家及开发者打造[1] - 该平台提供快速直观方式分析从文本嵌入到多模态表示等复杂高维数据，无需任何后端基础设施或上传外部数据[1] - 系统完全在浏览器端运行，所有计算任务均在本地完成，保障数据隐私与可复现性，支持流畅交互探索数百万个数据点[1] 核心技术特点 - 借助简洁WebGPU驱动界面，用户可实时缩放、筛选和搜索嵌入向量，极简设置即可识别数据模式、聚类及异常点[1] - 提供自动聚类与标记、核密度估计、顺序无关透明度处理及多视图协同元数据展示等关键可视化功能[1] - 底层依托苹果最新研究成果，融合Rust编写聚类模块与WebAssembly版UMAP实现，显著优化降维计算性能[2] 应用场景与开发支持 - 工具包适用于跨领域探索模型表征，开发者可审视模型语义编码、对比不同训练批次嵌入空间，为检索及可解释性研究构建交互式演示[2] - 提供Python包和npm库，Python包支持命令行处理DataFrame数据或集成到Jupyter Notebook及Streamlit应用[5] - npm包提供EmbeddingView、EmbeddingViewMosaic等可复用UI组件，使开发者能将可视化引擎集成到自有Web工具或仪表板中[5] 社区反响与部署方式 - 工具支持图像数据应用，只需将图像转化为高维向量并映射回概念空间即可实现更好效果[3] - 已在GitHub以MIT许可证开源，附演示数据集、文档及安装指南，融合浏览器原生性能优势与科研级功能[3] - 设计目标让用户像导航地图一样直观理解嵌入向量，将可视化能力直接部署到桌面及笔记本环境中[3]

100+企业已经申报，榜单倒计时一天！2025年度中国技术力量榜单申报即将截止

AI前线· 2025-11-29 05:32

活动基本信息 - 2025中国技术力量年度榜单报名将于11月30日截止，目前仅剩一天[2][3] - 今年是InfoQ连续第五年举办该榜单评选，每年收到超过100家企业案例申报[4] - 评选结果将于12月19日在AICon·北京站揭晓并举行颁奖典礼[8] 参与企业阵容 - 参与企业阵容强大，涵盖行业巨头与创新代表[4] - 包括阿里、腾讯、京东、百度、字节跳动、网易、科大讯飞、蚂蚁科技、神州数码、商汤科技等行业巨头[4] - 昆仑万维、博查科技、无问芯穹、小影科技等创新代表也积极加盟[4] 榜单主题与方向 - 榜单以"洞察AI变革，见证智能未来"为主题[4] - 围绕AI基础设施、工程与部署、智能体生产力、行业应用、数据智能、AI Coding、具身智能与开源八大方向展开[4] - 全面展现AI在技术突破与产业落地上的新成果[4] 具体奖项类别 - 共设置八大榜单类别，涵盖AI各细分领域[5] - 包括2025年度AI基础设施卓越奖TOP20、AI工程与部署卓越奖TOP20[5] - "人工智能+"行业最佳解决/落地方案TOP20、AI Agent最具生产力产品/应用/平台TOP15[5] - Data & AI最具价值产品/平台TOP10、AI Coding最具生产力产品TOP5[5] - 具身智能明星产品TOP10、AI开源明星项目TOP10[5] 评选规则与标准 - AI工程与部署卓越奖等五大奖项评审规则为专家团打分70%，InfoQ主编团30%[9] - AI基础设施卓越奖等三大奖项评审规则为专家团打分70%，InfoQ主编团与用户评分30%[11] - 用户评分在模力工场平台进行，由评论、点赞等数据构成的算法计算得出[11] - "人工智能+"行业最佳解决方案重点考察内部落地效果、资源投入情况、可复制性及行业参考价值[14] - Data & AI领域数据安全与合规是重要评分维度[14] - AI Coding奖项因大量工具出现和开发者试用，用户评分占比较高[14] - 具身智能领域除产品本身外，重点关注市场落地潜力[14] - AI开源项目评估技术和项目成熟度外，还关注开源协议遵守情况和社区活跃度[14] 活动议程与交流 - AICon·北京站为为期两天的盛会，汇聚头部企业和创新团队的行业专家[8] - 聚焦Agent、AI编程、具身智能和多模态等热门AI议题[8] - 参会者有机会与专家进行深度交流，探讨前沿技术落地经验与战略思考[8]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

千亿骗局穿帮，谷歌亲自打假！这家AI公司CEO履历造假、30 亿融资也假，深套1500人

AI前线· 2025-11-29 05:32

公司概况与核心业务 - Infinite Reality成立于2020年，原专注于企业级元宇宙解决方案，业务涵盖虚拟会议平台和数字资产交易系统[3] - 公司致力于构建沉浸式3D虚拟空间，结合AI与空间计算技术，推动下一代数字媒体和电商体验[6] - 拥有端到端平台"iR Engine"，支持虚拟空间创建、管理和分析，为音乐、娱乐、电商、社交等行业提供基础[7] - 2025年5月，公司更名为Napster Corporation，以统一其技术平台与音乐品牌Napster[6] 融资与估值动态 - 2025年初宣布从匿名投资者处获得30亿美元融资，并在全股票收购后自报估值飙升至155亿美元[2] - 2024年7月完成3.5亿美元新增投资，收购Landvault后估值升至约51亿美元[8] - 公司设定目标市值在2025年提升至500亿至1000亿美元[2] - 公司2024年营收达到7500万美元（高于2023年的5000万美元），但155亿美元估值相当于其营收的200倍，远超同业水平（Anthropic估值约为营收44倍，OpenAI约为24倍）[9] 收购与扩张战略 - 收入几乎全部来自2022年以来全股票收购的十余家公司，包括Thunder Studios、ReKT、Napster等[11] - 为增强AI能力，于2025年以约5亿美元收购AI公司Touchcast，其专注于"Agentic AI"技术[8] - 收购Landvault（专注于数字孪生技术）和社交体育平台Stakes，快速扩张业务版图[8] 估值与合作关系的质疑 - 公司将高估值归因于与谷歌的"五年战略合作伙伴关系"，但谷歌澄清其仅为谷歌云普通客户，否认特殊合作关系[11] - 30亿美元融资全部来自一位匿名投资者，耶鲁商学院教授指出这种巨额单一来源投资真实性存疑[12][13] - 元宇宙开发商Improbable和Animoca Brands均表示未接触过该公司，对其高融资表示不解[17][18] 融资承诺落空与内部动荡 - 2025年11月，公司CEO公开表示此前声称的33.6亿美元融资可能永远不会到账[18] - 公司第四次承诺股份回购后取消，导致员工和早期投资者无法套现[20][21] - 2025年7月公司裁员约三分之一（约100名开发人员），9月首席法律官和首席财务官离职[24] 行业背景与市场环境 - 2024年科技公司融资总额飙升至2090亿美元，较五年前1750亿美元和十年前870亿美元显著增长[15] - 元宇宙领域风险投资从2022年56亿美元骤降至2024年14亿美元，Meta投入超500亿美元但主要产品月活跃用户不足20万[16] - 公司与中介机构Cova Capital合作，后者曾因"未进行足够尽职调查"被FINRA罚款[24] 监管调查与潜在风险 - 美国证券交易委员会（SEC）正在调查公司2022年计划以18.5亿美元估值进行的反向并购交易[22] - 司法部（DOJ）调查聚焦于投资人及资金去向，但公司目前并非调查对象[23] - 法律人士指出若公司明知融资不具备兑现条件仍作出错误陈述，可能触及证券欺诈红线[24]

抛弃“级联”架构！快手OneRec用大模型重构推荐系统，服务成本降至1/10

AI前线· 2025-11-28 02:54

传统推荐架构的瓶颈与范式局限 - 传统级联式推荐架构将召回、粗排、精排与重排割裂，导致反馈难以闭环，模块间不一致性持续累积，算力利用效率长期偏低[2] - 从FM模型到基于行为序列的精排模型，单个推荐item的计算量提升了约5个数量级，但近两年LLM技术突飞猛进时，推荐领域创新却更多停留在精排等局部环节的微调上[5] - 直接采用LLM架构服务推荐面临三大挑战：推荐模型规模已达T级参数、毫秒级延迟要求严苛、大模型推理成本可能难以被业务收益覆盖[6] 大模型应用于推荐的可行性分析 - 对“模型已足够大”的判断应聚焦“激活参数”，推荐模型在线推理的激活参数远小于典型语言模型，例如快手约250M，同行baseline从16M提升至1B，说明仍有充足scale-up空间[7] - 在信息流场景测算中，假设CPM为20元，广告占比10%，则10,000次曝光收入20元，以DeepSeek模型为参照，20元可购买到输入与输出各2M Token的算力，理论毛利约84.5%[9] - 若单次曝光服务消耗1,000 Token，在保持80%计算毛利的条件下，单次曝光可投入0.0004元，对应约15.2T FLOPs计算能力，可支持约7.6B参数规模的模型在线服务[12] - 传统级联式推荐系统由于算力高度碎片化，广义MFU可能仅为1%甚至更低，而测算中按40% MFU计算，成本可行性结论与不少团队的直观感受存在差异[13] OneRec生成式推荐框架的核心设计 - OneRec将原有稀疏ID通过多模态表征离散化为一串Token序列（语义ID），使用Behavior Transformer处理用户行为序列，再以多层Decoder进行生成，反解回原始item ID完成推荐[18] - Tokenizer方案通过Vision-Language Model处理视频原始信息，引入item-to-item和语义保持两类Loss，确保表征既能理解视频内容又能抓住推荐关键信息，泛化性强，可编码新上传视频[19][23][24] - 强化学习设计了三类奖励：用户体验与兴趣偏好、业务与生态约束、编码规则约束，将传统多目标建模简化为统一逻辑输出，系统能在天级完成业务生态控制响应，所需样本量约为传统的1/1000[26][27] OneRec的落地应用效果 - 在快手单列短视频场景，OneRec带动主站综合LT提升0.077%，极速版综合LT提升0.118%，资源开销仅为线上大盘推荐系统的1/12[28] - 本地生活场景中，本地大盘GMV提升5.09%，本地短视频GMV提升21.01%，订单数提升17.89%，买家数提升18.58%，新买家数提升23.02%[28] - 电商商城场景中，买首feed GMV提升6.41%，订单量提升4.22%，买首feed商品GMV提升14.706%，订单量提升8.352%[28] - 全量推送中仅以原线上系统推理成本的1/10，在更低计算成本下使用更大模型并取得更优效果，用户更愿意持续下滑，为插入更多视频与商业化内容提供增量空间[29] OneRecV2的定制优化与Scaling Law验证 - 早期Encoder-Decoder架构存在计算与监督错配，训练资源近90%消耗在用户历史编码上但无直接Loss监督，优化后移除了用户历史编码阶段大部分计算，将主要算力集中到后端Decoder Transformer[33] - 优化带来约94%的训练资源节省，在等量资源下，模型规模从0.5B显著放大至8B，随着模型规模扩大，损失呈平滑且可预测的下降趋势，与scaling law拟合结果一致[33][35] OneRec-Think：生成与理解统一的进展 - 尝试将文本、图像与行为数据进行联合训练，构建既能“说话”又能“推理”的推荐模型，底层以ViT等组件处理图像得到图像Token，SID由自研Tokenizer产生，上层使用统一LLM完成解码与理解[36][38][40] - 模型具备交互式推荐能力，当用户提示发生变化时，思考路径会发生明显转折，在理解既往偏好基础上依据新提示生成匹配推荐，已实现“生成—理解”统一、覆盖多模态的模型原型[40][41] - 当前推荐效果尚未全面超越线上仅以行为数据训练的模型，且成本偏高不适合全量在线应用，但方向的可行性已得到验证，行为数据与语言、图像数据融合有望催生更智能模型[40][41]

“在数学上，中国模型没输过”！DeepSeek 深夜屠榜，Math V2 以碾压姿态终结“最强数学模型”之争

AI前线· 2025-11-28 02:54

模型发布与核心突破 - DeepSeek于11月27日无预告开源数学推理模型DeepSeek-Math-V2，参数规模达685B，是业内首个达到国际奥林匹克数学竞赛金牌水平且全面开源的数学模型[2] - 该模型在IMO-ProofBench基准测试中表现突出，Basic子集得分近99%，领先第二名Gemini DeepThink 10个百分点；Advanced子集得分61.9%，略低于Gemini DeepThink的65.7%[5] - 在真实竞赛中，模型在IMO 2025和CMO 2024达到金牌水平，Putnam 2024测试中获得118分（满分120），显示强劲定理证明能力[7] 技术架构创新 - 模型核心突破在于自验证机制，使模型具备检查自身推理链完整性和逻辑自洽的能力，避免“答案正确但过程错误”的问题[13][15] - 自验证机制让模型能在无标准答案的开放问题中继续提升能力，通过多次检查和修正思路，在使用更多算力时获得更高正确率[16] - 研发团队训练高精度验证器检查定理证明逻辑正确性，并作为奖励模型训练证明生成器，形成持续进化的闭环系统[16] 性能表现数据 - 在具体竞赛题目表现：IMO 2025问题P1-P5得分83.3%，CMO 2024问题P1、P2、P4-P6得分73.8%，Putnam 2024问题A1-B4、B5、B6得分98.3%[8] - 与前一版本DeepSeek-Math-7B相比，新模型参数规模从7B提升至685B，性能实现重大跨越[4] - 模型成绩是在未依赖大规模“题库答案”训练前提下取得，显示其真正的数学推理能力[7] 行业影响与评价 - 海外开发者社区对开源反应强烈，有评论称模型在Basic基准上以10个百分点优势击败谷歌Gemini DeepThink，远超市场预期[18] - 社区期待将强大数学能力应用于代码编写，特别是数学软件领域对数学正确性要求高的场景[20] - 有观点认为数学推理是AI推理任务中最苛刻的领域，DeepSeek数学团队可能是最具潜力的王牌团队[23] 技术发展趋势 - 自验证机制为处理无标准答案的开放问题提供路线图，使数学AI向“像数学家一样思考”迈进[17] - 该模型的开源重新定义大模型数学推理研究竞争格局，可自验证推理成为下一代数学型AI关键技术路径[25] - 过去一年强化学习技术提升数学推理任务表现，但正确答案不等于正确推理，过程验证成为关键突破点[12]

Self-verification mechanism

Mathematical AI

Artificial Intelligence

DeepSeek-Math-V2

Gemini DeepThink

Self-verification mechanism

Mathematical AI

Artificial Intelligence

DeepSeek-Math-V2

Gemini DeepThink

小米狂吸机器人技术大牛，前特斯拉Optimus工程师也来了

AI前线· 2025-11-27 06:30

小米机器人团队人才引进 - 前特斯拉Optimus灵巧手团队成员卢泽宇加入小米机器人团队并担任灵巧手负责人[2][3] - 卢泽宇在特斯拉工作2年多深度参与Optimus手部研发包括触觉传感器开发、灵巧抓取与操作、手部结构设计等关键技术[3] - 卢泽宇于2025年10月入职小米已工作2个月其目标是加速灵巧手技术路径收敛和工程化落地[6][7][8] 卢泽宇专业背景 - 2023年博士毕业于新加坡国立大学专业方向为机电、机器人与自动化工程深耕机器人灵巧操作、嵌入式系统、触觉传感等技术[9] - 在特斯拉期间从实习生成长为全职工程师参与Optimus灵巧手核心研发链路涵盖触觉传感器概念评估、样机验证、手部结构设计等[13] - 具备从硬件到底层感知再到结构与操控的完整经验横跨模拟与数字信号处理、雷达感知、电源系统等底层硬件方向[13] 小米机器人战略布局 - 公司当前开放机器人相关岗位达257个其中包含12个灵巧手机器人方向职位覆盖机械设计、执行器研发、具身抓取算法等关键环节[19] - 2023年成立北京小米机器人技术有限公司计划五年投资20亿元在亦庄建设仿人机器人研发与制造基地[31] - 通过智造基金、长江产业基金、顺为资本等机构构建具身智能投资网络累计投资近50家企业金额超150亿元覆盖核心零部件、整机系统与应用场景[35] 技术研发进展 - 2024年11月开源首个跨域具身大模型MiMo-Embodied该模型在自动驾驶与具身智能两大领域共29项基准测试全部拿下第一[20][24] - 2025年2月新增两项与机械手及机器人相关的专利指向公司在灵巧手技术上的深入布局[33] - 公司通过投资强化核心零部件布局如入股国华智能聚焦谐波减速器与行星滚柱丝杠投资坤维科技强化六维力传感器产能[36] 行业动态与竞争 - 特斯拉将2025年机器人量产预期从5000多台削减至2000台手部灵巧性仍是瓶颈正在敲定Optimus V3设计预计搭载26个执行器[16][18] - 小米铁蛋机器狗首次将价格打至万元以下仅为波士顿动力机器狗的1/50但铁蛋2商业化失败后机器人业务一度陷入沉寂[24][29] - 2024年小米机器人整体并入小米汽车体系被产业界解读为通过自动驾驶技术更务实、产业化地推进机器人研发[31]