量子位 - 财报，业绩电话会，研报，新闻

量子位

搜索文档

认知偏差、落地断层、体验割裂是目前AI产品的三大痛点｜百度王颖@MEET2026

量子位· 2025-12-19 01:01

编辑部整理自 MEET2026 量子位 | 公众号 QbitAI 当AI从"能说会道"的聊天伙伴，演进为"能想会做"的行动助手，一个关键问题却日益凸显：为什么AI能力越强，用户完成复杂任务反而越"累"？认知偏差、落地断层与体验割裂，正成为横亘在AI普惠面前的三大鸿沟。对此，百度集团副总裁，文库事业部、网盘事业部负责人王颖在量子位MEET2026智能未来大会上，分享了 AI时代下的"超级个人智能体" 。AI超越问答与生成，转向深度融合个人记忆、理解复杂意图、自主调度多能力协同执行的综合性智能伙伴。她系统阐释了百度如何通过核心调度中枢GenFlow及全新智能体生态，将百度文库与百度网盘重塑为 " 最懂你、能搜索、会干活"的超级个人助手，并披露了其全球化进展。 MEET2026智能未来大会是由量子位主办的行业峰会，近30位产业代表与会讨论。线下参会观众近1500人，线上直播观众350万+，获得了主流媒体的广泛关注与报道。核心观点梳理 …… 以下为王颖演讲全文：为完整呈现王颖的思考，在不改变原意的基础上，量子位对演讲内容进行了整理编辑，希望能给你带来更多启发。认知偏差、落地断层 ...

量子位· 2025-12-18 09:26

金磊发自凹非寺量子位 | 公众号 QbitAI 这一次，我真的分不清视频到底是不是AI生成的了。来，咱们先来看一下这段演技飙升的视频片段： Prompt：女子泣不成声，说台词："江辰……你一定要活着回来，好吗？……答应我"。女子边说话边将右手抬起抚摸男子的脸。背景音乐伤感。影视级。这台词、这演技、这眼神、这口型，不说是AI生成的，一般人绝对会以为是哪个电影里的片段。但重点还不是效果的逼真—— 因为这10s的片段，人物对白配音、视频背景音乐和音效，统统都是通过上面的Prompt 一锅出的。这就是刚刚火山引擎在FORCE原动力大会上推出的最新豆包视频生成模型Seedance 1.5 Pro 。主打的就是音画高精同步，一镜入戏。就这个功能一出，打造一个有趣好玩的小短片，那真是分分钟的事情了。例如我们以这位AI女主角为原型：然后就可以用Seedance 1.5 Pro搞一个"川剧"—— 《至辣园》：从这两个实测案例中，我们不难看出，这次豆包视频生成模型Seedance 1.5 Pro整体亮点可以总结为：目前，Seedance 1.5 Pro已经上线即梦AI 和豆包 ...

AI视频生成

人工智能

豆包视频生成模型Seedance 1.5 Pro

AI视频生成

人工智能

豆包视频生成模型Seedance 1.5 Pro

港股通用GPU第一股也冲刺了！哈佛博士带队，估值209亿

量子位· 2025-12-18 09:26

杰西卡发自凹非寺量子位 | 公众号 QbitAI 国产GPU组队过年！估值209亿的通用GPU独角兽壁仞科技，刚在港交所通过聆讯，即将敲钟，冲刺港股"国产GPU第一股" 。创始人张文，哈佛法学博士，2019年带队创业，更早之前是作为商汤总裁为人熟知。公司成立3个月就吸引到了天使轮融资，6年间融资不下10轮，背后站满了启明创投、IDG资本、高瓴创投、格力创投等知名投资者。算上最近在A股刚上市的摩尔线程和沐曦，这个月已经有三家国产GPU公司在资本市场传出了好消息。壁仞科技在做什么？壁仞科技，是一家研发通用GPU芯片及智能计算解决方案的AI基础计算公司，为AI训练和推理提供从云端到边缘的全栈支持。公司的核心产品智能计算整体解决方案，由两部分组成：一块是基于自研GPGPU架构的硬件系统，专为AI负载（尤其是LLMs）设计，支持多模态融合和大规模模型训练。其GPGPU芯片支持兼容主流的第三方软件平台，也可以被集成到行业标准硬件形态规格中，如PCIe板卡及OAM。整个不同配置的PCIe板卡、OAM、GPGPU服务器或服务器集群，共同组成了壁仞科技的GPGPU的硬件系统。 ...

量子位· 2025-12-18 09:26

岗位均为全职，工作地点：北京中关村。岗位面向：加入我们，你可以获得：以下是岗位详情：所有岗位不同能力层级职位均在开放，欢迎结合个人履历和经验申请。编辑部发自凹非寺量子位 | 公众号 QbitAI AI热潮还在汹涌，但如果你还不知道如何参与……那为什么不来量子位呢？我们是一家以追踪AI新进展为核心的内容平台，经过8年积累，目前拥有顶流影响力，广泛且备受认可的产业资源，以及时代风口的最佳观测和学习生态位。目前，我们有三大方向岗位招聘，希望你是（或者能成为）这三个方向的内容专家： AI产业方向岗位职责： AI产业方向：关注基建层创新，包含芯片、AI Infra、云计算； AI财经方向：关注AI领域创投和财报，跟踪产业链资本动向； AI产品方向：关注AI在应用和硬件终端方向的进展。社招：覆盖编辑、主笔、主编各个层级，按能力匹配岗位；校招：应届毕业生，接受实习且可转正。站在AI浪潮之巅：第一时间接触和了解AI领域最新技术和产品，构建完整的AI认知体系。玩转AI新工具：将各种AI新技术、新工具应用于工作，提升工作效率和创造力。打造个人影响力：通过撰写独家原创内 ...

行啊AI PC！现在都能隔空测血压、检测皮肤了

量子位· 2025-12-18 09:26

文章核心观点 - AI PC通过集成专用硬件（如NPU）和创新的AI算法，实现了无需联网、无需接触的实时健康与皮肤检测功能，这代表了端侧AI应用的重大突破，正在重新定义个人计算设备的边界和价值 [39][44] AI PC的创新应用案例 - 科思创动公司推出了基于AI PC的“个人健康助手”应用，仅需一个外接USB摄像头，即可实现非接触式健康检测，能测出心率、血氧、收缩压、舒张压、血管硬化风险、血糖浓度、心率不齐、房颤、心肌缺血及呼吸波动等多项指标 [5][7] - 该公司还推出了“隔空皮肤检测”应用，可快速生成皮肤报告，分析敏感肌、油分、缺水等问题，并精准标出如痤疮等问题的具体位置，甚至能准确评估皮肤年龄与实际年龄相符 [8][11][12][14] - 除了检测，配套的“AI美妆顾问”能基于肤质分析，提供一对一的个性化护肤方案和美妆方案，推荐具体到品牌和化妆步骤的产品 [15][16] - 上述所有检测和分析功能均可在AI PC上断网运行，无需连接互联网 [17] 核心技术原理 - 隔空健康检测的核心算法是远程光电容积描记术（rPPG），通过摄像头捕捉面部或手部视频流，分析由血流引起的皮肤表面微小亮度波动，从中提取生理信号并推算各项健康指标 [20][23][24] - 该技术还能通过分析血流动力学特征来评估血管硬化风险和潜在心脏问题 [25] - 隔空皮肤检测依赖于光学成像、光谱分析及偏振光成像技术，结合AI算法，通过分析皮肤对不同波长光的反射信号来量化评估肤质、深层血管及色素等问题 [27][29] AI PC的硬件支撑与优势 - 复杂算法的实时运行依赖于英特尔酷睿Ultra处理器内置的神经处理单元（NPU），这是一个专为AI推理设计的硬件引擎 [31] - 与CPU和GPU相比，NPU在处理AI模型时具有超低功耗、超高效率和极低延迟的优势，能高效处理海量视频帧数据和复杂运算 [33][34] - NPU的端侧计算能力使得整个检测过程完全在本地设备完成，无需上传数据至云端，保障了用户隐私安全 [38] - AI PC的“xPU+”异构计算架构（CPU+GPU+NPU）提供了强悍算力，保障了响应速度与能效比，是许多高效能、高隐私要求的AI应用得以运行的基础 [43] 行业趋势与影响 - 随着英特尔酷睿Ultra处理器与AI PC的深度结合，越来越多的独立软件开发商（ISV）正围绕端侧AI能力，开发只有在AI PC上才能高效运行的专属应用 [41] - AI PC的端侧智能正从健康管理、创意生产、办公提效到个性娱乐等多个方面，重新定义人机交互的边界 [44]

经验记忆黑科技！LightSearcher让AI工具调用减39.6%、推理快48.6%

量子位· 2025-12-18 09:26

文章核心观点 - 深度思考大模型在利用外部搜索工具（DeepSearch）提升推理准确性时，面临准确率与效率难以兼顾的“跷跷板”困境 [1] - 北京邮电大学百家AI团队提出的LightSearcher框架，通过基于经验记忆的强化学习优化技术，有效解决了这一困境，在保持顶尖准确率的同时，显著提升了工具调用效率 [1][14] 深度思考大模型的困境与挑战 - **困境本质**：频繁调用外部搜索工具能补充实时与领域知识、提升推理准确性与事实可靠性，但会导致计算开销激增、推理延迟大幅升高，等待时间可达几十秒至几分钟 [1][4][5] - **用户体验风险**：信息加载时间超过10秒会导致50%的移动用户放弃访问，长时推理等待存在类似的用户流失风险 [6][7] - **效率妥协的代价**：反之，若为提升效率而减少工具调用，则会因大语言模型内部知识局限，导致推理结果的准确性与完整性不足 [8] - **现有方法的缺陷**：提示工程或监督学习方法依赖人工标注，成本高且泛化差；而强化学习驱动的方法奖励偏重准确性，易导致模型为确保正确而过度调用工具，造成冗余开销和效率低下 [10][11][12][13] LightSearcher框架的解决方案 - **核心思路**：在强化学习推理过程中，通过“对比经验学习”将隐性推理轨迹转化为显性指导经验，并结合自适应奖励来优化工具调用策略 [14][15] - **关键组件一：对比经验推理机制**：收集高质量与低质量的推理轨迹，通过大语言模型生成成功模式的自然语言总结，构建动态经验记忆库 [16] - **关键组件二：自适应奖励塑造机制**：引入最小工具调用基准，仅在答案正确时惩罚冗余调用，并使用指数衰减函数动态平衡准确性和效率，避免盲目优化 [16] - **关键组件三：基于经验的强化学习训练机制**：采用GRPO算法，将积累的经验和少样本示例融入提示模板，指导模型生成高效推理轨迹，确保探索与利用的均衡 [16] - **优化目标**：最终优化目标为多目标奖励函数的加权和，旨在协同提升工具调用精简度与答案质量 [18] 实验性能与效果 - **准确性保持顶尖**：在四个多跳QA基准数据集上的实验显示，LightSearcher在F1分数和大语言模型评判得分上与当前最优的ReSearch基线相当，部分数据集上甚至更优 [19][22] - **效率显著提升**：与基线相比，搜索工具调用次数减少39.6%，推理时间缩短48.6%，Token消耗降低21.2% [2] - **泛化能力强**：在不同难度的查询上表现稳定，在域外测试集上也超越了依赖固定检索的迭代方法 [23] - **消融实验验证核心作用**：移除经验记忆组件导致F1分数下降7.2%，证明其核心作用；同时移除经验与少样本示例则导致F1分数下降8.8% [24][25] 技术意义与应用前景 - **技术路径创新**：该框架通过“对比经验”的设计思想，将隐性推理轨迹转化为可解释的指导，为构建高效、可靠的深度思考系统提供了新的技术路径 [27] - **成功解决关键痛点**：实现了从隐性到显性的经验转化、通过自适应奖励精准平衡调用、优先保证效率、以及对推理质量和执行效率的双重优化 [27] - **领域扩展性**：目前研究限于多跳问答领域，未来有潜力扩展到代码合成、策略规划等其他复杂推理任务领域 [26]

经验记忆机制

深度思考大模型

Artificial Intelligence

LightSearcher框架

经验记忆机制

深度思考大模型

Artificial Intelligence

LightSearcher框架

具身智能的数据难题，终于有了可规模化的解法

量子位· 2025-12-18 04:40

公司概况与市场表现 - 公司简智机器人是一家专注于具身智能赛道数据治理与产线设计的企业，其战略定位是成为行业的“数据与能力底座”[3][40] - 公司成立仅4个月就完成了3轮融资，累计融资金额超2亿元，投资方包括Momenta、百度风投、顺为资本等头部机构[4][36] - 公司已服务30余家具身智能头部公司，业务覆盖全球市场，超过70%的收入来自海外[4][37] 行业核心瓶颈：数据困境 - 具身智能发展的核心瓶颈在于数据，其所需数据需完成“人类技能的数字化”，对精度要求极高，且难以从互联网直接获取[7][8] - 行业面临五大核心数据痛点：1) 采集成本高；2) 效率低下；3) 数据鲜度不足；4) 真实性缺失；5) 规模难以突破[9][10][11] - 更深层的问题是“全链路闭环缺失”与“数据基建空白”的系统性困境，导致数据无法有效转化为驱动模型升级的燃料[12][14] 公司核心战略与解决方案 - 公司战略聚焦于解决数据全链路难题，而非卷模型或堆硬件，其核心是打通“人类技能数据化-云端AI数据治理-机器人应用”全链条[15][16] - 公司构建了“平台+产线”双引擎数据治理体系，旨在提供标准化、自动化的数据流解决方案[16][29] - 公司为数据产品立下“铁律”，追求真实、高质量、高精度、高鲜度、低成本、原子化标注与切片[17] 硬件创新：无感采集设备 - 公司推出核心硬件Gen DAS无感可穿戴采集设备，采用轻量化设计，确保用户长时间佩戴无负担，避免“动作变形”[19] - 设备布置了行业首个且数量最多的三目摄像头，结合车轨级IMU及自研VIO、SLAM技术，将轨迹恢复精度提升至小于1厘米[21] - 设备支持无线同步传输、长续航，无需复杂场地部署，开机即用，并能将数据体积压缩至原大小的2%，实现分钟级上传[27] 数据治理平台：Gen Matrix - Gen Matrix数据智能平台是保障数据质量的核心基石，旨在实现“高质量数据供给”[26] - 平台具备五大核心能力：1) 高精准轨迹还原（误差小于1厘米）；2) 智能标注切片；3) 高鲜度低成本并行；4) 超强吞吐能力；5) 智能治理生长[30][31] - 平台每日数据时长增长超1万小时，高质量数据产出超10万clips，且持续加速[31] 行业首创：规模化数据产线 - 公司行业首创Gen ADP智能数据产线，打破了“真实场景数据采集难规模化”的僵局，是其核心壁垒[30] - 公司提出“数据当作产品来制造”的理念，融合众包模式，构建了规模化、自动化的真实场景数据闭环生产系统[33] - 该产线已在超1000个真实家庭完成部署，累计积累超百万小时真实场景数据，覆盖500余种高频技能场景[35] - 产线交付效率领先，采集完成后2小时内，加工数据就能送达模型，为迭代提供“即时燃料”[35] 核心竞争优势 - 团队优势：核心成员来自Momenta、华为、蔚来、字节、理想汽车、DeepMind、斯坦福等顶尖机构，兼具模型与智驾数据工程经验，仅用4个月就完成从产品设计到软硬件交付的全流程[16][36] - 战略优势：在行业聚焦硬件制造时，公司精准押注数据治理与产线设计，构建了“硬件为基础、治理为核心、产线为支撑”的完整差异化体系[36] - 商业化进展：技术实力已快速转化为商业成果，与30余家行业头部企业深度合作，并推动具身智能在家庭服务、工业制造、医疗健康等领域的规模化应用[37][38]

Gen ADP（AI Data Pipeline）智能数据产线

Gen ADP（AI Data Pipeline）智能数据产线

医生版ChatGPT，估值120亿美元

量子位· 2025-12-18 04:40

医生专用ChatGPT，估值120亿美元又一家超级独角兽诞生。 Jay 发自凹非寺量子位 | 公众号 QbitAI 没想到，医疗场景ChatGPT生意能做这么大…… 最新消息，美国明星创业公司——医生版ChatGPT「OpenEvidence」，新融资将获投约 2.5亿美元，估值翻倍至 120亿美元。这意味着，Perplexity、Cursor等超级独角兽的牌桌上，将迎来一家医疗AI公司。这并不令人惊讶，毕竟OpenEvidence几乎已经垄断了美国ToC医疗AI市场—— 日均处理临床查询超6万次，45%的美国医生都是它的用户。 Information消息，旨在打造医生专用ChatGPT的AI公司—— OpenEvidence，正筹集2.5 亿美元股权融资。如果交易完成，这家成立仅三年的初创公司估值将直接翻倍，来到120亿美元。回看OpenEvidence的融资历史，也像火箭一样迅速攀升： 2025年2月，A轮融资7500万美元，估值10亿美元。 2025年7月，B轮融资2.1亿美元，估值翻了三倍多，来到35亿美元。 2025年10月，C轮融资2亿美元，估值进一步跃升至60亿美元。股东 ...

小杯Gemini战胜GPT5.2，1分钟模拟Windows操作系统

量子位· 2025-12-18 04:40

一水发自凹非寺量子位 | 公众号 QbitAI 谷歌丢出 Gemini 3 Flash ，给AI圈示范了啥叫：小孩子才做选择题，成年人当然是全都要（doge）。一个公式来形容这款新模型： Gemini 3 Flash=Pro级智能+Flash级速度+更低价格。比速度，它几乎是Gemini 2.5 Pro的3倍，实测更是丝滑到起飞：比智能，它更是在多个经典测试中，战胜了包括Gemini 3 Pro、GPT5.2在内的一众顶尖模型。数图中有多少根手指，GPT5.2张口就来"5根"，而Gemini 3 Flash成功识破陷阱并给出正确答案"6根"。画一张骑车的鹈鹕，Gemini 3 Flash（右上）的表现明显优于Gemini 2.5 Pro（左）和Gemini 3 Pro（右下），而且这些还都是反复测试后抽取的最佳结果。 Gemini 3 Flash率先答对，而Gemini 3 Pro将他误认为Gemini前负责人Jack Krawczyk （已于今年4月离职并转投Meta）。在更多测试中，Gemini 3 Flash都展示出自己不俗的综合实力。虽然叫"Flash"，但其实是谷歌迄今最强 ...

紧急吃瓜！英伟达GPU供应要缩水了，第一刀砍向RTX 50系列

量子位· 2025-12-18 02:34

英伟达GeForce RTX 50系列显卡产能调整 - 公司计划在2026年上半年对GeForce RTX 50系列显卡进行大幅减产，削减幅度预计为30%-40% [1] 减产的具体产品与市场影响 - 减产将首先影响两款热门中端显卡型号：RTX 5060 Ti 16GB和RTX 5070 Ti 16GB [2][6] - 这两款显卡与更高端的RTX 5080显存容量相同但售价更亲民，原本是市场热门选择 [7] - 产能削减可能导致16GB显存版本供应减少，消费者可能被迫选择8GB“阉割版”或加价购买更昂贵型号 [2][9] 减产背后的原因分析 - 直接原因是面临“内存荒”，包括GDDR7在内的多种类型内存供应紧张，限制了满负荷生产的能力 [4] - 公司预判2026年NAND和DRAM内存成本将上涨，推高整机价格，可能导致需求疲软和库存积压，因此主动削减产能以控制风险 [5] - 从商业策略看，公司倾向于将有限的内存资源优先分配给利润更高的RTX PRO系列和高端消费级显卡，牺牲中端卡产能以保障整体利润 [8] 对行业与消费者的潜在影响 - 显卡供应减少叠加内存成本上升，可能导致2026年GPU市场出现缺货与涨价的双重压力 [10] - 当前3A游戏对显存要求日益提高，8GB显存可能无法满足需求，导致游戏体验下降，而16GB显卡供应短缺将加剧此矛盾 [9] - 这一策略引发了消费者不满，并可能为竞争对手（如AMD、Intel）提供市场机会 [3][11]