Workflow
量子位
icon
搜索文档
不儿,这谁还能看出是AI演的视频啊
量子位· 2025-12-18 09:26
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 这一次,我真的分不清 视频到底是不是AI生成 的了。 来,咱们先来看一下这段 演技飙升 的视频片段: Prompt:女子泣不成声,说台词:"江辰……你一定要活着回来,好吗?……答应我"。女子边说话边将右手抬起抚摸男子的脸。背景 音乐伤感。影视级。 这台词、这演技、这眼神、这口型,不说是AI生成的,一般人绝对会以为是哪个电影里的片段。 但重点还不是效果的逼真—— 因为这10s的片段,人物对白配音、视频背景音乐和音效,统统都是通过上面的Prompt 一锅出 的。 这就是刚刚 火山引擎 在FORCE原动力大会上推出的最新 豆包视频生成模型Seedance 1.5 Pro 。 主打的就是 音画高精同步,一镜入戏 。 就这个功能一出,打造一个有趣好玩的小短片,那真是分分钟的事情了。 例如我们以这位AI女主角为原型: 然后就可以用Seedance 1.5 Pro搞一个"川剧"—— 《至辣园》 : 从这两个实测案例中,我们不难看出,这次豆包视频生成模型Seedance 1.5 Pro整体亮点可以总结为: 目前,Seedance 1.5 Pro已经上线 即梦AI 和 豆包 ...
港股通用GPU第一股也冲刺了!哈佛博士带队,估值209亿
量子位· 2025-12-18 09:26
杰西卡 发自 凹非寺 量子位 | 公众号 QbitAI 国产GPU组队过年! 估值209亿的通用GPU独角兽 壁仞科技 ,刚在港交所 通过聆讯 ,即将敲钟,冲刺 港股"国产GPU第一股" 。 创始人 张文 ,哈佛法学博士,2019年带队创业,更早之前是作为 商汤总裁 为人熟知。 公司成立3个月就吸引到了天使轮融资,6年间融资不下10轮,背后站满了启明创投、IDG资本、高瓴创投、格力创投等知名投资者。 算上最近在A股刚上市的 摩尔线程和沐曦 ,这个月已经有三家国产GPU公司在资本市场传出了好消息。 壁仞科技在做什么? 壁仞科技,是一家研发通用GPU芯片及智能计算解决方案的AI基础计算公司,为AI训练和推理提供从云端到边缘的全栈支持。 公司的核心产品智能计算整体解决方案,由两部分组成: 一块是 基于自研GPGPU架构的硬件系统 ,专为AI负载(尤其是LLMs)设计,支持多模态融合和大规模模型训练。 其GPGPU芯片支持兼容主流的第三方软件平台,也可以被集成到行业标准硬件形态规格中,如PCIe板卡及OAM。 整个不同配置的PCIe板卡、OAM、GPGPU服务器或服务器集群,共同组成了壁仞科技的GPGPU的硬件系统。 ...
量子位编辑作者招聘
量子位· 2025-12-18 09:26
岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
行啊AI PC!现在都能隔空测血压、检测皮肤了
量子位· 2025-12-18 09:26
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI PC 能干的事儿,终究是超出了我的认知。 不是你以为的断网跑大模型或是写PPT,而是—— 隔空测血压! 操作方式是这样的。 首先,在这个名叫AI Camera的应用中心里,找到 AI生理检测 并打开它: 然后,你只需要在AI PC上盯着屏幕片刻,其它的什么都不用做,与你健康相关的指标"啪的一下"就全弹出来了: 大到 心率、血氧、收缩压、舒张压、血管硬化风险、血糖浓度, 细到 心率不齐、房颤、心肌缺血…… 甚至 连呼吸波动都能实时被检测。 △ 测试者1 这便是 科思创动 推出的 个人健康助手 ,只需要再搭配一个摄像头(通过USB连接的汇博士摄像头),就可以在AI PC上实现这种 非接触 式健康检测 。 (感兴趣的小伙伴可以再拿血压仪等设备对结果进行对比) 但除了隔空检查身体情况之外,科思创动还推出了一个 利好女生 的玩法—— 隔空皮肤检测! 操作方式依旧是让AI PC"看看你"就OK: 不大一会儿,一份基于你皮肤状况的 快速报告 就生成了 (上下滑动查看) : 从大致结果来看,敏感肌、油分过多和严重缺水,是相当符合被测者皮肤的状态。 并且点击 查看掩膜 ...
经验记忆黑科技!LightSearcher让AI工具调用减39.6%、推理快48.6%
量子位· 2025-12-18 09:26
文章核心观点 - 深度思考大模型在利用外部搜索工具(DeepSearch)提升推理准确性时,面临准确率与效率难以兼顾的“跷跷板”困境 [1] - 北京邮电大学百家AI团队提出的LightSearcher框架,通过基于经验记忆的强化学习优化技术,有效解决了这一困境,在保持顶尖准确率的同时,显著提升了工具调用效率 [1][14] 深度思考大模型的困境与挑战 - **困境本质**:频繁调用外部搜索工具能补充实时与领域知识、提升推理准确性与事实可靠性,但会导致计算开销激增、推理延迟大幅升高,等待时间可达几十秒至几分钟 [1][4][5] - **用户体验风险**:信息加载时间超过10秒会导致50%的移动用户放弃访问,长时推理等待存在类似的用户流失风险 [6][7] - **效率妥协的代价**:反之,若为提升效率而减少工具调用,则会因大语言模型内部知识局限,导致推理结果的准确性与完整性不足 [8] - **现有方法的缺陷**:提示工程或监督学习方法依赖人工标注,成本高且泛化差;而强化学习驱动的方法奖励偏重准确性,易导致模型为确保正确而过度调用工具,造成冗余开销和效率低下 [10][11][12][13] LightSearcher框架的解决方案 - **核心思路**:在强化学习推理过程中,通过“对比经验学习”将隐性推理轨迹转化为显性指导经验,并结合自适应奖励来优化工具调用策略 [14][15] - **关键组件一:对比经验推理机制**:收集高质量与低质量的推理轨迹,通过大语言模型生成成功模式的自然语言总结,构建动态经验记忆库 [16] - **关键组件二:自适应奖励塑造机制**:引入最小工具调用基准,仅在答案正确时惩罚冗余调用,并使用指数衰减函数动态平衡准确性和效率,避免盲目优化 [16] - **关键组件三:基于经验的强化学习训练机制**:采用GRPO算法,将积累的经验和少样本示例融入提示模板,指导模型生成高效推理轨迹,确保探索与利用的均衡 [16] - **优化目标**:最终优化目标为多目标奖励函数的加权和,旨在协同提升工具调用精简度与答案质量 [18] 实验性能与效果 - **准确性保持顶尖**:在四个多跳QA基准数据集上的实验显示,LightSearcher在F1分数和大语言模型评判得分上与当前最优的ReSearch基线相当,部分数据集上甚至更优 [19][22] - **效率显著提升**:与基线相比,搜索工具调用次数减少39.6%,推理时间缩短48.6%,Token消耗降低21.2% [2] - **泛化能力强**:在不同难度的查询上表现稳定,在域外测试集上也超越了依赖固定检索的迭代方法 [23] - **消融实验验证核心作用**:移除经验记忆组件导致F1分数下降7.2%,证明其核心作用;同时移除经验与少样本示例则导致F1分数下降8.8% [24][25] 技术意义与应用前景 - **技术路径创新**:该框架通过“对比经验”的设计思想,将隐性推理轨迹转化为可解释的指导,为构建高效、可靠的深度思考系统提供了新的技术路径 [27] - **成功解决关键痛点**:实现了从隐性到显性的经验转化、通过自适应奖励精准平衡调用、优先保证效率、以及对推理质量和执行效率的双重优化 [27] - **领域扩展性**:目前研究限于多跳问答领域,未来有潜力扩展到代码合成、策略规划等其他复杂推理任务领域 [26]
具身智能的数据难题,终于有了可规模化的解法
量子位· 2025-12-18 04:40
公司概况与市场表现 - 公司简智机器人是一家专注于具身智能赛道数据治理与产线设计的企业,其战略定位是成为行业的“数据与能力底座”[3][40] - 公司成立仅4个月就完成了3轮融资,累计融资金额超2亿元,投资方包括Momenta、百度风投、顺为资本等头部机构[4][36] - 公司已服务30余家具身智能头部公司,业务覆盖全球市场,超过70%的收入来自海外[4][37] 行业核心瓶颈:数据困境 - 具身智能发展的核心瓶颈在于数据,其所需数据需完成“人类技能的数字化”,对精度要求极高,且难以从互联网直接获取[7][8] - 行业面临五大核心数据痛点:1) 采集成本高;2) 效率低下;3) 数据鲜度不足;4) 真实性缺失;5) 规模难以突破[9][10][11] - 更深层的问题是“全链路闭环缺失”与“数据基建空白”的系统性困境,导致数据无法有效转化为驱动模型升级的燃料[12][14] 公司核心战略与解决方案 - 公司战略聚焦于解决数据全链路难题,而非卷模型或堆硬件,其核心是打通“人类技能数据化-云端AI数据治理-机器人应用”全链条[15][16] - 公司构建了“平台+产线”双引擎数据治理体系,旨在提供标准化、自动化的数据流解决方案[16][29] - 公司为数据产品立下“铁律”,追求真实、高质量、高精度、高鲜度、低成本、原子化标注与切片[17] 硬件创新:无感采集设备 - 公司推出核心硬件Gen DAS无感可穿戴采集设备,采用轻量化设计,确保用户长时间佩戴无负担,避免“动作变形”[19] - 设备布置了行业首个且数量最多的三目摄像头,结合车轨级IMU及自研VIO、SLAM技术,将轨迹恢复精度提升至小于1厘米[21] - 设备支持无线同步传输、长续航,无需复杂场地部署,开机即用,并能将数据体积压缩至原大小的2%,实现分钟级上传[27] 数据治理平台:Gen Matrix - Gen Matrix数据智能平台是保障数据质量的核心基石,旨在实现“高质量数据供给”[26] - 平台具备五大核心能力:1) 高精准轨迹还原(误差小于1厘米);2) 智能标注切片;3) 高鲜度低成本并行;4) 超强吞吐能力;5) 智能治理生长[30][31] - 平台每日数据时长增长超1万小时,高质量数据产出超10万clips,且持续加速[31] 行业首创:规模化数据产线 - 公司行业首创Gen ADP智能数据产线,打破了“真实场景数据采集难规模化”的僵局,是其核心壁垒[30] - 公司提出“数据当作产品来制造”的理念,融合众包模式,构建了规模化、自动化的真实场景数据闭环生产系统[33] - 该产线已在超1000个真实家庭完成部署,累计积累超百万小时真实场景数据,覆盖500余种高频技能场景[35] - 产线交付效率领先,采集完成后2小时内,加工数据就能送达模型,为迭代提供“即时燃料”[35] 核心竞争优势 - 团队优势:核心成员来自Momenta、华为、蔚来、字节、理想汽车、DeepMind、斯坦福等顶尖机构,兼具模型与智驾数据工程经验,仅用4个月就完成从产品设计到软硬件交付的全流程[16][36] - 战略优势:在行业聚焦硬件制造时,公司精准押注数据治理与产线设计,构建了“硬件为基础、治理为核心、产线为支撑”的完整差异化体系[36] - 商业化进展:技术实力已快速转化为商业成果,与30余家行业头部企业深度合作,并推动具身智能在家庭服务、工业制造、医疗健康等领域的规模化应用[37][38]
医生版ChatGPT,估值120亿美元
量子位· 2025-12-18 04:40
医生专用ChatGPT,估值120亿美元 又一家超级独角兽诞生。 Jay 发自 凹非寺 量子位 | 公众号 QbitAI 没想到,医疗场景ChatGPT生意能做这么大…… 最新消息,美国明星创业公司——医生版ChatGPT「OpenEvidence」,新融资将获投约 2.5亿美元,估值翻倍至 120亿美元 。 这意味着,Perplexity、Cursor等超级独角兽的牌桌上,将迎来一家医疗AI公司。 这并不令人惊讶,毕竟OpenEvidence几乎已经垄断了美国ToC医疗AI市场—— 日均处理临 床查询超6万次,45%的美国医生都是它的用户 。 Information消息,旨在打造医生专用ChatGPT的AI公司—— OpenEvidence,正筹集2.5 亿美元股权融资 。 如果交易完成,这家成立仅三年的初创公司估值将直接翻倍,来到120亿美元。 回看OpenEvidence的融资历史,也像火箭一样迅速攀升: 2025年2月,A轮融资7500万美元,估值10亿美元。 2025年7月,B轮融资2.1亿美元,估值翻了三倍多,来到35亿美元。 2025年10月,C轮融资2亿美元,估值进一步跃升至60亿美元。 股东 ...
小杯Gemini战胜GPT5.2,1分钟模拟Windows操作系统
量子位· 2025-12-18 04:40
一水 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌丢出 Gemini 3 Flash ,给AI圈示范了啥叫:小孩子才做选择题,成年人当然是全都要(doge)。 一个公式来形容这款新模型: Gemini 3 Flash=Pro级智能+Flash级速度+更低价格 。 比速度,它几乎是Gemini 2.5 Pro的3倍,实测更是丝滑到起飞: 比智能,它更是在多个经典测试中,战胜了包括Gemini 3 Pro、GPT5.2在内的一众顶尖模型。 数图中有多少根手指,GPT5.2张口就来"5根",而Gemini 3 Flash成功识破陷阱并给出正确答案"6根"。 画一张骑车的鹈鹕,Gemini 3 Flash(右上)的表现明显优于Gemini 2.5 Pro(左)和Gemini 3 Pro(右下),而且这些还都是反复测试后 抽取的最佳结果。 Gemini 3 Flash率先答对,而Gemini 3 Pro将他误认为Gemini前负责人Jack Krawczyk (已于今年4月离职并转投Meta) 。 在更多测试中,Gemini 3 Flash都展示出自己不俗的综合实力。 虽然叫"Flash",但其实是谷歌迄今最强 ...
紧急吃瓜!英伟达GPU供应要缩水了,第一刀砍向RTX 50系列
量子位· 2025-12-18 02:34
英伟达GeForce RTX 50系列显卡产能调整 - 公司计划在2026年上半年对GeForce RTX 50系列显卡进行大幅减产,削减幅度预计为30%-40% [1] 减产的具体产品与市场影响 - 减产将首先影响两款热门中端显卡型号:RTX 5060 Ti 16GB和RTX 5070 Ti 16GB [2][6] - 这两款显卡与更高端的RTX 5080显存容量相同但售价更亲民,原本是市场热门选择 [7] - 产能削减可能导致16GB显存版本供应减少,消费者可能被迫选择8GB“阉割版”或加价购买更昂贵型号 [2][9] 减产背后的原因分析 - 直接原因是面临“内存荒”,包括GDDR7在内的多种类型内存供应紧张,限制了满负荷生产的能力 [4] - 公司预判2026年NAND和DRAM内存成本将上涨,推高整机价格,可能导致需求疲软和库存积压,因此主动削减产能以控制风险 [5] - 从商业策略看,公司倾向于将有限的内存资源优先分配给利润更高的RTX PRO系列和高端消费级显卡,牺牲中端卡产能以保障整体利润 [8] 对行业与消费者的潜在影响 - 显卡供应减少叠加内存成本上升,可能导致2026年GPU市场出现缺货与涨价的双重压力 [10] - 当前3A游戏对显存要求日益提高,8GB显存可能无法满足需求,导致游戏体验下降,而16GB显卡供应短缺将加剧此矛盾 [9] - 这一策略引发了消费者不满,并可能为竞争对手(如AMD、Intel)提供市场机会 [3][11]
国产AI芯片看两个指标:模型覆盖+集群规模能力 | 百度智能云王雁鹏@MEET2026
量子位· 2025-12-18 02:34
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 当国产AI芯片接连发布、估值高涨之际,一个尖锐的问题依然悬在头顶:它们真的能撑起下一代万卡集群与万亿参数模型的训练吗? 一边是市场对替代方案的迫切期待,另一边是英伟达在利润与估值上仍高歌猛进…… 百度智能云 A I计算首席 科 学家王雁鹏 在量子位MEET2026智能未来大会上,基于百度昆仑芯在大规模生产环境中的实战经验指出: 评判芯片实力的标准已从单纯的算力数值,转向了能否稳定支撑从百亿到万亿参数、从稠密模型到MoE架构、从单模态到多模态的完整模型谱 系训练,并能在万卡乃至更大规模集群上实现高效扩展。 在演讲中,王雁鹏系统拆解了大规模训练中集群稳定性、线性扩展与模型生态三大核心挑战的攻坚路径,并回应了行业对MoE时代硬件路径的 关切。 他认为,即便是参数激增的MoE模型,"小芯片搭大集群"的路径依然可行,其关键在于极致的通信优化与系统级协同设计。 为完整呈现王雁鹏的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能给你带来更多启发。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众 ...