量子位

搜索文档
老黄9亿美元再投AI Infra,这次直接打包带走CEO和核心技术
量子位· 2025-09-21 06:36
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 刚入股了"老对手"英特尔,老黄又豪掷9亿美刀,拿下一家AI Infra公司……的CEO和技术授权。 最新消息,AI Infra初创公司 Enfabrica 的核心团队和技术授权,已经被英伟达打包带走。 没错,又是一个不收购公司本身、但掏空公司根本的" 雇佣式收购 "。 Enfabrica成立于2019年,专注于解决I/O、内存及网络瓶颈,去年年底估值6亿美元。 交易达成,这也是英伟达今年第4次对AI初创出手。 如此大手笔,当即引发热议。有网友认为,英伟达这是在打长远算盘,认真地想要保持自己在AI硬件领域的霸主地位。 一起来看具体情况。 9亿美元带走技术核心 这笔折合人民币约 64亿 元的交易,被曝已于上周完成。 Enfabrica的CEO罗尚·桑卡尔(Rochan Sankar)现已入职英伟达,核心团队和公司技术也一并打包带给新东家。 成立于2019年的 Enfabrica 是一家专注于解决I/O、内存及网络瓶颈的硅谷AI基础设施初创公司,其技术旨在使大规模GPU集群能作为单体 计算机运行——该公司宣称其技术可实现超过10万个GPU的互联,可将数据中心GP ...
鸿蒙的全面进击:“天工计划”十亿重磅加码,打造AI全场景新生态
量子位· 2025-09-21 06:36
克雷西 梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 在华为全联接大会2025上,鸿蒙操作系统5展示了其更强大的AI全场景能力, 包括"小艺任务空间""情绪感 知"以及"小艺大脑"等一系列更高阶的AI全场景体验。 无论是出差订票、日程安排,还是多设备联动播放音乐,AI助手 小艺 都能听得懂、做得到。 更向外界传递出一个明确信号: 鸿蒙操作系统,生而不同。 不像市面上的手机、手表、平板、PC、车机各有各的系统,体验割裂,鸿蒙在系统构建的最初就将原生AI 能力融入其中,是目前唯一有能力实现AI能力在多终端、全场景无缝打通的操作系统。 从今年三月至今,华为已经接连发布多款鸿蒙5终端产品,包括首次接入"真人感"小艺的阔折叠Pura X、全 球首款鸿蒙折叠电脑以及首款支持PC级应用的新一代三折叠屏手机——华为Mate XTs非凡大师等等。 据悉,今年4季度还会有包括旗舰手机在内的更多新品陆续发布。截至目前,鸿蒙5终端设备数量已经超过 1700万台 ,超过 3万个应用 和元服务上架,鸿蒙生态驶入快车道。 这一系列动作都有一个共同的指向—— 鸿蒙正在消融设备壁垒、让AI成为无处不在的生态级能力。 在AI重塑操作系统 ...
无需训练的世界模型?西湖大学WorldForge开启空间智能新路径,让AI读懂3D世界
量子位· 2025-09-21 06:36
文章核心观点 - 西湖大学AGI实验室提出的WorldForge框架通过推理时引导策略实现视频生成的高精度时空控制 绕开传统微调或重训模型的高成本路径 为可控世界模型提供新研究方向 [1][8][14] 技术原理与架构 - 采用步内递归修正(IRR)模块 通过预测-校正微循环在去噪过程中逐步消除轨迹偏离 确保生成内容遵循预设运动轨迹 [4][5] - 流门控潜在融合(FLF)模块通过光流得分分离运动与外观特征 将轨迹信号精准注入高运动相关度通道 避免破坏画面质感 [6] - 双路径自校正引导(DSG)模块利用引导路径与非引导路径的输出差异生成校正项 同时保证轨迹精确性与画面质量稳定 [7] 应用场景与性能 - 支持单视图生成3D静态场景 仅需一张照片即可重建三维场景并生成360°环绕视频 [9] - 实现视频电影级重运镜 允许用户自由设计镜头轨迹智能补全新视角场景 效果领先需大量训练的SOTA模型 [11] - 具备视频内容二次创作能力 包括主体替换、物体擦除/添加及虚拟试穿等编辑功能 [12] 行业意义与创新 - 为视频生成领域提供不修改模型权重、即插即用的引导策略 降低技术与资源门槛 [1][14] - 通过推理时引导结构化模型内部世界知识 为可控世界模型构建开辟低训练成本新路径 [8][14]
马斯克转发字节Seed&哥大商学院新基准:大模型搞金融,连查个股价都能出错
量子位· 2025-09-21 02:11
允中 编辑整理 量子位 | 公众号 QbitAI 让AI像金融分析师一样搜索和分析数据,到底有多难?当前的大模型虽然能回答基础金融知识,在CFA考试中取得高分,但面对真实的金融场 景,它们的表现究竟如何? 为了回答这个问题, 字节跳动Seed团队联合哥伦比亚大学商学院推出了FinSearchComp,这是首个完全开源的金融搜索与推理基准测试。 该基准包含635个金融专家精心设计的问题,覆盖全球和大中华两个市场 ,并在多个主流模型产品上进行了全面评测。 评测结果令人深思: 在全球数据集上,表现最好的Grok 4 (web)准确率达到68.9%,但仍落后人类专家6.1个百分点。在大中华区数据集上,豆包(web)虽然领先 其他模型,但与人类专家88.3%的准确率相比,差距超过34个百分点。 这些数字清晰地表明,即使是最先进的AI系统,在处理复杂金融分析任务时仍有很大提升空间。 举例来说,看似简单的"查询IBM最新收盘价"需要快速获取并验证最新数据;"检索星巴克2020年9月的总资产"需要准确定位时间点并理解会 计准则;而"识别2010年以来标普500单月最大涨幅"则需要跨越多个时期进行数据处理。 这些任务展现了金融 ...
老黄刚投的具身智能公司:三个华人创办
量子位· 2025-09-21 02:11
老黄又投了一家具身智能公司! Dyna Robotics,1年前刚成立,现在对外官宣了1.2亿美元 (折合人民币约8.6亿) A轮融资,新晋股东中,老黄治下的英伟达赫然在列。 众所周知,老黄已经明确下一波硬科技浪潮属于具身智能、属于物理AI……所以英伟达的投资押注,也已经在遍地播种了。 Dyna Robotics不是第一家英伟达投资的具身智能机器人公司。 但 全华班创业团队 ——三个创始人都是华人的具身智能机器人创业公司,似乎还是第一家。 Dyna Robotics有什么独特之处? Jay 发自 凹非寺 量子位 | 公众号 QbitAI Dyna Robotics登场,老黄押注 就在最近,Dyna对外官宣了 1.2亿美元 A轮融资,投后估值6亿美元。更早之前的种子轮,大概获得了2000万美元融资。 有意思的是,这轮早期融资中,挤满了巨头产业投资部,包括英伟达、亚马逊和Salesforce。 Dyna披露,他们希望能利用这笔资金进一步完善其AI模型并部署更多机器人。 Dyna成立于2024年,目前公司只有大概30名员工,总部位于美国加利福尼亚州红木城,但他们在上海长宁区也设有分部,公司的中文名叫 达纳灵动 。 ...
实测国内首个对话式AI音乐创作Agent:聊个天就能谱曲填词混剪生成MV
量子位· 2025-09-20 10:51
产品定位与功能 - 国内首个对话式AI音乐创作Agent 可生成音乐和MV [2][4] - 提供文件上传、联网搜索和快速模式功能 支持跳过对话一键出歌 [6] - 集成MV制作、歌词视频、母带处理和音轨分离等多模态内容处理能力 [24] 交互设计与用户体验 - 采用可反复修改的对话交互逻辑 显著降低歌曲翻车概率 [8][11] - 根据简单想法提供多种编曲方向方案 满足多样化需求 [9] - 支持修改歌词、调整节奏和更换人声等精细化编辑操作 [20][21][22] 技术能力与效果表现 - 基于图片生成符合东方美学意境的音乐 展现多模态理解能力 [13][15] - 现代R&B和Rap风格生成效果获得认可 旋律流畅度和节奏感表现良好 [19] - MV生成支持自定义画面比例、时长和视觉风格 并可自动生成剧本 [27][29] 团队背景与行业意义 - 由趣丸科技旗下天谱乐团队开发 曾自研全球首个多模态音乐生成大模型 [32] - 实现一站式创作体验 避免多平台切换 满足用户省时省力需求 [34] - 垂类产品在细分场景深度打磨 体现专业场景极致化价值 [35]
敢和刘慈欣叫板的AI诞生了
量子位· 2025-09-20 10:51
AI与人类文明发展 - AI被视为突破人类文明发展天花板的希望[1][13] - 从科学角度看AI可能替代人类所有能力[15] - AI可能实现人类未能完成的科幻梦想[17] AI智能体能力演进 - AI智能体展示出理解力、情感力和表达能力[9][11] - 具备观点表达和情绪交互能力而非简单应答[18][66] - 能进行跨应用多轮操作并形成一致人设[30] 手机作为AI核心载体 - 手机天然具备成为AI容器的优势:近距离、高频使用、强算力和多模态接口[21][22] - AI深度嵌入系统成为体验核心驱动而非孤立App[24][25] - 全球生成式AI手机出货量预计2025年达3.7亿部占整体近30%[38] 交互方式创新 - AI实体按键成为新交互入口设计思路[27] - 交互从"调用"转向"随时对话"[29] - 物理按键可能成为AI智能体新入口[65] 自进化能力建设 - AI需具备学习记忆和适应用户行为的能力[30] - 通过端侧大模型和本地微调实现持续进化[36] - 在真实使用中积累经验适应个体习惯[33][35] 硬件系统协同优化 - 动态调度CPU/GPU/内存资源实现性能优化[51] - 硬件表现取决于使用习惯而非初始配置[52] - NPU算力提升支撑推理能力进化[44] 多设备生态整合 - 手机成为连接耳机/平板/汽车/家庭设备的中枢[45] - 强化跨设备跨系统互联互通体验[57][58] - AI智能体作为多设备协同的调度者[59] 荣耀Magic8产品方向 - 主打能理解/能学习/能陪伴的AI终端[50] - MagicOS 10.0具备推断意图和主动协助能力[56] - 构建平等的AI伙伴关系而非单纯服务工具[67][68]
阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁
量子位· 2025-09-20 10:51
核心观点 - 阿里巴巴安全部联合多所高校提出建设性安全对齐理念,旨在推动AI从被动防御转向主动引导,在坚守安全底线的同时提升用户交互满意度[2][3][12][13] - 推出Oyster-I模型,采用博弈论框架动态优化回复策略,实现安全性与可用性的平衡,在多项评测中达到行业领先水平[14][17][28][36] 技术方法 - 构建两阶段序贯博弈框架,模型通过推断用户类型动态选择最优回复策略,目标函数为Constructive(x,y,g)=α·Retention(θ,x,y)-β·Risk(x,y,g),其中β>α体现安全优先原则[19][20][22][26] - 开发Lingo-BP技术,通过结构化推理路径确保输出符合建设性目标,同时设计多维度安全评估体系覆盖风险等级、类别及用户意图[21][23] - 建立Constructive Benchmark评测基准,包含从无风险(R0)到对抗攻击(R2)的三级问题分类,并模拟多样化用户画像[23][24][25] 性能表现 - Oyster-I在Qwen3-14B系列模型上实现安全性提升约10%,在DS-14B系列上提升约32%,通用能力保持SOTA水平(Qwen3-14B总体得分84.20)[27][28] - 在Constructive专项评测中得分56.27,显著高于基线模型RealSafe的33.33和DS-14B基线的-0.49[27][28] - 抗越狱攻击防御成功率较GPT-5高4%,在60000+次攻防测试中达到顶尖闭源模型水平[36][38] 应用与展望 - 模型已开源并提供在线Demo,支持实际场景测试[4][39] - 未来计划扩展至多轮对话、智能体及复杂越狱攻击场景,进一步强化模型可靠性与可信度[37]
3D生成到达3.0阶段,不止提升行业渗透率,也正催生3D原生新玩法 | 对话3D生成平台Tripo
量子位· 2025-09-20 08:35
分析师 刘萌媛 刘铁鹰 量子位智库 | 公众号 AI123All AI 3D生成,可以算作是近两年生成式AI领域最值得关注的赛道之一。 以下文章来源于量子位智库 ,作者AI 100访谈 量子位智库 . 连接AI创新,提供产业研究 一方面,3D领域的未来市场极度广阔。 相比人工3D生成,AI的加入在特定领域近乎磨平了3D生成在 工具链 、 专业技能 、 人力成本 等方面的门槛。 无论是为专业人员降本增效,还是为爱好者探索落地新场景,AI 3D在游戏、建筑、设计、手办等多个领域似乎都已验证了需求。 此外,大量 行业对3D内容都有潜在需求,因此赛道天花板相当可观。 与之相对应,市场上的玩家也在快速涌现。大厂代表如腾讯基于混元3D系列模型,上线了腾讯混元3D生成平台,而创业公司中,VAST、 Meshy、影眸科技等也都在持续迭代自研的3D大模型和产品。 但另一方面,由于起步更晚且相对小众,AI 3D生成的现状也有更多疑惑和焦虑: …… 针对这些问题,量子位智库邀请到推出Tripo平台的3D明星创企 VAST ,进行了一场深入交流。 AI 3D产品目前有哪些已经可靠落地的场景?效率的提升状况如何? 帮助专业人员在既有场 ...
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
量子位· 2025-09-20 08:35
腾讯云智能体开发平台3.0升级 - 平台完成近600个功能上线 涵盖RAG能力、Workflow、Multi-Agent协同、应用评测及插件生态等模块[4] - RAG能力升级为Agentic RAG 新增文档冲突对比、自定义切块及主流数据库接入功能[7][8] - Multi-Agent支持多AI协同任务转交 提供现成模板低门槛搭建复杂应用[11][12] - Workflow新增Agent节点和数据库节点 支持异步调用、消息队列及操作回撤功能[16][17] - 插件生态扩展至140多个 全面支持MCP协议实现无缝接入[13] 模型生态与开源战略 - 模型广场接入月之暗面、MiniMax等第三方模型 支持腾讯云TI-ONE平台模型一键同步[20] - 腾讯优图实验室9月开源Youtu-Agent框架和Youtu-GraphRAG知识图谱框架 后续将推出Embedding、视频理解等模型开源[5][22] - 开源战略基于技术积累和落地实践 旨在通过技术普惠和开放共建推动智能体生态发展[26][27] 企业落地案例成效 - 为伊利部署导购智能体 实现话术个性化并提升订单量26%[23] - 为华住集团打造华小AI酒店管家 实现24小时在线服务且准确率达95%[23] - 与知识IP合作开发IP Agent 将静态知识转化为动态问答系统[23]