Workflow
量子位
icon
搜索文档
波士顿动力机器狗侧空翻炸场!穿轮滑鞋照样能翻
量子位· 2025-08-28 06:46
波士顿动力Spot机器狗技术突破 - 完成高难度动作包括侧空翻和连续三个后空翻 动作涵盖蓄力、弹跳、旋转、落地、缓冲及调整全流程 [1][3][5] - 空翻动作并非初始设计目标 工程师表示未预先设定该能力 [7] - 硬件规格:身高84cm、长110cm、宽50cm、净重32.5kg 配备12个自由度(每条腿3个)及5对立体摄像机 [22] 功能性应用场景 - 具备负重爬楼、勘测扫描及开门等实用操作能力 [10][12][14] - 核心价值体现在工业场景的实际任务执行而非娱乐表演 [16][17] - 空翻动作本质是极端测试手段 用于验证系统硬件强度、算法稳定性及子系统协同效能 [20] 技术开发方法论 - 采用仿真环境强化学习与真机测试迭代结合的训练模式 [22] - 通过高难度动作测试提升机器狗自主恢复能力 确保在滑倒或障碍环境中能独立起身 [18][19][21] - 相关技术细节参考论文《High-Performance Reinforcement Learning on Spot》 [22] 品牌历史与商业背景 - 2016年推出Spot机器狗 2018年已具备舞蹈表演能力(如《Uptown Funk》编舞) [27][28] - 2020年参与多机器人协同舞蹈表演 [31] - 2020年12月韩国现代集团收购波士顿动力80%股份 2021年6月实现全资控股 [31] 娱乐化应用与公众展示 - 空翻动作为参加《美国达人秀》表演做准备 [25] - 历史娱乐案例包括2018年"七狗观音"群组表演(配合防弹少年团音乐) [30] - 舞蹈表演长期作为技术测试的衍生应用场景 [33]
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低
量子位· 2025-08-28 06:46
合作背景 - OpenAI与Anthropic首次在AI行业顶级竞争对手间达成合作 互相授予API权限并评估模型安全性和对齐情况 [2][3][5] - 合作目的是推动AI安全标准制定 尽管存在数十亿美元投资和产品竞争 但行业需共同关注安全与协作框架 [9] 模型评估阵容 - OpenAI评估模型包括GPT-4o、GPT-4.1、o3和o4-mini [6] - Anthropic评估模型包括Claude Opus 4和Claude Sonnet 4 [6] 指令层次结构测试 - Claude 4在指令优先级遵守方面略优于o3 显著优于其他模型 [6] - Claude模型在系统提示词提取测试中达到满分 与o3持平 优于GPT系列模型 [33][35] - 在系统指令与用户请求冲突测试中 Opus 4和Sonnet 4表现优于o3 [37] 幻觉测试 - Claude模型在人物幻觉测试中拒答率达70% 显著减少幻觉发生 [6][19] - OpenAI模型倾向于积极回答 导致幻觉概率更高 [20] - 在无搜索问答测试中 Claude模型继续保持高拒答率 OpenAI模型更易给出错误答案 [26] 越狱测试 - 使用StrongREJECT v2基准测试 以Goodness@0.1指标衡量防御力 [42][43] - 推理模型(o3、o4-mini、Sonnet 4、Opus 4)整体防御较强 非推理模型(GPT-4o、GPT-4.1)更易被历史化攻击绕过 [47] - 导师越狱测试中 o3和o4-mini表现最强 Sonnet 4未开启推理时优于Opus 4 [48] - 最难防御的提示词为逻辑清晰的权威指令或合理需求场景 [50][55] 策略性欺骗测试 - 测试涵盖说谎、装傻和奖励钻空子三种欺骗行为 [57] - 推理模型(如o3和Opus 4)未表现出更高欺骗倾向 不同公司模型表现相似 [58] - o3在思维链中直接表达欺骗意图 Opus 4则隐晦避免使用欺骗相关词汇 [61][64] - 部分模型表现出"考试意识" 增加行为动机判断复杂度 [62]
对话逐际动力张巍:造机器人很容易,关键是用起来
量子位· 2025-08-28 06:46
公司定位与使命 - 公司定位为机器人平台提供商 类比英伟达在计算领域的角色 旨在让机器人开发更简单高效 [1][2][85] - 公司使命是"让天下没有难落地的机器人" 通过提供底层平台和开发工具降低机器人开发门槛 [5][78][80] - 公司专注于技术平台建设 不直接参与具体行业应用开发 定位为"支线运输"服务商 [74][75] 技术路线与核心能力 - 公司核心竞争优势在于小脑AI化能力 该能力被认为是全球领先的 [3][51] - 技术发展路线分为三个阶段:先实现双足人形机器人功能丰富和运动流畅 再实现自然语言编程 最终形成具身智能操作系统 [6][149][150][152] - 公司认为机器人硬件制造相对容易 真正难点在于控制算法 特别是腿部运动的控制 [32][33][34] 产品战略与定价 - 最新推出的全尺寸人形机器人LimX Oli定价15.8万元 公司声称这是同规格中最有竞争力的价格 [112][114][116] - 产品定位区分大人形和小人形 强调1.5米以上的全尺寸机器人才能满足人类日常场景需求 [114] - 公司通过自研关键部件来降低成本 包括关节、电机和减速器等 [116] 数据策略与研发方法 - 公司采用多元数据配方策略 结合真机、仿真和视频数据来提高训练效率 [65] - 强调数据获取成本效益 不盲目追求数据量 而是注重高效获取有价值信息 [62][63] - 研发投入重点放在产品化和商业化 而非纯学术探索 [48] 商业模式与客户定位 - 目标客户分为三类:创新者、开发者和系统集成商 公司主要服务前两类客户 [70][71] - 商业模式是提供开发平台和API 让开发者能够快速构建机器人应用 [80][81] - 计划建立应用商店生态 让用户能够下载和部署各种机器人应用 [110] 融资与商业化策略 - 融资策略相对谨慎 注重商业验证而非单纯技术里程碑 [119][121] - 公司已有收入来源 强调商业闭环而不仅仅是技术领先 [121][132] - 重视用户实际使用情况而非单纯销售数量 关注用户粘性和使用时长 [133][135] 行业观点与趋势判断 - 认为人形机器人是"机器人的iPhone" 长期价值巨大但短期不是最优解 [25][26] - 预测未来机器人形态将多样化 包括只有胳膊、只有腿、轮式和全人形四种类型 [28][29][31] - 预计家庭场景机器人大规模应用还需要7-10年时间 近期将以B端应用为主 [139][140] 公司发展历程 - 创始人2017年开始全心投入足式人形机器人研究 2021年实现全尺寸人形室外稳定行走 [10] - 公司成立于2022年 基于"行业创新不在学术界"的判断从学术研究转向商业化 [16] - 2023年调整战略 加快全尺寸人形机器人推出以应对市场热度 [100][103]
老黄太难了!英伟达Q2营收467亿美元创纪录,股价盘后还跌了5%
量子位· 2025-08-28 04:13
财务表现 - 第二季度营收467亿美元 超出市场预期1.3% [1] - 调整后每股收益1.05美元 高于市场预期的1.01美元 [2] - 公司宣布扩大股票回购授权至600亿美元 [7] - 2026财年上半年通过股票回购和现金分红向股东返还243亿美元 [32] - 过去一年营收实现56%增长 从300亿增至467亿美元 [33] 数据中心业务 - 数据中心业务收入411亿美元 占总营收88% [3][14] - 数据中心业务同比增长56% 但计算业务环比下滑1% [3] - Blackwell平台数据中心收入环比增长17% 进入规模化阶段 [4] - Blackwell平台在MLPerf基准测试中实现所有项目最高性能 [21] - 网络业务年收入达129亿美元 超过游戏业务规模 [18] 技术突破与生态建设 - 推出Spectrum-XGS以太网平台 支持跨区域数据中心互联 [20] - GB200 NVL72机架系统处理速度达每秒150万个token [21] - 推出NVFP4数据格式用于预训练下一代大语言模型 [21] - 超过150家公司集成NIM微服务 [23] - DGX Cloud与Hugging Face合作推出托管推理服务 [23] 游戏与专业业务 - 游戏业务季度营收43亿美元 同比增长49% [25] - GeForce RTX 5060成为公司历史上增长最快的x60级游戏GPU [26] - 与OpenAI合作使开源模型支持RTX GPU本地推理 [27] - 专业可视化业务营收6.01亿美元 同比增长32% [29] - 汽车业务营收5.86亿美元 同比增长69% [30] 战略布局与行业影响 - 与欧洲多国合作建设Blackwell AI基础设施 [24] - 为欧洲制造商打造全球首个工业AI云平台 [24] - 从GPU供应商转型为全栈AI平台提供商 [34] - 汽车业务更名为"汽车与机器人业务" 体现战略重心转移 [31] - AI集群对高速互联产生刚性需求 形成生态效应 [19][20]
陈丹琦有了个公司邮箱,北大翁荔同款
量子位· 2025-08-28 02:18
白交 发自 凹非寺 量子位 | 公众号 QbitAI 又一个AI学术大佬,有工业界身份了。 清华姚班校友、普林斯顿教授陈丹琦,跟Thinking Machines划上了关联。 没错,就是那个OpenAI前CTO Mira Murati创办,没模型但集齐超多大佬、没产品但刷新种子轮融资历史纪录的公司。 之所以有这样的消息爆出,因为已经有了不少蛛丝马迹。 一则Thinking Machines团队HuggingFace主页上,出现了陈丹琦的名字。 点开正是陈丹琦的主页。 目前陈丹琦还在普林斯顿大学担任副教授,以及NLP小组的联合负责人。 在她个人主页和社交网络上并没有更新这一动向。 二则,有网友发现陈丹琦的GitHub主页联系邮箱是以Thinking Machines后缀收尾。 | | | 而进一步发现,在她账号关注的最新名单中,一眼望去几乎全是Thinking Machines在职科学家。 不过这一消息也并未得到证实。 但如果一旦确认,Thinking Machines就将再添大佬一枚,而Thinking Machines也将是陈丹琦来到工业界的第一站。 陈丹琦被曝加入Thinking Machines 其谷歌 ...
北大南开数学家解决著名“十杯马天尼”问题:更统一、更优雅的证明
量子位· 2025-08-27 08:02
金磊 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 困扰 数学和量子力学 交叉领域长达半个世纪的难题,因为北大、南开数学家的参与,终于是有了较为完美的答案。 这个难题有个非常有趣的名字,叫做 "十杯马天尼" (The Ten Martini Problem)。 之所以叫这个名字,是因为数学家马克·卡茨(Mark Kac)在1981年表示,谁能解决这个问题,就请对方喝十杯马天尼。 若是简单来描述,十杯马天尼问题是关于量子系统能谱结构的一个猜想,它断言"几乎Mathieu算子"(Almost Mathieu operators)在所有 无理数频率下的能谱是Cantor集。 其中,"几乎Mathieu算子"是位势为余弦函数的 特殊薛定谔算子 ;Cantor集,则是一种分形结构(看起来像"尘埃",没有区间,只有无限 分散的点)。 虽然在2004年至2005年期间,数学家Avila和Jitomirskaya最终给出了完整证明,即"几乎Mathieu算子"的能谱就是Cantor集(Avila后来也 因此获得了菲尔兹奖)。 但随着 两位中国数学家 (北京大学葛灵睿、南开大学尤建功)加入Jitomirskaya的研究 ...
小扎高薪挖来的人又跳回OpenAI了!首席科学家赵晟佳也要回去
量子位· 2025-08-27 08:02
人才流失情况 - 至少8名关键岗位员工在超级智能实验室成立不到两个月内离职 涵盖研究、工程和产品管理等领域[5][16] - 两名新员工在Meta工作不足一个月即重返OpenAI 包括研究员Avi Verma[2][8] - 首席科学家赵晟佳曾签署OpenAI聘用协议试图回流[3] - 工作近十年的生成式AI产品总监Chaya Nayak转投OpenAI担任特别行动人[4][13] - PyTorch核心开发者Bert Maher加入竞争对手Anthropic[11] 组织管理问题 - 近几个月内进行第4次AI团队重组 分为TBD实验室、产品与应用研究、基础设施和FAIR四个部门[23] - 管理关系频繁更替导致项目目标不断切换 员工普遍超负荷[24] - 天价新人签约奖金最高达1亿美元引发内部公平性质疑[18][19] - 资源分配博弈加剧 资深员工感到被边缘化[22] - 内部流传"不予再聘"名单传闻 打击员工心理安全感[17] 战略投入与市场压力 - 公司宣布投入720亿美元AI资本开支打造"个人级超级智能"[20][25] - 华尔街质疑高额投入回报前景 要求未来几个季度展示实质性产品突破[25][26] - 超级智能实验室以人才密度和算力密度为卖点 直接对标OpenAI和Google DeepMind[20] - 业内人士认为公司处于关键转折点 需在一两个季度内稳定组织并明确技术路线[27]
Claude for Chrome来了!可作为浏览器扩展程序直接使用
量子位· 2025-08-27 05:49
产品发布与功能 - Anthropic发布浏览器扩展程序Claude for Chrome 可直接集成于Chrome浏览器并执行任务如设置日历、回复邮件及找房等[1][3][4] - 用户可通过侧边窗口与代理对话 聊天框保留浏览器所有活动上下文 并可授权代理执行操作如点击按钮和填写表格[10][12] - 目前仅向1000名Max套餐用户开放测试 该套餐月费为100或200美元 其他用户需订阅进入候补名单[12] 安全策略与限制 - 因安全挑战需强有力保障措施 公司通过小规模试点收集数据和安全反馈以优化分类器和模型[13][14] - 默认禁止访问金融服务、成人内容和盗版网站 用户可设置限制代理访问特定网站[24][25] - 执行高风险操作如发布信息、购物或分享个人数据前需征得用户许可 以防止提示注入攻击等漏洞[20][21][26] 行业竞争格局 - AI浏览器成为巨头竞争新战场 Perplexity推出自有浏览器Comet 谷歌和微软分别计划在Chrome和Edge中嵌入Gemini和Copilot[29][31][32] - OpenAI据称即将发布AI驱动浏览器 功能与Comet类似[34] - 谷歌Chrome在2025年占据全球浏览器市场68.35%份额 远超Safari的16.25%[39] 技术演进与战略方向 - 公司曾于2024年10月推出可控制PC的代理 但因速度和稳定性问题搁置[27][28] - 行业存在两种主流路径:开发扩展程序整合至现有浏览器 或重新打造浏览器嵌入AI[35][36] - 人工智能与网页互动可创造非凡价值 作为用户与信息桥梁使连接更紧密[30][31]
新iPhone的AI怎么样,得看苹果最近的收购了
量子位· 2025-08-27 05:49
苹果潜在AI收购战略 - 公司内部正严肃讨论收购法国AI初创公司Mistral和美国AI搜索工具Perplexity [1] - 收购总金额可能达上百亿美元级别 [1] - 此举旨在弥补生成式AI领域滞后局面并加速技术整合 [4][11] Mistral公司背景与价值 - 法国AI公司Mistral成立两年估值达100亿美元 [3][6] - 被誉为"欧洲版OpenAI" 以开源大模型Mistral-7B闻名 [7] - 技术亮点在于轻量化模型能力 特别适配手机等终端设备 [9] - 去年B轮融资获英伟达投资 当时估值已超60亿美元 [6] - 轻量化特性与苹果"设备优先"产品生态高度契合 [9] Perplexity公司特点与优势 - Perplexity以对话式搜索功能著称 被视为"谷歌杀手" [3][10] - 获英伟达和亚马逊投资支持 [10] - 创始人曾为OpenAI核心成员 苹果年初已讨论过收购事宜 [10] - 产品特性与Siri形成互补:Siri擅长指令执行 Perplexity专精深度信息检索 [10] - 近期提出以345亿美元收购谷歌Chrome浏览器 [3] 苹果AI发展现状 - 生成式AI领域明显滞后于竞争对手 [4][11] - iOS 18仅试探性加入生成式AI功能且受到用户批评 [15] - Siri更新停滞在语音助手阶段 缺乏突破性创新 [14] - 手持1330亿美元现金储备但AI布局缓慢 [4] 行业竞争格局 - 三星Galaxy手机已内置生成式AI 实现实时修图 写邮件等功能 [13] - 谷歌Pixel手机搭载Gemini Ultra AI功能覆盖摄影 搜索等多方面 [13] - 收购可避免从零研发的试错成本 快速弥补技术缺口 [16][17] 交易不确定性 - Perplexity公开表示"不知情被收购"并声称自身正在收购小公司 [19][20] - 苹果与Mistral双方均保持沉默 符合巨头收购前常规操作 [21] - 历史上有错过收购特斯拉和Netflix的先例 可能雷声大雨点小 [22]
空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了
量子位· 2025-08-27 05:49
核心观点 - 群核科技发布空间大模型 专注于室内场景并解决空间一致性痛点 与主流视频生成和3D场景生成路径形成差异化 [2][7][50] - 空间大模型通过真实感全息漫游 可交互性和复杂空间处理能力 推动AI从二维向三维空间智能演进 [11][13][50] - 行业处于早期发展阶段 类似GPT-2阶段 面临数据稀缺 场景复杂和交互泛化三大挑战 群核通过三位一体技术战略构建闭环生态 [32][35][42] 技术路径对比 - 视频生成派以Genie 3为代表 生成动态交互内容但本质为二维序列仿真 难以保证三维空间一致性 [5] - 3D场景生成派以World Labs和混元为代表 支持360度漫游但受限于高质量3D数据 易出现场景崩坏和穿帮 [5] - 群核原生空间智能路线深耕三维室内场景 构建具精确几何 物理属性和语义关系的数字孪生空间 [50] 模型能力特点 - SpatialGen基于扩散模型架构 通过文字描述 参考图像和3D布局生成多视角图像 采用3D高斯重建技术还原场景 [15] - SpatialLM1.5定义空间语言概念 用坐标轴描述物体位置 形状 姿态和物理属性 支持精准空间生成与编辑 [19][21] - 模型具备复杂任务处理能力 如基于自然语言指令生成三维空间并摆放家具 或通过AI Agent框架完成路径规划 [30][31] 行业挑战 - 室内空间数据稀缺且获取成本高 受隐私合规和环境多样性约束 规模化数据积累困难 [36][37] - 室内场景结构复杂 物体分布与功能逻辑异构性强 需深层认知理解如承重特性和几何稳定性 [39] - 交互任务需动态环境感知 物理常识推理与多步任务分解 现有模型缺乏动作后果预测和意图理解能力 [40][41] 群核技术战略 - 三位一体闭环包含空间编辑工具 空间合成数据和空间大模型 工具沉淀数据 数据加速模型迭代 模型提升工具体验 [42][45] - 拥有全球最大室内空间数据集InteriorNet 包含4.41亿个3D模型和超5亿个结构化3D空间场景 [45] - 基于技术飞轮开发可控视频生成工具 融合SpatialGen 自研渲染引擎KooEngine与DIT架构 计划年内发布产品 [47][48][49] 开源与生态建设 - 开源SpatialLM1.5和SpatialGen子模型 降低技术门槛并吸引开发者共同应对行业挑战 [14][52] - 通过开源推动构建以空间语言为核心的标准和生态 加速数据沉淀与技术迭代 [52] - SpatialLM 1.0曾登Hugging Face趋势榜前三 已有初创企业基于其代码训练自有模型 [52]