量子位

搜索文档
马斯克周末血裁xAI 500人
量子位· 2025-09-16 05:58
xAI裁员事件与战略调整 - xAI进行内部突袭测试 淘汰率高达33% 超过500名员工被裁[1][2] - 数据标注团队规模从1500人缩减至1000余人 裁员比例接近三分之一[18] - 被裁员工主要为通用数据标注员 负责视频标注 音频标注和写作等任务[17][18] 数据标注团队结构与成本 - 数据标注团队是xAI最大团队 在Grok开发中发挥关键作用[3] - 公司采用直接雇佣而非外包模式 以增强对模型训练的控制和隐私保护[4] - 直接雇佣模式导致成本更高[5] - 2025年2月计划招聘数千人 半年内新增约700名数据标注员[6] 战略转向与招聘计划 - 公司战略转向专业数据标注领域 计划将专业数据标注员规模扩大10倍[19] - 专业数据标注员专注于STEM 编程 金融 法律和媒体等垂直领域[18] - 此次调整反映公司从"数据数量"向"数据质量"的战略转变[21] 垂直领域AI发展背景 - 互联网高质量语料枯竭导致Scaling Law出现边际效应递减[24] - 垂直模型在金融 医疗 法律等行业更具准确性与合规性优势[25] - 行业从通用大模型向垂直场景应用发展趋势明显[25][27] 马斯克管理风格 - 马斯克偏好精悍小团队 强调性能与效率[35] - 其管理理念认为小团队更具创造力 沟通效率更高且迭代更快[36][37][38] - 历史上在特斯拉2年内裁员7000余人 在Twitter一周裁员3700人[31][34] - 实行"硬核文化"要求 要求员工长时间高强度工作[42][43] 战略影响与行业意义 - 此次裁员可能帮助Grok在垂直应用领域建立优势[28] - 过度依赖专家库可能限制数据多样性 带来模型盲点风险[22] - 行业需要重新平衡数据质量与数量的关系[23] - 若战略失败 xAI可能在Scaling Law赛道落后于OpenAI等竞争对手[29]
魅族AI眼镜1999元开卖:拍照翻译付款全都会,39g重
量子位· 2025-09-16 05:58
支持12国语言同声传译、AI识物、语音转写,甚至还能直接用眼镜买单。 怎么说呢,感觉是把一个 随身AI Agent 戴在了脸上。 顺带也把Live实况图和胶片滤镜也一起安排上了。(看样子是冲着年轻人去的) 39g的轻量框架,把"会拍"和"能懂"都塞进了一副眼镜里。 这回,魅族明显在AI上下了重注: 梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 智能眼镜赛道,又添一款新产品。 刚刚,魅族官方发布了全新AI拍摄眼镜—— StarV Snap ,首发价1999元。 具体产品如何,一起来看—— 轻巧便捷的随身AI助手 大厂们都在给硬件塞AI,魅族这次也不例外。 这次它没走"噱头路线",而是把AI直接做成了标配,还在交互上搞了点小花样: 在交互方式上,和多数智能眼镜一样,StarV Snap支持镜腿触控;不同的是, 右侧新增AI专属按键 ,单指一按即可发出指令,无需唤醒 词。 在视觉识别能力上,StarV Snap也没有缺席,直接安排上了 AI识物 功能:能读懂艺术场景,能算出食材卡路里,还能认得花鸟鱼虫。 (别说,减肥党看到食物秒查热量这事儿,还真挺刚需。) 再说说操控体验,魅族这次搞眼镜的同时,还不忘拉一把 ...
奥特曼“续命”大计:押注让大脑变年轻的药物,预计年底临床试验
量子位· 2025-09-16 04:05
奥特曼投资Retro Biosciences - 奥特曼加大对旧金山生物技术初创公司Retro Biosciences的投资 该公司致力于将人类寿命延长10年 [3] - 奥特曼此前提供全部1.8亿美元(约13亿人民币)种子轮融资 显示其对该公司的全力支持 [4] - 公司与OpenAI合作开发GPT-4b-micro模型 可将普通细胞转化为干细胞 专为蛋白质工程设计 [5] 公司研发进展与临床试验 - 计划2025年底启动首个人体临床药物试验 首批试验患者将服用代号RTR242的实验性药物 [8][12] - 已完成澳大利亚临床试验地点选址与实验室供应商遴选 首位受试者预计今年年底完成入组 [19] - RTR242通过清除与阿尔茨海默症和帕金森症相关的细胞垃圾来重启老年人停滞的自噬过程 从而清理脑细胞损伤 [17] 技术机制与策略 - RTR242针对细胞自噬机制 该机制类似细胞的垃圾处理和回收系统 通过溶酶体降解受损细胞器和错误折叠蛋白质 [16] - 公司采取平衡策略 既开发针对特定疾病的药物(如RTR242) 也探索通过AI实现重大范式转变的激进方案 [22][23][24] - GPT-4b-micro将干细胞重编程标志物的表达效率提升50倍 显示AI在抗衰老疗法中的颠覆性潜力 [29] 公司目标与融资计划 - 终极目标是为人类增加10年健康寿命 而非单纯延长预期寿命 旨在让人们始终保持健康、警觉和活力 [33][34] - 公司明确A轮融资目标为10亿美元 若成功将进入长寿创业公司行列 [35][36] - 目前除RTR242外 还有针对白血病的RTR890疗法和针对中枢神经系统疾病的RTR888疗法处于临床前开发阶段 [34] 行业背景与团队 - 长寿科技行业包括杰夫·贝索斯支持的Altos Labs 该公司已募集超30亿美元资金 [37] - 公司共同创始人丁胜为清华药学院创始院长 以干细胞研究闻名 [41][42] - CEO贝茨-拉克鲁瓦曾带领团队打造世界最小Windows电脑 拥有超100项专利 并曾在YC担任兼职合伙人 [44][45]
宇树:开源机器人世界大模型!
量子位· 2025-09-16 04:05
核心观点 - 宇树科技开源世界模型-动作架构UnifoLM-WMA-0 专为通用机器人学习设计 能够理解机器人与环境交互的物理规律 并支持多机器人本体适配 [1][9] 技术表现 - 模型在真机部署中表现稳定 包括堆积木任务 预测视频与实际操作高度吻合 [2][3] - 支持双机械臂协作任务及精细操作如文具收纳 [5][7] - 作为仿真引擎使用时 可根据当前场景图像和未来动作指令生成可控交互内容 精准匹配预期效果 [23] 模型架构与训练 - 架构支持两种模式:决策模式(预测物理交互关键信息辅助动作生成)和仿真模式(生成逼真环境反馈模拟交互) [19][20] - 训练基于Open-X数据集微调视频生成模型 适配机器人实际作业场景 [15] - 使用宇树科技五个开源数据集完成全流程训练 包括Z1和G1机器人系列任务数据 [22][23] 开源与社区反响 - 完整开源训练代码、推理代码及模型Checkpoints GitHub迅速获得101个Star和11个Fork [11][12] - 项目提供详细训练策略及测试结果对比 包括长程任务交互生成能力验证 [12][23]
每周7亿人都在如何用ChatGPT?OpenAI最全报告来了
量子位· 2025-09-16 00:52
核心观点 - OpenAI联合哈佛大学发布首份ChatGPT用户研究报告 基于大规模实际对话数据分析2022年11月至2025年7月期间用户行为模式 [1][5][6] 用户规模与活跃度 - 截至2025年7月 ChatGPT周活跃用户数突破7亿 [5] - 每周消息发送总量达180亿条 [5] - 中低收入国家用户增长率是高收入国家的4倍以上 [27][28] 使用场景分布 - 75%对话集中于实用指导、信息搜索和写作三大场景 [12] - 具体占比:实用指导28.8% 信息搜索24.4% 写作23.9% [18] - 编程和社交等需求占比较小 [13] 交互模式特征 - 询问类消息占比49% 为增长最快且用户评价最高的类别 [15] - 行动类消息占比40% 其中约三分之一与工作相关 [16] - 表达类消息占比11% 主要用于个人反思和娱乐 [17] 用户人口特征 - 性别差距显著缩小:从早期80%男性用户为主转变为女性用户占比反超 [23][24] - 18-25岁用户贡献46%消息量 为成年用户中最活跃群体 [26] - 年龄越大 工作相关消息占比越高 [26] 研究方法论 - 分析150万次大规模对话数据 采用自动化分类器结合隐私保护方法 [6][20] - 数据集包含:Growth数据集(2022年11月-2025年9月全量消息) 分类消息样本(110万条去标识化消息) 就业数据(13万用户职业信息) [8][9][10] - 通过数据Clean Room进行聚合分析 确保用户隐私保护 [10][20][21]
GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用
量子位· 2025-09-16 00:52
模型升级 - 推出GPT-5-Codex特化版模型 支持独立连续编程7小时[1][5] - 新模型具备真动态思考能力 可在执行任务过程中实时调整算力分配[4] - 针对复杂工程任务训练 包括完整项目构建、功能测试、调试和大规模重构[8] 性能表现 - 在SWE-bench Verified上表现略优于原版GPT-5 代码重构任务成功率提升近20%[9] - 简单任务输出token数比GPT-5减少93.7% 响应速度提升10倍[11] - 复杂任务推理时间增加 输出token量提升102.2%[12] - 代码审查错误率从13.7%降至4.4% 高影响力评论比例从39.4%提升至52.4%[15] 产品生态 - 推出IDE插件版 支持VS Code和Cursor编辑器[2] - CLI支持图像输入 可处理截图和设计稿[18] - 集成网络搜索和MCP工具 用待办列表追踪复杂任务进度[19] - 终端界面升级 工具调用和diff展示更清晰[20] - 支持云端本地无缝切换 可在IDE创建云任务并跟踪进展[23] 基础设施 - 通过容器缓存技术 新任务中位完成时间缩短90%[24] - 自动扫描设置脚本并执行 运行时可通过pip install获取依赖[24] - 前端任务可启动自有浏览器查看构建结果 迭代改进并附加截图至PR[24] 市场时机 - 升级正值Claude Code因模型质量下降出现用户退订潮[25] - 公司借机抢占AI编程市场份额[26]
2025Q3 AI 100产品榜单报名开启|AI 100
量子位· 2025-09-15 09:25
量子位智库 . 连接AI创新,提供产业研究 进入2025下半年,国内AI产品的竞争格局发生了质变——更激烈,新变量也更多。 一方面,竞争回归 产品本质 。流量营销战鲜有效果,用户开始用实打实的 重复使用 和 持续消费 投票,产品增长回归到了 价值交付 和 体 验细节 。 头部产品在大场景中加强垄断的同时,初创的高度细分产品正抓紧把握时间窗口,抢夺用户心智。 编者荐语: 新一期AI100榜单来了! 以下文章来源于量子位智库 ,作者AI 100组委会 另一方面, 新一代AI-Native 的产品设计正在撬动新蓝海。Multi-agent、AI消费级硬件、Vibe Coding、Deep Research、多模态交互等新 变量加速落地。 新场景、新工作流、新交互方式正在快速萌芽,在分歧与竞争中找寻面向未来的解法。 在过去的三个月,哪些产品在头部屹立不倒?哪些互联网产品加入AI阵营?又有哪些新产品崭露头角? 量子位智库将在2025 Q3的「AI 100」榜单中给出答案,期待你的参与。 一、关于AI 100 「AI 100」是量子位智库推出的 AI产品风向标 系列内容,主要由「旗舰100」和「创新100」双榜单,以及邀 ...
DeepMind哈萨比斯最新认知都在这里了
量子位· 2025-09-15 05:57
文章核心观点 - 谷歌DeepMind CEO哈萨比斯认为AGI将在未来十年内实现 并开启科学的黄金时代和新文艺复兴 在能源 健康等领域带来巨大益处 [2][7][51] - 当前AI系统仍存在关键瓶颈 包括缺乏真正的创造力 无法提出新假设 以及在某些领域表现优异但其他方面犯简单错误 [4][5][33] - 实现AGI需突破多模态理解 世界模型构建和持续学习能力等核心技术障碍 [6][21][36] DeepMind战略定位与团队规模 - DeepMind与谷歌完成合并 整合Alphabet所有AI团队 成为谷歌和Alphabet的"发动机舱" 负责构建核心Gemini模型及视频模型 交互式世界模型等多种AI模型 [15] - 团队规模约5000人 其中80%以上为工程师和博士研究员 约有三四千名顶尖技术人才 [16] - 模型已全面接入谷歌生态 包括Workspace和Gmail等全线产品 每日服务数十亿用户通过AI概览 AI模式或Gemini应用进行交互 [15] 世界模型技术突破 - Genie 3世界模型通过分析数百万段YouTube等平台视频 自主推导现实世界运行逻辑 能即时生成可交互的沉浸式环境 [17][19] - 模型无需预编程物理规则 仅通过观察学习即掌握光影反射 物体运动等复杂原理 生成持续一两分钟的高度一致性交互场景 [19][20] - 技术突破点在于实现逆向工程学习物理规律 生成范围远超人类活动 包括操控沙滩小狗或与水母互动等多元世界模拟 [19] 机器人技术发展路径 - 采用"安卓模式"战略 打造跨机器人的通用操作系统层 同时探索垂直整合 将最新模型与特定机器人类型深度结合 [25] - 人形机器人对日常任务极具价值 因人类环境基于人体工学设计 但专用机器人形态在工业等领域仍有不可替代性 [26][27] - 当前处于类似70年代PC初期阶段 未来两三年将实现算法突破 关键挑战在于硬件规模化时机选择 需平衡成熟度与量产需求 [28][29] AGI核心能力缺失与衡量标准 - 当前AI缺乏真正创造力 无法像爱因斯坦提出狭义相对论那样实现直觉飞跃或类比推理 [33][34] - 真正AGI需在所有领域保持博士级表现 而非仅在某些领域优异 同时需具备持续学习能力以实时吸收新知识 [35][36] - 关键测试包括给AI设置1901年知识截止点 检验其能否提出类似1905年爱因斯坦的创新理论 [34] 创意工具变革与行业影响 - Nano Banana等工具的核心优势在于惊人一致性 能理解指令并保持其他元素不变 实现高效迭代 [14][38] - 工具双轨赋能:降低大众创作门槛 同时为顶级创作者提供十倍百倍效率提升 但输出质量仍依赖使用技巧和审美素养等专业因素 [38][39] - 未来娱乐将出现融合共创的新艺术形式 顶级创意先锋主导高质量动态叙事 数百万人可参与部分内容共创 [39][40] 药物研发加速前景 - Isomorphic Labs依托AlphaFold技术 旨在将药物研发周期从数年或十年缩短至几周或几天 [41] - 目前与礼来 诺华等重要合作 推进癌症 免疫学和肿瘤学研究 预计明年进入临床前阶段 [43][44] - 采用混合模型架构 结合学习组件与化学物理规则约束 以解决生物学数据不足问题 [45] 能源效率与AGI贡献 - 通过模型蒸馏等技术 相同性能下模型能效过去两年提升10倍甚至100倍 [49] - AI系统在电网效率 材料设计和新能源等领域的贡献将远超其自身能源消耗 [50] - 当前总需求未降低因前沿模型仍需扩大规模实验 但服务端能效持续优化 [49]
马斯克的最快AI模型来了
量子位· 2025-09-15 05:57
产品性能表现 - xAI发布Grok 4 Fast模型 生成速度达每秒75个token 比标准版快10倍[1] - 在编程任务中表现高效 解决LeetCode雨水问题用时不到2秒 用C语言编写链表代码仅需8秒[3][5][6] - 处理常识性问答响应迅速 例如瞬间解答"量子计算机何时取代传统计算机"等问题[5] 准确性测试 - 成功解答初中数学应用题 包括两列火车相遇时间计算(正确答案为2小时)及往返飞鸟总飞行距离计算[12][14][15] - 在部分场景存在局限性 如生成Xbox 360手柄SVG代码时输出结果不理想[17] - 简单问答可能出现异常 例如对"你是谁"等基础问题回应不准确[20] 产品定位策略 - 采用速度优先设计理念 通过跳过部分验证检查实现实时响应 适合简单查询和工具使用场景[26] - 与注重深度验证的专家模式形成差异化定位 类似GPT-mini的即时模式满足用户对实时性的需求[24][25][26] - 延续xAI速度优化产品线 继8月28日推出Grok Code Fast 1后 两周多即发布Grok 4 Fast[27][28] 市场反馈 - 用户评价为"迄今最快的思考模型" 认可其响应速度优势[9] - 出现非传统应用场景 例如用户尝试与模型进行娱乐性对话互动[10] - 尽管持续推出新功能 但市场热度未达预期 存在用户认知度提升空间[28]
只要科学任务能打分,AI就能实现SOTA结果 | 谷歌最新论文
量子位· 2025-09-15 05:57
文章核心观点 - 谷歌开发了一种结合大语言模型和树搜索的AI系统 能够自动创建专家级科学实证软件 在多个科学领域实现超越人类专家的SOTA性能 [1][10][17] 技术方法 - 系统使用LLM重写代码提升质量评分 首先生成大量候选解决方案 再通过树搜索算法筛选优化方案 [17] - 通过注入外部研究思想增强代码变异能力 思想来源包括高被引论文 专业教科书和搜索引擎结果 [21] - 用户可直接注入思想或通过搜索引擎自动获取文献研究成果 LLM在编码过程中充分利用这些指导信息 [22][23] 性能表现 - 生物信息学领域发现40种单细胞数据分析新方法 在公开排行榜上超越人类顶尖方法 [10][25] - 流行病学领域生成14个COVID-19住院预测模型 全部超越CDC集合模型及所有其他个体模型 [10] - 地理空间分析领域三个新方法在DLRSD基准测试mIoU指标均突破0.80 显著优于近期学术论文结果 [26] - 神经科学领域斑马鱼活动预测方案训练速度比最佳视频模型快几个数量级 [28] - 在时间序列预测和数值积分求解领域达到或超越人类顶级方法水平 [10][30] 系统特点 - 专门针对可评分任务设计 这类任务以最大化可度量质量指标为目标 在科学界无处不在 [12][13][14] - 能够系统性地自动创建实证软件 解决科学软件开发过程缓慢艰难的痛点 [15][17] - 通过大规模彻底搜索发现高质量解决方案 实现超人类性能 [24] 社会反响 - 论文在X平台获得2.6K赞和283.4K浏览量 引发广泛讨论 [7][11] - 部分网友认为这标志着任何可量化领域都将被AI征服 [5] - 存在关于AI接管科学研究合适性的争议 有观点认为结果需要人类核查可靠性 [32][34]