Workflow
量子位
icon
搜索文档
小扎“亿元俱乐部”刚组就被拆!千人AI团队面临裁员,高管也得走
量子位· 2025-08-20 01:13
公司AI部门重组 - Meta在6个月内进行第4次AI部门重组 将AI部门Meta Superintelligence Labs拆分为四个子部门 [2][3] - 新架构包含TBD实验室(负责人Alexandr Wang)、产品与应用研究(负责人Nat Friedman)、基础设施(负责人Aparna Ramani)和基础人工智能研究FAIR(负责人Robert Fergus) [3] - 重组后公司股价连续两日下跌4.29% 一度成为美股科技七巨头中跌幅最大 [3] 组织架构调整细节 - Alexandr Wang担任首席人工智能官并主导重组 直接负责TBD实验室 该部门名称"待定"体现其探索性定位 [7][8][9] - 赵晟佳担任首席AI科学家 老员工需通过其面试以在新架构中定位 [11][12] - 原AGI Foundations Group被解散 其负责人转向Wang汇报 原AI产品组负责人Connor Hayes调任管理Threads [21][23] 人力资源与战略调整 - 重组伴随高管离职和规模缩减 数千人团队面临洗牌 可能裁员或转岗 [24][25][27] - 新老员工存在摩擦 新人获天价薪酬包 老员工面临调整 [28][29] - 公司探索使用第三方AI模型支持产品 包括开源模型和闭源授权 [29] 行业竞争与战略定位 - 频繁重组反映公司在AI军备竞赛中追求速度 通过快速迭代寻找最优解 [4][6] - FAIR实验室多次调整定位 从元宇宙到生成式AI再到AGI 图灵奖得主Yann LeCun从公司首席科学家降级为FAIR部门首席科学家 [30][31]
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
量子位· 2025-08-19 07:21
Qwen-Image-Edit核心功能 - 支持点对点图像编辑,包括精准文字修改、新增/消除/重绘元素、IP编辑、视角切换、风格迁移等生成式玩法 [2] - 采用语义与外观双重编辑技术,结合Qwen2-5-VL和VAEEncoder实现视觉语义控制与外观控制 [67] - 在公开基准测试中展现SOTA性能,成为强大的图像编辑基础模型 [69] 原创IP编辑能力 - 以吉祥物卡皮巴拉为原型生成系列衍生形象,保持角色特性同时实现场景化创新 [8][10] - 实测中成功将熊形象调整为体操运动员造型,细节处理精准(手指数量、单杠形变) [11][13] 视角转换技术 - 支持90度/180度多角度旋转,实测WRC小瓦力模型后侧视角转换效果惊艳 [14][16][17] - 对非标准主视图(含俯视角度)仍能保持主体结构完整性 [17][19] 虚拟形象生成 - 可生成动漫/007/恶魔等多风格头像,3D卡通风格下眼镜框细节保留但存在全框化倾向 [20][21][26] - 复杂画风(如热血漫画)会出现线条凌乱现象 [23] 元素新增与修改 - 在颐和园实景照片中添加木质指示牌并生成倒影,高分辨率输入时主动降低输出分辨率 [29][32][34] - 低分辨率漫画测试中效果更优,成功添加"欢迎来到大海"标牌 [37] AI消除与重绘 - 精准去除头发丝等细小元素,支持复杂场景中单一元素颜色修改(如字母a黄变橙) [39][43][45] - 电商场景模拟表现优异,模特换装时手部/头发/光影处理自然 [46][47] 文字编辑技术 - 支持中英文双语编辑,可修改海报大字及细小文字(如AICoding→AIAgent) [49][50][54] - 链式编辑实现书法作品逐字/偏旁级修正,避免整图重生成 [56][60][62] 技术实现特点 - 一次出图即可完成多类编辑,虽存在色调/细节轻微变化但整体效果达标 [64] - 同时满足low-level外观编辑(像素级不变)与high-level语义编辑(整体像素可变)需求 [69]
美国专家来中国转了一圈:AI比赛已经结束了
量子位· 2025-08-19 07:21
中美AI差距分析 - 美国专家Rui Ma认为中美AI竞赛可能已结束,核心差距在于电力能源基建 [1][2][4] - 中国电力供应稳定安全且低成本,被视为已解决的问题,而美国电网老化且审批流程缓慢 [6][22][24][31][33] - 中国发电量达9000TWh(2022年),占全球30%,是美国的两倍 [44] 中国AI发展现状 - 中国AI企业实力雄厚但盈利困难,产品定价较低 [17] - 中国正利用制造业优势将AI融入产业链 [19] - 中国电力备用容量比例达80%-100%,远超美国的15% [37] 美国电力与AI发展瓶颈 - 美国70%输电线路使用超25年,接近寿命终点 [31] - 输电项目审批需10年以上,等待接入电网的项目容量较2020年翻倍 [33][34] - 科技公司短视追求利润,缺乏对能源基建的长期投入 [5][46][48] 行业专家观点 - AI教父Hinton批评硅谷公司短视,忽视AI安全与长期发展 [50][51][56] - 马斯克通过特斯拉虚拟电厂(VPP)尝试缓解电力压力 [40] - 国际能源署预测中美将占2030年全球数据中心电力消耗增长的80% [27] AI与电力需求关系 - ChatGPT日耗电量相当于1.7万美国家庭,模型推理更耗电 [27] - AI发展依赖电力基础设施,电力不足将直接导致竞赛落后 [26][27] - 中国通过核电、水电等可持续能源投资保障电力供应 [22][43]
奥特曼:我承认GPT-5发布搞砸了
量子位· 2025-08-19 07:21
GPT-5发布与用户反馈 - GPT-5发布后引发用户强烈不满,主要因一刀切停用旧型号且未提前通知,后在吐槽声中重新上线GPT-4o [2][16] - 用户实测发现GPT-5能力未达AGI预期,且存在明显缺陷如识别错误(如将5条腿斑马识别为4条腿)[7][8][10] - 核心槽点为交互体验差,被形容为"性格太冷"、"像与加班通宵者对话",缺乏GPT-4o的亲和力 [13][15] - 公司承认推广策略失误,总结教训为"不可仓促为数亿用户同步升级产品" [17][18] 公司战略调整与未来计划 - 计划投入数万亿美元建设数据中心,以支撑每日数十亿用户访问量,目标使ChatGPT成为全球流量第三大网站 [4][21][22][23] - 当前GPU短缺限制更先进模型的部署,需通过基础设施扩建解决 [24] - 秘密资助Merge Labs开发脑机接口,直接对标马斯克的Neuralink [4][25][26] - 暗示可能收购Google Chrome(若监管强制剥离)以扩展生态 [5][27] 行业观点与自我反思 - 承认AI领域存在投资过热现象,但坚持认为AI是长期最重要的技术方向 [29][30][31] - 强调产品设计需平衡功能性与伦理,避免用户形成不健康依赖 [19]
英伟达开源9B参数小模型,比Qwen3快6倍
量子位· 2025-08-19 05:25
小模型技术发展 - 英伟达推出新型小型语言模型Nemotron Nano v2 该9B模型在复杂推理基准测试上准确率与Qwen3-8B相当或更高 速度提升6倍 [1][7] - 模型设计目标为兼顾推理与非推理任务的统一模型 支持"思考"预算控制 用户可指定允许"思考"的token数量 [8] - 模型采用生成推理过程后输出答案的机制 允许跳过中间推理步骤但可能降低复杂推理准确率 展示推理过程可显著提升答案质量 [10][11] 模型性能表现 - 在NeMo-Skills套件测试中 AIME25达72.1% MATH500达97.8% GPQA达64.0% LiveCodeBench达71.1% [16] - 指令遵循和长上下文测试表现优异 IFEval达90.3% RULER 128K测试达78.9% BFCL v3和HLE基准也有提升 [16] - 模型经过FP8精度预训练 使用20万亿token 采用Warmup-Stable-Decay学习率调度 后训练包含SFT/GRPO/DPO/RLHF [19][21] 开源与数据发布 - 公司首次开源用于创建模型的绝大部分数据 包括预训练语料库 [4][23] - 发布两个基础模型NVIDIA-Nemotron-Nano-12B-v2-Base和NVIDIA-Nemotron-Nano-9B-v2-Base 均支持128k上下文长度 [22] - 预训练数据集包含66万亿token 分为Nemotron-CC-v2/Nemotron-CC-Math-v1/Nemotron-Pretraining-Code-v1/Nemotron-Pretraining-SFT-v1四个类别 [26][27] 技术实现细节 - 模型压缩后支持在单个NVIDIA A10G GPU(22GiB内存)进行128k token上下文推理 采用基于Minitron的压缩策略 [25] - 通过截断思维链训练解决模型在预设思维链外"思考"的问题 实现精确的思考预算控制 [12] - 预训练阶段计算量达1.45E+24 FLOPS 能耗708.3MWh 后训练阶段计算量7.25E+22 FLOPS 能耗35.6MWh [5] 行业战略布局 - 公司构建Nemotron生态 采取开源策略 近期连续发布Llama Nemotron Super v1.5和Nemotron Nano v2 [29][30] - 开源模型对标国内Qwen3系列 展现与国外科技巨头闭源路线差异化的战略选择 [32] - 模型当前支持在线试用 公司持续强化在AI领域的技术影响力 [22][33]
16岁炒马斯克鱿鱼,SpaceX天才转投北大数学校友赵鹏麾下
量子位· 2025-08-19 05:25
核心观点 - 16岁的天才少年Kairan Quazi从SpaceX离职,加入全球顶尖量化交易公司Citadel Securities,担任量化开发者[1][2][8] - Kairan智商超过180,14岁从圣克拉拉大学毕业,曾是SpaceX Starlink部门最年轻的软件工程师[1][15][51] - 量化金融领域相比AI研究具有更快的反馈和更直观的结果,这是Kairan选择转行的重要原因[17][18] 职业经历 - 14岁加入SpaceX Starlink部门,负责数百万客户与互联网连接的关键系统,年薪14-21.6万美元[1][35][39][40] - 在SpaceX工作两年后决定接受新挑战,将技能扩展到不同高性能环境[7] - 曾因年龄问题被上百家公司拒绝,最终被马斯克破格录用[26][30][31] 新公司情况 - Citadel Securities处理美国股票市场近四分之一的交易份额,2024年8月股票成交量超越纽交所[8][9] - 公司CEO赵鹏14岁就读北大数学系,23岁获UC伯克利统计学博士,是量化圈传奇人物[24][25] - Kairan将负责全球交易系统基础设施,工作处于工程与量化问题解决交汇点[11] 个人背景 - 9岁开始修读大学课程,11岁进入圣克拉拉大学工程学院,14岁以建校172年来最年轻毕业生身份毕业[51] - 10岁成为首位在英特尔智能系统研究实验室实习的本科生,参与开发霍金ACAT系统[51] - 幼年加入门萨俱乐部,智商超过180,一直被外界视为神童[27][51] 其他信息 - 因未满16岁曾被领英封禁账号,公开质疑平台规定"不合逻辑、落后可笑"[44][45] - 入职SpaceX时因年龄原因没有驾照,需母亲接送上班[48] - 新工作地点在纽约市中心,步行10分钟即可到达办公室[50]
“现在读AI博士已经太晚了”
量子位· 2025-08-19 05:25
行业观点 - 谷歌生成式AI团队创始成员Jad Tarifi认为,当前AI领域发展过快,不建议为追赶热潮而攻读AI博士学位,因为AI技术可能在博士毕业前就被解决[1][5][8] - Tarifi建议要么选择AI生物学等早期细分领域,要么完全避开AI领域,并强调博士学位需要牺牲大量时间和承受痛苦,仅适合对该领域极度痴迷的人[8][9][10] - Tarifi认为传统需要长时间完成的学位(如法律和医学)也面临挑战,因为所学内容可能过时且基于死记硬背[12][13] 就业市场影响 - 生成式AI已成为裁员主要推手之一,2025年前七个月美国因AI裁员超过1万人,AI被列为劳动力减少的五大原因之一[14] - 2025年美国公司已宣布裁员80.6万人,为2020年以来同期最高,科技行业裁员8.9万人,其中2.7万个岗位直接归因于AI驱动的冗余[15][16] - 应届毕业生就业市场收紧,计算机科学专业毕业生需投递2500份简历才能获得10次面试机会,应届生失业率攀升至6%,高于全美平均水平4%[19][20][22] 人才需求变化 - Tarifi建议发展社交技能和同理心,认为AI专业知识涉及"情感谐调"和"良好品味",而非掌握所有技术细节[23][24][25] - Y Combinator创始人Paul Graham指出低级别编程工作正在消失,建议深耕某一领域至远超AI杂活水平以抵御冲击[27][28] - 近50%美国Z世代求职者认为AI已使其学位贬值,企业如多邻国以"AI使用流畅度"作为招聘晋升标准[18][21]
首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025
量子位· 2025-08-19 05:25
文章核心观点 - 淘天集团未来生活实验室团队提出的CombatVLA模型在3D动作角色扮演游戏的战斗任务中表现出色,成功率超越GPT-4o和人类玩家 [1][4] - CombatVLA是一个3B级别的多模态大模型,通过动作思维(AoT)序列训练,实现了高效战斗决策和50倍加速 [4][8] - 该模型解决了3D战斗场景中的三大挑战:视觉感知、战斗推理和高效推理,并在战斗理解基准测试中全面超越现有模型 [6][11][46] CombatVLA概览 - 视觉-语言-动作模型(VLA)结合视觉、语义和动作控制,推动具身智能发展 [6] - 3D战斗场景面临视觉感知、战斗推理和高效推理三大挑战,现有方案存在泛化能力弱和推理延迟高的问题 [6][7] - CombatVLA基于3B参数规模,能处理视觉输入并输出具体可执行的动作指令,支持键鼠操作 [8] 动作追踪器和评测基准 - 团队开发了动作跟踪器,自动采集大规模训练数据,并建立了战斗理解评测基准CUBench [12][15] - CUBench涵盖信息获取、理解和推理三项核心能力,包含914条数据用于全面测试模型的战斗理解能力 [20][21] - 动作跟踪器在后台运行,监控键盘和鼠标操作以记录用户动作,并同步截取游戏截图 [17][18] CombatVLA模型 - 团队将动作跟踪器采集的数据转化为"动作思维"(AoT)数据,包含动作和解释两部分 [24] - 采用三阶段渐进式训练范式:视频级粗粒度微调、帧级细粒度微调和帧级截断微调 [26][27][29][33] - 训练过程中视觉编码器参数冻结,仅微调语言模型参数,并通过特殊标记实现输出截断加速 [35] 动作执行框架 - 团队开发了轻量级且高效的动作执行智能体,接收实时游戏画面作为输入,输出键鼠动作指令 [36][37] - 推理过程中采用截断输出策略,检测到特殊标记即停止,将内容解析为动作并转换为Python代码执行 [39][40] - 对实时游戏画面进行帧采样,去除冗余视觉信息,降低模型推理负担 [38] 实验结果 - 在CUBench上,CombatVLA取得63.61的最高平均分,比第二名Gemini-2.0-flash高出5.71分 [46] - 在通用基准评测中表现与基座模型相当,验证了方法的稳健性和泛化能力 [47] - 平均推理延迟仅1.8秒,比VARP快约50倍,模型调用成本仅为其1/10 [48][49] - 在任务级实战测试中,CombatVLA在中高难度任务上全面超越基线,并在零样本任务上展现较强泛化能力 [47][55]
AI Agent,搞投资?|量子位AI沙龙
量子位· 2025-08-19 03:13
AI Agent在投资领域的应用 - AI Agent具备全天在线、理性决策、快速执行的能力,可能替代传统投资方式 [2] - AI Agent在金融投资中的应用潜力成为关注焦点,涉及市场理解、行情预测及替代专业投资顾问团队的可能性 [3] RockFlow创始人背景 - RockFlow创始人兼CEO赖蕴琦(Vakee)拥有12年全球高科技与AI领域早期投资、金融科技产品设计及量化交易经验 [4] - Vakee曾主导投资20多家中美以早期AI与高科技公司,包括Cloudflare(NYSE: NET)、Circle(NYSE: CRCL)等,一级与二级市场投资均实现优异回报 [6] - 曾任职百度投资总监、洪泰资本控股执行董事,具备"产品+资本+技术"融合视角 [4][6] 活动信息 - 量子位AI沙龙将于8月22日周五下午14:00举办,探讨AI Agent与金融投资的结合 [3] - 活动提供线下交流与线上直播两种参与方式 [9]
突破Claude-4编程上限!自进化Agent框架拿下新SOTA,底模越好性能越高,已开源
量子位· 2025-08-19 03:13
核心观点 - SE-Agent框架通过自进化机制显著提升大语言模型在复杂推理任务中的表现,在SWE-Bench Verified基准上实现80%的Top-1 Resolution Rate,刷新领域纪录 [2] - 该框架突破传统独立尝试模式,引入集体进化思想,通过修订、重组、精炼三大算子实现轨迹级优化 [6] - 在开源模型测试中表现突出:DeepSeek-V3提升73%至54.8%,Qwen-2-5-72B提升106%至38.8%,Llama-3-1-70B提升112%至32.6% [12] - Claude-3-7-Sonnet应用该框架后解题成功率从40.6%提升至61.2%,相对提升51% [18] 技术架构 自进化机制 - 修订算子:通过多样性初始生成和深度反思修正,消除逻辑不一致和冗余推理 [8] - 重组算子:创新性实现跨轨迹知识共享,包括交叉融合优势基因和知识迁移 [9] - 精炼算子:通过多维度评估函数进行精英选择和多样性保持,实现高效进化收敛 [10] 性能优势 - 解决方案多样性:通过轨迹级干预生成本质不同的解决路径,扩展候选方案空间 [15] - 跨轨迹协同:充分利用轨迹间相互依赖关系,突破单一智能体认知局限 [15] - 模型兼容性:作为独立优化模块可与现有框架无缝集成,在多种LLM上表现一致 [16] 实证表现 基准测试 - 在500个真实GitHub问题的SWE-bench Verified基准上全面评测,所有测试LLM均实现显著提升 [11] - 消融实验证明修订和重组两大模块对框架成功至关重要 [14] 案例研究 - 在scikit-learn案例中,传统方法修复失败率78.6%,SE-Agent通过定位multioutput.py文件关键字段实现根本性修复 [20] - 展示框架如何通过轨迹演化避免"隧道视野",发现隐藏更深的解决方案 [21] 行业影响 - 开创轨迹级优化范式,从参数调整转向系统性推理路径操作 [22] - 验证集体智慧机制是突破单一智能体认知瓶颈的有效途径 [23] - 为构建持续自我改进的智能体系统奠定基础,未来可扩展至强化学习策略发现等领域 [24]