Workflow
量子位
icon
搜索文档
AI Coding大佬聊透了:产品智能重要还是用户体验重要?答案让人意外
量子位· 2025-08-13 09:13
AI Coding行业趋势 - 行业从讨论"AI替换开发者"转向"人机协作",关键词从replace变为cooperate [17][18][19] - 未来发展方向是弱人机交互,人充当看管者角色,任务可夜间自动执行[29][30] - 2年内AI编程产品将服务更广泛人群,具备特定工作环境下的长期记忆[10][128][130] - AI时代To B与To C界限模糊,产品可能从to C再融入to B[40][41] 产品形态与技术发展 - 智能体(Agent)成为扩大生产力的重要手段,能串联任务并彻底解决问题[23][25][26] - 基础模型能力是产品能力底线,决定产品上限[8][110][113] - 产品形态多样化,IDE与CLI适配不同场景,背后智能可共享[55][56][57][59] - 多智能体协作形成"智能体团队",各司其职解决复杂任务[52][53][54] 用户需求差异 - 专业开发者看重代码精确度与可控性,不希望AI修改指定范围外的代码[90][92][95] - 普通用户更关注结果呈现,需要明确进度反馈而非技术细节[100][102][106] - 企业用户注重数据安全、系统稳定及效能提升[33][34][37][38] - 非程序员可用AI做软件但难达到专业复杂度[5][44][89] 产品评价维度 - 效果为王,产品好用比免费更重要[6][77][78] - 智能能力决定长期用户粘性,需理解用户真实意图[103][104][107][108] - 人机交互友好度影响使用体验,需降低学习成本[69][70][72][75] - 语法结构逻辑性注入可提升代码质量[71] 开发者能力变化 - 开发者从纯执行者转向协作与监控者,需了解AI能力边界[118][119][124] - 程序员需兼具技术深度与产品/市场知识,参与复杂系统设计[11][121][123] - 招聘要求变化:全栈能力需求增加但深度要求降低,需掌握AI工具[10][12] - 生产关系调整可能使编程工作更轻松,但工具开发者压力增大[14][16][17] 核心关键词 - 成本:AI大幅压缩生产力提效成本,降低创新门槛[131][133] - 协作:涵盖人机协作、多Agent协作及新的人人协作模式[134][136] - 需求:技术进步的原动力,驱动产品与代码发展[137] - 杠杆:AI将个人产出价值放大数十倍[139]
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
量子位· 2025-08-13 09:13
扩散语言模型的数据学习潜力 - 在token数量受限情况下,扩散语言模型的数据潜力可达自回归模型的三倍多 [1] - 一个参数规模为1B的扩散模型,仅用1B tokens训练480个周期,就在HellaSwag和MMLU基准上分别取得56%和33%的准确率 [5] - 即使在极端数据重复下,模型也未出现性能饱和,表明其还能从1B数据中挖掘出更多有用信息 [4] 扩散语言模型的技术优势 - 扩散目标和双向注意力机制使其能够进行双向建模,更充分地挖掘网络数据中的信息 [8] - 双向建模打破传统自回归模型的因果限制,能更全面捕捉语言及非因果数据的复杂模式 [8][9] - 扩散模型计算密度极高,在训练和推理中投入更多计算资源,通过多次处理数据和迭代优化提升性能 [11] - 扩散目标要求在预训练时对每个数据点进行多种掩码比例和组合的扰动,从而更有效地训练 [15] 扩散语言模型的过拟合特性 - 模型过拟合出现的训练周期数与独特数据量呈正相关,与模型规模呈负相关 [18] - 独特数据量越大,过拟合出现越晚;模型规模越大,过拟合发生越早 [18] - 模型在预训练验证集上"过拟合"时,下游任务性能不一定会下降,反而可能持续上升至训练结束 [19] - 绝对负对数似然值的变化不一定转化为相对顺序的变化,因此验证损失上升时模型判别能力仍可能提升 [21][22][25] 自回归模型的比较与行业背景 - 自回归模型优先考虑计算效率而非数据潜力,其transformer设计采用教师强制和因果掩码,限制了建模能力 [14] - 随着计算成本下降,数据可获得性成为关键瓶颈,这是研究团队开展扩散语言模型研究的出发点 [15]
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
量子位· 2025-08-13 07:02
世界模型与Genie 3技术进展 - Genie 3能实时生成可交互的虚拟世界并让智能体在其中运行,标志着世界模型技术取得突破[3][5][35] - 世界模型需理解物理规律、材料特性及生物行为,这是实现AGI的必要条件[33][34] - Genie 3已实现720p分辨率、多分钟交互时长及可导航的提示性世界事件生成能力[32] DeepMind发展动态 - 公司研发节奏持续加速,几乎每天都有新成果发布,包括DeepThink、IMO金牌模型等里程碑[9][15][18] - 智能体系统从早期游戏领域扩展到多模态模型,现正通过整合思考规划能力向AGI迈进[24][25] - 强化学习仍是核心技术路径,2010年至今持续投入并验证其可扩展性[27][28] AI能力评估与Game Arena平台 - 现有模型表现参差不齐:IMO金牌级数学能力与高中基础题错误并存[11][29] - 行业亟需新评测基准,需覆盖物理直觉、多目标优化等更复杂维度[13][45][46] - Game Arena平台通过数千款游戏动态测试AI能力,支持模型间对抗与自动难度调整[47][48][53] 工具整合与系统进化 - 工具使用能力成为AI新扩展维度,需平衡内置功能与外部工具调用[63][64][66] - 模型正向系统级进化,能组合调用数学软件、搜索引擎等工具完成复杂任务[68][69] - 产品设计需预测技术发展节奏,保持架构灵活性以适应快速迭代[72] 技术融合与AGI路径 - Genie、VO、Gemini等模型正朝"全能模型"方向融合,形成统一能力体系[75][76] - AGI需具备自主转化人类意图为动态奖励函数的能力,解决多目标优化难题[23][60] - 物理模拟器可能成为关键工具,帮助AI理解并操作现实世界[33][63]
偷数据的AI公司被抓到了
量子位· 2025-08-13 07:02
AI公司利用互联网档案馆获取数据 - AI公司通过Wayback Machine的存档绕过Reddit的数据获取限制,偷偷抓取大量数据用于模型训练 [2][3][4] - Wayback Machine是公益性的数字存档工具,自1996年开始缓存网页,2001年推出时已存档超100亿个页面 [11][14][15] - AI公司利用其开放性特点抓取Reddit历史数据,规避付费和合规协议,获取训练所需内容 [16][17] Reddit对数据滥用的抵制措施 - Reddit对AI公司直接抓取数据行为设置严格限制,仅向付费合作方(如谷歌)开放数据 [5][6] - 2023年Reddit调整API政策以阻止AI公司滥用数据,导致部分第三方应用关闭 [8] - Reddit起诉Anthropic,因其在宣称停止抓取后仍违规获取数据 [9][10] - Reddit宣布限制Wayback Machine对其内容的索引,仅允许抓取主页,禁止访问帖子详情和用户资料 [20] 行业影响与争议 - AI公司的“曲线抓取”行为侵犯平台权益和用户隐私,打破数据使用规则平衡 [18][20] - 除Reddit外,Meta、Twitter等平台也曾限制第三方爬虫抓取用户内容用于AI训练 [20] - 有观点认为Reddit试图通过数据交易获利,但数据所有权与AI需求的冲突正在升级 [23][24] 互联网档案馆的立场 - Wayback Machine负责人表示与Reddit有长期合作,将继续就数据抓取问题进行讨论 [21] - 互联网档案馆的数据由公众上传和网络爬虫自动搜集,旨在提供免费存储服务 [11][13]
微软反制Meta发起人才狙击战!“精准打击”名单+特制数百万美元薪酬包,高管24小时内批复
量子位· 2025-08-13 07:02
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 螳螂捕蝉,黄雀在后。 Meta再次陷入挖人大战,但这次是被挖的一方。 内部文件显示,微软计划用数百万美元的薪酬包从小扎手里挖人。 并且微软这波的计划是实施"精准打击", 意向人员名单已被列出 ,瞄准的全都是Meta的AI Research等人才重地。 爆料显示,微软还为了这波计划 专门准备了新流程和特殊预算 。 网友表示,如果微软成功撬动Meta人才,也算是小扎自食其果了。 同时,微软最近的财报表现出色,市值接近4万亿美元,这很大程度上得益于AI热潮。 为了保持这种成功势头,微软迫切需要吸引顶尖的AI工程师和研究人员, 所以招募的重点,正是AI人才。 Business Insider透露,微软计划给目标AI人才提供数百万美元的聘用奖金(on-hire bonuses)。 文件显示,微软有一份关于Meta热门员工的电子表格,其中记载了人物姓名、地点和职位,涉及Meta的Reality Labs、GenAI Infrastructure和AI Research等组织。 据一位知情人士透露,这份表格正在与微软内部某些AI团队的招聘经理共享。 并且为了招聘,微软 ...
26岁陶中恺教授,加盟法国数学象牙塔
量子位· 2025-08-13 04:17
学术成就与教育背景 - 15岁考入西安交大少年班,本科期间创造惊人学术记录:16门课程100分、24门98分、30门以上95分,大一至大三均分96.94 [2][15] - 伯克利交换期间三门研究生课程两门A+,代数几何课程获教授首个A+评分 [3][20] - 本科期间自修17门研究生课程,专业排名常年第一,54门课成绩95分以上 [15] - 获国家/国际级竞赛奖项7项、省级3项、市校级2项,包括全国大学生数学竞赛第四名(西安交大历史最佳)[16][18] - 丘成桐大学生数学竞赛华罗庚奖铜奖(题目难度等同国外博士资格考试),阿里巴巴全球数学竞赛最年轻金奖得主 [18][19] 研究方向与学术贡献 - 主攻数学分析与前沿物理交叉领域,涉及光谱理论、微观局部分析、广义相对论、凝聚态物理及双曲动力系统 [10][11][26] - 在魔角石墨烯研究中与UCLA教授合作,证明TBG模型特征函数在经典禁区的指数衰减,推动二维材料电子态解释 [28] - 证明无压环境下无限体积负曲率曲面的谱间隙存在,构造广义相对论初始数据拼接新方法 [31] - 混沌流与开放动力系统研究中明确Axiom A流共振分布的多项式上界与亚线性下界 [29] - 谷歌学术显示其成果涵盖偏微分方程、微局部分析、谱理论,2023年两篇论文各获12次引用 [27] 职业发展与机构选择 - 26岁博士毕业即被法国高等科学研究所(IHES)聘为初级教授,同期收到MIT、斯坦福邀请 [7][34] - IHES为数学界顶级机构,现任7位常任教授中5位数学家含2名菲尔兹奖得主,历任13位教授中8位获菲尔兹奖 [8][42][47] - 选择IHES因巴黎的数学研究环境优势,计划深化微观局部分析研究 [35] - IHES近年新增多位华人学者,包括破解挂谷猜想的王虹(常任教授)及随机共形几何专家王艺霖(初级教授)[49][52][54] 个人背景与社会影响 - 父母为数学教师,初三因自学微积分与数论确立数学兴趣 [12][13] - 本科期间被称"陶神",自谦称受陶哲轩启发希望成为多领域学者 [9][21] - 师从伯克利教授Maciej Zworski(量子混沌领域专家,《半经典分析》作者)[22][24][25]
对话百度文库:不做大模型能直接做的事,能力积累换来竞争壁垒|AI产品Time
量子位· 2025-08-13 04:17
百度文库AI转型核心观点 - 百度文库从文档检索平台转型为一站式AI内容获取和创作平台,付费用户突破4000万,AI功能带动付费率年同比增长60%,AI MAU近亿[3][4] - 智能PPT访问量全球第一,成为AI创作领域绝对头部产品[3] - 通过"没有大模型不行、只靠大模型也不行"的策略,在模型缺陷补充架构和工程上下功夫[19] - 坚定选择符合战略主路径、能建立领先优势并加高竞争门槛的功能优先开发[89] 产品定位与战略 - 定位为"一站式AI内容获取和创作平台",解决用户端到端问题而非单环节问题[10][11] - 系统设计强调低门槛输入、多模态处理和自由输出,让用户不受格式限制[12] - 产品愿景从"方便找到信息"升级为"自由高效获得想要的东西",市场空间从几十亿大幅扩展[16] - 选择用户有付费心理预期的功能如PPT开发,避免AI产品付费难问题[37] 技术架构与优势 - 采用MoE架构,在时间、稳定性和成本上具有规模化优势[57] - 构建沧舟OS系统和GenFlow调度系统,实现多智能体并行处理复杂任务[56] - 拥有全网最核心的专业公域数据和最全私域数据,数据积累形成壁垒[22] - 技术领先期仅半年,关键是通过产品迭代保持用户心智构建壁垒[59][60] 用户增长与商业化 - 自然用户增长显著,APP在未推广情况下自然用户增长一倍[62] - 自带订阅制商业模式,将AI权益包进现有体系节省用户认知成本[33] - 采用限免策略让用户先认同品质再付费,增加会员权益获得感[38][39] - 关注DAU、使用次数、生成采纳率和使用率等核心指标[36][40] 产品方法论 - 功能选择标准:必须有模型、需求痛点强、效果易衡量[28][29] - 构建用户旅程而非刻意引流,预测用户行为延长线[42][43] - AI Agent是实现目的的手段,用户关注交付时效性、稳定性和实际效果[48][49] - 一站式产品会大幅减少单点工具数量,创业者需做好战略选择[71] 团队与执行 - 产品成功三要素:坚定愿景、正确战略路径、找对伙伴[78] - AI产品经理需比用户超前半步,更懂技术路线并有前瞻性思考[80][82] - 团队需要强学习能力、空杯心态、打破路径依赖和真执行力[85][86] - 开发优先级依据:符合战略主路径、建立领先优势、加高竞争门槛[89]
倒反天罡!AI新贵345亿美元报价谷歌浏览器,此前碰瓷Tiktok未果
量子位· 2025-08-13 04:17
核心观点 - AI初创公司Perplexity以345亿美元全现金形式向谷歌发出收购Chrome浏览器业务的要约,成为科技史上最大胆的"蛇吞象"案例之一[1][2][4] - 收购时机选在谷歌面临美国司法部反垄断诉讼的关键节点,Perplexity的提议为法官提供了现成的解决方案[5][13][15] - 无论交易成功与否,这一举动都显著提升了公司知名度,展示了AI新贵挑战科技巨头的决心[21][23] Perplexity公司背景 - 公司由前谷歌AI研究员Aravind Srinivas于2022年创立,主打产品为AI驱动的"答案引擎",提供简洁答案并附信息来源链接[6] - 估值增长迅猛:2024年初估值5亿美元,2025年5月升至140亿美元,2025年7月达180亿美元[7] - 获得亚马逊创始人贝索斯、英伟达、Databricks和图灵奖得主LeCun等硅谷大佬投资[8] - 年度经常性收入略低于1亿美元,180亿美元估值对应180倍市销率[9] - 已推出自研AI浏览器Comet,并在浏览器赛道有所布局[10] - 曾拒绝Meta收购意向,2025年1月提出与TikTok美国业务合并方案[12] 收购要约细节 - 345亿美元报价相当于公司自身估值的近两倍(180亿美元)[2] - Chrome浏览器全球市场份额超过60%,掌控超过30亿用户的互联网入口[14] - 承诺收购后维护Chromium开源项目,未来两年投资超过30亿美元,Chrome继续默认使用谷歌搜索引擎但用户可自由更换[16] - 市场对Chrome估值存在分歧:200-500亿美元或至少1000亿美元,Perplexity报价处于中间位置[16] - 公司声称已获得多家大型风险投资基金全额资金支持[20] 反垄断背景 - 美国司法部反垄断诉讼已进入"补救措施"裁决阶段,法官曾裁定谷歌在搜索市场存在非法垄断[13] - "强制剥离Chrome"是司法部核心建议之一,旨在阻断谷歌对互联网入口的控制[14] - 谷歌CEO Pichai明确表示无出售意愿,认为强制出售将损害业务发展和创新[18] - 法官曾询问剥离Chrome是否比其他方案"更简洁、更优雅",强制剥离仍是开放选项[20] 行业影响 - OpenAI曾表示如果法院裁定谷歌必须出售Chrome也会感兴趣[3] - 多数分析师认为交易成功可能性较低,法官更可能选择限制谷歌商业合同等替代方案[20] - 事件成为AI时代科技行业格局剧烈变动的标志性事件[22] - 展示了AI应用公司挑战传统科技巨头的潜力和想象力[23]
AI独角兽总估值达27000亿美元,其中100家成立不到2年
量子位· 2025-08-13 04:17
AI领域独角兽概况 - AI领域独角兽数量已达498家,其中100家成立于2023年[1][2] - 这些独角兽总估值达27000亿美元,超过谷歌24400亿美元市值[3] - 四家最大私营AI公司创造十几位亿万富翁,总净资产380亿美元[5] 新晋亿万富翁榜单 - 亚历山大·王:Scale AI联合创始人,现Meta AI团队成员,身价36亿美元[7][10] - 郭露西:Scale AI联合创始人,持有5%股份,身价超10亿美元[7][12] - 达里奥·阿莫迪:Anthropic CEO,身价超12亿美元,公司估值170亿美元[7][13] - 迈克尔·因特罗特:CoreWeave CEO,身价100亿美元,公司估值670.9亿美元[7][15] - 梁文锋:DeepSeek创始人,身价可能超10亿美元[7][17] - 姚润昊:叠纸游戏CEO,公司2024年营收约70亿元,身价10亿美元[7][21] - 迈克尔·特鲁埃尔:Anysphere CEO,公司估值99亿美元[7][22] - 布雷特·阿德科克:Figure AI创始人,公司估值395亿美元[7][24] - 阿拉温德·斯里尼瓦斯:Perplexity CEO,公司估值180亿美元[7][26] - 伊利亚·苏茨凯夫:OpenAI前首席科学家,新公司估值320亿美元[7][28] - 米拉·穆拉蒂:OpenAI前CTO,新公司估值120亿美元[7][30] AI行业发展特点 - AI公司倾向保持私营状态,吸引风投、主权基金等投资[31] - 2023年以来发生73起流动性事件,包括并购和IPO[32] - 创始人更注重财富管理,通过投资科技公司或专业团队配置资产[33][34] - 行业高度集中于旧金山湾区,当地亿万富翁数量达82位[36] 行业影响 - 旧金山湾区百万富翁数量十年翻倍,房价和购房需求大幅上涨[36] - AI公司创始人通过股权抵押借款,如OpenAI正谈判5000亿美元估值员工股份出售[32]
大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销
量子位· 2025-08-13 04:17
文章核心观点 - 字节团队提出Post-Completion Learning (PCL)训练方法 首次实现语言模型"训练-推理不对称"范式 通过训练时增加自我反思和评估环节提升模型能力 推理时零额外开销 [1][2][3][4] 突破性不对称训练范式 - 传统语言模型训练存在对称性约束 训练和推理必须完全对称 模型仅学习预测到结束符(EOS)为止的内容 [6] - PCL方法打破对称性约束 训练时将原始EOS替换为临时结束符 使模型继续输出自我评估和质量预测内容 [7][9] - 推理时模型在临时结束符处直接停止 不输出评估部分 实现零额外计算开销 [3][5][7] 白盒化强化学习设计 - PCL实现强化学习过程白盒化 直接教会模型计算奖励 让模型主动进行自我评估 训练过程完全透明可解释 [10] - 利用模型输出评估结果与外部奖励函数对齐 监督模型评估能力 从"老师打分"变为"学生自己会打分" [10] 统一混合训练框架 - PCL实现统一监督微调(SFT)和强化学习(GRPO)训练框架 进行多目标联合优化 [12][14] - 训练包含四个目标:推理能力SFT(使用推理数据集训练think+answer部分) 评估能力SFT(使用教师输出蒸馏训练evaluation+reward部分) 推理能力GRPO(使用accuracy+format奖励函数) 评估能力GRPO(使用一致性奖励函数指导预测奖励得分) [16] 实验结果验证 - 在数学推理和逻辑推理数据集上 Qwen-2.5 7B模型PCL方法达到78.02分 较SFT基础版72.73分提升5.29分 较SFT+RL方法74.81分提升3.21分 [18] - Qwen-2.5 1.5B模型PCL达到60.40分 较SFT基础版54.71分提升5.69分 [18] - Llama-3.1 8B模型PCL达到62.45分 较SFT基础版54.64分提升7.81分 [18] - 平均提升幅度达6.27分 消融实验验证方法有效性 [15][18] 方法论价值 - 发掘EOS后空间训练价值 自我评估能提升推理能力 [19] - 证明强化学习可白盒化 提升可解释性可优化学习效果 [19] - 实现复杂训练与简洁推理平衡 不对称范式有望成为大模型训练标准做法 [20]