General Artificial Intelligence (AGI)
搜索文档
万条推文“怒轰”、估值下跌, OpenAI被误导性“突破”反噬,陶哲轩:有实力,但方向错了?
36氪· 2025-10-20 11:45
事件概述 - Meta首席AI科学家Yann LeCun批评OpenAI研究员关于GPT-5数学突破的宣传是“搬起自己的GPT石头砸了自己的脚” [1] - 事件起因是OpenAI研究员高调宣布GPT-5取得数学“突破”,但在受到AI社区质疑后迅速撤回了说法 [2] - 谷歌DeepMind首席执行官Demis Hassabis批评其沟通存在疏漏 [2] 所谓的“突破”与事实澄清 - 前微软副总裁、现OpenAI研究科学家Sebastien Bubeck称,研究人员借助GPT-5找到了10个埃尔德什问题的答案 [3] - OpenAI研究员Mark Sellke正式宣布,经过数千次GPT-5查询,发现了10个未解埃尔德什问题的答案,并对11个难题取得部分进展 [3] - 负责维护埃尔德什问题网站的数学家Thomas Bloom指出帖子“存在严重失实”,GPT-5只是找到了文献中已有的解决方案,并非独立生成数学证明 [6] - OpenAI内部的Bubeck承认GPT-5“只找到了文献中已有的解决方案”,但认为这仍是检索文献方面的一项成就 [6] - 最初的相关推文已基本删除,涉事研究员承认错误 [6] 事件对公司及行业的负面影响 - 外界认为OpenAI是一家承受巨大压力、行事风格轻率的机构 [7] - 社交平台上“OpenAIFail”等话题标签热度攀升,短短几天内有超过1万条推文表达失望与质疑 [7] - OpenAI与股票挂钩的估值指标在盘前交易中大幅下跌 [7] - 美国联邦贸易委员会已开始调查OpenAI的行为是否构成虚假广告,可能面临罚款或其他处罚 [7] - 立法者呼吁在人工智能研究中提高透明度,参议员Maria Cantwell表示需要确保AI进步不会被夸大 [7] - 美国监管机构发现OpenAI通过未公开的资金关系获得了对FrontierMath基准测试的内部优先访问权,引发关于公平竞争和基准测试透明度的担忧 [7] AI在数学研究中的实际应用价值 - 著名数学家陶哲轩指出,AI在数学领域最富成效的应用是借助中等算力工具,加速处理普通、耗时却关键的研究任务,如文献综述 [8] - 陶哲轩提及用AI找出解决埃尔德什问题的相关文献的例子,并指出应用AI做文献综述的多方面好处 [10] - AI驱动的文献综述工具可以系统性地报告“阳性结果”和“阴性结果”,有助于更准确地呈现某一问题的现有文献实际情况 [11] - 生成式AI有望推动数学研究“工业化”,加速该领域发展进程,但人类的专业判断在审查、分类AI结果时仍是关键 [12]
OpenAI测试称GPT-5媲美专家
36氪· 2025-09-26 01:27
文章核心观点 - OpenAI发布名为GDPval的新基准测试,旨在评估AI模型在经济价值工作上与行业专家的表现差距,这是其开发通用人工智能(AGI)的关键环节[1] - 测试结果显示,GPT-5和竞争对手Anthropic的Claude Opus 4.1模型已接近行业专家的工作质量,但AI目前仅涵盖人类实际工作中的有限任务[1] - OpenAI认为GDPval的进展具有重要意义,表明AI可以帮助从业者节省时间以专注于更有价值的工作,并且模型能力提升迅速[3] GDPval基准测试概述 - GDPval基于美国GDP贡献最大的九个行业,包括医疗、金融、制造业和政府等领域,覆盖了44种职业[1] - 测试方法为邀请资深专业人士对比AI生成的报告与其他专业人士的成果,并挑选出更优者,例如要求投行人员为特定行业制作竞争格局分析并与AI报告对比[2] - 测试将AI模型在全部44个职业中对抗人类报告的"胜率"进行平均计算[2] 模型测试结果 - GPT-5-high(高算力版本)在40.6%的情况下被评为优于或与行业专家持平[2] - Anthropic的Claude Opus 4.1模型在49%的任务中被评为不输于行业专家,表现超过了OpenAI的模型[2] - OpenAI解释Claude得分更高的部分原因是其倾向于生成更美观的图表,而非纯粹性能更优[2] 测试局限性与未来计划 - GDPval-v0仅测试提交研究报告这一项内容,而大多数职业的工作远不止于此[2] - OpenAI承认测试的局限性,并计划在未来开发更全面的测试,涵盖更多行业和交互式工作流程[2] 行业影响与趋势展望 - 测试结果表明从业者可以利用AI模型节省时间,从而专注于更有意义的工作[3] - 约15个月前发布的GPT-4o模型得分仅为13.7%,而GPT-5的成绩几乎提高了三倍,预计这一趋势还会继续[3]
AI办公应用能力评价考试网:大厂开出百万美金期权激励,谁能拿到?
搜狐财经· 2025-09-25 02:15
AI人才市场需求与薪酬状况 - AI相关岗位平均月薪高达4.7万至7.8万元,部分实习生日薪达到4000元 [1] - 脉脉平台AI新发岗位数量同比增长超10倍,在招岗位超过7.2万个 [3] - 百度今年秋招AI职位占比超九成,阿里超六成,腾讯、美团大幅增加AI岗位投入 [1] 企业人才竞争策略 - 大模型企业MiniMax启动百万美金期权激励计划,覆盖技术、产品及实习生岗位 [1] - 字节跳动为旗下Seed部门推出长达18个月的期权增发方案,员工每月可获得价值数万元期权 [1] - 高薪竞争加剧行业马太效应,资金雄厚巨头能吸引更多精英并加速技术迭代 [4] 人才供需与能力要求 - AI人才市场呈现供需失衡,顶尖人才需具备跨学科知识,应届生需扎实基础和实践经验 [3] - 企业招聘指标与AI办公应用能力评价考试内容一致,强调数学算法基础和项目经验 [5] - 求职者在选择企业时开始关注数据场景和资源投入等落地条件 [3]
从Transformer到GPT-5,听听OpenAI科学家 Lukasz 的“大模型第一性思考”
36氪· 2025-09-22 13:04
Transformer架构的诞生与影响 - 2017年论文《Attention Is All You Need》提出Transformer架构,彻底抛弃循环神经网络,仅使用注意力机制处理语言,重塑人工智能领域[1] - 该论文截至发文时在Google Scholar上的引用次数高达197,159次,证明其巨大影响力[1][23] - Transformer架构成为驱动手机输入预测文本、DALL-E图像生成及ChatGPT等应用的底层核心技术[1] 核心研发团队与职业路径 - 论文八位作者包括Ashish Vaswani、Niki Parmar等,被AI技术圈称为"Transformer八子"[2] - 八子中七位已踏上创业之路,创立Cohere、Character.ai、Adept AI Labs等公司,成为AI产业商业巨擘[3][20] - Lukasz Kaiser是八子中唯一未创业的科学家,于2021年加入OpenAI,深度参与GPT-4、GPT-5及推理模型o1、o3等核心研发工作[3][21][23] Lukasz Kaiser的学术背景与研究理念 - Kaiser拥有波兰弗罗茨瓦夫大学计算机科学与数学双硕士学位,在德国亚琛工业大学获博士学位,专攻"自动结构上的逻辑与博弈"[5] - 2009年荣获逻辑学领域最高学术荣誉之一E.W. Beth dissertation prize,证明其在理论科学领域达到世界顶尖水平[6] - 2013年辞去法国国家科学研究中心的终身研究员职位加入Google Brain,体现其从理论证明向实际构建的转变[7][8] 技术突破与行业影响 - Transformer架构解决了RNN的长距离依赖问题和串行处理效率低下的缺陷,与GPU/TPU硬件发展趋势完美匹配[10][11][12] - 团队开发Tensor2Tensor开源库旨在降低深度学习门槛,体现普惠AI理念[13][14] - 2017年同期论文《One Model To Learn Them All》提出MultiModel架构,首次证明统一深度学习模型有潜力联合学习多领域知识,是AGI追求的早期探索[17][18][19] AI技术演进与未来方向 - Kaiser将深度学习演进路径概括为:证明可行性→架构创新→自监督预训练→规模定律→数据质量与RLHF[24] - 2021年预言AI发展的三个方向——多模态融合、更大更好的Transformer、模型服务化——如今已逐步成为现实[25] - 未来AI发展关键在于教会模型通过生成更多中间步骤进行深度思考和推理,计算力将从大规模预训练转向高质量数据的海量推理计算[25][26]
AI人才争夺战下的暗流:谁在为源头创新续费?
36氪· 2025-09-12 09:01
全球AI人才格局与中国青年科研力量 - 中国在全球AI专利占比达61.1% [1] - 全球顶尖AI团队(如OpenAI、谷歌DeepMind)核心成员包含大量华人面孔 [1] - 青年科研者面临产业界快速变现与学术界长期基础研究的职业选择 [1] 四大前沿科技竞争领域 - 通用人工智能(AGI)为产业界人才竞争最激烈领域 [2] - 具身智能需攻克"人类水平泛化能力"基础科学难题 [5] - 数字医学需突破数据、伦理及法规壁垒 [6] - 数据处理与安全隐私是AI时代的底层"护栏"技术 [6] 产学研协同创新模式 - 学术界长期研究解决产业爆发期核心痛点(如电子科技大学张帆的医疗影像技术将处理时间从数小时压缩至几分钟) [8] - 产业界经验反哺学术研究(如北京大学李萌基于Meta工作经历聚焦端侧部署与隐私计算) [9] - 学术与产业边界模糊化协同进化(如上海交大李永露与穹彻智能合作具身智能研究) [9][13] - 中国人民大学张峰的数据压缩技术为阿里"智行通2.0"实现14%成本下降 [13] 科技企业人才战略布局 - InTech奖新增10位顶尖博士生奖学金作为长期价值投资 [14] - 蚂蚁集团构建AGI全栈能力覆盖基础技术至应用场景 [14] - 通过"Plan A"招聘计划、AGI部门及校企合作构建多层次人才平台 [18]
Altman描绘AI十年路线图:"智能即电力",任何软件秒生,10人公司也能年入10亿
华尔街见闻· 2025-09-10 15:34
人工智能未来十年发展图景 - OpenAI CEO Sam Altman预测,到2035年软件将实现即时生成,10人公司年收入可达10亿美元,AI成本将趋同于电力成本 [1] - 技术变革速度将难以用现有框架理解,但人类的生物性需求如社交、情感连接和家庭关怀将保持恒定 [1] - 建议投资者将0%时间用于寻找下一个AI研究实验室,而将100%时间投资于因通用人工智能而成为可能的新商业模式 [1] 软件行业根本性重构 - 当用户可通过简单描述需求获得定制软件时,购买现成SaaS产品的必要性将大幅降低,传统软件商业模式面临颠覆 [2] - 《财富》500强企业的消亡速度将在2030年代显著加速,企业生存取决于适应速度,新公司增长速度将达到空前水平 [2] - 变革的核心驱动力来自三大支柱的持续优化:更好的算法、更大的计算能力和更多的数据 [2] 人性价值与职业重塑 - AI将能够胜任几乎所有的智力工作,但需要深度情感连接和同理心的职业如教师、护士、长者照护将变得更加珍贵 [3] - 人类极度渴望来自同类的关怀和认可,一个平庸的人类老师的激励作用可能超过一个很棒的AI老师 [3] - 未来社会将拥有更多自由,随着AI承担更多智力工作,人类将能够投入更多时间到真正需要人际互动的领域 [3] ChatGPT的进化与愿景 - ChatGPT从研究实验室的意外发现演变为全球第五大网站,如果保持现有增长轨迹,有望成为全球最大网站 [4][5] - 对ChatGPT的未来愿景是将其定位为智能操作系统或个人AGI,一个了解用户、连接各种服务、按照用户意愿行动的系统 [5] - 目标是通过聊天、代理或其他服务集成,提供无处不在的个性化智能伙伴 [5] 投资范式转移 - 投资逻辑需要根本性调整,停止寻找下一个OpenAI,转而关注AGI技术催生的全新商业模式 [6] - 真正的巨大价值类似晶体管,并非来自制造基础技术的少数公司,而是由这项技术催生的遍布各行业的无数新应用 [6] - 当智能成本趋近于零时,投资者应思考哪些全新的、未经证实但具有巨大潜力的商业模式会应运而生,应追逐未来而非过去有效的东西 [6] 全球普惠与新稀缺资源 - AI将带来巨大的通货紧缩效应,推动全球普惠发展,每个人都将获得优质医疗建议、教育资源和免费软件制作能力 [7] - 当智能本身不再稀缺时,支撑其运行的基础设施算力与能源将成为价值核心,算力可能成为疯狂稀缺的资源 [7] - 预测十年后AI的成本会趋同于电力成本,解决算力稀缺之道是制造更多算力,能源将成为智能基石 [7]
一位被开除的00后爆红
投资界· 2025-09-01 07:42
核心观点 - 前OpenAI研究员Leopold Aschenbrenner被开除后创立对冲基金 通过押注AI受益行业及做空落后行业 实现基金规模达15亿美元 上半年回报率47% 远超市场基准[5][11][12] - 其投资策略基于对AI技术发展的深刻理解 重点布局半导体 基础设施 电力公司及新兴AI企业如Anthropic[11] - 基金获得多位科技及投资界知名人士支持 包括Stripe创始人 Collison兄弟 Meta的AI团队领导Daniel Gross和Nat Friedman 以及投资者Graham Duncan[11] 基金表现与规模 - 基金上半年回报率达到47% 同期标普500指数回报率为6% 技术对冲基金指数回报率为7% 超额收益显著[12] - 资金规模迅速突破15亿美元 折合人民币约108亿元(按1:7.2汇率)[11] - 投资者愿意将资金锁定数年 显示对基金策略的强烈信心[12] 创始人背景与经历 - Leopold Aschenbrenner为00后 15岁进入哥伦比亚大学 19岁获数学 统计学和经济学三个学位[13] - 曾任职于OpenAI的"超级对齐"团队 致力于确保超级智能AI与人类价值观一致[16] - 2024年4月因向董事会提交安全漏洞备忘录后被OpenAI以泄密理由解雇[17] 投资策略与理论基础 - 基金投资策略直接源于其撰写的165页分析文章《Situational Awareness: The Decade Ahead》[10][19] - 核心论点为AI正处于指数级增长阶段 从GPT-2到GPT-4代表多个数量级(OOM)的提升[20][21] - 驱动因素包括扩展定律(Scaling Laws) 算法创新及海量数据集使用[22][26] - 预测到2027年可能实现通用人工智能(AGI) 将引发各行业革命性变化[26][28] 行业影响与技术展望 - AGI发展将显著提升生产力和效率 但同时带来失业 AI伦理及治理结构等挑战[28] - 超级智能可能出现"智能爆炸" 通过自我完善循环实现指数级智力增长[29] - 构建AGI需大规模计算基础设施 涉及算力 设备效率 能源利用及信息处理能力的全面提升[31] - 国家安全机构将在AGI技术管理中发挥更大作用 其战略意义可比曼哈顿计划[33]
23岁小哥被OpenAI开除,成立对冲基金收益爆表,165页论文传遍硅谷
机器之心· 2025-08-30 04:12
文章核心观点 - 前OpenAI员工Leopold Aschenbrenner被解雇后创立对冲基金 通过押注AI相关领域实现47%回报率 远超市场平均水平[1][14] - Aschenbrenner预测2027年将实现通用人工智能 其依据是AI能力的指数级增长和算力扩展定律[29][38] - AI发展将引发各行业变革 需关注算力基础设施 国家安全和治理结构等关键因素[31][36][38] Leopold Aschenbrenner背景 - 23岁 拥有哥伦比亚大学数学 统计学和经济学三个学位 GPA年级第一[16] - 曾任职OpenAI超级对齐团队 参与Weak-to-Strong Generalization研究 后因泄露内部信息被解雇[7][18] - 在FTX Future Fund工作期间专注于AI安全和全球风险管理[17] 对冲基金表现 - 基金规模达15亿美元 投资策略为做多半导体 基础设施 电力公司及Anthropic等AI企业 同时做空可能被淘汰行业[10][11] - 2024年上半年回报率47% 同期标普500指数回报6% 技术对冲基金指数回报7%[14] - 获得Stripe创始人 Collison兄弟 Meta的AI团队领导及著名投资者Graham Duncan支持[11] AI技术发展预测 - 从GPT-2到GPT-4代表多个数量级(OOM)进步 即指标十倍增长[26] - AI进步依赖三大因素:扩展定律 算法创新及海量数据集 性能提升接近指数级[27][29] - AGI系统将具备并行研究能力 可同时进行多项测试 解决复杂科学技术难题[35] 行业影响与基础设施 - AGI将改变材料科学 能源和健康领域 显著提高经济生产力和人类福祉[35] - 构建AGI需大规模计算基础设施 包括设备效率 能源利用和信息处理能力提升[36] - 科技巨头正投入重金建设大规模AI算力基础设施[38]
刚刚,GPT-5 Pro自证全新数学定理,OpenAI总裁直呼颠覆,大佬们集体转发
36氪· 2025-08-21 03:13
AI数学问题解决能力突破 - GPT-5 Pro独立攻克数学论文中关于梯度下降法步长η的未解区间问题 从零开始且未参考人类已有证明方法[1][6][15] - 模型将已知下限从1/L推进至1.5/L 证明过程被评价为非常优雅[6][12][17] - 该证明与论文作者后续发布的v2版本证明方法完全不同 属于v1证明的演进[12][15] 技术实现细节 - 研究针对光滑凸优化中梯度下降步长η与函数值曲线凸性的关系 未解决区间原为[1/L, 1.75/L][2][3][5] - 论文v1版本证明η<1/L时成立 η>1.75/L时存在反例[3] - 人类作者在v2版本中将阈值改写为1.75/L 彻底解决该问题[12] 行业影响与评价 - OpenAI总裁Greg Brockman认为这可能是AI在数学领域展现生命力的迹象[13][14] - 此次突破由面向用户的GPT-5 Pro版本实现 而非内部推理模型[15] - 前微软AI副总裁Sebastien Bubeck用25分钟验证结论 确认AI实际证明该问题[17][20] 研究者背景与方向 - Sebastien Bubeck现任OpenAI研究工程师 专注智能涌现与AGI物理学研究[18][21][22] - 拥有微软研究院10年工作经验 曾获STOC2023、NeurIPS2018/2021等多个最佳论文奖[20] - 职业生涯前15年主要研究凸优化、在线算法及机器学习对抗鲁棒性[20]
OpenAI史上最大失误:放走这位MIT学霸,美国AI「三朝元老」,现实韦小宝
36氪· 2025-08-21 00:39
AI算力基础设施规模 - AI基础设施规模超越阿波罗登月与曼哈顿计划[1] - AGI算力投入年增速高达3倍[2] - 2027至2028年算力增长存在不确定性[3] Anthropic发展历程 - 公司由OpenAI前团队成员联合创立[4] - 初创团队仅7人且缺乏明确产品规划[5] - Claude系列产品现已成为全球开发者首选工具[7] - 公司员工规模已超2000人且保持使命驱动文化[36] 技术突破与市场表现 - GPT-3训练实现从TPU到GPU的算力架构转型[29] - Scaling Law证明算力规模与智能水平呈正相关[31] - Claude 3.5 Sonnet版本实现编程场景市占率从个位数升至80%-90%[37] - Claude Code通过"心智切换"理论实现智能体式编程突破[41][42] 人才发展与行业趋势 - 线性代数B-成绩者通过自学成为AI核心研发人员[3][19] - 分布式系统与机器学习复合型人才极为稀缺[25] - 行业更注重内在驱动而非传统学历认证路径[46][47] - FAANG公司职业路径价值在AI时代被重新评估[48]