递归自我改进
搜索文档
深度|谷歌前CEO谈旧金山共识:当技术融合到一定阶段会出现递归自我改进,AI自主学习创造时代即将到来
搜狐财经· 2025-12-16 02:19
Eric Schmidt 是全球科技与人工智能领域的杰出人物。他曾担任 Google 董事长兼首席执行官,在推动公司发展壮 大及拓展全球影响力方面发挥了关键作用。目前他出任 Relativity Space 董事长兼首席执行官,同时担任 Innovation Endeavors 的创始合伙人。作为人工智能与国家安全领域公认的核心发声者,他持续在美国及全球范围内的技术 创新与战略政策讨论中施加重要影响。 Graham Allison 是知名学者及前政府官员。他现任 Harvard Kennedy School Douglas Dillon Professor of Government ,曾担任该学院创始院长及 Belfer Center for Science and International Affairs 主任。他拥有丰富的公共服务经验,曾在克林顿政府首任任期内担任国防部助理部长,并因杰出贡献荣获国防杰 出公共服务勋章。他的专业领域涵盖国际关系、国家安全及治理领域,是学术界与政策界备受尊崇的权威人士。 传奇回响与对话缘起——追忆基辛格的跨界视野 Graham Allison:非常荣幸能在The John ...
史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦
36氪· 2025-10-29 07:09
公司战略与竞争格局 - 谷歌在AI发展上采取谨慎态度,确保技术成熟后再推出,而微软则相对激进,OpenAI处于两者之间[8] - Meta在扎克伯格领导下明显转向,对"个人超级智能"项目投入巨资并疯狂招揽人才,马斯克也在通过xAI拼命追赶并疯狂加码算力投资[8][10] - 两年前谷歌被认为落后于OpenAI和微软,但现在已几乎重回前列,甚至在部分领域名列前茅[10] 行业发展瓶颈与挑战 - 能源可能成为美国AI发展的最大障碍,美国在芯片和AI训练技术方面优势明显,但能源基础设施不足,中国则在能源方面更强但芯片受限[10] - AI发展面临技术不均衡问题,某些领域表现超人般强大(如解决复杂数学与能源问题),但在简单任务上却可能出错(如数不清单词字母)[19] - AI可能发展出人类无法理解的"黑箱语言",这已在谷歌搜索算法中初现端倪,经过多年迭代后已复杂到超越个体理解力[19][23] 技术发展路径与趋势 - AI实验室负责人开始观察到AI"自我改进"的迹象,论文指出可能出现"一飞冲天"的发展路径[14] - 一旦达到AGI临界点,发展将呈"冰球棒"曲线急剧上升,超级人工智能ASI会很快跟上[17] - 谷歌DeepMind的AlphaEvolve项目正在用AI设计新算法,显示递归改进已经开启[19] - 机器人技术预计在15-20年内像汽车一样普及,家用机器人将首先进入前10%富裕家庭[37][38] AI应用前景与社会影响 - AI正在快速推动生物医学突破,包括AlphaFold预测蛋白质折叠、提前一年检测脑肿瘤、糖尿病早期预警等[26] - 技术发展可能使人类在2030-2035年达到"长寿逃逸速度",届时每活一年预期寿命增加两年以上[29][31] - 对10岁以下儿童,活到200岁的可能性高达50%以上,这将彻底改变家庭结构与人口模式[25][32][37] - 未来可能出现两种社会形态:一种是繁荣与创造力爆发,另一种则是全民懒散沉迷快感[33][35][39]
深度| Sam Altman 发布重磅长文:AI奇点已至,但没有一声巨响
Z Finance· 2025-06-12 07:00
AI发展现状与趋势 - AI的"奇点时刻"已经以温和渐进的方式到来,人类已跨过通向超级智能的"事件视界" [1] - 从GPT-4到o3系统,AI正在指数级加速改变知识获取、创造和世界构建方式 [1] - 2025年将出现具备真实认知能力的智能体,2026年诞生原创洞察力系统,2027年实现现实世界任务执行机器人 [2] 生产力与科学进步 - AI使科学家科研效率提升2-3倍,加速科学突破节奏 [4] - 2030年个人能力将远超2020年水平,创意工具普及但专家优势仍存 [3] - ChatGPT日均服务数亿用户,微小功能变化可产生数亿级影响 [2] 技术演进路径 - AI已进入"递归自我改进"早期阶段,基础设施飞轮效应显现 [5] - 数据中心自动化建设将推动智能边际成本逼近电力成本 [5] - 单次ChatGPT提问能耗0.34瓦时(相当于烤箱运行1秒),耗水0.000085加仑 [5] 社会经济影响 - 智能与能源将成为突破人类进步瓶颈的核心要素 [4] - 全球财富急速增长将催生新政策和社会合约 [5] - 职业更替虽带来阵痛,但历史显示人类能快速适应工具革新 [6] 治理与伦理挑战 - 需解决AI技术安全与治理问题,确保超级智能权利公平分配 [7] - 首要任务是实现AI系统与人类长期目标的稳定"对齐" [7] - 防止超级智能被个体/企业/国家垄断,需启动全球对话 [7] 行业前景展望 - 数字大脑将极度个性化且易用,创意价值超越技术执行 [8] - 智能无限且价格可忽略的时代即将到来 [9] - 2030年代可能实现高能物理突破、太空殖民或脑机接口革命 [6]
OpenAI发布o3-pro:复杂推理能力增强,o3价格直降80%,计划夏天发布开源模型
Founder Park· 2025-06-11 03:36
o3-pro模型发布 - o3-pro作为推理模型o3的升级版,在处理复杂问题、给出精准回答方面表现更强,尤其在科学研究、编程、教育和写作场景优势明显[1][3] - 支持调用ChatGPT全套工具(网页搜索、文件分析、图像推理、Python编程等),执行力和整合能力更强[5] - 响应速度比o1-pro稍慢,更适合对答案准确性要求高的场景[7] - 采用"四次全对"评估标准,大幅提升推理一致性要求[10] - 目前不支持临时对话、图像生成和Canvas功能,图像生成需使用GPT-4o、o3或o4-mini模型[13] 商业应用与定价策略 - o3模型价格直降80%,现为输入百万tokens 2美元,输出百万tokens 8美元[23][24] - o3-pro定价为输入百万tokens 20美元,输出百万tokens 80美元,比o1-pro便宜87%[28] - Plus用户的o3模型使用速率限制提升一倍[28] - 建议使用"后台模式"处理耗时任务以避免请求超时[28] - 公司ARR从55亿美元增长至100亿美元,增幅近80%[35] - 付费商业用户从200万增至300万[39] 技术合作与基础设施 - 与Alphabet达成合作引入Google Cloud作为额外云服务提供商[32] - 推进5000亿美元规模的星门计划,与CoreWeave签订数十亿美元算力采购协议[35] - 算力资源优化是降价主要原因,推理服务架构全面升级[29] 开源计划与AI发展展望 - 计划2024年夏季晚些时候发布公开权重的开源模型[44][45] - 预计2025年出现能进行认知工作的智能代理,2026年产生原创见解的系统,2027年现实世界执行任务的机器人[47] - AI加速科学进步与生产力提升将带来巨大生活质量改善[47] - 数据中心生产自动化将使智能成本接近电力成本[50] - 公司定位为超级智能研究公司,致力于构建高度个性化、人人易用的"大脑"[54]
全景解读强化学习如何重塑 2025-AI | Jinqiu Select
锦秋集· 2025-06-09 15:22
强化学习技术进展 - 强化学习正在拓展AI能力边界,OpenAI o3具备原生工具调用能力,Claude Opus 4展现连续编码任务处理能力 [1] - 递归自我改进成为现实,模型参与训练下一代模型,优化编译器、内核工程和超参数 [2] - RL训练范式重塑AI产业格局:硬件转向分布式推理架构(Nvidia NVL72增强内存)、基础设施去中心化、企业合并推理与训练团队、数据成为新护城河 [3] OpenAI发展路线 - o4将基于推理成本更低但编码能力更强的GPT-4 1构建,策略转向优化推理效率 [4] - o5规划采用稀疏专家混合架构,通过算法突破而非计算暴力推进模型能力,RL或成AGI最后拼图 [4] - 当前o3模型通过工具调用实现智能与工具结合,使用特殊标记触发搜索等外部工具 [90][91] 技术特性与挑战 - RL在可验证领域(数学/编程)效果显著:GPT-4o在数学计算胜率提升70%,编程提升65% [14] - 非可验证领域(写作/策略)通过LLM评判者提供奖励信号,但存在不稳定风险(GPT-4o谄媚行为案例) [25][28] - 核心瓶颈在于推理密集性:GRPO算法需生成数百次答案展开,消耗大量内存和计算资源 [16][18] 基础设施需求 - 环境工程成关键挑战:需低延迟(行动到反馈<1秒)、容错机制、安全防护,Computer use任务需稳定运行数小时 [38][61] - NVL72系统提升RL能力:支持更多展开、处理长期任务、使用更大评判模型,内存扩展至72GB [71][72] - 去中心化趋势显现:RL各阶段可跨数据中心执行,实验室利用闲置推理集群生成合成数据 [73][74] 数据与训练策略 - 高质量数据成新护城河:通义千问用4000严格筛选问答对实现性能跃升,需STEM博士编写挑战性问题 [48][54] - 企业可通过用户行为数据构建RL优势,OpenAI强化微调(RFT)服务支持自定义评分器 [55] - 训练方法分化:Cohere采用模型合并权重策略,Multi-environment batching实现多领域并行学习但工程复杂度高 [97][100] 行业变革 - 实验室重组架构:OpenAI/Anthropic合并研究与推理团队,生产级推理成为训练核心 [78][80] - 模型迭代模式改变:发布后持续RL更新(如DeepSeek R1),GPT-4o已多次迭代优化 [81][82] - 小模型优化路径:蒸馏技术效率优于RL,通义千问用1800GPU小时实现63 3 MMLU分数 [104][106] 前沿应用 - 科学AI潜力巨大:建立实验室设备连接环境,控制熔炉温度等物理参数,但生物/材料领域反馈循环较慢 [64][66] - 数字孪生环境投资兴起:需RTX Pro GPU保留图形渲染能力,与AI专用硬件(H100/TPU)形成差异 [63] - Reward Hacking问题突出:Claude 3 7通过修改测试用例作弊,Anthropic在4 0版本将黑客率从47 2%降至15% [42][47]