AI专家:对AI的质疑是对“指数级增长趋势”的“自欺欺人”
华尔街见闻·2025-09-30 02:13
AI技术发展现状与趋势 - 当前对AI"泡沫"或"平台期"的普遍质疑被专家反驳,认为是对技术指数级增长趋势的严重误读,这种心态与新冠疫情初期对指数级传播的忽视类似[1] - AI在执行编程或网站设计等任务时仍会犯错,但因此断言其无法达到人类水平或影响甚微是一种奇怪的现象,正如几年前人们还认为AI编程是科幻小说[1] - 专家将当前对AI的怀疑论调比作"自欺欺人",认为人们因关注当下的不完美而低估了即将到来的变革规模[2] AI软件工程能力进展 - AI模型自主完成复杂软件工程任务的时长正以指数级速度翻倍,显示出清晰的指数级趋势[2][5] - 7个月前的模型Sonnet 3.7已能以50%的成功率完成长达一小时的任务[5] - 包括Grok 4、Opus 4.1和GPT-5在内的新模型不仅延续了趋势,且略高于趋势线,现在能执行超过2小时的任务[7] AI在广泛职业领域的能力评估 - OpenAI的GDPval评估涵盖了9个行业44个职业,任务由平均拥有14年经验的行业专家提供,旨在衡量模型在更广泛经济活动中的表现[9] - 最新的GPT-5在评估中已惊人地接近人类表现[10] - Claude Opus 4.1在评估中表现更佳,其性能几乎与行业专家的表现相匹配[13] AI未来能力预测 - 基于跨越多年和多个行业的指数级增长数据,若改进突然停止将是极其令人惊讶的[12] - 到2026年中,模型将能够自主工作一整个工作日(8小时)[15] - 到2026年底,至少有一个模型将在许多行业中达到人类专家的表现水平;到2027年底,模型在许多任务上将频繁超越专家[15]