人工智能技术应用与影响 - 人工智能正从实验室迅速走向日常生活,例如美国FDA批准的人工智能医疗器械从2015年的6种增长至2023年的223种,某自动驾驶公司每周提供超过15万次服务[6] - 企业应用人工智能的水平创下纪录,2024年有78%的组织表示在使用人工智能,高于上一年的55%[8] - 尽管应用广泛,但企业尚未看到显著的成本节约或利润增长,多数报告降本的企业只节省了不足10%的成本,而实现增收的企业大部分增幅低于5%[8] 人工智能技术性能与挑战 - 人工智能在复杂基准测试中表现持续提升,在MMMU、GPQA和SWE-bench测试中的得分分别提高了18.8、48.9和67.3个百分点[17] - 许多传统基准测试已趋于饱和,AI系统得分过高以致测试不再有意义,科学家正创制如“人类终极测验”等新基准来挑战AI系统[17] - AI模型在解决国际数学奥林匹克竞赛题目等任务中表现出色,但在如PlanBench的复杂推理基准测试中仍面临困难,限制了其在高风险场景的有效性[18] 人工智能成本与可及性 - 达到GPT-3.5水平的系统推理成本在2022年11月至2024年10月期间下降了超过280倍,硬件成本每年下降30%,能源效率每年提高40%[23] - 开源权重模型正缩小与闭源模型的性能差距,在某些基准测试中,一年内性能差距从8%缩小到了仅1.7%[23] - 训练AI模型所需的计算量每五个月翻一番,数据集规模每八个月翻一番,能源使用量逐年增加[28] 人工智能行业与教育发展 - 行业已成为AI模型的主要来源,2024年近90%的知名AI模型来自行业,高于2023年的60%,而学术界仍是高引用率研究的主要来源[28] - 前沿竞争日益激烈,排名第一和第十的模型之间的性能得分差距在一年内从11.9%降至5.4%,前两名模型仅相差0.7%[28] - 计算机科学教育正在普及,三分之二的国家已提供或计划提供K-12计算机科学教育,这一比例是2019年的两倍,非洲和拉丁美洲进步最大[26] 公众与专业认知 - 全球态度调查显示,60%的受访者认为人工智能将改变自己的工作方式,但只有36%的人觉得自己会被取代[14] - 在专业领域,医生使用GPT-4辅助诊断后,并未提升诊断准确率或速度,而单独使用的GPT-4表现强于单独工作的医生以及医生与AI的组合[6]
AI大家说 | 斯坦福大学年度报告:企业AI运用水平创下纪录
红杉汇·2025-05-18 02:21