通用人工智能(AGI)

搜索文档
GPT-5发布,这一次OpenAI没有颠覆式创新
新京报· 2025-08-08 06:43
据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。 从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年 多的时间。期间,OpenAI推出了其他众多以奇奇怪怪方式命名的大模型,复杂得让用户在选择时,都 犯了选择困难症。 虽然不少媒体对这次发布会给予了积极评价,但从更广泛视角看,与其说这是OpenAI的一次技术展 示,不如说是OpenAI和奥尔特曼不得不举办的一场发布会。 OpenAI的升级与失落 从发布会来看,OpenAI给出的GPT-5卖点很清晰:更强、更稳、更便宜、更好用。 "更强",是OpenAI一贯的特色。每一次GPT系列产品出来,总要在模型能力上来个"屠榜",这次也不例 外。OpenAI官方数据显示,GPT-5在多项基准测试中创下新纪录,包括数学、编程、多模态理解和健康 等领域。 不仅如此,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据 不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。也就是"简单问题快 答,复杂问题拉长思考",这样的使用体验, ...
GPT-5来了!可免费使用
天天基金网· 2025-08-08 05:07
当地时间周四,OpenAI 终于发布了新的旗舰 AI 模型 GPT-5。OpenAI表示,该模型更智能、更快、"更 有用",特别是在写作、编码和医疗保健等领域。目前,该模型正在向所有人提供GPT-5,包括其免费用 户。这是 OpenAI 首次使用推理模型来支持 ChatGPT 的免费版本。与之前的技术不同,推理模型可以花 时间"思考"复杂的问题,然后才能确定答案,可减少"幻觉"或编造内容的出现。 OpenAI 表示,这项技术比之前的模型"感觉更人性化",即使是新手也能通过简短的文本提示构建简单的 软件应用程序。一位 OpenAI 工程师要求该系统生成一款帮助人们学习法语的在线应用程序,而该系统在 几分钟内就创建完成了。 OpenAI表示,GPT-5的幻觉率较低,这意味着该模型编造答案的频率较低。该公司表示,在开发GPT-5 的同时,还进行了广泛的安全评估,包括5000小时的测试。GPT-5将使用"安全完成",而不是在用户有 潜在风险的情况下直接拒绝回答他们的问题。 OpenAI 首席执行官山姆·奥特曼(Sam Altman) 表示:"无论是显而易见的还是微妙的,感觉都好多 了。GPT-5 第一次让人感觉像是在 ...
GPT-5登场!国产大模型“扎堆上新”,DeepSeek得加速了
华夏时报· 2025-08-08 05:04
GPT-5发布 - OpenAI正式推出GPT-5,CEO山姆·奥特曼称其为迈向通用人工智能(AGI)的重要一步 [2] - GPT-5在编程能力、创意写作和健康咨询三个关键领域实现显著提升,能够创建网站、应用程序和游戏,处理复杂写作任务,解析医疗结果 [3] - GPT-5共有四款模型:GPT-5、GPT-5 mini、GPT-5 nano和GPT-5 chat,面向普通消费者免费开放但有额度限制,Plus会员每月20美元,Pro会员每月200美元 [5] - 开发者端提供三款模型的API服务,价格比GPT-4更低,输入输出价格分别为每百万token 1.25美元/10美元、0.25美元/2美元、0.05美元/0.4美元 [6] 行业竞争格局 - GPT-5上线后迅速屠榜大模型竞技场LMArena,在所有细分类目中位列第一 [3] - ChatGPT今年7月访问量增速6.14%,月活用户近7亿,月访问量59.1亿,预计9月超过Instagram成为全球第四大网站 [7] - 国内大模型厂商竞争激烈,月之暗面发布Kimi K2,阶跃星辰推出Step-3,阿里发布通义千问3,智谱带来GLM-4.5 [9] DeepSeek现状与挑战 - DeepSeek访问量连续4个月下降,平均每月降低9.63%,6月访问量3.8亿,7月月活用户下降11.87%至8293万 [8] - 字节豆包和腾讯元宝月活用户分别达到1.32亿和4473万,持续增长 [8] - DeepSeek R2模型迟迟未推出,业内期待但面临压力,部分观点认为其已落后OpenAI两步(GPT-4.5和GPT-5) [10] - 创始人梁文锋被指在憋大招,行业认为大模型竞争呈螺旋式上升状态,没有绝对领先者 [9][10]
OpenAI发布GPT-5模型,多模态是升级重点
环球网资讯· 2025-08-08 04:04
产品发布 - OpenAI正式推出GPT-5模型,首席执行官表示这是迈向通用人工智能(AGI)的重要一步,模型交流体验如同与人类专家对话[1] - GPT-5系列包含三款模型:GPT-5、GPT-5 mini及GPT-5 nano,上下文长度均达400K,最大输出为128K tokens[4] - API价格体系公布:GPT-5每百万tokens输入1.25美元、输出10美元;GPT-5 mini输入0.25美元、输出2美元;GPT-5 nano输入0.05美元、输出0.40美元[4] 性能表现 - GPT-5在Swe Bench等多个基准测试中表现亮眼,树立了新的性能标准[3] - 模型核心发展方向聚焦于提升可靠性与事实准确性,在安全框架内为用户提供最大化帮助[3] - 面对无法回答的问题时,GPT-5会详细解释原因并引导用户寻求第三方帮助,而非简单拒绝[3] - 编程能力强大,几分钟内可输出超200行代码,曾成功创建融合多种视觉与音频元素的网站[3] 功能特点 - 用户可在提示中要求模型"深入思考"或"更精确",并能直观看到其思维过程[3] - 语音模式即将上线,演示中展现出用单个单词回应并总结"人际关系"相关内容的能力[4] - 记忆功能支持Pro、Plus及Teams订阅用户连接谷歌账号访问日历,联动Gmail与Google Calendar[4] - 提醒用户回复未回邮件的功能将于下周先向Pro用户开放,随后扩展至Plus和Teams用户[4] 服务推广 - 免费用户今日起可使用GPT-5(有配额限制),Plus及Pro订阅用户享有更高权益[4] - 公司表示将持续聚焦安全性提升与防欺骗机制完善,推动GPT-5在合规前提下更好服务用户[4]
刚刚,奥特曼发布GPT-5,人人免费用“博士级”智能,基准图错误遭全网吐槽
36氪· 2025-08-08 03:05
模型发布与核心功能 - GPT-5作为集成模型发布,无需用户手动切换子模型,系统自动分配最优处理模块(如高效应答、深度推理的"Thinking模式")[3][30] - 采用实时router系统优化模型分配,结合用户反馈及使用量动态调整,未来计划融合为单一终极模型[30] - 三大关键突破:显著降低幻觉生成、提升指令遵循精度、减少迎合性回答,核心场景(文本创作、编程开发、健康咨询)性能全面提升[30] 技术性能与基准测试 - 数学领域无工具辅助下AIME 2025测试达94.6%,编程领域SWE-bench Verified 74.9%/Aider Polyglot 88%,多模态MMMU 84.2%,健康领域HealthBench Hard 46.2%[4][31] - GPT-5 Pro在GPQA基准测试创88.4%新纪录(无工具辅助),内部评估显示其在40多个职业领域综合表现超越人类专家及前代模型[4][61] - 多模态能力覆盖视觉、视频、空间推理,可精准解析非文本输入(图表、演示文稿等)[51] 产品商业化与定价 - 提供免费版、Plus和Pro三档计划,免费版具备"博士级智能"基础推理功能,Pro版开放最高性能模型[4] - API定价:标准版每百万输入Token 1.25美元/输出Token 10美元,mini/nano版更便宜[4] - 微软生态全线接入(Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundry),模型基于Azure AI超算训练[68][69][70] 应用场景演示 - 教育领域可快速生成数百行代码及互动内容(如伯努利效应解释),写作质量优于GPT-4o[7][8] - 编程能力支持全流程开发(如法语学习网页),语音模式升级后支持自然语调调节及长对话,适配语言学习[8][10] - 健康功能优化,现场展示癌症病情解释案例,被定位为"迄今最佳健康模型"[12] 争议与行业对比 - 现场出现跑分图错误及幻觉案例争议,部分观点认为错误源于训练数据本身偏差[13][21][23][24] - 行业评价认为闭源与开源模型差距缩小,GPT-5编程性能仅领先消费级开源模型10%,AGI发展或放缓[26] - 对比前代模型,GPT-5在视觉推理等场景输出token量减少50-80%,效率显著提升[64][65][66] 模型架构与版本迭代 - GPT-5系列包含gpt-5-main(基础版)、gpt-5-thinking(推理版)及Pro版本,全面替代GPT-4o/o3系列[72][74] - GPT-5 Pro取代o3-pro,专攻高复杂度任务,支持并行测试计算,在科学问题(如GPQA)表现领先[72]
GPT-5正式发布 ,Open AI 奥特曼称“是世界上最好的模型”,马斯克“拆台”,A股多只ChatGPT概念股大跌
搜狐财经· 2025-08-08 02:56
GPT-5发布与性能特点 - OpenAI于8月7日正式推出新一代AI模型GPT-5 这是继2022年11月ChatGPT和2023年3月GPT-4后时隔两年半的重大升级 [1] - 公司CEO称GPT-5为"世界上最好的模型" 在实现通用人工智能(AGI)道路上迈出重要一步 且是"迄今为止最强大的编码模型" [1] - 新模型在编码、数学、写作、健康、视觉感知等领域性能卓越 例如仅通过提示即可创建网站、应用程序和游戏 官网展示案例包括网页游戏、像素画图板等工具 [1] 模型优化与开放策略 - GPT-5减少了对人类的"阿谀奉承"行为 通过改进训练使该概率从14.5%降至6%以下 使对话表现更接近人类朋友 [2] - 模型面向所有用户开放 Plus会员可获得更多使用量 Pro会员可访问GPT-5 Pro版本 该版本具有扩展推理能力并提供更全面准确的答案 [2] - 马斯克在X平台称"Grok 4在ARC-AGI上击败了GPT-5" 引发网友对Grok 4推理能力与GPT-5性价比的讨论 [2] 资本市场反应 - A股ChatGPT概念板块指数下跌1.95%至1947.98点 多只成分股出现大幅下跌 [3][4] - 金现代股价下跌11.50%至13.31元 流通市值42亿 鼎捷数智下跌10.66%至59.02元 市值159亿 [3] - 万兴科技下跌9.22%至79.13元(市值136亿) 能科科技下跌8.41%至39.73元(市值97.2亿) 其他成分股如赛意信息、用友网络等均下跌超5% [4]
GPT-5来了!可免费使用
券商中国· 2025-08-08 02:13
GPT-5发布 - OpenAI发布新旗舰AI模型GPT-5 该模型在智能性、速度和实用性方面均有提升 特别是在写作、编码和医疗保健等领域表现突出 [1] - GPT-5首次向所有用户开放 包括免费用户 并首次采用推理模型支持ChatGPT免费版本 该模型通过"思考"复杂问题减少幻觉或编造内容 [1] - 在LMArena排名中 GPT-5以1481±11的分数位列第一 领先于Gemini 2 5 Pro(1460±6)和GPT-4 5(1438±6)等竞争对手 在文本、编程、数学等全方面表现最佳 [2] 技术特性 - GPT-5的幻觉率较低 编造答案的频率减少 开发过程中进行了5000小时的安全测试 采用"安全完成"机制处理潜在风险问题而非直接拒绝回答 [3] - OpenAI CEO表示GPT-5在交互体验上有显著提升 感觉更人性化 能够像博士级专家一样在各个领域提供专业回答 [3] - 该系统被定位为公司向通用人工智能(AGI)目标迈出的重要一步 展示了技术突破性进展 [4] 用户服务 - GPT-5提供分层服务 Plus会员可获得更多使用量 Pro会员可访问GPT-5 Pro版本 免费用户在配额用完后将使用GPT-5 mini模型 [4] - 系统展示强大应用开发能力 例如在工程师要求下 仅用几分钟就生成了一款帮助学习法语的在线应用程序 [1]
OpenAI最强模型GPT-5来了!免费可用,Altman高呼迈向AGI一大步,微软抢先接入
硬AI· 2025-08-08 01:36
模型性能与突破 - GPT-5是OpenAI首个将o系列模型推理能力与GPT系列快速响应结合的"一体化"AI系统,具备专家级智慧 [2][6] - 编程能力显著提升,SWE-bench Verified测试准确率74.9%,超越Claude Opus 4.1(74.5%)和Gemini 2.5 Pro(59.6%) [7][9] - 健康领域错误信息率降至1.6%,较GPT-4o(15.8%)和o3(12.9%)改善明显 [14] - 幻觉问题大幅优化,事实错误率4.8%,较GPT-4o(20.6%)降低45%,较o3(22%)降低80% [17] 产品部署与商业化 - 免费及付费用户全面开放,Pro用户可无限使用增强版GPT-5 Pro,企业版年费1美元象征性收费 [4] - 微软当日整合GPT-5至365 Copilot、GitHub Copilot等平台,企业用户可处理复杂文档,开发者获得代码支持 [4][27] - Azure AI Foundry提供全系列GPT-5模型,配备智能任务路由功能 [27] 功能创新与用户体验 - 新增四种预设聊天性格(愤世嫉俗者/机器人/倾听者/书呆子),可调整交互风格 [21] - 支持"氛围编码",演示案例中根据自然语言提示生成法语学习网页App [12] - 创意写作能力提升,可处理无韵律诗等复杂结构,响应更自然 [12] - 安全训练模式"安全补全"减少过度拒绝,拒绝时提供透明解释 [19] 行业竞争与定位 - 被CEO Altman称为"世界最佳模型",数学测试中GPT-5 Pro得分42%略低于Grok 4 Heavy(44.4%) [9][24] - 微软AI红队测试显示GPT-5具备历代最强安全配置,防御恶意软件生成等攻击 [28] - 经济价值测试显示GPT-5在40+职业中半数案例达专家水平,覆盖法律、工程等领域 [25]
OpenAI GPT-5 发布:模型能力全面“屠榜”,构建“超级智能”第一步
36氪· 2025-08-08 01:20
与此前 OpenAI 速通式的发布会明显不同,这次 OpenAI 准备了时长超过一个小时的发布会直播几波人马轮番上阵,你方唱罢我登场,从各种角度展示 GPT-5 的强悍性能。 经历过无数次「跳票」之后,GPT-5 终于来了。 北京时间 8 月 8 日凌晨一点,颇有新一代「科技春晚」架势的 OpenAI 夏季发布会拉开帷幕。 先说重点:GPT-5 在多个领域的表现都迎来了全面提升,在文本、WebDev 和视觉感知能力领域排名第一;在硬提示、编码、数学、创造力、长查询等方 面排名第一 GPT-5,在代号为「峰会」的测试下,目前保持着截至目前最高的 Arena 分数,可以说是字面意义上的「屠榜」了。 | C Model - 224 (224) | Coperad : 11 | Hard Proenpts 11 | Coding Ti | March 10 | Creative Writing : 11 | Instruction Following | Longer Query fi | Mults-Torn 51 | | --- | --- | --- | --- | --- | --- | --- | --- ...
GPT-5登场,有三大亮点!OpenAI奥特曼:已从大学生变博士级专家
齐鲁晚报· 2025-08-08 01:09
千呼万唤始出来,GPT-5终登场。 8月8日,人工智能(AI)巨头OpenAI正式推出GPT-5。OpenAI CEO山姆·奥特曼(Sam Altman)称之为"进化","比任何以往的AI都更实用、更聪 明、更迅捷、更人性化。" 山姆·奥特曼正式发布GPT-5 奥特曼用三个身份类比了OpenAI的三代模型:GPT-3像是高中生,偶有灵光闪现但常伴挫败感;GPT-4像大学生,具备真实智慧与实用价值; GPT-5则如同按需召唤各领域的博士级专家,随时助力达成目标。 同时,深度思考模式下也能更诚实地向用户传达其操作和能力了。GPT-5在处理不可能完成、具体要求不明确或缺少关键工具的任务时,不会为 了获得高额奖励,"谎报"自己成功完成了任务或者对不确定的答案过于自信,而是更准确地识别任务无法完成的情况,并清晰地传达局限性。 奥特曼表示,GPT-5是OpenAI通往通用人工智能(AGI)道路的重要里程碑。 根据发布会所展示的,GPT-5在编程、数理逻辑、文本创作、健康咨询及视觉感知等多维度,整体智能水平相较前代产品实现跃升。 在健康医疗领域,GPT-5可以通过动态适应用户背景、知识储备及地域特征,其提供的健康指导精准度 ...