Workflow
通用人工智能(AGI)
icon
搜索文档
GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防
机器之心· 2025-08-02 04:43
GPT-5技术进展 - GPT-5在编程、数学和复杂任务处理能力上有显著提升,尤其在自动化编码和客服退款规则制定方面表现优于前代[15] - 新模型能更高效分配计算资源,在不增加消耗的情况下生成更高质量的文本和代码答案[20] - 性能改进幅度不及早期GPT-3到GPT-4的飞跃,显示技术突破速度放缓[15] 技术开发挑战 - 从研究模型转为ChatGPT版本时性能收益大幅下降,沟通方式差异导致效果折损[32][33] - Orion模型原计划作为GPT-5发布,因未达预期改为GPT-4.5,预训练阶段遇到数据质量和规模扩展问题[27] - Meta挖走十多位关键研究人员导致团队动荡,研究副总裁公开抱怨管理问题[25][26] 核心技术创新 - 采用"通用验证器"技术自动评估模型输出质量,覆盖从编程到创意写作的广泛领域[38][39] - o3推理模型通过增加英伟达芯片和网络搜索能力,在科学理解上取得突破[29][30] - Test-Time Scaling技术证明增加计算时间可持续提升模型性能[13] 商业与融资动态 - 最新融资83亿美元使估值达3000亿美元,年收入预计年底突破200亿美元[42] - 微软可能获得重组后33%股权,双方在技术授权条款上存在争议[24] - 450亿美元GPU采购计划依赖技术改进带来的投资者信心[16] 战略方向 - 自动化编码能力成为研发重点,被视为实现AI自我进化的关键[21] - 公司高管公开表示现有技术路径可支持GPT-8目标,并最终实现AGI[18] - 强化学习被视为通向AGI的核心技术,获得xAI和谷歌等竞争对手重点关注[39]
国地中心首席科学家江磊:人形机器人已跨过0到1门槛未来三年场景落地与生态整合将成核心命题!
机器人大讲堂· 2025-08-02 04:19
行业趋势与商业化进展 - 2025年被视为人形机器人商业化元年,国内已出现人形机器人4S店和电商平台销售,部分热门机型在618大促期间成为爆款[3] - 人形机器人市场化落地以指数级速度推进,宇树、智元等企业拿下上亿元订单,出货量持续增长[3] - 高端人形机器人价格降至50万元以内,宇树科技推出的R1人形机器人价格低至3.99万元[6] 技术突破 - 具身智能规模化赋能、大脑小脑协同升级、数据集与训练场体系化建设成为三大技术亮点[6] - 具身智能与核心零部件结合显著降低成本,突破规模化应用障碍[6] - 机器人交互能力和环境适应力明显提升,能自主调整动作应对干扰[8] - 多模态数据集建设成为行业共识,各地加速建设机器人训练场[10] 商业化路径 - 未来1-2年厘米级精度机器人将在服务场景规模化应用,3-5年毫米级精度机器人进入工业场景,长期将发展具备情感交互能力的家庭机器人[11] - 厘米级精度机器人已能胜任无人超市售货、银行迎宾等场景需求[13] - 机器人4S店成为厘米级服务场景的规模化载体,整合服务资源和数据沉淀[15] 国际竞争格局 - 中国人形机器人在走跑跳能力上已位居全球第一,攻克了运动稳定性难题[15][17] - 在具身智能领域中国与全球同一起跑线,拥有本体制造和数据规模化生产两大核心优势[19] 市场验证与价格策略 - 智元机器人和宇树科技中标1.2405亿元人形机器人代工项目,验证商业化价值[20] - 宇树科技R1人形机器人3.99万元的定价策略延续四足机器人平民化路径,加速用户教育和产业规模化[22] 未来发展方向 - 场景落地与生态整合成为核心命题,需补全"产业中部力量"通过平台型企业整合和国央企示范应用[24] - 行业已跨过0到1阶段,下一步将聚焦制造业和数据优势实现实际价值创造[24]
普惠AI照进现实:云知声如何让技术“越山海”
观察者网· 2025-08-01 15:49
公司技术架构与产品体系 - 公司以"AI三驾马车"(算法、算力、大数据平台)为技术基座,是国内最早搭建千卡GPU智算集群的AI公司之一 [3] - 2016年完成支持千卡同时调用的Atlas智算中心,并推出以模型为中心的"云知大脑"平台,其核心为"山海大模型" [3] - 云知大脑由认知模型(山海大模型)和感知/生成模组(语音降噪、识别、合成等)构成,整合为多模态强推理大模型 [5] - 技术架构呈现"底层三驾马车-中间云知大脑-上层场景应用"的完整体系 [5] 核心应用场景布局 - 智慧物联:通过语音交互打通物联网,实现"万物互联,开口即控"的横向场景覆盖 [5] - 智慧医疗:自2016年与协和医院合作起,已深入病历质控、医保控费、辅助诊疗等垂直领域,构建医疗知识图谱并持续升级专业模型 [5] - 智慧交通:与南宁轨道集团成立合资公司,覆盖智能客服、运维调度等轨道交通智能化场景 [9] - 采用"智慧物联(宽度)+智慧医疗(深度)"的复合场景战略,形成场景化应用矩阵 [8] 技术产业化路径 - 公司经历2012年深度学习(AlexNet)和2022年大模型(ChatGPT)两次技术革命,均保持国内首批产业化应用地位 [11] - 医疗领域采用"助手-同事-导师"的渐进式发展路径,目标培养超级医生但需长期投入 [5] - 行业大模型选择标准取决于专业knowhow需求程度,医疗等严肃场景需结合行业知识与数据构建专业模型 [6] - 技术发展策略强调"深入行业解决实际问题",而非单纯技术刷榜 [11][12] 全球化与资本市场 - 出海战略聚焦东盟和"一带一路"国家,已与瓦努阿图达成震后智能化重建合作 [13][14] - 认为中国在AI工程化应用和产业化体系方面具有全球领先优势 [17] - 指出DeepSeek等突破正在重构全球对中国技术公司的价值评估,中美技术代差已缩短至1-2个季度 [16] - 预测全球化2.0将形成中美"双核主导"格局,打破美国技术垄断有利于行业均衡发展 [13][17] 行业趋势与创业建议 - 观察到WAIC参展应用从概念展示转向垂直行业落地,C端产品显著增多 [15] - 判断底层通用大模型最终存活3-5家,建议创业者聚焦应用层价值创造 [18] - 数据质量被视为AI能力关键,公司通过医疗等垂直领域深度合作获取高质量行业数据 [19][20] - 强调"算法-算力-数据"闭环需通过真实场景验证,商业化价值反哺技术迭代 [20]
又一位剑指AGI的华人理工男!这家百人“作坊”,凭什么年入70亿,还成了OpenAI的“御用陪练”?
混沌学园· 2025-08-01 12:06
行业背景与问题 - AI数据标注行业长期遵循"人力=产量"逻辑 以Scale AI为代表的传统模式依赖海量兼职人员处理简单重复任务[7][8] - 大语言模型(LLM)兴起后 需要理解逻辑、文化、偏见等复杂反馈 传统模式暴露三大弊端:标注错误率高(如餐馆标成医院)、效率低下(小项目启动需数月)、价值密度低(空洞数据泛滥)[8][12] - 行业存在"价值错配":顶级AI工程师被迫从事低价值数据预处理 而非专注模型创新[11] Surge AI商业模式创新 - 重构竞争四维度:极致质量×精英团队×自动化系统×使命感文化 形成乘法效应[15] - 精英路线:全球筛选顶尖1%标注人才 包括博士硕士 将其定位为"AI教练"而非数据工人 团队仅110人但人均产出达Scale AI的9倍[16][17][21] - 专注高价值环节:主攻RLHF(基于人类反馈的强化学习)领域 收费达同行2-5倍 服务OpenAI等顶级实验室[19] - 智能系统:开发人机协同平台 AI负责质检与辅助 人类专注高阶判断 每周处理数百万条高质量数据[20][21] - 文化驱动:以"养育AGI"为使命 标注者自视为"AI父母" 形成金钱无法替代的精神凝聚力[24] 商业成果与行业影响 - 2024年营收超10亿美元(约70亿人民币) 反超Scale AI(8.7亿美元) 零外部融资情况下估值达150亿美元[1][27][28] - 客户质量审计表现优于Scale AI 获O'Reilly创始人公开称赞 Meta投资Scale后更多实验室转向Surge[27] - 开创"高维战场":与Snorkel AI(程序化标注)相比更擅长人类价值观判断 与Turing(专家众包)相比提供更稳定的团队协同输出[29][32] - 验证新范式:证明"更聪明人力+更智能系统"可超越线性规模增长 重新定义AI数据需求为"人类智慧养料"而非简单标注[30][31]
对话凯文·凯利:不必过多担忧,AI变强后,人类只需专注于“玩”
36氪· 2025-08-01 10:55
AI技术发展趋势 - 当前AI模型扩展规模面临困难 新模型缺乏革命性突破 包括中国模型与美国模型相比仍无明显差异[3] - 实现通用人工智能需要超越现有扁平化模型架构 智能是包含几十种不同元素的复杂化合物[4] - 智能不是单一维度 而是多维度的广阔空间 需要建立"可能心智的分类学"来标示各类智能体的位置[9] 异类智能概念 - 用"异类智能"替代AGI/ASI概念 强调AI不是高于人类的超级智能 而是不同于人类的"他者"[6][7] - 智能无法在所有维度都优化 就像蚂蚁在某些能力上优于人类 AI也将专注于不同领域而非全能[12][13] - 需要同时准备两种场景:大型通用模型成功路线与去中心化小众模型路线[15] 镜像世界技术 - 镜像世界是叠加在现实世界的虚拟维度 包含VR体验、真实世界孪生、空间智能和机器认知四个层面[16][17] - 镜像世界需要廉价普及的AI支持 通过实时处理真实世界数据构建虚拟环境[18] - 主要用途是协作工具而非娱乐 能实现百万人规模实时协作 超越现有通讯方式限制[20][21][22] AI行业竞争格局 - AI行业将形成自然垄断格局 遵循网络效应"越大越好 越好越大"的规律[26] - 垄断地位生命周期较短 新平台会快速取代旧主导者 如OpenAI可能取代谷歌搜索地位[27] - 当前主导企业可能被新兴AI公司取代 镜像世界平台将带来新一轮洗牌[27] 人类价值定位 - 人类拥有AI不具备的"大写的创造力" 能突破性创新而非仅优化现有方案[29] - 人类存在本身将变得稀缺且有价值 富人更愿被真人包围 人性成为稀缺品[35] - 人类将通过提供陪伴、教学等"做人"服务获得收入 即使AI能完成经济价值更高的工作[35] 数据与隐私 - 用户愿意用隐私换取个性化服务 会自主选择开放透明度以获取AI助理的更大价值[38] - 信任是关键因素 不同地区用户对政府或企业的信任度将决定数据开放意愿[38] 教育体系变革 - 核心技能是"学会如何为自己学习" 需要掌握优化自身学习方式的能力[41] - 学校教育应关注学习能力本身而非特定科目 采用自定进度个性化教学[42] - 提问能力比知识掌握更重要 学会提问是优化学习的关键方法之一[43]
中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先
机器之心· 2025-08-01 04:23
中国人工智能发展态势 - 中国在人工智能领域已成为全球竞争的重要力量,与美国在MMLU、HumanEval等基准测试中的差距从双位数下降到几乎持平 [1] - WAIC大会展示了中国在AI应用、智能体和新模型方面的迅猛迭代 [2] - 中国凭借活跃的开源模型生态和半导体领域的进取,展现出超越美国的潜在路径 [8] 美国人工智能政策与竞争 - 特朗普宣布「人工智能行动计划」,主张在最少监管下刺激美国AI产业发展 [4][5] - 美国白宫发布的《AI行动计划》支持开源,但不足以确保长期领先优势 [9] - 美国顶尖闭源大模型如Gemini 2.5 Pro、Claude 4 Opus等仍占主导 [11] 中美技术生态对比 - 中国开源模型生态竞争激烈,涌现DeepSeek R1-0528、Kimi K2、Qwen3系列等领先产品 [12] - 美国企业采取高度保密策略,知识流动高成本且缓慢 [14] - 中国通过开源和快速知识扩散加速技术迭代,美国侧重闭源商业竞争 [19] 半导体与硬件进展 - 华为推出CloudMatrix 384系统,通过堆叠芯片与英伟达GB200竞争 [15] - 中国在GPU性能上仍落后于英伟达B200,但通过架构创新寻求突破 [15] - 出口限制推动中国企业加大自主技术研发投入 [16] 行业专家观点 - 吴恩达认为中国高度竞争的商业环境和知识扩散机制赋予其巨大动能 [9] - 黄仁勋称赞中国企业在受限条件下实现世界级创新,如深度求索、阿里巴巴等 [19] - AI技术将渐进式演进,不存在单一「终点线」,领先优势将带来经济增长与国家实力差距 [10][11] 未来竞争格局 - 中国可能通过开源生态和半导体进展实现「弯道超车」,类似电动汽车领域 [16] - 行业已为中国主导开源大模型的未来格局做好准备,当前处于这一阶段初期 [17] - 良好的竞争态势是行业发展的驱动力,中国有望在AI领域转为领先 [20]
Ilya之后,两位90后撑起OpenAI核心研究
量子位· 2025-08-01 04:23
OpenAI核心研究团队 - 在Ilya Sutskever离职后,Mark Chen和Jakub Pachocki成为OpenAI研究领域的核心支柱,分别担任首席研究官和首席科学家 [1][5][29] - 两人均为90后(Chen 90年出生,Pachocki 91年出生),拥有国际奥赛背景,且均为公司资深员工(Chen工作6年,Pachocki工作8年)[9][20][22] - 分工明确:Chen负责研究团队建设与管理,Pachocki主导研究路线图制定与技术愿景规划,但协作灵活,可交叉介入具体技术细节 [5][30] 关键人物背景 Mark Chen - 学术成就:h指数27,论文总被引108,391次,参与撰写GPT-3(被引51,872次)、GPT-4技术报告(被引16,368次)等里程碑论文 [13] - 技术贡献:主导开发DALL-E、Codex编码模型,构建GPT-3并行策略,为GPT-4添加图像识别功能 [12] - 职业经历:MIT计算机本科,曾任职Jane Street Capital量化研究员,开发期货交易机器学习模型 [19] - 拒绝Meta创始人扎克伯格10亿美元薪酬邀约,坚持留在OpenAI [15][17] Jakub Pachocki - 学术背景:CMU三年速获博士学位,哈佛大学博士后,本科毕业于华沙大学 [23] - 竞赛成就:2009年IOI银牌,2012年Google Code Jam冠军、ICPC世界总决赛团队金牌 [26][28] - 技术领导:接替Ilya担任首席科学家,监督GPT-4和o1项目,曾负责Dota AI应用项目 [20][22] 研究战略与成果 - 通过国际竞赛推动AI进步:OpenAI在AtCoder编程竞赛获全球第二,IMO数学竞赛夺金,旨在通过挑战顶级人类表现提升模型能力 [32][34] - 研究范式:认为数学与编码是通用AI的关键,强调模型需学习人类创新解法(如竞赛选手Psyho的新颖方案)来突破技术瓶颈 [35][36] - AGI发展路径:主张渐进式发展,将AGI视为工具而非革命性存在,认为对齐研究应融入核心业务而非独立进行 [38][41] 组织动态与行业影响 - 超级对齐团队解散原因:认为当前应聚焦现有模型对齐,而非假设性超级智能控制 [41] - 公司转型:从纯研究转向研究+产品双轨模式,技术突破衍生产品(如GPT系列)成为AGI探索的副产品 [37][42] - 行业竞争:扎克伯格受Chen启发启动Meta人才争夺战,反映AI顶尖人才稀缺性 [14][8]
大模型脱颖而出 智谱走上台前
北京商报· 2025-07-31 16:40
GLM-4.5采用混合专家(MoE)架构,GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数 1060亿,激活参数120亿,有用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式。在 包含推理、代码、智能体的综合能力测评中,GLM-4.5达到开源SOTA(即"当前最佳技术"或"最前沿水 平"),在真实代码智能体的人工对比评测中,实测国内最佳。 真实场景表现比榜单更重要。在真实场景Agentic Coding(Agentic Coding)中,52个编程开发任务,涵 盖六大开发领域的测试中,GLM-4.5与Kimi-K2、Claude Code、Claude-4-Sonnet、Qwen3-Coder进行对 比测试,结果显示,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度 方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,在大部分场景中可以实现平替的效 果。 在成本角度,GLM-4.5的API调用价格输入0.8元/百万tokens、输出2元/百万tokens;高速版最高 100tokens/秒。综合成本和、参数和表 ...
GLM-4.5大模型杀出重围 “领跑者”智谱走上台前
北京商报· 2025-07-31 14:55
核心观点 - 智谱华章发布新一代旗舰大模型GLM-4.5,综合得分位列全球第三、国产第一,专为智能体应用打造,实现复杂推理、代码生成及智能体交互等能力融合与技术突破 [1][3] - GLM-4.5采用混合专家(MoE)架构,总参数量3550亿,激活参数320亿,在开源社区Hugging-Face榜单全球第二,创增速纪录 [3] - GLM-4.5在真实场景Agentic Coding测试中展现出竞争优势,API调用成本较低,输入0.8元/百万tokens、输出2元/百万tokens,被评价为"成本更低、性能更优" [4] - 公司已启动IPO上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的"大模型六小虎",并获多地国资战略投资 [1][7] 技术能力 - GLM-4.5是首款原生融合模型,首次在单个模型中实现推理、编码和智能体能力原生融合,能够一键生成复杂应用、游戏、交互网页 [5] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,国产第一 [3] - 在真实代码智能体的人工对比评测中,GLM-4.5达到开源SOTA(当前最佳技术),实测国内最佳 [3] 市场表现与竞争 - GLM-4.5发布仅2小时就被X平台推荐上首页,12小时后位列Hugging-Face榜单全球第二,创增速纪录 [3] - OpenAI将智谱定义为全球竞争对手,GLM-4.5的发布早于OpenAI多次推迟的GPT-5 [1][6] - 在真实场景Agentic Coding测试中,GLM-4.5相比其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出 [4] 商业模式与资本动向 - 公司已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,8月将进入正式辅导期第二阶段 [1] - 公司获多地国资战略投资,股东背景多元,可同时获得应用场景、政务资源、国际市场等支持 [7] - 与具身智能相比,智谱专注通用大模型与智能体,商业模式相对成熟,直接竞争较少 [8] 行业趋势 - 大模型的下一个范式是将各种能力整合到一起,成为一个"全优生",GLM-4.5正是朝着这一目标努力 [5][7] - OpenAICEO山姆·奥特曼提到GPT-5将整合大量技术,包括o3,但发布时间多次推迟 [6] - 智谱与OpenAI相似之处在于双方都在各自国家较早地开始训练大模型,并探索不同方向的能力边界 [7]
全网疯传GPT-5泄露,首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?
36氪· 2025-07-31 09:18
GPT-5这回是真的要来了。 现在,全网都在"偶遇"GPT-5。 不仅是ChatGPT上有踪迹: 而且在MacOS应用的模型列表中也发现了GPT-5。 还有Cursor、微软Copilot以及OpenAI API平台上,也都被网友捉到已经悄悄接入/测试GPT-5。 这一大波泄露,大家对GPT-5的热情和好奇再次被重新拉回高点,还是奥特曼会玩啊。 连向来怼天怼地的马库斯都说:不开玩笑,这一次GPT-5真的要来了。 从已经泄露的信息来看,GPT-5肯定更强大。 它将整合GPT系列和o系列,实现多模态和推理能力大一统、编程能力很强、百万tokens上下文、支持MCP等。 最快下周就会发布! 据说微软Copilot上的GPT-5将向所有人开放,不受订阅限制。今年3月,奥特曼在采访中还说了GPT-5将免费向用户开放。 感觉GPT-5这一波,是要全面铺开啊。 所以到底有多强? GPT‑5 nano(代号 "starfish") 两款模型都编程能力突出 根据OpenAI内部人士透露,GPT-5实现推理能力(o系列)和多模态交互能力(4o以及GPT系列)的大一统,以后不用再手动切换模型。 模型包含多个版本: GPT‑5 主模 ...