Workflow
AGI(通用人工智能)
icon
搜索文档
3年前投中Claude的人,今年又赚了7亿美金
虎嗅· 2025-08-21 08:34
AGI发展时间表与预测 - AGI将于2027年前后抵达临界点 超级智能或将在2030年浮现 [2][8] - 需再提升2至3个数量级算力(100到1000倍)AGI就会出现 [6] - 技术爆炸为指数级跃迁 非线性爬坡 [3] AI基础设施投资规模 - 高盛预计2027年AI相关基础设施总投资突破1.5万亿美元 [16] - 训练接近AGI能力的大型模型需数十万张NVIDIA H100芯片 每张市价3万美元 单一模型硬件投入突破百亿美元 [10] - 拥有10万张高端GPU的训练集群年耗电量相当于中型城市 [11] 能源需求与布局 - AI将成为工业文明中单位耗电量最大的技术 [12] - 微软部署水电直连数据中心 OpenAI洽谈核能合作确保2030年前能源自给 [12] - AI对电力需求无上限 因人类对智能追求永无止境 [13] 供应链与产业链影响 - 液冷系统 光纤交换 数据中心建设等环节催生独立工业支柱 [14] - Equinix、Digital Realty全球抢占土地建设数据中心 CoreWeave等AI云基础设施公司估值达数十亿美元 [15] - 最壮观技术-资本加速度启动 数万亿美元流入GPU 数据中心和电力建设产业 [3] 对冲基金SALP业绩与策略 - 基金规模达15亿美元 半年净收益47% [4][42][51] - 主要持仓包括Broadcom、Intel(期权形式)、Vistra、Constellation Energy等能源与芯片公司 [44] - Q1半数以上收益来自Intel看涨期权 股价飙升40% [45] - 采用delta-neutral投资框架 运用复杂期权对冲降低回撤 [30][52] 投资逻辑与布局特点 - 完全避开消费级AI赛道 锁定AGI底盘产业链 [44] - 重仓Broadcom和Intel 押注供应链结构变化 [46][47] - 布局核能 电力调度与液冷基础设施提供商 [50] - 持有半导体ETF(SMH)Put期权 做空可能被AI取代的传统行业 [48] 行业结构变化与地缘影响 - 美国资本将AI基建锁进本土框架:能源批文锁定十年期 产能合约带地域限制 云算力签排他条款 [60] - 其他经济体面临芯片出口管制 能源与模型云服务成本被推高 [61] - AI发展成为国家级工业部署问题 非单纯科研突破 [17] 技术发展里程碑 - AI智力曲线五年内陡升:从GPT-2写语法正确句子到GPT-4解答数学题通过律师考试 [5] - AGI发展分为五个等级:从对话机器人到能完成组织工作的AI [32] - 第一台AGI出现后 AI将自行建造更好AI 一年压缩人类百年科技发展 [9]
喝点VC|a16z对话OpenAI研究员:GPT-5的官方解析,高质量使用场景将取代基准测试成为AGI真正衡量标准
Z Potentials· 2025-08-21 03:09
GPT-5技术能力提升 - 模型在推理、编程和创意写作方面实现质的飞跃,前端开发能力相比GPT-3达到完全不同的层次[6][9][12] - 通过优化数据集设计和奖励模型,显著提升编程能力,被描述为"市面上最强的编程模型"[11][12] - 创意写作能力显著增强,能够生成细腻动人的文本,例如悼词等难以撰写的内容[29] - 通过中期训练(mid-training)更新知识截止时间并扩展模型智能,弥补预训练和后期训练之间的空白[45] 行为设计与幻觉控制 - 针对GPT-4存在的"逢迎"问题,团队重新设计行为目标,追求健康、有帮助的互动感[13] - 幻觉和欺骗问题得到显著收敛,通过引导模型逐步思考而非快速回答来减少错误[14] - 优化多奖励目标的权衡,确保模型既有帮助性又避免过度互动[13] 智能体与工作流变革 - 智能体定义为能异步完成真实任务的助手,核心能力包括深度研究、文档编辑和跨服务数据整合[36] - 未来方向包括长时间运行任务(如耗时数小时或数天的项目)和端到端流程自动化[35] - 当前限制在于缺乏高质量计算机使用数据,需通过自举(bootstrap)方式生成训练数据[43][44] - 用户对异步任务接受度提高,愿意为高质量结果等待(如深度研究任务等待5分钟)[37][38] 评估标准与开发方法论 - 基准测试价值趋近饱和(如指令跟随分数从98提升至99),未来标准转向真实使用场景和新用例解锁[21][22] - 开发方法从目标能力反推,针对具体场景(如幻灯片制作、电子表格编辑)设计内部评测[6][22] - 通用能力优先于垂直领域,因智能提升会同时改善多项功能(如指令理解、工具使用)[24][25] 行业影响与机会 - 非技术背景用户可通过"vibe coding"快速构建完整应用,几分钟完成过去需一周的工作[6][17] - 定价策略降低使用门槛,预计催生大量独立开发者和创业公司[15][17] - 多模态能力(如计算机视觉理解网页截图)和工具集成(浏览器+终端)为自动化奠定基础[28][42] 公司文化与使命 - 研究团队保持小规模灵活结构(如深度研究团队仅2人),强调主动性和跨部门协作[54] - 使命是推动AGI落地并通过免费提供最强模型实现技术普及[58] - 数据质量被视为当前能力跃升的关键因素,优于架构或规模改进[26][27]
Manus对话实录:探索AI Agent支付新领域,年度化收入逼近1亿美元
搜狐财经· 2025-08-21 00:54
公司经营数据 - 公司年度化经常性收入达到9000万美元 即将突破1亿美元 [1] - 收入计算方式为当月收入乘以12 不等同于现金收入 [1] - 年付选项收入属于预存款性质 实际营业收入数字更为可观 [1] 通用AI Agent技术定位 - 真正Agent应具备环境感知能力 是应用型AI的子集 [3] - 公司Agent可部署于虚拟机及互联网环境 通过观察和行动改变环境 [3] - Agent代表用户与环境交互 与AGI存在本质区别 AGI利用模型通用能力无需特别设计 [3] 行业应用实践 - 公司从Agent编程应用获得灵感 非工程师用户使用AI工具进行数据可视化和写作 [4] - 当前AI模型存在环境交互障碍 包括缺乏API接口和验证码等问题 [4] - 房产中介使用公司产品分析客户需求并生成推荐 [5] - 研究人员采用公司产品进行深度研究并生成正式报告 [5] 行业发展前景 - 行业尚未出现iPhone式革命性时刻 但生态系统正在协同进化 [4] - 基础设施层面持续发力 预示未来将取得重大突破 [4]
首个国产“手机智能体”问世,智谱补位Manus
观察者网· 2025-08-21 00:51
(文/陈济深 编辑/张广凯) 8月20日,智谱在iOS安卓,PC三端同步推出AutoGLM 2.0,并首次面向公众全面开放,无需邀请码即可使用。 作为一款纯国产智能体,AutoGLM的发布也给了中国用户一个在Manus退出中国后可以合规便利体验智能体的选择。 不同于Manus等网页端原生的智能体产品,智谱AutoGLM 2.0作为全球首个手机通用Agent,被定位为"执行型助手"。相比目前主流AI产品和智能体助手多停 留在"对话"层面,只能实现信息查询和整理回答,AutoGLM则实现了质的飞跃——它不再只是"说",而是真正能够"做"。 3月AutoGLM1.0发布时,AI尽管也可以操作手机,但是在AI做事期间人不能切屏,不能打断,只能看着干瞪眼。本次AutoGLM2.0则给每个用户预制了一台 虚拟手机和电脑,直接解决了AI和人抢屏幕的操作痛点,让AI从只能在人眼皮子底下干活变成了"你干你的,我干我的"的异步处理模式。 在实际测试中,尽管部分功能的执行效率和优化程度依然有待提升,但目前AutoGLM已经可以较好地执行包括购物、订餐、买机票、自动写文案等大众场 景,智能体不再是极客们的工具,开始步入了更加大众的群 ...
OpenAI掌门人曝GPT-6瓶颈,回答黄仁勋提问,几乎为算力“抵押未来”
36氪· 2025-08-16 04:04
AI技术发展瓶颈 - 随着算力和数据规模快速扩展,算法重要性再次凸显,成为未来AI技术发展的关键瓶颈 [1] - 强化学习成为算法研究新方向之一,但仍存在许多明显能力缺口 [1] - 基础研究正在回归,算法取代数据和算力成为关键制约因素 [21][22] 工程与科研的协同关系 - 工程与科研是驱动AI发展的两大引擎,工程师贡献与研究人员相仿甚至更大 [3][4] - OpenAI坚持工程与研究同等重要,两者需紧密合作解决复杂问题 [5][6] - 工程背景与科研背景人员对系统约束的理解存在根本性差异,需技术谦逊来调和 [6][7] 资源调配与产品化挑战 - 为支撑ChatGPT和ImageGen的海量需求,公司不得不抽调科研算力"抵押未来" [8][9] - 产品上线导致系统崩溃风险增加,需在资源协调中做出取舍 [8][9] - 公司理念是优先满足用户体验,推动技术快速落地 [10] AI编程范式演进 - "氛围编程"正从趣味应用向严肃软件工程转型,可改造遗留代码库 [11][12] - 未来代码库需模块化设计,通过高质量测试让模型填充细节 [13] - 软件工程需回归可维护性实践,最大化模型价值 [13] 训练系统与基础设施 - 长时间训练任务需优化检查点设计,强化学习系统状态保存更复杂 [14][15] - AGI开发需同步建设超级计算机,涉及大规模基础设施投资 [18][19] - 未来AI基础设施需兼顾计算密集型与低延迟两类需求 [16][17] 行业发展趋势 - 多样化模型库正在成形,经济系统将逐步由AI驱动 [24][25] - 特定领域Agent开发需大量定制工作,创造新商业机会 [24][27] - 医疗、教育等垂直领域需专业知识和责任框架 [26]
商汤林达华:破解图文交错思维链技术,商汤的“两步走”路径
36氪· 2025-08-15 09:09
多模态智能技术路径 - 多模态是通向AGI的必经之路 因语言仅是智能的产物而非本源 需通过多模态感知和处理信息实现通用性[4] - 智能演进需经历四次破壁:长序列建模、多模态理解、多模态推理、数字与物理空间交互[5] - 公司2023年初推出国内最早多模态模型 2024年突破原生多模态融合技术 2025年实现图文交错思维链[5] 原生多模态技术优势 - 适应训练通过微调实现模态对齐 成本低但仅僵硬遵循范例模式[7] - 原生训练在预训练阶段融合多模态数据 从根源具备多模态能力[7] - 公司2024年确定融合路径:预训练中段开始多模态融合 形成统一模型且不再生产单独语言模型[7] 技术成果与性能表现 - 2024年Q3完成融合训练数据配方验证 Q4完成千亿参数级别多模态模型训练[8] - 模型在OpenCompass和SuperCLUE评测中位居国内首位 语言任务与DeepSeek V3并列[8] - 日日新6.5仅有多模态模型 无单独语言模型 与国内其他厂商架构存在显著差异[9] 图文交错思维链突破 - 主流多模态模型推理链仍为纯文本 通过图像转文本描述再进行语言推理[9] - 公司通过图像编辑工具构建图文交错思维链 实现逻辑思维与形象思维结合[10] - 采用两步走路径:先通过工具构建对外智能体 再通过多模态理解实现内生混合思考[10] 模型架构效率优化 - 视觉编码器专注连续信号感知 语言模型主干处理离散语义 需差异化结构与学习方式[11] - 架构更新后处理高分辨率大图和长视频更快捷 数据优化使同性能下效率提升超3倍[11] - 性能成本曲线显著优化 实现比Gemini 2.5系列更优的效费比[11] 具身智能与世界模型 - 世界模型通过虚拟系统模拟现实交互 提供近真实反馈且效率远高于真实环境[12] - 开悟世界模型基于多模态能力构建 用智能汽车业务数据增强模拟生成能力[12] - 可根据指定路径生成多视角视频 有效支撑智能驾驶系统训练[12] 商业战略与落地成果 - 采用"基础设施-模型-应用"三位一体战略 形成技术与商业正向循环[13] - 基础技术实现原生融合训练/多模态强化学习/无限时长视频交互记忆等突破[14] - 生产力AI装机量从百万级走向千万级 交互AI落地新型硬件与机器人[14]
GPT-5最大市场在印度?Altman最新访谈:可以聊婚姻家庭,但回答不了GPT-5为何不及预期
AI前线· 2025-08-15 06:57
GPT-5发布与市场反响 - OpenAI于2025年8月8日正式发布新一代大语言模型GPT-5 引发全球科技领域高度关注 [2] - 部分个人用户反馈使用体验不佳 包括反应速度变慢 回答篇幅缩短 基本问题错误率上升 甚至导致部分付费用户取消订阅 [2][3] - 企业级市场对GPT-5接受度显著更高 在发布后7天内 Cursor、Vercel和Factory等科技创业公司已将其设为关键产品的默认模型 [4] - 企业反馈GPT-5相比前代模型展现出三大优势:部署效率提升明显、复杂任务处理能力增强、总体使用成本大幅度降低 [4] - 云存储巨头Box正在对GPT-5进行深度测试 重点评估其在逻辑密集型长文档处理方面的表现 并计划在年底前将其整合至企业级文档处理解决方案中 [5] GPT-5技术特性与优势 - OpenAI CEO Sam Altman将GPT-5描述为一次技术飞跃 强调其流畅性和适应性智能远超以往模型 用户无需在不同模型间切换选择 [8] - GPT-5被定位为集成模型 能够执行从零开发软件、撰写复杂主题研究报告、策划活动等多样化任务 [8][9] - 模型在稳健性和可靠性方面有显著提升 对自主性工作流程非常有帮助 能处理的任务长度和复杂度令人印象深刻 [10] - 在印度市场 GPT-5成为OpenAI全球第二大市场 很可能成为第一 公司采纳了大量当地用户反馈 包括更好的语言支持和更实惠的价格 [11] - GPT-5在快速创建小型软件方面表现出色 比以往任何模型都更高效 能帮助用户解决生活中的小问题 [16] AI行业发展趋势与机遇 - 当前被视为有史以来最令人兴奋的职业起点阶段 工具能力的提升使个人将想法落地所需的时间、人力和经验大大减少 [13] - AI在科学领域的应用前景广阔 个人能发现的科学成果、速度和规模将是前所未有的 同时将彻底改变编程方式 [14] - 初创企业能够以非常小的团队完成大量工作 限制几乎只来自想法的质量和创造力 这些工具会帮助实现 [15] - 学习如何使用人工智能工具被视为最重要、最具体的硬技能 真正擅长使用这些工具的人与不具备这种能力的人差距非常大 [15] - 机器人领域在未来几年会变得极其重要 最有AGI感的时刻之一可能是在街上看到机器人像人一样走过 做一些日常任务 [41] 商业模式与竞争格局 - AI被视为一种通用技术 类似于晶体管 不会有一家公司能占到全球GDP的一半 价值将以分散的方式被捕获 [29] - 在AI模型之上构建业务时 如果业务能随着模型进步而变得更好 则会持续向好 否则可能面临被淘汰的风险 [33] - 与客户建立深度关系的公司更具长期价值 例如Cursor最近流行度爆发式增长 并与客户建立了非常牢固的关系 [34] - 拥有客户接口的服务公司比产品公司更能加深客户关系 因为服务会重复发生 有机会在交易中加入个人品味 [35] - 在一个充斥着无限AI内容的世界里 真实的人的价值会提高 人们非常在意对方是不是真人 这深植于我们的生物本能 [37][39] 技术局限性与未来方向 - GPT-5在知识、模式识别和短期记忆等方面已达到超人类水平 但在确定要提出哪些问题或长时间坚持研究一个问题方面还远未达到人类水平 [41] - 模型思考跨度从几分钟提升到了一个半小时 但要证明一个新的、重要的数学定理可能需要一千个小时 目前还无法做到 [41] - 现有电脑形态并不适合AI伙伴愿景 未来的形态可能是眼镜、可穿戴设备、放在桌上的小装置等 环境感知型硬件可能会很重要 [44] - 公司会尝试多种产品 打造AI可以寄居的硬件形态 这将是重要方向之一 [45] - 能够想出逆向且正确的创意的能力价值会随时间提升 擅长做模型做不到的事情会越来越有价值 [35]
没有共识又如何?头部企业抢夺标准定义权 机器人“暗战”升级
第一财经· 2025-08-14 19:31
具身智能大模型技术发展 - 机器人通过数据驱动的闭环大模型具备感知失败并自主尝试新解法的能力,这种能力被视为AGI发展的重要标志[1][2] - 星海图发布的G0模型搭载端到端双系统全身VLA架构,能在任务失败后通过模仿学习和强化学习持续优化动作[2][3] - 传统机器人依赖预设程序执行,而新型具身大模型通过传感器实时反馈与环境交互,实现"评估-学习-优化"的闭环[3] 行业技术路线分歧 - 模型架构存在"统一直出"(如自变量WALL-A)与分层设计的对立,前者可减少误差扩散但算力消耗巨大[5][6] - 自变量选择全模型直出架构以提升效率,但面临高训练成本与工业场景延迟问题,目前聚焦商业服务领域[5][6] - 宇树科技等企业认为模型架构优化比数据规模更重要,当前VLA模型定义宽泛但缺乏统一标准[4][9] 商业化与生态竞争 - 企业通过自研核心零部件(如自变量"量子2号"机器人)和开源数据集(星海图Galaxea 500小时数据集)构建生态壁垒[7][8] - 行业头部公司正争夺性能测评标准与数据集主导权,星海图开源数据集旨在建立算法比较基准并吸引开发者[7][8] - 首程控股管理的100亿元机器人基金已投资多家技术路径迥异的企业,认为架构设计将决定未来规模化成本优势[9] 技术迭代与行业格局 - 具身智能企业持续迭代模型架构,优秀架构可降低数据需求并提升泛化能力,成为核心竞争力[9] - 行业短期目标为击穿酒店、养老院等标杆场景,验证技术商业价值以撬动千亿级市场[6][8] - 当前竞争焦点从单点技术转向全生态布局,包括数据、零部件、本体及模型的全链条能力[8][9]
对话王小川:换个身位,做一家「医疗突出」的模型公司
Founder Park· 2025-08-14 07:48
公司战略调整 - 百川智能从450人精简至不足200人 管理层级从3.6级压缩至2.4级 团队更加扁平化和专注 [7][8] - 公司明确战略重心为"为人类造医生 为生命建模型" 放弃金融等快速变现方向 回归医疗初心 [7][8][29] - 调整后公司资金可支撑120个月运营 属于主动战略聚焦而非被动收缩 [30][31] 技术突破 - 发布医疗大模型Baichuan-M2 性能超越OpenAI两个开源模型 闭源领域仅次于GPT-5 [2][32] - 在Health-Bench评测中 Baichuan-M2在Hard模式得34分(OpenAI 32分) 标准版突破60分与GPT-5并列 [32] - 选择开源Baichuan-M2 旨在提升中国AI生态实力 同时展示公司在医疗领域的专注成果 [33] 医疗AI发展路径 - 医疗AI将比无人驾驶更早落地 因医疗需求更刚性且人机协同更易实现 [42][43] - 医疗AI发展需考虑场景(院内/院外)和关系(医患/家属)两个新维度 [45][46] - 计划2026年推出重大版本迭代 先进入医院体系再推向C端用户 [37][48] 行业观察 - 2023年资本狂热期后 行业进入调整期 国内外发展阶段出现"时间差" [57][58] - 美国公司已进入ARR收获期 国内仍处Benchmark内卷阶段 差距被重新拉大 [58][59] - 长期有抱负的公司仍需自研模型 但轻量级公司可通过调用第三方模型快速变现 [60] 技术路线思考 - 认为代码是通向AGI的核心路径 代码的自我运行将标志AGI到来 [53][55] - 医疗AI需解决"提问能力"和"减少幻觉"等通用模型未专注的问题 [39][40] - 医疗知识体系融合逻辑推理与医学认知 需叠加厚重应用层开发 [38][39]
免费+广告,AI行业终究也走上了互联网圈的老路
36氪· 2025-08-13 23:46
多亏各路互联网厂商孜孜不倦的教育,"免费的才是最贵的"、"天下没有免费的午餐"这类说法早已深入 人心。"免费+广告"这套组合拳更堪称是互联网厂商最有创造力的发明,也将互联网行业的网络效应和 商业公司的盈利需求有机地统一在了一起。 | Elon Musk 2 @ @elonmusk . 54分钟 | | | --- | --- | | Grok 4 is now free for all users. | | | The free tier allows a small number of queries per day. Beyond that requires | subscription. | | axai · 10小时 | | | ok 4 is now free for all users worldwide! | | | Simply use Auto mode, and Grok will route complex queries to Grok 4. | Prefer control? Choose "Expert" anytime to always use Grok 4. | | 显示更多 ...