AGI

搜索文档
晚点播客丨李开复聊零一万物调整:只有大厂能追逐超大模型
晚点LatePost· 2025-01-14 09:35
文丨程曼祺 ▲扫描上图二维码可收听《晚点聊 LateTalk》第 98 期节目。欢迎在小宇宙、喜马拉雅、苹果 Podcast 等渠道关注、收听我们。 《晚点聊 LateTalk》是《晚点 LatePost》 推出的播客节目。"最一手的商业、科技访谈,最真实的从业者思考。" 不再追求 AGI,他第一个讲了出来。 上周初开始,市场陆续出现有关零一万物的新调整传闻,关键词包括:"放弃预训练,资金链紧张、被阿里收购……" 传 闻出现的第二天,我们在零一万物办公地,中关村鼎好大厦,采访了李开复。 他解释了实际发生的变化:零一万物已经和阿里云成立了 "产业大模型联合实验室",零一万物的大部分训练和 AI Infra 团队会加入这个实验室,成为阿里的员工,侧重超大模型研发等。零一自己接下来会聚焦做更快、更便宜、更小,更能 支持普惠应用的模型,同时自己做应用。 在李开复的描述里,超大模型和更快、更便宜、更小的模型的关系类似于 "老师和学生",超大模型可以通过标注结果和 生成更多合成数据的方式帮更小的模型提升性能。 去年 5 月,我们也访谈过一次李开复,当时的话题是从中国 "最年长的 AI 大模型创业者" 开始的,在 2023 ...
AI 一年过山车:从狂想到放下幻想丨晚点回望 2024 ⑤
晚点LatePost· 2025-01-13 11:40
当 OpenAI 不再技惊全场,这是技术扩散的开始。 文丨贺乾明 张家豪 王与桐 李梓楠 制图丨 黄帧昕 编辑丨程曼祺 贺乾明 2024 年的开始,解决了 OpenAI 政变的山姆·阿尔特曼和天才科学家伊利亚·苏茨克维重修于好,发布视频生成模型 Sora,重演 ChatGPT 上线时的震撼。 在中国,阿里巴巴从年初起连续投资月之暗面、MiniMax 等大模型公司近 15 亿美元,为 AI 创业公司送去新的弹药。 不久后,月之暗面创始人杨植麟在一次行业活动上被围着要签名——这是中国创投领域许多年未见的光景。 图片、文字到视频,技术突破在 ChatGPT 发布的第三年开了个好头。行业关注点从模型、应用到商业化,要建立一套 AI 时代的商业模式;创业公司不断融资,向大公司发起冲击,誓要颠覆互联网平台,解锁阶层跃升的新机会。 然而到了年底,大部分乐观期望已经落空。 OpenAI 的 Sora 延期 10 个月才发布,实际效果不如年初的演示,和同行的视频生成模型同样不再令人惊喜。同时让 ChatGPT 变成现实的最关键人物——OpenAI 前首席科学家伊利亚·苏茨克维、CTO 米拉·穆拉蒂、技术奠基者阿列克· 拉德福德 ...
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 14:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]
第三个万亿美元芯片公司;肯德基中国两年来首次涨价;特朗普在硅谷招了批顾问丨百亿美元公司动向
晚点LatePost· 2024-12-25 12:17
博通市值突破万亿美元 - 博通市值突破万亿美元,主要得益于AI业务收入增长220%至122亿美元 [1] - 博通与英伟达同为AI算力投资受益者,但商业模式不同:英伟达出售GPU,博通提供自研AI芯片方案 [1] - 博通正在为Google、Meta、苹果、字节跳动等公司开发AI芯片,尽管字节跳动否认合作 [1] - 今年以来博通市值上涨128%,英伟达上涨182% [1] - 博通CEO透露客户正在规划未来3-5年AI基础设施投资,预计2027年将出现百万AI芯片集群 [1] 特朗普组建科技行业班底 - 特朗普任命a16z管理合伙人Scott Kupor为人事管理局局长,负责政府招聘工作 [2] - a16z普通合伙人Sriram Krishnan被任命为白宫科技政策办公室AI高级政策顾问 [2] - 其他科技行业任命包括:PayPal联合创始人Ken Howery任驻丹麦大使,Scale AI董事总经理Michael Kratsios任白宫科技政策办公室主任,Uber前首席商务官Emil Michael任研究和工程副部长 [2] - 此前特朗普团队已吸纳多位科技高管,包括马斯克密友David Sacks [2] OpenAI模型测试争议 - OpenAI的o3模型在ARC-AGI测试中得分87.5%,较9月o1模型的32%大幅提升 [3] - 测试前o3使用了75%的ARC-AGI公开数据集训练,而其他模型未采用此方法 [4] - OpenAI CEO称未对o3做特殊处理,引发AGI进展讨论 [3] 微软减少对OpenAI依赖 - 微软尝试用自研和第三方大模型驱动365 Copilot,以降低对OpenAI依赖和成本 [5] - 2023年3月微软曾以使用GPT-4作为365 Copilot卖点,但一年半来OpenAI基础模型性能提升有限 [5] - 在某些特定任务如文档总结中,低成本模型表现不逊于OpenAI [5] 餐饮行业动态 - 肯德基中国两年来首次涨价,平均涨幅2%(0.5-2元),优惠套餐维持原价 [6] - 星巴克美国罢工扩大至300多家门店、5000多名员工,因工资谈判分歧(星巴克提议未来几年加薪1.5%被拒) [7] - 库迪咖啡暂停"店中店"招商,该模式曾计划与美宜佳、华莱士等合作,目标2025年5万家门店(目前8170家) [8] 科技与出行行业 - 滴滴上线拉黑异味车功能,用户可12个月内拒乘该车,对差评率高司机采取降分或暂停服务措施 [9] - 菜鸟CFO刘政加入蚂蚁集团将任CFO,曾主导菜鸟IPO筹备工作 [10] - 小红书上线AI搜索产品"点点",基于笔记内容和公开信息提供生活场景答案,日均搜索量达6亿次 [11] 新能源与汽车行业 - 特斯拉上海储能工厂7个月建成,规划年产1万台Megapack(40GWh),2025年Q1投产 [12] - 宁德时代发布电池底盘一体化技术"磐石",称能在120km/h碰撞后保证电池安全,阿维塔将采用该技术 [13][14][15] - 丰田计划在上海新建雷克萨斯电动车工厂,预计2027年运营(官方称非官方消息) [16] - 北汽新能源获宁德时代等81.5亿元增资,与华为合作推出享界S9(起售价40万元) [16]
阶跃星辰完成数亿美元B轮融资:持续发力「超级模型」+「超级应用」
IPO早知道· 2024-12-23 14:37
融资与资金用途 - 阶跃星辰完成数亿美元B轮融资 参与方包括上海国有资本投资有限公司及其旗下基金 腾讯投资 五源资本 启明创投等 [3] - 融资将用于基础模型研发 强化多模态和复杂推理能力 覆盖C端应用场景 [3] 公司背景与团队 - 公司成立于2023年4月 由微软前全球副总裁姜大昕博士创办 [3] - 团队包括ResNet作者张祥雨 AI系统专家朱亦博等 研发人员占比80%以上 [3] 技术路线与模型矩阵 - 技术路线规划为"单模态—多模态—多模理解和生成的统一—世界模型—AGI" [3] - 已形成从文本到多模态全系列模型矩阵 过去10个月发布11个自研基座模型 [4] - 模型包括千亿参数Step-1 万亿参数Step-2(国内首个创业公司发布) Step-1V Step-1X Step-1.5V Step-Video Step-tts-mini Step-Asr Step-1o Audio等 [4] 产品与生态布局 - 战略聚焦"超级模型+超级应用" 推出智能助手「跃问」支持多模态交互 [4] - 「跃问」的「拍照问」功能是国内首个集成到iPhone 16相机控制键的大模型应用 [4] - 在金融财经 内容创作 智能终端等领域与合作伙伴深度合作 打造垂直场景应用 [4] 开发者生态与数据表现 - 开发者基于多模态大模型创造丰富C端应用 2024年下半年多模态API调用量增长超45倍 [4]
张一鸣的基金正式来了
投资界· 2024-12-19 07:31
张一鸣成立Cool River Venture并获得香港9号牌照 - 字节跳动创始人张一鸣创立的个人投资基金Cool River Venture HK Limited正式获得香港证监会颁发的9号牌照(资产管理牌照),主要办公地址位于中环国际金融中心 [3][8] - 9号牌照允许公司直接参与境外投资并管理海外投资者资金,业务范围包括投资咨询、资产管理和基金管理等 [10] - 公司唯一董事为张一鸣,唯一股东为Galaxy LLC(开曼群岛注册),持股比例100% [8] Cool River Venture的投资方向 - 主要投资方向为科技相关行业,包括张一鸣曾公开提及的虚拟现实、生命科学和科学计算领域 [4][10] - 生成式AI可能成为重点投资领域之一,张一鸣卸任CEO后仍积极参与字节跳动的AI战略,并监督AI人才招聘 [10] - 字节跳动旗下AI产品"豆包"月活跃用户达5998万(全球第二),累计用户突破1.6亿 [10] 新一代创始人的科技投资趋势 - 米哈游创始人蔡浩宇卸任后成立AGI创业项目Anuttacon(新加坡注册),目标是用AI技术创造新型虚拟娱乐体验 [13] - 快手创始人宿华卸任CEO后专注于前沿科技投资,涉及AI、大模型等方向 [13] - 中国新一代创始人普遍选择通过VC投资方式参与科技变革,聚焦AI等颠覆性技术领域 [13][14] 香港9号牌照的行业意义 - 9号牌照是香港《证券及期货条例》第9类受规管业务资格,为国内私募出海主流方式之一 [10] - Cool River Venture登记两位持牌负责人:刘彼得(LIU Bide)和LIU Zhao(曾任职巴克莱资本亚洲) [10]
我在 Character.ai 做 Post Training|42章经
42章经· 2024-11-24 14:09
CharacterAI的核心优势 - 全自研模型带来性能优势 可自由调整预训练语料比例以优化对话效果 [3] - 技术团队将推理成本压缩至同参数量模型的1% 支撑千万级免费用户 [3] - 用户偏好对齐高效 建立从数据反馈到模型迭代的闭环 [3] - 当前核心用户日均使用时长2小时 月活2000万(年增100%) 预计明年月活达3000万 [3] Post Training技术实践 - SFT阶段使用精挑细选的高质量人类对话数据 与预训练数据质量差异显著 [4] - RLHF通过奖励模型模拟教师批改 DPO直接利用用户偏好数据简化流程 [4] - 数据与产出形式需高度一致 如将万字同人文拆解为50段对话格式 [5] - 通过预生成回复/光标动画/双模型搭配将语音延迟从2秒压缩至0.5秒内 [5] 模型迭代方法论 - 建立高频测试机制 包括优化评估集/AB测试/数据回流/管线健壮性 [5] - 通过用户对话次数/时长/留存等数据评估迭代效果 关注细分用户变化 [5] - 涌现出"提问式回避"等行为特征 模型自主规避敏感话题延长对话轮次 [5] 行业发展趋势 - 多模型混用成为主流 如OpenAI不同任务采用差异化模型组合 [6] - 硅谷关注点转向推理优化 如entropix项目探索模型自信度调节机制 [6] - 产品端聚焦多模态变现 算法端追求o1式突破 期待Agent交互场景 [6] - 一级市场投资更趋务实 从技术叙事转向商业模式验证 [6] 人才与组织观察 - Post Training人才供需失衡 相关岗位面试强调实战解题思路 [6] - 初创公司普遍存在自驱型加班现象 工程师主动参与用户问题处理 [6] - 硅谷华人技术群体影响力提升 核心岗位占比显著增加 [6]
智谱发布智能体AutoGLM:AI的「Phone Use」来临,智谱AI概念股持续走强
IPO早知道· 2024-10-28 04:08
作者|Stone Jin 微信公众号|ipozaozhidao 据 IPO 早 知 道 消 息 , 智 谱 技 术 团 队 日 前 推 出 了 一 个 基 于 GLM 技 术 团 队 研 究 成 果 的 新 产 品 —— AutoGLM,这是一个智能体(Agent),能够模拟人类操作手机,执行各种任务。 某种程度上而言,AutoGLM的推出标志着人工智能在"Phone Use"领域的进步,使得AI的应用更加 贴近人们的日常生活。理论上,AutoGLM 可以完成人类在电子设备上可以做的任何事,它不受限于 简单的任务场景或 API 调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似 。 值得注意的是, 今日开盘后,智谱AI概念股持续走强 ——传智教育涨停,豆神教育、电广传媒、思 美传媒此前涨停,凌云光、华策影视、创业黑马、首都在线等涨超5%。 具体来讲:AutoGLM 基于智谱自研的「基础智能体解耦合中间界面」和「自进化在线课程强化学习 框架」。其中的核心技术WebRL,克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练 任务和数据稀缺、反馈信号稀少和策略分布漂移等智能体研究和应用难题,加之自适 ...
智谱上线GLM-4-Voice端到端情感语音模型:迈向AGI之路的最新一步
IPO早知道· 2024-10-26 02:12
智谱GLM-4-Voice模型发布 - 智谱于10月25日上线GLM-4-Voice端到端情感语音模型,具备情感表达、语速调节、多语言支持和随时打断等功能 [3] - 模型采用端到端架构,避免了传统"语音转文字再转语音"级联方案的信息损失和误差积累 [3] - 支持中英文及中国各地方言,尤其擅长粤语、重庆话、北京话等 [3] - 即将上线视频通话功能,实现"能看又能说"的AI助理 [3] - 这是智谱首个开源的端到端多模态模型,延续了"发布即开源"的风格 [2][3] GLM-4-Plus基座模型能力 - GLM-4-Voice的推出标志着智谱在迈向AGI道路上的最新进展 [4] - 背后依托新的基座模型GLM-4-Plus,其语言文本能力与GPT-4o及405B参数的Llama3.1相当 [4] - 基于GLM-4-Plus,智谱在多模态领域取得阶段性成果,使GLM多模态模型家族更加完整 [4] 模型功能特点 - 情感表达和共鸣:支持高兴、悲伤、生气、害怕等细腻情感变化 [3] - 实时交互能力:可随时打断并调整语音输出的内容和风格 [3] - 语速调节:在同一轮对话中可要求加快或放慢语速 [3]
C.AI 被收购的宿命论与万恶的 Scaling Law | 42章经
42章经· 2024-08-18 13:52
C.AI被收购的核心逻辑 - 交易本质是以授权协议变相收购 旨在规避反垄断监管[1] - 30名底层模型开发人员加入Google 100余名产品团队保留在C.AI[1] - 公司结局由创始人Noam Shazeer的决策路径决定 其作为Transformer论文核心作者选择AGI赛道[1] 公司定位与战略失误 - 2022年12月明确"全栈AGI公司"定位 导致资源分散在模型研发与产品两端[1] - 2023年产品团队仅0.5人 模型团队数十人 反映资源错配[3] - 创始人提出"AGI公司+产品优先公司"并列定位 引发投资人质疑商业模式闭环[3] 行业竞争格局演变 - 2023年三大2C产品形态:ChatGPT类、Perplexity类搜索、C.AI类陪聊[1] - 开源模型崛起加速推理成本下降 自研模型必要性降低[3] - 底层模型战争结束 形成Google/Anthropic/OpenAI三足鼎立[4] 大厂战略布局对比 | 厂商 | 模型战略 | 关键动作 | |--------|--------------|---------------------------------| | Google | 全链路自研 | 收购C.AI团队 巩固Gemini生态[6] | | 微软 | 混合策略 | 收购Inflection对冲OpenAI风险[8] | | Meta | 开源主导 | 推动Llama生态 放弃商业变现[9] | 资本市场的决定性作用 - Scaling Law导致资源向头部集中 第二梯队难获融资[4] - 2021年SaaS公司PS达60-70倍 2023年暴跌至6-7倍 凸显融资时机重要性[10] - 出行行业"大黄蜂案例"显示资本站队决定竞争结局[4] 行业趋势判断 - 模型商品化成为共识 工程落地能力取代底层研发壁垒[4] - 端到端全栈模式被证伪 开源方案成为产品公司首选[3] - 大厂战略摇摆直接影响创业公司退出路径[10]