Workflow
AI前线
icon
搜索文档
OpenAI 盲测新模型不如 Nano Banana Pro?曝 Altman 要暂停 Sora,死磕 ChatGPT
AI前线· 2025-12-11 07:28
OpenAI近期产品动态与战略调整 - 公司可能正在内部测试GPT-5.2,代号为“olive-oil-cake”,有传言其最新发布日期是当地时间周四 [2] - 公司已在Design Arena与LM Arena平台开启盲测新的图像生成模型,新模型名称包括“Chestnut”和“Hazelnut”,结果接近Nano Banana Pro [4] - 新图像模型据称具有与Nano Banana Pro类似的全球知识,能生成质量非常相似的名人自拍照,并能在图像中编写代码 [6] - 有分析认为,此次盲测通常是公司重大模型发布前1-3周的常规流程,新一代图像模型极有可能与传闻中的GPT-5.2同步推出 [10] 产品性能与市场反馈 - 流出的新图像模型生成图被部分网友评价为图像质量仍不如Nano Banana Pro,看起来塑料感很强,但比GPT Image 1好很多 [10] - 爆料博主认为新模型仍然基于4o版本,相比GPT-Image-1是一个巨大的飞跃,但目前还达不到Nano Banana Pro的水平 [10] - 根据a16z合伙人Olivia Moore的数据,Sora的首日留存率只有10%,30天留存率只有1%,远不如TikTok [11] 公司战略重心转移与内部动态 - 公司CEO Sam Altman近期发出“红色警戒”(code red)以应对谷歌的威胁,调整了公司优先任务:所有“旁支项目”包括Sora都要暂停,未来八周将精力集中在改进ChatGPT上 [10] - 此举被视为一次重大的战略纠偏,意味着公司从追求更大众化的产品影响力与坚持研究机构式的长期技术探索中做出了明确站队 [13] - 公司内部分裂为“产品派”与“研究派”:产品派主张优化现有功能,研究派押注通往AGI关键的“推理模型”但进展又慢又贵,前首席科学家Ilya Sutskever的离职标志着“纯粹研究导向”时代终结 [13] - 公司计划在本周推出GPT-5.2,管理层希望它能带来新的增长动力,尤其是在代码开发和企业用户方面,尽管有员工建议推迟发布以打磨模型 [13] - 公司计划在明年1月发布另一款具备更强图像生成能力、更快速及更好“人格表现”的模型,之后将结束“code red”状态 [13] - 公司发言人表示,大规模推动AI工具的应用与实现AGI价值普惠的理念之间并不存在冲突 [14] 管理层变动与业务目标 - 新任首席科学家Jakub Patchocki需面对在18个月内证明公司5000亿美元估值的压力 [14] - 公司挖来前Slack首席执行官Denise Dresser担任首席营收官,她将负责企业业务与客户成功领域的全球营收战略,帮助更多企业将人工智能投入日常运营 [14][15]
“人人都是程序员”的梦该醒了!AI 编程“大逃杀”:Cursor 或成创业公司唯一“幸存者”,“60 分开发者”撑起最后防线
AI前线· 2025-12-10 08:27
行业热度与市场表现 - “氛围编程”在2025年成为最热话题,但热度在爆红后仅六个月即开始明显“退潮”[3] - 全线主要产品的用户流量出现大幅下滑,其中Lovable流量从3500万降至不足2000万,几乎腰斩,Bolt.new下降27%,Vercel v0自5月以来下降64%[4] - 行业经历了资本驱动的“超高速增长期”,但热度迅速回落后,正在见证一场真正的价值回归[5] - 根据12周流量变化数据,除Base44依靠投放驱动保持高增长外,多数平台如Cursor、Replit、Bolt等流量在近期转为负增长[6] 主要参与者与商业模式分野 - Lovable起步于2023年末,以“描述你想要的,看着软件成真”为口号,第一年宣称年化收入突破1亿美元,构建项目超1000万个,并以18亿美元估值完成A轮融资,随后市场传闻估值飙至40亿美元[8] - 以Claude Code为代表的“异步Agent式氛围编程”,通过将代码“藏”在后台,营造“AI正在替你干活”的沉浸体验,奠定了“交托任务-后台执行”的协作范式[9] - 以GitHub Copilot和Cursor为代表的“人主导的严肃工程协同”路径,将AI作为嵌入现有工作流的编程助手,负责补全、重构等任务,节奏与决策权保留在工程师手中[10] - 面向专业开发者的工具更容易获得长期认可与付费订阅,而面向C端非开发者的产品面临需求刚性问题[10][12] 用户构成与资本逻辑 - Lovable宣称的3500万月活已逼近全球专业开发者总数上限(约4000-4700万),说明其峰值用户主要为产品经理、学生、创作者等“圈外人”[12] - 支撑这场全民实验的是数十亿美元的资本力量,资本正通过补贴算力搭建平台,让非开发者体验代码生成,但用户留存率极低,“100个里有99个会在觉得无聊时消失”[13] - 面向专业开发者的AI工具能提升效率,且开发者能为结果兜底,但当前“氛围编程”的估值故事同样难以支撑[14] 竞争格局与未来展望 - 面向专业开发者的市场非常依赖模型,被判断为“大厂的生意”,全球最终竞争者可能不超过5家,创业公司中仅有起步最早的Cursor可能有机会[15] - 国内投资热度同样经历骤热骤冷,上半年所有投资人都在关注“氛围编程”,但到当前时间点主流投资人已不再看此类项目[16] - 真正的难题在于Agent基础设施仍处早期阶段,AI编程过程像“抽盲盒”,缺乏稳定的调试环境、清晰的上下文和真正的可观测性,导致用户体验挫败[20][21] - 2025年爆发的“大众涌入”浪潮可能是一场顺序错误的科技狂欢,技术体系尚未成熟,行业却过早许下了超出能力的承诺[23] 价值回归与应用场景 - 面向大众消费者的“氛围编程”最终可能收缩成类似建站工具或无代码的小市场,真正具备长期价值的方向与专业用户、成熟模型及大厂基础设施绑定更深[24] - 一个潜在方向是“vibe working”,即用户将数据丢给AI直接获取结果,无需关心背后实现方式[25] - 在企业环境中,“氛围编程”大幅降低了开发门槛,过去需要“90分能力”才能开发生产级产品,现在“60分就能做出东西”[26] - 该技术适用于开发业务逻辑相对简单的应用,如100人使用的数据上报系统,但难以支撑高并发、业务复杂的超级应用[26] - 在美团,非技术员工在AI Coding帮助下已构建了超过3000个持续在使用的应用[27] - 行业流量放缓是必然结果,但早期噪音和尝鲜用户离场后,作品质量在提高,留下的是真正在特定场景中用其解决问题的人,尤其是企业内部被激发的新“开发者”[27]
模力工场 023 周 AI 应用榜:从旅行生活到 AI 基建,“Agent 时代拼图”再添新砖
AI前线· 2025-12-10 05:18
模力工场 新鲜事 模力工场新联展活动来啦!当 AI 普及率突破 35%,每 3 个中国人中就有 1 人使用生成式智 能,我们正共同站在一场技术驱动的变革起点。 2025 年 12 月 28 日,"AI 闪耀中国·吴晓波科技人文秀"将在厦门举办。作为年度 AI 生态的重要发布 场合,活动将系统揭晓本年度"AI 应用生态调研"成果,并聚集行业决策者、技术专家与优秀产品团 队,共同探讨 AI 落地与商业前景。 本次联合展台仅设 6 席 ,席位有限,采纳即止。如您希望与行业关键资源方建立连接,并推动产品 在优质场景中曝光,欢迎扫码联系运营,立即加入共创。 12 月 6 日,由模力工场与 TGO 鲲鹏会联合举办的 "Vibe Coding Sprint · AI 编程闪电黑客 松" 在阿里巴巴西溪园区激情开跑! 模力工场携手 TGO 鲲鹏会,发出了一份属于新一代 builder 的现场邀约:用 AI 写代码,用代码写公 司。活动以 3 小时极限 Vibe Coding 为核心,鼓励每位参与者围绕现场发布主题,打磨一个 Demo,在真实场景中跑通一条 AI 工作流链路。 这场高强度的编程冲刺,不仅是一次技术能力的试炼,更 ...
OpenAI、Anthropic、谷歌罕见同框:Agentic Al基金会成立,打响智能体开源标准战!
AI前线· 2025-12-10 05:18
AAIF基金会成立与核心架构 - Linux基金会正式宣布成立智能体AI基金会,定位为AI智能体相关开源项目的中立托管平台,全球几乎所有科技巨头均已签约成为成员 [2] - Anthropic、OpenAI与Block三家公司作为联合创始成员,贡献三大开源项目构成基金会启动初期的支柱 [2] - 成员名单包括亚马逊云科技、Anthropic、Block、Cloudflare、谷歌、微软、OpenAI、思科、IBM、甲骨文、Salesforce、SAP、Snowflake、Hugging Face等,将首次携手共同制定AI智能体的开放标准 [2] 三大核心开源项目与标准 - 基金会围绕三大开源项目构建:Anthropic的模型上下文协议、Block的goose项目,以及OpenAI的AGENTS.md规范,旨在协同实现AI智能体与外部工具的交互标准化 [3] - MCP协议由Anthropic开源,核心目标是通过标准化方式连接AI智能体与数据源,已部署超过1万台MCP服务器,主流产品如Claude、Cursor、微软Copilot、Gemini、VS Code及ChatGPT均已支持 [4] - AGENTS.md规范由OpenAI推出,旨在为AI编程智能体提供项目专属指令支持,已被超6万个开源项目采用,主流开发框架如Cursor、Devin、GitHub Copilot及Gemini CLI均已兼容 [5] - Block开源的AI智能体框架Goose,通过融合语言模型、可扩展工具及基于MCP协议的集成能力,为开发者提供结构化的工作流构建方案,目前每周已有数千名工程师使用 [5] 行业背景与标准化驱动力 - 企业对AI智能体的采纳率快速攀升,截至2025年年中,约65%的组织已启动智能体系统的试点或部署工作,近九成高管计划在2026年增加相关投入 [8] - 多智能体系统能显著提升业务表现,与传统流程相比,错误率最多可降低60%,执行效率提升40% [8] - 行业面临生态“碎片化”风险,各系统可能孤立运行、难以互联互通,AAIF基金会的核心使命在于通过推动开放标准来规避这一风险 [9] - 尽管开源模型成本更低,功能相近,但封闭模型仍然占据了95%的收入,导致每年在专有系统上的支出估计高达248亿美元 [12] 治理模式与未来展望 - AAIF采用开放治理模式,项目路线图由技术指导委员会制定,任何单一成员都无权单方面决定发展方向,资金投入不等于控制权 [6] - 衡量AAIF早期成功的关键指标是全球厂商的智能体产品是否开发并落地这些共享标准,以及标准能否持续迭代吸收新的行业反馈 [12] - 2026年可能迎来真正的企业自动化浪潮,包括多智能体工作流、学习型编排、验证框架以及确定性和非确定性系统的新融合 [12] - PARK技术栈正在迅速成为大规模AI部署的默认平台,这一技术栈包括PyTorch、AI、Ray和Kubernetes,被认为将定义未来的AI技术栈 [13] 对开发者与行业的潜在价值 - AAIF基金会的短期价值在于减少定制化连接器的开发时间,提升跨代码库的智能体行为可预测性,同时简化在高安全需求环境中的部署流程 [13] - 长远愿景是若MCP、AGENTS.md、Goose等工具成为行业标准基础设施,AI智能体领域或将从封闭平台模式转向开放兼容、自由组合的软件生态 [13] - 社区期待AAIF能制定一套类似聊天补全JSON API的社区共享标准,并配有公认的标准规范及相应的一致性测试套件 [13]
为什么你的 Agent 总是出故障?从算力基建到可信熔断的架构生死线 | 直播预告
AI前线· 2025-12-09 06:26
直播活动概览 - 直播主题为企业Agent如何实现“可信”,旨在拆解可信Agent的构建之道[2] - 直播时间为12月10日20:00-21:30[3] - 直播嘉宾来自值得买科技、商汤科技、明略科技三家公司的技术负责人[3][4] 核心讨论议题 - 探讨企业级Agent落地面临的挑战,包括长程推理带来的显存天价成本以及业务逻辑的“死循环”风险[2] - 讨论如何利用MCP协议解决接口调用中的“信任危机”、“幻觉”与“误解”问题,实现Agent从对话到行动的精准对齐[2][7] - 分析大模型基础设施如何攻克KV Cache显存危机,以及异构集群如何承载Agent的长程推理需求[4] - 探讨可信Agent架构设计,涉及知识图谱与Long Context记忆的对比,以及设计防止业务死循环的“熔断按钮”[4][7] 直播内容与价值 - 直播将集结值得买、商汤、明略三位技术专家,联袂复盘算力基建、熔断机制与MCP协议实战[7] - 直播福利为免费领取《AI Agent落地实践资料包》[7] - 资料包内容涵盖工程实践与场景应用,包括阿里云、钉钉、华为云、火山引擎等头部企业的可验证Agent架构与工程方法论[7] - 资料包深入金融、零售等行业的智能投研、门店分析、经营决策等场景,旨在实现业务提效[7] - 资料包覆盖从需求理解、任务规划、工具集成到部署监控、自动进化的完整Agent开发闭环[7] - 资料包包含多智能体协同框架、模块化RAG、端到端评估体系等内容,以构建高可靠、可进化的企业级AI Agent[7]
搅局者来了!智谱重磅开源AutoGLM,让“豆包手机”人人可造!官方:AI手机不该掌握在少数厂商手中
AI前线· 2025-12-09 06:26
AutoGLM模型开源发布 - 智谱于2023年4月开始研发能让AI像真人一样使用手机的技术,并在32个月后,于2025年4月将其核心AI Agent模型AutoGLM完整开源[2][3] - 开源内容包括:训练好的核心模型、手机操作能力框架与工具链、覆盖50多个高频中文App的可直接跑通的Demo、针对Android的适配层与示例工程、以及文档和快速上手指南[15] - 模型以MIT许可证开放,所有代码以Apache-2.0许可证托管在GitHub仓库中[10] AutoGLM的核心能力与技术 - AutoGLM具备手机操作能力,包括点击、滑动、输入、截图理解、流程恢复、噪声处理等,能稳定完成外卖点单、机票预订等长达数十步的复杂操作流程[5] - 模型已支持上百个主流APP[6] - 其能力基于三大核心技术突破:1) 创新的双层Agent结构,将行为拆分为负责思考的Planner和负责执行的Grounder,解决了“看得懂但点不准”的难题,使GPT-4o视觉模式的网页任务执行成功率从18%提升至36.4%[26][27];2) 自进化式的Curriculum RL强化学习框架,赋予模型错误恢复能力[29];3) 在包括上千台云端虚拟手机的大规模可控环境中训练,极大地扩展了Agent的准确性和泛化能力[9][30][31] 开源动机与行业愿景 - 智谱认为“AI手机”是大势所趋,但非一家公司能完成,也不应被极少数厂商垄断,开源旨在将AutoGLM打造成行业可共同拥有和打磨的公共底座[12][14] - 通过开源和私有化部署,企业和开发者可在自己的合规环境中完整掌控数据、日志和权限,解决AI手机面临的隐私问题[16][17] - 智谱希望分享其技术积累,将走过的路变成行业在Agent爆发时代的起跑线,自身定位为AI手机生态中开放、易集成的关键拼图,而非取代手机厂商[18][47] AI手机行业现状与前景 - 据IDC预计,2026年中国新一代AI手机出货量将达到1.47亿台,占总体市场的53%[36] - 赛迪顾问判断,2027年AI手机销量将跃升至1.86亿部,占比56.1%[36] - 2023年中国AI手机销售量为1100万部,占全球22%;2024年预计出货量超过3500万部,市场占有率约12%[41] - 目前AI手机实际体验仍处早期阶段,存在“宣传大于实际”的问题,跨App操作成功率受限于权限、界面变化等工程难题[42][43] 行业技术路线与竞争格局 - 行业技术路线主要分为两派:依赖App授权的“意图框架”和无需授权、依靠读屏与模拟操作的“视觉路线”[44] - 字节跳动的“豆包手机”尝试将GUI Agent做到系统级,其首批约3万台供内部测试,核心团队由多个硬件团队整合而来,目标是探索“大模型+超级App+硬件”的新形态[46] - 第三方AI在手机中大规模落地面临权限、数据、应用配合等挑战,手机厂商普遍倾向与可控性更强的大模型公司合作,如OPPO选择阶跃星辰,荣耀、三星采用智谱[46]
Scaling Law 仍然成立,企业搜广推怎么做才能少踩“坑”?
AI前线· 2025-12-09 06:26
作者 | AICon 全球人工智能开发与应用大会 策划 | 罗燕珊 编辑 | 宇琪 当大模型从通用技术探索深入产业场景,搜索、广告与推荐系统作为连接用户需求与业务价值的 核心链路,正迎来全链路智能重构。那么,生成式推荐真正落地后的关键挑战是什么?又应该如 何解决? 近日 InfoQ《极客有约》X AICon 直播栏目特别邀请了 京东内容推荐架构负责人颜林 担任主持 人,和 荣耀 AI 算法专家冯晓东、京东算法总监张泽华、中科大计算机学院副教授王皓 一 起,在 AICon 全球人工智能开发与应用大会 2025 北京站 即将召开之际,共同探讨生成式推 荐的落地洞察。 部分精彩观点如下: 完整直播回放可查看: https://www.infoq.cn/video/0ViWrdqyQwNvO7TdQpyD 以下内容基于直播速记整理,经 InfoQ 删减。 行业真正做到端到端的统一 pipeline 仍有较大差距,更多工作还是在 pipeline 的单点与大模型 结合。 搜广推场景中的 scaling law 依然成立,并且仍在快速上升阶段。 低价值场景用小模型覆盖,高价值场景用大模型争取额外收益。 不应拘泥于某项技术 ...
OpenAI 囤 DRAM 晶圆,内存价格炸了!32GB DDR5 一月狂涨 156%,厂商倒买、交货延期,商业遏制引市场崩盘?
AI前线· 2025-12-09 04:52
文章核心观点 - OpenAI在2025年10月1日与三星、SK海力士达成两笔前所未有的巨额、绝密DRAM原始晶圆采购协议,其突然性和规模引发全行业恐慌性囤货,导致DRAM供应链紧张和价格飙升[7][8][22] - 由于关税混乱、价格下跌预期和二级产能停滞等因素,DRAM市场在事件发生前已极度脆弱,安全库存被严重削减,缺乏缓冲机制[11][15][16] - OpenAI采购的是无法立即使用的原始晶圆,其行为被解读为不仅是为了保障自身供给,更是为了“抽干市场”,以延缓竞争对手在AI算力竞赛中的追赶速度[18][19][21] 市场现象与价格冲击 - 个人消费者案例显示,一套32GB的DDR5内存在三周内价格从原价飙升至330美元,涨幅达156%[3][4] - 业内渠道反馈内存极度短缺,有内存厂商向零售商“倒买”内存,整机公司收到的DRAM交付时间预估已排到2026年12月[4] - 研究机构TrendForce估计DRAM价格可能上涨8%到13%,而Counterpoint预测涨幅更大[5] 行业恐慌的触发与蔓延 - OpenAI的采购交易保密程度极高,连主要DRAM供应商彼此之间也未获知对方同时与OpenAI合作,这种“毫无预警”和“极度强势”的做法引发了行业管理层和采购团队的全面恐慌[7][8] - 恐慌情绪迅速蔓延至OpenAI的竞争对手、OEM厂商和云供应商,他们为了“自保”而争抢市场剩余库存,加剧了供应紧张[9] - 行业恐慌的核心问题包括:是否还存在未知交易、未来供应商是否会提前预警、以及若不立即抢购可能面临长期缺货[14] 市场脆弱性的背景原因 - **关税混乱**:2025年夏季美国与亚洲关税政策频繁变动,企业为规避“关税陷阱”主动减少了安全库存采购[15] - **价格下跌预期**:由于企业采购犹豫,DRAM价格在整个夏季持续下跌,导致无人愿意提前囤货,库存进一步减少[15] - **二级产能停滞**:三星、SK海力士等大厂因担心地缘政治风险,未将升级产线后替换的旧设备出售给低成本品牌,导致新旧产能均未有效增加,市场总产能被“卡死”[16] OpenAI交易的性质与战略意图 - OpenAI采购的是未切割、未封装的**原始晶圆**,而非成品内存条(如DDR5模组或HBM)[18] - 这些晶圆目前未被立即加工使用,很可能只是被囤积在仓库中[18] - 结合交易的绝密性、采购标的的非成品属性以及OpenAI在AI领域面临Anthropic、Meta、xAI、Google等对手激烈追赶的背景,其交易的主要目的之一被怀疑是人为制造稀缺,“抽干市场”以遏制竞争对手[19][20][21]
算力十年狂飙100000倍,他却每天担心破产!黄仁勋亲述:如何用“30天危机感”逆袭万亿AI市场
AI前线· 2025-12-08 07:18
英伟达最新技术发布:CUDA Toolkit 13.1 - 公司正式推出CUDA Toolkit 13.1,官方称这是自2006年推出CUDA平台以来“20年来最大、最全面的一次更新” [2] - 新版本的核心亮点是引入了全新的CUDA Tile编程模型,该模型允许开发者以数据块(tile)为单位编写算法,在比传统SIMT更高抽象层上构建GPU程序,底层细节由编译器与运行时管理 [4][7] - 新版本带来了多项重大变革,包括:1) 暴露绿色上下文(Green Context)的Runtime API,实现更灵活的GPU资源管理;2) 在数学库cuBLAS中增强了对双精度与单精度的仿真支持;3) 全面重写了编程指南并更新了工具链与库,显著提升平台稳定性与易用性 [7] 公司创始人的危机感与驱动力 - 创始人黄仁勋坦承,支撑其一路走下来的驱动力并非野心,而是长期笼罩的危机感,他每天醒来都感觉公司可能“距离破产,还剩30天”,这种紧迫感持续了三十多年 [6][8][82] - 这种持续的“不想失败”的紧绷感与危机感,被认为是公司得以不断突破的重要原因 [9][84] - 创始人回顾了公司最惊险的创业阶段,包括早期战略错误、濒临破产的现金流,以及押上公司未来的技术重构与一次性量产的豪赌 [1][8] 公司早期发展史与关键转折点 - 公司创立于1993年,最初目标是创造一种能解决传统计算机无法解决问题的新型计算架构,但当时相应的“杀手应用”并不存在,使命本身极具挑战 [66] - 早期通过说服日本世嘉公司,将街机3D游戏移植到PC以开启PC 3D游戏时代,并为其开发游戏主机芯片,以此获得启动资金 [67][68][69] - 公司第一代图形技术(NV1)在三个关键技术方向(曲面 vs 三角形、正向贴图 vs 逆向贴图、无Z-buffer)上全部选错,导致公司在竞争中处于劣势 [69][70] - 在资金即将耗尽、技术路线错误且与世嘉的合同可能无法交付的存亡之际,创始人前往日本,以极大的坦诚说服世嘉CEO将合同尾款500万美元改为对公司的投资,这笔投资拯救了公司 [72] - 公司上市后全面收缩战线,关闭错误方向,三位架构师基于从Silicon Graphics教科书学来的理念,重新发明3D图形技术,将百万美元工作站性能压缩进PC显卡,为电子游戏时代奠定技术基座 [8][73][74] - 在研发RIVA 128时,公司现金流极度紧张,为了一次成功,用仅剩的约50万美元现金购买了已倒闭公司的模拟器,以便在芯片流片前完成所有软件调试 [78] - 随后,公司说服当时规模仍小的台积电,在没有试产的情况下直接风险量产新品,一次失败就会让公司消失,最终成功并使其成为当时增长最快的科技公司之一 [8][79] 对人工智能(AI)发展的观点 - 认为过去两年里,AI技术的能力提升了100倍 [16] - 指出AI的发展将是渐进的,而非瞬间到达某个“事件视界” [13][15] - 认为最佳情景是AI融入我们所做的一切,让一切更高效,但同时网络安全等挑战将持续存在 [20] - 预测未来两三年后,世界上90%的知识很可能由AI生成 [35] - 相信未来5-10年有三大趋势:1) AI会大幅缩小技术鸿沟,因其是“最容易使用的技术”,例如ChatGPT几乎一夜之间就有十亿用户;2) 每个国家都将拥有优秀的AI,即便是“过去版本的AI”也依然惊人;3) AI的能耗会大幅下降,让更多国家享受红利 [50][51] - 强调加速计算使AI性能与能效大幅提升,过去十年将计算性能提升了100,000倍,使同样任务所需的能源减少了100,000倍,未来能耗将继续下降 [52] AI对就业与社会的影响 - 以放射科为例,指出AI并未取代放射科医生,反而因其能更高效处理影像而让医院雇佣了更多放射科医生,关键在于区分工作的“目的”(诊断疾病)与“任务”(阅读影像) [41][42] - 认为AI不会直接导致普遍失业,人的工作目的通常不变,变的是完成任务的方式,AI将取代部分以执行为核心的任务,但同时会创造大量前所未有的新工作 [44][45][46] - 提出工作的价值在于必须有“超越任务”的意义,人们需要寻找工作中更有意义的部分 [47] - 对“全民基本收入(UBI)”的看法是,“资源极大丰富”与“人人需要补贴”这两种极端情况不会同时发生,未来富裕更可能意味着“资源极大丰富” [48][49] 对AI安全与意识的看法 - 认为当前AI的力量大部分被导向了安全性,例如减少幻觉、提高答案的真实性,类似于汽车中ABS等技术让驾驶更安全 [16][17] - 在网络安全方面,指出存在一个由专家构成的共同体,进行协作、分享最佳实践,共同应对威胁,这种合作已持续约15年 [20][22] - 不相信AI会获得“意识”或“感知力”,认为意识是对自我存在的认知和情感体验的集合,而AI是由知识和智能定义的 [27][28] - 认为即便AI能完美模仿人类,也只是“模仿的版本”,而非真正的意识 [33] - 对于AI可能带来的威胁,认为防御性AI会保护人类,其逻辑类似于网络安全,即用AI来应对AI [26] GPU、深度学习与公司市场地位的奠定 - 公司从成立之初就研究并行计算,GPU本质上是图像生成超级计算机,为全球消费者提供了最大规模的超级计算平台 [58] - 2012年,Geoff Hinton实验室的AlexNet在图像识别上取得突破,其使用的硬件是两块英伟达GPU,这被视为现代AI的“大爆炸时刻” [57][59] - 公司意识到深度学习是一个“通用函数逼近器”,只要存在输入和输出,AI就能学会,其强大的前提是模型能扩大规模并能进行无监督学习 [60] - 2016年,公司研发了第一台DGX-1超级计算机,使用8个GPU,售价30万美元,研发成本达几十亿美元,最初无人问津,直到埃隆·马斯克为其初创的非营利机构OpenAI购买 [61][62][63] - 技术快速迭代,9年后,提供相同1 PetaFLOPS算力的DGX Spark体积大幅缩小,价格从30万美元降至约4000美元 [65][66]
谷歌突砍Gemini免费版炸锅,数据养模遭背刺?GPT-5.2突袭Gemini 3,Demis Hassabis:谷歌须占最强位
AI前线· 2025-12-08 07:18
谷歌收紧Gemini API免费政策 - 谷歌大幅收紧Gemini API免费层级的限制,Pro系列已取消,Flash系列每日请求次数从250次降至仅20次,对小型项目开发者造成打击[2] - 谷歌已从其“批量API速率限制”列表中删除了Gemini免费API项,标志着免费API的彻底结束[3] - 此前,谷歌曾推出极具吸引力的免费套餐,例如Gemini 1.5 Flash每天提供高达15亿个免费Token,包括每分钟15次请求、每分钟100万个Token以及每天1500次请求的权限[4] 开发者反应与谷歌策略转变 - 政策变动未提前告知,导致依赖该服务的自动化脚本和实验性项目突然停摆,引发开发者不满[5] - 开发者认为谷歌在通过免费政策收集足够数据并取得领先优势后,正转变策略以推进盈利,开始进行付费转化[5] 大模型竞争格局与性能对比 - 竞争激烈,OpenAI计划将GPT-5.2的发布时间从12月底提前至12月9日,以回应谷歌Gemini 3[6] - 网传基准测试数据显示,GPT-5.2在多项评测中领先于Gemini 3 Pro,例如在Humanity‘s Last Exam(学术推理)上得分67.4%,而Gemini 3 Pro为37.5%[7] - 谷歌Gemini 3 Flash已登陆LM Arena,被视为对标GPT-5.2的产品[7] - 截至2025年底,用户在桌面和移动网页端使用Gemini的平均停留时长达到约7.2分钟,首次超过ChatGPT的约6分钟[6] 谷歌对Gemini 3的评价与未来方向 - 谷歌对Gemini 3的个性、风格和能力表示满意,认为其实现了阶跃式的智能提升,尤其在简洁回答和合理反驳方面[11] - Gemini 3在游戏制作和前端/网站开发方面展现出强大能力,能够理解高层次指令并生成细致输出[12] - 谷歌未来的三个主要发力方向是:模态融合、世界模型和智能体系统[19][20] - 在模态融合方面,谷歌正推进多模态理解与生成,特别是视频处理能力,并开发如Gemini Live的实时交互功能[19] - 在世界模型方面,谷歌正在开发如Genie 3的交互式视频模型,可生成具有一分钟连贯性的模拟世界[20] - 在智能体系统方面,谷歌愿景是打造“通用助手”,并预计未来一年在可靠性上会有重大进展,使其能够完成完整任务[20][21] 谷歌的竞争决心与资源投入 - 谷歌DeepMind联合创始人兼CEO Demis Hassabis表达了与OpenAI竞争到底的决心,强调必须处于最强位置[10] - 公司持续需要更多算力以支持广泛研究,并主张将Scaling Law(规模定律)推到极限[13][14] - Hassabis认为,实现AGI可能需要五到十年,且除了规模化,可能还需要一两次类似Transformer级别的重大突破[14] 行业竞争态势与人才争夺 - 全球AI大模型竞争白热化,Hassabis认为美国与西方在算法创新上仍领先,但中国的领先优势可能只剩“几个月”而非“几年”[22] - 在AI人才争夺上,谷歌寻找“使命驱动”的人才,并凭借其全栈能力、顶尖研究、工程技术和基础设施吸引顶尖科学家与工程师[16]