Workflow
量子位
icon
搜索文档
Google全链路赋能出海:3人团队调度千个智能体,可成独角兽|MEET2026
量子位· 2025-12-17 03:38
编辑部 整理自 凹非寺 量子位 | 公众号 QbitAI 未来应该是智能体之间自主协同,解决复杂问题、自动化工作流程、自主下达任务,创建一种全新的商业模式。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了 主流媒体的广泛关注与报道。 核心观点 初创企业在全球化过程中面临不同侧重点与挑战,Google的全链路生态在每一阶段都可以为初创企业助力,赋能高效出海。 Gemini 3是一次真正的突破,在多个权威榜单中排名第一,标志着从"辅助工具"向"自主智能体"的跨越。 谷歌主导推出了A2A协议(Agent-to-Agent Protocol,智能体间通信协议),旨在打通跨企业、跨系统的智能体协同。 商业模式正在从SaaS按月订阅转向Outcome-based按结果付费,这是智能体时代的底层逻辑变化。 3到10人的初创团队完全可能通过调度大量智能体成长为独角兽,但需要重视数据壁垒、行业深度集成以及法律合规。 初创出海的五个阶段与Google全链路解决方案 在演讲开篇, Dennis系统梳理了初创企业出海的五个阶段,以及谷歌在每个阶 ...
是个公司都在用AI Agent,但大家真的用明白了吗??| MEET2026圆桌论坛
量子位· 2025-12-17 01:04
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI "每个人每天使用最高频的三个APP中有两个是Agent时,才意味着AI Agent进入新发展阶段。" "一个好Agent的衡量指标,包括可控性、可解释性以及持续稳定执行任务的能力。" "多数Agent存在负毛利问题,完成任务的代价高于用户支付意愿,这对创业者来说是巨大挑战。" …… 透过这些观点,我们或可窥见Agent从技术概念走向规模应用的关键路径,以及产业先行者们在探索中所面临的思考与抉择。 本次圆桌环节由量子位智库首席分析师 刘萌媛 主持。在不改变原意的基础上,本文对内容进行了编辑整理。希望能够给你带来更多的启发与 思考。 联汇科技CEO兼首席科学家 赵天成 博士 小宿科技联合创始人兼CEO 杜知恒 先生 蚂蚁集团平台体验技术部负责人 徐达峰 先生 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下到场参会观众近1500人,线上直播观众350万+,获得 了主流媒体的广泛关注与报道。 话题要点 以下为圆桌对话全文: 在量子位MEET2026智能未来大会的 圆桌环节 ,三位来自产业一线的嘉宾围绕 AI Ag ...
反超Nano Banana!OpenAI旗舰图像生成模型上线
量子位· 2025-12-17 01:04
Jay 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI的红色预警,还在发力。 憋了大半年的图像生成模型—— GPT-Image-1.5 ,终于发布。 据官方表示,本次更新主要有四个亮点: 拯救这个被烤焦的饼。 感觉……这是要全面对标Nano Banana了啊。 目前的玩法也很类似。比如,将汽车颜色改为橙色。 更严谨的指令遵循; 精确编辑; 细节保留; 速度比以前快4倍。 根据奶昔架、芝士汉堡等元素,做一个复古风格的餐馆广告。 指令遵守和精确编辑方面,的确比之前强了不少。 而且今天就能用上了,GPT-Image-1.5将在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5推出。 拍摄一张20世纪70年代伦敦切尔西的场景照片,画面要逼真,所有景物清晰对焦,人群密集,还有一辆公交车,车身贴着「ImageGen 1.5」的广告,广告上印有OpenAI标志和「创造你的想象」的副标题。整体风格像业余摄影作品,iPhone快照画质…… OpenAI最强图像生成模型 被谷歌一轮正面「拷打」之后,OpenAI藏了大半年的GPT-Image-1.5,终于憋不住了。 这个旗舰级图像生成模型, ...
给Agent装上“海马体”!上海AILab开源MemVerse,定义多模态记忆新范式
量子位· 2025-12-16 11:52
MemVerse团队 投稿 量子位 | 公众号 QbitAI 一页纯文本的记忆是看不清世界的。 人与世界的交互天然是多模态的。一张产品设计图、一段用户操作录屏、一次包含语音和演示的线上会议,这些由图像、声音、视频构成的高 维业务信息,正成为驱动AI智能体创造价值的关键来源。 当前绝大多数"长期记忆"系统在架构上仍设计为纯文本的记忆库。但智能体的"记忆"不应该是扁平的文本日志,而是一个能够记录并关联 " 在 何时、看到了何物、讨论了何事 " 的多维体验图谱。这种 跨模态、跨时间 的记忆关联与融合能力,是智能体从被动工具进化为 智能助手 的 关键要素。 为了攻克这一挑战,上海人工智能实验室正式开源 MemVerse —首个面向智能体的通用多模态记忆框架。它突破性地将图像、音频、视频等 多模态信息与文本对齐到统一的语义空间进行记忆,并首创 "双通路"架构与"记忆蒸馏" 技术,让智能体首次拥有了可成长、可内化、秒级响 应的终身记忆能力。 从"文本堆叠"到"模态融通":MemVerse实现多模态记忆的范式跃迁 它从人类认知的经典记忆模型中汲取灵感,旨在构建一个包含中央协调器、双通路记忆与参数化蒸馏的完整闭环,实现从"被 ...
用企业级智能体落地,还有谁没踩这四种大坑?无问芯穹的系统性解法来了
量子位· 2025-12-16 11:52
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 最近和几家公司的技术负责人闲聊,兜兜转转都会聊到Agent话题。 给出的反馈几乎一致:智能体确实已经嵌进了不少工作流,但实际水平,最好也就是个实习生水平。 能做些自动化处理,偶尔还能让团队眼前一亮。但很多团队还是会下意识地把它排除在主要职责之外。 用是会用,说完全放心肯定谈不上 。 更别提把它当成自己团队可信赖的数字员工了。 与此同时,行业的关注重心已经发生转移,仅依靠模型性能领先,已无法支撑AI应用的企业级落地,工程红利和场景红利开始上桌。这堪称AI 行业在2025年最大的心态变化之一。 然而整体落地情况并不顺利,真正能在生产环境稳定运行、持续产生价值的智能体项目数量,比预期少得多。 几乎每一家企业都踩过好几个共性很强的坑。 最先暴露的是效果问题 。 智能体使用起来,模型选择、提示词、检索链路、工具调用逻辑……每一个环节都有可能成为影响效果的因素。 即使一开始表现不错,随着业务更新或数据变化,效果也常常出现衰减。 在这样的背景下,无问芯穹给出了版本答案: 无问芯穹智能体服务平台 。 这个平台旨在帮助企业应对智能体落地过程中会反复遇到的一系列问题,包括从0 ...
量子位编辑作者招聘
量子位· 2025-12-16 11:52
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 跟进AI基建层新进展,包括但不限于芯片、AI Infra、云计算领域新进展,核心玩家动态; 做前沿论文、开源社区、技术大会 (Hot Chips、NeurIPS、MLSys) 技术报告大众化解读; 参与核心采访,对话产业专家、技术大牛、撰写AI云落地案例。 任职要求: AI财经商业方向 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招: ...
QQ音乐你变了,竟能免费在AI PC上原创一首《大东北》
量子位· 2025-12-16 11:52
AI PC的兴起与核心价值 - AI PC正在从底层计算范式上改变个人电脑的功能和使用方式,使其从一个被动的计算终端进化为主动的、智能的生产力和创造力中心 [9][36] - AI PC打破了专业与业余的界限,将许多曾经需要专业工作站才能完成的任务,带入到轻薄的笔记本电脑中 [10][11] 具体应用场景与用户体验提升 - 在AI PC上,用户可以利用本地大模型进行免费AI作曲,例如在QQ音乐上,用户只需输入灵感并选择曲风,即可在几分钟内生成一首包含引子、主歌、副歌的完整原创歌曲 [1][2][3][4] - AI PC极大地降低了各类创意工作的门槛,例如视频剪辑、修图、制作PPT、撰写报告等,使非专业人士也能轻松完成高质量创作 [7][8][23] - 本地AI计算提供了更高的安全性和自由度,用户数据无需上传云端,保护了隐私,并允许用户随时随地、断网使用AI功能 [24][25] 英特尔酷睿Ultra处理器的技术革新 - 英特尔酷睿Ultra处理器进行了史无前例的架构革新,首次在消费级PC处理器中集成了独立的NPU硬件单元,形成了CPU+GPU+NPU的异构计算架构 [29][30][31] - 在新的计算架构中,CPU负责通用计算和任务调度,GPU(集成锐炫显卡)专注于图形渲染和高吞吐量并行计算,而NPU则专为高效、低功耗地处理持续性AI工作负载(如实时字幕、背景虚化)而设计,从而提升能效和电池续航 [33][38] - 英特尔发起了“AI PC加速计划”,已吸引超过350家独立软件开发商参与,共同打造了近500多款AI优化应用,支持超过900个AI模型 [34] 行业趋势与未来展望 - 2023年被视为AI PC的元年,英特尔酷睿Ultra系列将AI能力从云端拉回本地设备,解决了数据隐私、网络依赖和实时性等关键痛点 [40] - 未来的竞争将是整个AI生态的较量,包括硬件算力协同效率、软件应用丰富程度以及开发者社区活跃度 [41] - 按计划即将上市的下一代处理器Panther Lake将在算力上进一步提升,带来更多元、更智能的AI PC体验 [41] - 技术升级的最终目的是满足更细分、更多元的用户需求,酷睿Ultra是朝着该目标迈出的关键一步 [44]
50万个AI生成的应用,正在赚钱
量子位· 2025-12-16 09:05
西风 发自 凹非寺 量子位 | 公众号 QbitAI 用零手写代码、零成本、零部署压力的 "三无"AI生成应用 ,把Prompt换成真金白银的第一批"野生开发者"已经出现了。 而且这样的创作者还真不少,他们甚至已经造出了 50万个 商业应用,覆盖教育、商业、内容生产、企业服务等200多个细分领域, 累计服 务超1000万用户,撬动经济与效 率价值超50 亿元 。 这是我们在 2025秒哒 创造者大 会 上得到 的行业VibeCoding最新进展。 比 如海口市荣 堂古村景区运营团队,用AI打造出了" 荣堂古村数字博物馆 "。 这座古村始建于宋末元初,虽村民已整体搬迁,但凭借火山石民居、"龙塘七十二洞"溶洞群等独特风貌,仍吸引着每年超四万名游客到访。 针对游客常遇到的找不到72洞、不了解村史、无导览路线等问题,景区团队将老人手写的村史、历史沿革和风俗美食等资料进行了数字化整 理,用AI一键生成应用页面结构与信息框架。 这款应用随即快速上线并投入使用 (游客现场扫码即可获取全方位游览指引) ,改善了游客游览体验的同时,也带动了古村创收—— 在数字博物馆内容的带动下, 当地椰 壳风铃等手作年销量突破1000件,部分 ...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码
量子位· 2025-12-16 05:58
文章核心观点 - 一篇由社交媒体讨论引发的学术研究论文,挑战了计算机视觉领域的传统观念,即预训练视觉编码器的全局语义分类性能(如ImageNet-1K准确率)是驱动生成模型质量的关键因素[7][23] - 研究结论表明,视觉表征的空间结构信息(即图像局部区域或补丁tokens之间的相互关系)才是决定生成性能的主要驱动力,更好的全局语义信息并不等于更好的生成效果[23] - 基于此发现,研究团队对现有的表征对齐框架进行了简单改进,提出了仅需3行代码即可实现、能持续提升性能的iREPA方法[3][32] 研究背景与起源 - 该研究的灵感源于4个多月前,研究员谢赛宁与网友在社交媒体上关于自监督学习模型应用重点的一场辩论[2] - 辩论核心是:为稠密任务(如REPA、VLM)设计的模型,其性能应更依赖于捕捉图像局部细节信息的patch tokens,而非仅用于全局分类的[CLS]token[8] - 谢赛宁最初持反对意见,但被网友提供的论据(如SigLIPv2和PE-core在REPA任务上优于DINOv2的例子)说服,并最终促成了跨团队合作研究[13][17] 核心研究发现 - 通过大规模定量分析验证,覆盖了**27种不同的视觉编码器**(包括DINOv2、v3、Perceptual Encoders等)及**3种模型规模**(B、L、XL)[26] - 研究发现,**线性检测准确率仅约20%的视觉编码器,在生成任务上可以超过准确率>80%的编码器**,颠覆了“更大更强编码器带来更好生成效果”的传统观念[23] - 生成效果更好的表征,其**空间自相似性**指标更强,即图像内部不同区域token之间的关注关系更明确[25] - 研究甚至发现,像**SIFT、HOG这样的经典空间特征提取方法**,也能带来与现代大规模视觉编码器(如PE-G)相竞争的提升,进一步凸显了空间结构信息的基础重要性[28] 方法论与模型改进 - 研究基于对表征对齐(REPA)框架的分析,提出了改进版本**iREPA**[30] - iREPA的核心改进包括两点:1) 将REPA中标准的MLP投影层替换为一个简单的卷积层;2) 为外部表征引入一个空间规范化层[31] - 这些修改旨在**保留并强化输入表征中的空间结构信息**,从而显著提升性能[32] - iREPA的实现极为简洁,**仅需3行代码**即可添加到任何表示对齐方法中,并且在REPA、REPA-E、Meanflow及JiT等多种训练方案中都能实现持续更快的收敛[3][32]
AI终点不是算法,而是业务成果 | 云徙科技@MEET2026
量子位· 2025-12-16 05:58
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 大模型时代,基础模型卷到飞起,参数规模爆炸再爆炸,但谈到落地应用,产业端反馈出的问题依然明显: 企业的核心业务中的AI真实渗透率可能都不到1%。 在量子位MEET2026智能未来大会上,云徙科技执行总裁毛健如此坦言。 如何能让实验室里的前沿技术真正走向落地,更好地为企业创造价值? 毛健认为, 现在需要的不是"AI+",而是"×AI" 。 AI创业者更应该在增量中找市场、在专业里找空间、在业务中找场景、在结果中找收益 。 为了准确呈现毛健的完整思考,以下内容基于演讲实录进行整理编辑,希望能提供新的视角与洞察。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主 流媒体的广泛关注与报道。 核心观点梳理 时代会从"AI+"快速切换到"运营xAI", Agentic AI时代中,AI从工具将跃迁到业务主体。 对于企业来讲,核心的诉求不是买AI工具,而是需要能够直接对业务结果负责的AI运营智能体。 要让智能体走向自主运营有三步 。 第一步,面向"人+智能体+机器人" ...