Z Potentials

搜索文档
喝点VC|a16z:Computer-using Agents代表着一次超越浏览器自动化和RPA的跃迁
Z Potentials· 2025-09-08 03:17
图片来源: a16z Z Highlights : a16z 是硅谷最具影响力的风险投资机构之一,它长期深耕人工智能、企业软件等多个领域,支持了包括 OpenAI 、 Databricks 在内的全球领先科技企业。 作为新一代技术与产业变革的推动者, a16z 不仅在资本层面提供支持,更通过研究、行业洞察与政策对话推动技术生态的成熟与落地。本篇文章由 a16z 团队发表于 2025 年 8 月 28 日,系统性地勾勒了 Agents 成为未来数字同事的趋势,并进一步展现了他们在生成式 AI 和未来工作模式探索中的前瞻视野。 自主型智能的临界点:从 RPA 到真正的 Agent 化转变 想象一下,你被要求为公司寻找新的办公空间 —— 这是个你宁愿避免的任务。现在再想象,你能把整个流程都交给一个 AI 来完成:从确定需求、调研地 点、安排看房、谈判租约,到处理保险和突发问题,全程无需你的参与或明确指令。 这样的自主型、任务导向的 "AI Agents" ,长期以来一直是这一领域 的终极目标。 然而,尽管已经投入了大量关注和努力,如今的 Agents 仍然未能实现这一愿景。目前市面上的 Agents 更接近于先进的 ...
Z Tech|9月9日线上对话Meta FAIR研究科学家:利用Confidence动态过滤,告别低效推理
Z Potentials· 2025-09-08 03:17
随着大型语言模型( LLMs )的发展,应用端对其推理效率和性能的要求不断提高,研究人员持续探索更有效的推理方法。因此 Deep Think with Confidence ( DeepConf )方法应运而生,它克服现有方法的不足,通过利用模型内部置信度信号,在推理过程中或生成后 动态过滤低质量推理轨迹 ,实 现 推理效率和性能的双重提升 。 本次访谈, Z Potentials 特邀 Meta FAIR 研究科学家、加州理工学院博士 Jiawei Zhao 于北京时间9月9日9:00am 直播 talk ,深度解析其团队颠覆性工 作 DeepConf ,揭开了 LLMs 推理中 " 置信度信号驱动低质轨迹动态过滤 " 的核心逻辑。 Yichao FU 和 Jiawei Zhao 为 DeepConf 的共同贡献者。 图片来源: https://jiaweizzhao.github.io/deepconf/ Jiawei Zhao 是 Meta FAIR ( Meta 的基础 AI 研究部门)研究科学家。拥有加州理工学院( Caltech )的博士学位。研究成果主要集中在机器学习领域,特 别是针对大型语言模 ...
速递|AI编程并购持续升温,英伟达收购800万美元融资Solver,OpenAI11亿美元买Statsig
Z Potentials· 2025-09-08 03:17
该公司此前已从 Radical Ventures 和 Horizons Ventures 等投资方处筹集了 800 万美元资金。 如下图所示, Solver 收购案只是推动科技并购复苏的众多 AI 交易之一。 周二, OpenAI 宣布以全股票交易方式斥资 11 亿美元收购产品测试初创公司 Statsig 。预计未来会有更多收购——既因为大型初创企业正在寻求技术和人才 来构建更好的应用和模型,也因上市软件公司亟需将更多 AI 技术融入产品以保持竞争力。 编程领域尤其受到潜在收购方的重点关注。 图片来源: Unsplash 我们正处于人工智能初创企业并购热潮之中。 最新动态是:据知情人士透露,英伟达上月收购了 Solver 。这家成立三年、原名 Laredo Labs 的初创公司开发了一款 AI 编程助手,可替用户完成软件开发 任务。 参考资料 https://www.theinformation.com/articles/nvidia-buys-coding-startup-ai-deal-blitz-grows?rc=rpuplc 编译: ChatGPT 例如,过去一年里, OpenAI 曾试图收购热门代码 ...
深度|OpenAI联创:GPT-5的突破在于智能开始触及真正的深度认知领域;理想状态应该是默认使用我们的自动选择,而非手动配置
Z Potentials· 2025-09-06 04:40
文章核心观点 - OpenAI联合创始人Greg Brockman分享GPT-5和GPT-OSS的技术突破及AGI战略路径 强调推理能力演进、算力核心地位和模型泛化能力 [3][4][6] - GPT-5实现深度认知突破 在数学证明、编程和科研领域达到接近人类专家的智能水平 标志AGI发展进入新阶段 [24][25][26] - 强化学习与在线学习范式成为技术核心 通过推理-训练循环和现实交互提升模型可靠性 推动智能体集群协同发展 [9][10][29] - 算力规模化是技术突破的根本驱动力 成本两年半降低1000倍 未来算力分配将成社会核心议题 [12][39][59] OpenAI推理能力演进 - GPT-4后期训练发现对话能力 但存在可靠性不足和错误答案问题 通过强化学习实践提升假设验证能力 [5][6] - 推理技术团队提出10种方案验证 最终由Jerry领导团队取得突破 依赖卓越基础设施和跨团队协同 [7] - 模型从离线预训练转向在线学习 通过token价值强化实现高质量数据生成 样本效率远超传统预训练 [8][9] - 人类策划任务产生高杠杆效应 10-100个任务可激发复杂行为 下一步将实现实时在线学习 [10] 算力规模化与超临界学习 - 算力是根本瓶颈 通过持续突破算力边界推进技术 扩展过程蕴含工程实践价值 [11][12] - 算力转化为智能势能 通过摊销效应降低单次使用成本 形成优美技术范式 [12] - IMO模型能力可迁移至IOI竞赛 核心团队仅三人 证明通用学习技术解决复杂问题的可迁移性 [14] - 生物学语言与人类语言在神经网络中同构 400亿参数模型已达GPT-2水平 需突破长上下文处理 [18][21][22] GPT-5技术特征与应用 - 智能达到深度认知领域 能写出媲美人类的数学证明 在编程任务中实现无需调整的完美执行 [23][24] - 作为科研合作伙伴加速研究 帮助物理学家快速推导洞见 改变传统科研范式 [25] - 在竞争性编程平台表现卓越 但真实编程环境更复杂 需连接智能与现实应用多样性 [26][27] - 通过多实例协同释放潜力 用户需培养模型直觉 成为智能体集群管理者而非单智能体 [28] 模型优化与安全架构 - 采用指令层级技术建立信任层级 类似SQL注入防护 通过沙盒隔离和多级防护保证安全性 [30] - Model Spec提供价值对齐框架 规范与行为差距持续缩小 社区反馈完善争议问题处理 [31] - 架构决策受限于运行时资源 混合专家模型优化内存占用和计算消耗 体现工程务实性 [43] - 本地与远程模型协同实现隐私架构 边缘计算保持基础功能 智能分配计算负载 [44] 技术普及与生态建设 - 降价策略激进 价格降低80%后用量激增 需求曲线陡峭 推理效率持续优化 [39] - 开源模型构建技术栈依存关系 有利于商业发展和国家战略 形成完整生态系统 [46] - 软件工程变革聚焦AI优化架构 创建自包含单元和模块组合 提升10倍效率 [47][48] - 算力分配成未来核心议题 物质需求满足后 算力访问权决定问题解决能力 [59] 发展路径与行业展望 - 研究领域存在多样性 各实验室持有独特视角 OpenAI专注阶跃式突破和范式转移 [52][53] - 多模态、语音、图像生成相互关联 但需聚焦连贯核心问题 硬件瓶颈领域进展缓慢 [55] - 模型连接现实应用蕴藏机遇 需深入理解行业和建立合作关系 而非单纯技术优化 [56] - 技术发展速度使2045年难以想象 人类或成多行星物种 算力需求持续飙升 [58][59]
速递|OpenAI推出AI招聘平台和人才认证,重新定义人岗匹配,挑战LinkedIn
Z Potentials· 2025-09-06 04:40
OpenAI新产品规划 - 公司正在开发AI驱动的招聘平台OpenAI Jobs Platform 预计2026年年中推出服务[2][3] - 该平台旨在利用AI技术实现企业需求与人才供给的精准匹配 重点服务中小企业和地方政府[3] - 产品将使公司与LinkedIn形成直接竞争 后者目前隶属微软旗下 而微软是OpenAI最大资金支持者[3] 公司战略扩张 - 公司计划超越核心产品ChatGPT 向多个新市场扩张 包括浏览器和社交媒体应用[3] - 应用部门CEO菲吉·西莫负责管理聊天机器人之外的多个应用项目[3] - 公司通过OpenAI Academy教育项目为不同AI熟练度人员提供认证 认证项目计划2025年底试点推出[4] 行业影响与合作 - LinkedIn过去一年持续注入AI功能提升求职匹配效率[4] - 与沃尔玛合作推进认证计划 目标2030年前为1000万美国人提供AI认证[5] - 该项目是响应白宫提升全民AI素养倡议的举措 公司CEO将参与白宫人工智能议题讨论[5] 行业趋势研判 - 科技企业高管担忧AI将颠覆传统工作岗位 Anthropic CEO预测2030年前AI可能淘汰50%初级白领职位[4] - 公司承认AI变革带来的风险 但强调通过帮助人们掌握AI技能并与企业对接来应对挑战[4]
速递|18个月估值破100亿美元!前Salesforce联席CEO的初创,Sierra再融3.5亿美元
Z Potentials· 2025-09-06 04:40
融资与估值 - 公司完成3.5亿美元融资轮 由Greenoaks Capital领投 估值达100亿美元 [3] - 融资总额累计达6.35亿美元 包括红杉资本和Benchmark领投的1.1亿美元及Greenoaks领投的1.75亿美元 [5] 公司背景与团队 - 公司由前Salesforce联席CEO Bret Taylor和谷歌资深员工Clay Bavor于2024年初共同创立 [4] - 联合创始人Taylor曾创立Quip(2016年被Salesforce以7.5亿美元收购) Bavor曾管理谷歌Gmail和Google Drive等产品 [5] - 公司运营18个月内已获数百家客户 包括SoFi、Ramp和Brex等企业 [4] 业务与技术 - 公司专注于为企业构建客户服务AI Agent [3] - 启动APX项目 为计算机科学专业毕业生提供智能体工程和产品管理轮岗机会 复刻谷歌早期人才培养模式 [6][7] 行业与市场影响 - AI Agent技术可能对劳动力需求产生冲击 企业正评估相关工具的影响力 [6] - 在严峻就业市场中 公司通过APX项目提供新毕业生直接参与产品发布的机会 [6][7]
Z Tech|9月9日线上对话Meta FAIR研究科学家:利用Confidence动态过滤,告别低效推理
Z Potentials· 2025-09-06 04:40
DeepConf方法技术特点 - 通过利用大型语言模型内部置信度信号动态过滤低质量推理轨迹 实现推理效率和性能双重提升 [1] - 无需额外模型训练或超参数调优 可无缝集成现有服务框架 [8] - 分为离线和在线两种操作模式 在线模式相比全并行推理最多减少84.7%生成Token [8][10] 性能表现数据 - 离线模式下DeepConf@512在GPT-OSS-120B模型上实现99.9%准确率 远超传统多数投票的97.0% [10] - 在线模式下在保持准确率提升的同时显著降低计算开销 [10] - 在包括AIME2025在内的多个推理基准测试中均表现优异 [10] 相关技术研究背景 - 研究覆盖低秩梯度/权重结构、张量分解、Quantized GaLore等内存优化方法 [6] - GaLore利用梯度低秩结构显著节省内存和计算资源 相关成果发表于ICML 2024 [12] - Mini-Sequence Transformers针对长序列训练进行中间内存优化 成果发表于NeurIPS 2024 [12] 研究人员背景 - Jiawei Zhao是Meta FAIR研究科学家 拥有加州理工学院博士学位 专注于LLM和深度学习优化方法 [5] - Yichao Fu是加州大学圣地亚哥分校博士生 聚焦LLM推理优化与系统优化 [8] - 研究人员曾开发"Efficient LLM Scheduling by Learning to Rank"发表于NeurIPS 2024 [8]
速递|Benchmark破例投资:AI搜索Exa获8500万美元B轮融资,估值7亿美元
Z Potentials· 2025-09-05 02:27
融资与估值 - 风险投资公司Benchmark牵头向Exa Labs投资8500万美元B轮融资 使公司估值达到7亿美元 是去年融资估值的10倍[2] - Benchmark通常在A轮阶段投资约1500万美元 但对Exa在B轮投资5000万美元 打破自身投资原则[4] 公司定位与产品 - Exa Labs致力于开发专为AI Agent设计的新型搜索引擎 帮助AI系统从网络筛选最相关数据[2] - 传统搜索为人类输入查询设计 而Exa从零开始为AI构建 专门服务自主进行搜索的大语言模型[3] - 采用按查询次数收费模式 与谷歌广告驱动模式不同 该模式能激励提供高质量结果而非诱导用户点击[3] 市场前景与战略 - Benchmark合伙人认为AI搜索领域将孕育价值数百亿美元的公司[4] - AI正重新构想整个技术栈 搜索作为所有软件的基础功能之一 传统网页索引模式供应商难以转型为最佳AI搜索引擎[5] - 公司计划扩建价值500万美元的图形处理器集群"赫菲斯托斯" 并扩大现有35名员工的办公空间[6] 客户与合作 - 客户包括Cursor开发商Anysphere、Databricks、亚马逊云科技和Vercel 被创始人称为"旧金山半壁江山"[3] 团队与人才 - 公司希望吸引志在打造世界最佳搜索技术、渴望在即将爆发领域抢占先机的人才加入[7] - 办公地点位于米慎区 已为员工配备午休舱 体现人工智能热潮的激烈程度[6]
速递| Atlassian豪掷6.1亿美元收购The Browser Company,Arc浏览器归巨头麾下
Z Potentials· 2025-09-05 02:27
收购交易核心信息 - Atlassian以6.1亿美元现金收购The Browser Company [2] - 交易预计于2026财年第二季度完成 [4] - 被收购公司将在Atlassian旗下保持独立运营 [3] 战略动机与产品定位 - 收购旨在开发AI驱动的知识工作浏览器 优化SaaS应用标签页管理 [2][3] - 目标为打造专为AI时代设计的工作浏览器 替代现有浏览导向产品 [2] - 浏览器公司将继续开发Dia浏览器项目 已停止旧款Arc浏览器开发 [3] 被收购方背景与估值 - 浏览器公司最近融资估值达5.5亿美元 去年获5000万美元投资 [5] - 累计融资总额1.28亿美元 投资者包括Pace Capital及多家科技公司高管 [5] - 收购将加速其人才招聘 功能发布和多平台开发 [4] 行业背景关联 - 交易宣布前一日 美国法院裁定谷歌无需被迫出售Chrome浏览器 [6]
Z Tech|对话Meta FAIR研究科学家:利用Confidence动态过滤,告别低效推理
Z Potentials· 2025-09-05 02:27
DeepConf方法核心创新 - 利用大型语言模型内部置信度信号动态过滤低质量推理轨迹 实现推理效率与性能双重提升 [1] - 无需额外模型训练或超参数调优 可无缝集成现有服务框架 [8] - 分为离线和在线两种操作模式 适应不同推理场景需求 [8] 技术实现机制 - 采用组置信度、底部10%组置信度及尾部置信度作为核心评估指标 [8] - 在推理过程中或生成后实施动态过滤机制 [1] - 在线模式下相比全并行推理最多减少84.7%生成Token [10] 性能表现数据 - 离线模式DeepConf@512在GPT-OSS-120B模型上达到99.9%准确率 显著超越传统多数投票97.0%的基准 [10] - 在AIME2025等多个推理基准测试中均表现优异 [10] - 在线模式下在减少生成Token的同时实现准确率提升 [10] 研究人员背景 - Jiawei Zhao为Meta FAIR研究科学家 拥有加州理工学院博士学位 专注大型语言模型优化方法 [5] - Yichao Fu为加州大学圣地亚哥分校博士生 聚焦LLM推理优化与系统优化 [8] - 团队在NeurIPS 2024、ICML 2024等顶级会议发表多项相关研究成果 [8][12] 相关技术研究 - GaLore方法利用梯度低秩结构显著节省内存和计算资源 发表于ICML 2024 [12] - Mini-Sequence Transformers针对长序列训练进行中间内存优化 发表于NeurIPS 2024 [12] - HeadInfer通过head-wise offloading实现内存高效推理 S²FT为模型微调策略 均发表于NeurIPS 2024 [12]