Workflow
Z Potentials
icon
搜索文档
Z Event|本周日ZP团队现场对话明星AI硬件公司,嘉宾完整名单揭晓,我们未来与AI共生
Z Potentials· 2025-11-22 03:21
活动概述 - 活动名称为虎嗅FM创新节,主题涉及商业、技术和人的价值重构 [4] - 活动于11月22日至11月23日在北京798艺术区751园区的79罐、第一车间和黑魔方场地举行 [4] - 预计现场观众规模超过5000人,并有超过200位KOL和虎嗅作者参与 [4] 核心议题 - 圆桌对话议题为“记录的意义:AI从捕捉瞬间到重塑体验”,探讨AI技术在记录和体验方面的应用与发展 [1] - 活动强调商业祛魅和技术破界,关注个体通过拒绝旧我以实现自我重构的价值 [4] 参与方与形式 - 合作单位包括Z Potentials、Z Lives和IRN TO AI等机构 [1] - 活动环节包括“ZP Hour”圆桌对话,主持人和嘉宾来自Z Potentials主理人、心流资本合伙人及前Kimi产品经理等背景 [1] - 提供限量免费赠票,可通过虎嗅FM创新节小程序使用兑换码“ZP1123”进行兑换 [3]
深度|解码具身智能下半场的价值标尺,中国需要Figure吗?
Z Potentials· 2025-11-22 03:21
产业资本投资趋势转变 - 产业资本(如汽车、高端制造)的投资重点从科技风投和平台巨头转向"软硬一体、深度协同"的闭环模式[3] - 汽车巨头吉利资本对星动纪元的投资是继宇树后在中国具身智能领域的再次出手,也是全球范围内该赛道的最大单笔投资[2] - Figure在2025年9月获得宝马等产业方加持,以390亿美元估值完成超10亿美元C轮融资,成为全球估值最高的具身智能公司[3] 软硬一体模式的优势 - 产业应用需要系统性的可靠性、一致性与成本效益,而软硬一体模式能实现极致的性能协同和加速迭代的闭环飞轮[5] - 核心部件全自研能构建真正的成本优势,摆脱供应链掣肘,为大规模部署奠定基础[6] - 单纯的"大脑"或"身体"公司在成为通用生产力时将面临被"一体化"范式整合或边缘化的挑战[6] Figure范式分析 - Figure构建了"技术-资本-场景"的铁三角模式,技术路径以Helix模型+Figure 03本体的软硬一体为核心[7] - 资本结构形成"科技巨头+产业资本+专业资本"的三驾马车矩阵[7] - 场景落地与宝马、Brookfield等行业龙头深度绑定,获得汽车制造和商业运营等高标准应用场景[8] 星动纪元与Figure的趋同性 - 核心技术架构相似,星动纪元ERA-42模型采用分频VLA和HiRT快慢分层架构,与Figure的Helix模型双系统架构原理相通[11][13] - 硬件自研率超过95%,在电机、谐波减速器、控制器、高精度五指灵巧手等核心部件实现全面自研[14] - 资本生态构建"科技巨头+产业资本+国家力量"组合拳,与阿里巴巴、海尔、联想及汽车巨头等形成合作[15] 星动纪元的商业化进展 - 公司已实现产品批量交付,2025年积累订单额超5亿元,与吉利、雷诺、顺丰、TCL、海尔等企业深度合作[20] - 全球市值TOP10的科技巨头中9家已成为客户,海外市场收入占比超过50%[22] - 在物流场景中,全尺寸双足人形机器人的分拣和供包效率达到人效的70%,物流最大订单近5千万元[22] 行业价值重估趋势 - 行业竞争焦点从"Demo King"转向"Deployment King",商业合同与真实场景部署数量成为衡量价值的关键标尺[26] - 与Figure 390亿美元估值相比,星动纪元在技术范式和资本生态上呈现高度趋同性,当前估值存在低估可能[26] - 2025-2026年具身智能行业将迎来以规模化部署测试为标志的价值重估阶段[26]
Z Event|本周日ZP团队现场对话明星AI硬件公司,嘉宾完整名单揭晓,我们未来与AI共生
Z Potentials· 2025-11-21 03:15
活动基本信息 - 活动名称为虎嗅FM创新节 主题为"新节" 活动时间为11月22日至11月23日 [4] - 活动地点位于北京798·751园区的79罐 第一车间和黑魔方三个场地 [4] - 预计现场观众规模超过5000人 参与KOL和虎嗅作者超过200位 [4] 圆桌对话安排 - 11月23日11:10-11:50举行圆桌对话 主题为"记录的意义—AI从捕捉瞬间到重塑体验" [1] - 主持人包括Seki Yuca和Sarea 合作单位包括Z Potentials Z Lives和IRN TO AI [1] - 圆桌嘉宾包括Z Potentials主理人 ZP Fellow 心流资本合伙人以及前Kimi产品经理 [1] 活动主题与理念 - 活动核心理念为"商业在祛魅 技术在破界 而人的价值从来不是被定义" [4] - 强调与"保持beta的人"相遇 通过AI技术"撕碎过去的标签"和"重构自我" [4] - 活动设有"AI记录·AI陪伴"环节 关注AI技术如何从捕捉瞬间发展到重塑体验 [1] 参与方式 - 可通过"虎嗅FM创新节"小程序 输入兑换码"ZP1123"获得限量免费赠票 [3]
速递 | 打破Instagram与Snapchat增长纪录:Agnes揭示AI时代真正的增长来自未被服务的99.5%
Z Potentials· 2025-11-21 03:15
公司业绩与增长表现 - 公司Agnes AI在PC端上线后2个月内实现注册用户新增300万,日活跃用户突破20万 [3] - 其增长速度打破了Instagram和 Snapchat的历史纪录,并成为东南亚、拉美、中东等新兴市场最热门的消费级AI应用 [4] - 公司展现出高用户留存率,第4周留存率为40%,第8周留存率仍高达30% [4] - 用户获取成本极低,仅为0.2美元,公司估值已超过1亿美元 [4] 行业洞察与市场定位 - 尽管AI热度高,但全球每日真正使用AI的用户约5亿至6亿,仅占全球60亿网民的约10%,其中真实订阅用户不足5%,即仅占全民网民的0.5% [7] - 当前绝大多数AI应用产品围绕全球前0.5%的“高认知、任务型、愿付费”用户设计,聚焦于办公效率、研究、生产力等狭窄赛道 [7] - 公司定位服务于全球99.5%的“长尾用户”,这些用户可能没有PC或iOS设备,主要使用安卓,对AI功能使用浅甚至未使用付费功能 [7] - AI真正的增长机会在于满足99.5%普通人的未被满足需求,而非争夺前0.5%的用户 [8] 产品战略与功能特点 - 公司选择打造AI原生的“全民AI”,不同于传统AI应用聚焦生产力工具,其目标是让AI融入更广泛的生活与工作场景 [9] - 核心功能覆盖AI搜索、深度研究、广度研究、图片视频生成、PPT与表格生成等主流生产力需求 [9] - 通过底层工程优化响应速度、输出质量与成本控制,并构建一体化工作流模式建立竞争优势 [9] - 向所有用户开放高级功能体验并提供相当免费额度,极大降低用户使用门槛 [12] - 积极探索AI在社交、娱乐等多元场景的应用,认为社交是提升使用频次和时长的有效途径,并可能重塑人机交互方式 [13][14] 技术架构与研发实力 - 团队核心成员来自麻省理工、斯坦福、加州大学伯克利分校、德克萨斯大学奥斯汀分校、新加坡国立大学、南洋理工大学等世界一流院校 [15] - 为支撑“AI普惠”愿景,公司尽量不依赖昂贵的外部SOTA API,而是自研高性能模型和多Agent架构 [15] - 团队在模型训练、多智能体协作、Agentic Office System以及AIGC生成优化等领域成果丰硕,有多篇论文被国际顶级会议录取 [16] - 自主研发的7B参数SOTA模型AgnesR1已商用,多个参数规模在7B至30B的模型也已部署应用,更大规模模型在积极研发中 [16] - 50%的流量路由到自研模型,用于任务编排、研究调研、PPT生成、图片和视频生成等大部分任务,在推理速度、输出质量和token成本效率上表现优异 [18] - 为提升东南亚及拉美用户的本地化体验,持续训练区域大语言模型以加强对当地口语、俚语及文化环境的理解与生成能力 [18]
速递|从芯片到机架:OpenAI与富士康合作,深入掌控AI硬件供应链
Z Potentials· 2025-11-21 03:15
合作核心内容 - OpenAI与鸿海精密工业(富士康)合作设计生产数据中心硬件,以满足人工智能系统激增的基础设施需求[2] - 合作内容包括共同设计开发数据中心服务器机架,并努力确保此类机架能在美国本土实现规模化生产[3] - 富士康还计划为美国数据中心设施生产线缆、电力系统及其他关键设备,但协议不包含具体采购承诺[4] OpenAI的战略动向 - 过去数月里,OpenAI已与英伟达、超微半导体等云计算服务商及芯片制造商达成多笔数十亿美元协议,大幅扩张其数据中心规模[6] - 公司正采取行动以加强对AI供应链的控制,包括10月与博通公司达成的芯片及零部件采购协议[6] - OpenAI今年大部分时间在与甲骨文公司和软银集团合作,计划未来几年内向美国数据中心及AI基础设施领域投入5000亿美元[6] - OpenAI首席执行官已表示公司承诺投入1.4万亿美元用于AI基础设施[8] 富士康的战略意图 - 与OpenAI的合作突显了富士康长期意图——扩大在人工智能生态系统中的角色,以减少对为苹果公司组装iPhone的依赖[6] - 此次直接结盟表明富士康正积极协助客户将定制化设计整合到数据中心中[6] - 作为星际之门项目的合作伙伴,富士康已在扩大美国的AI服务器生产,这既是行政管理部门的关键要求,也能降低关税风险[7] - 富士康公司另宣布与Intrinsic成立合资企业,共同探索AI数据中心业务[9]
深度|“新手简单,高手可控”,这款短剧Al Agent,让创作不再妥协
Z Potentials· 2025-11-21 03:15
产品核心特点与定位 - 产品为短剧生成Agent,旨在解决AI生成精品短剧的高门槛痛点,将2-3分钟成片的制作时间从3-5天大幅缩短,并减少对多种AI工具和创作者深厚功底的依赖 [1] - 产品通过上传小说、剧本或创意,由Agent完成超过90%的工作流程,包括创作故事、拆分脚本、创立人物、设置场景、绘制分镜、生成视频、生成对白、多语言配音、对齐口型、生成音乐和快速剪辑 [1] - 产品未采用主流的一站式全自动AI生成模式,而是设置了“角色库”、“分镜板”、“剪辑板”三个关键界面,将“挑剔权”交还给创作者,允许通过prompt调整细节,实现“新手简单,高手可控” [1][5] - 产品设计理念是AI辅助人而非取代人,让AI处理重复性工作,人专注于审美和判断,以释放创意 [7][10] 公司发展历程与市场表现 - 公司创立不到一年半,从文生漫画工具起步,后打造了海外漫剧APP,在2025年上半年获得奇绩、正轩、后浪、云沐等机构投资后开始发力短剧漫剧AI Agent [2] - 在零投放的情况下,通过AI漫画工具和漫剧APP已收获超过20万注册用户,并在5个月内迭代两个版本,获得20万活跃用户 [2][3] - 短剧Agent产品2.0版已完成内测,计划于12月1日上线,海外版已开启Waitlist,国内版将在完成大模型备案后上线 [2][20] 行业背景与市场机遇 - 短剧作为热门内容形态,对AI而言是复杂场景,大模型难以一次性处理长达2分钟的稳定输出,例如SORA2仅能生成10-15秒短片,扩展至2分钟*100集体量面临多次抽卡和人工拼接问题 [6] - 美国短剧市场2025年行业增速为50%,日本短剧市场规模为美国的1/9,是第二大市场,增速超过85%,预计2025年日本短剧市场规模达4.8亿美元,同比增长85%,占全球市场份额约15% [10] - 漫剧市场增长迅猛,抖音漫剧单日广告消耗已突破1000万人民币,相比24年四季度2000万的充值收入呈现超100倍增长,预计2026年海外漫剧将迎来爆发机会 [10] 团队背景与产品愿景 - 创始团队非典型,CEO刘耕为北京大学哲学系美学博士,曾任武汉大学哲学学院副教授,后任职字节跳动,其美学背景有助于系统化拆解艺术作品并教AI判断和生成好作品 [16][17] - CTO张国栋为北京大学计算机系研究生,前阿里巴巴员工,大学期间展现领导力,吸引技术高手构成公司早期技术骨干 [18] - 公司愿景是打造下一代以虚构故事为主的互娱平台,让每个创作者成为IP工厂,漫剧是打造IP的起点,未来可能拓展至游戏等互动形态 [12][14] - 团队追求“效果挑剔级”,在获得第一笔融资后,用4个月开发出从分镜到成片的Agent,又用3个月完成从创意到成片的复杂Agent,在确定达到“挑剔级”效果后才计划大规模推广 [20]
Z Tech | LMSYS 团队发布大规模  MoE 强化学习框架 Miles,不积跬步无以至千里
Z Potentials· 2025-11-20 04:12
文章核心观点 - LMSYS团队正式推出Miles,这是一个专为企业级大规模MoE训练及生产环境工作负载设计的强化学习框架[1] - Miles从轻量级框架slime分叉而来,在继承其轻量级与高可定制性基础上,针对新一代硬件(如GB300)与大规模MoE进行了深度优化[1] - 该框架引入了Infrastructure-level的True On-Policy、投机训练以及更极致的显存管理机制,旨在为追求高可靠性与大规模部署的团队提供流畅且可控的RL训练体验[1] 从slime出发的技术传承 - Miles完整继承了slime框架的轻量与模块化设计原则,已成为众多模型科学家探索算法的首选工具[3] - 采用True On-Policy策略,结合Flash Attention 3和DeepGEMM,实现了训练与推理的严格一致性[3] - 引入MTP Online Training的投机采样,在训练过程中对Draft Model进行在线SFT,解决了分布偏移问题[3] - 实施极致的显存优化,包括NCCL显存余量控制、部分Offloading及Host峰值内存节省,大幅减少大规模MoE训练中的OOM风险[3] 生产级核心技术突破 - 通过kernel层面优化实现True On-Policy,训练与推理之间的mismatch被精确地降至零[5] - 利用Flash Attention 3、DeepGEMM以及Batch invariant kernels,结合torch compile技术,确保结果的位级一致性[5] - 对SGLang和Megatron的全栈优化提供原生支持,紧跟推理与训练框架的快速迭代[6] - 算法、数据、采样与评估四大组件完全解耦,研究人员仅需极少的代码修改即可插入新的Agent类型或奖励函数[6] 大规模MoE显存优化 - 创新性地在RL过程中对Draft Model进行在线SFT,相比冻结MTP基线实现了25%以上的Rollout加速[9] - 引入传播机制以规避良性OOM导致的错误,实现显存余量机制以修复NCCL导致的OOM[10] - 修复FSDP中的额外显存占用问题,支持基于Move的部分Offloading以及Host端峰值内存节省策略[10] - 支持带Sequence Packing和Context Parallel的MTP,处理Loss Mask的边缘情况,实现LM Head/Embedding的梯度隔离[11] 未来路线图与社区愿景 - 未来开发路线图包括增强FSDP后端以提升大规模分布式训练的稳定性[14] - 计划允许Rollout子系统脱离框架独立部署,适应更灵活的集群调度[14] - 将新增更多监控指标、Post-hoc分析器及增强型Profiler等调试工具集[14] - 扩展对Multi-modal模型的支持,兼容SGLang Spec v2以获得更高性能,推进EAGLE3等更先进的投机训练技术[18]
速递|星动纪元获近10亿元A+轮融资!吉利资本领投,总订单额破5亿
Z Potentials· 2025-11-20 04:12
融资与战略合作 - 2025年11月20日完成近10亿元A+轮融资,由吉利资本领投,北汽产投战略投资,北京市人工智能产业投资基金及北京机器人产业发展投资基金联合注资 [2] - 融资将用于支持端到端VLA具身大模型ERA-42的技术迭代及落地应用,吉利资本和北汽产投的加入为产业应用打开战略协同发展空间 [2] - 公司坚持"具身大脑"与"人形本体"软硬一体全栈自研,致力于打造通用大脑及通用机器人 [2] 商业化进展与市场布局 - 总订单额突破5亿元,物流行业最大单笔订单金额近5千万元 [3][5] - 形成"国内深耕+海外拓展"的业务格局,海外业务收入占比达50% [3][5] - 全球TOP10市值科技巨头中有9家是公司客户,并与吉利、雷诺、顺丰、TCL、海尔、联想等达成深度合作 [5] 技术实力与产品创新 - 具身大脑ERA-42是中国唯一、全球四分之一能实现全尺寸人形机器人全身及五指灵巧手精准控制的系统 [8] - 2024年12月发布全球首个融合世界模型的VLA算法框架VPP,将可用数据扩展至海量互联网视频数据 [8] - 硬件自研比例超过95%,全栈自研关节模组、灵巧手、电机、减速器等核心部件 [12] 产品线与应用场景 - 产品线覆盖科研、工业、服务领域,可按月迭代,已推出星动XHAND 1、星动XHAND 1 Lite、星动Q5、星动L7等多款产品 [13][17] - 全尺寸双足人形机器人星动L7是国内首个实现"大运动+巧操作"的机器人,曾在世界人形机器人运动大会创造跳远世界纪录 [15] - 轮式服务机器人星动Q5已在海尔、卡萨帝、联想集团、世纪金源等企业及活动中提供导览讲解、门店引流等服务 [15] 行业影响与生态建设 - 公司灵巧手成为全球顶尖具身实验室产出论文的标配,在2025年CoRL会议上多篇基于该灵巧手的学术成果被收录 [15] - 灵巧手可操控100种工具,供应多家头部人形机器人厂商,推动机器人末端执行器向五指灵巧手形态进化 [15] - 公司构建了"模型-本体-场景数据"的物理世界AI飞轮,形成场景越丰富、模型越智能的正向循环 [6][9][21]
独家|数创弧光连融两轮估值数亿,解码大模型时代的“数据破壁者”
Z Potentials· 2025-11-20 04:12
公司融资与定位 - 数创弧光(DataArc)于2025年1月成立,孵化自粤港澳大湾区数字经济研究院(IDEA研究院),近期连续完成种子轮及种子+轮融资,累计融资额达数千万元人民币,投后估值数亿元[1] - 两轮融资分别由英诺天使基金与东方富海领投,君科丹木、数字未来、启迪之星等财务投资机构及深智城、头部云厂商等产业资本共同参与[1] - 公司定位于大模型合成数据赛道,通过技术创新精准切入海外小语种等存在结构性数据缺口的蓝海市场[1] 合成数据行业机遇 - 大模型行业正逼近结构性拐点,互联网上高质量、可合法使用的真实数据正被快速消耗殆尽,合成数据从“可选项”变为关键变量[2][3] - 大模型下一阶段能力提升需要大量面向金融、医疗、法律等垂类场景的任务型数据,但真实数据难以采集、标注昂贵且受合规限制,合成数据成为最具可行性的定向强化手段[5] - 在隐私、版权与跨境合规压力上升的背景下,合成数据可在保持分布特征的前提下去隐脱敏,从源头规避法律风险并降低数据成本[5] - 国务院印发的《人工智能+行动的意见》明确提出“支持发展数据标注、数据合成等技术”,合成数据已上升为国家层面战略支撑[6] - 技术需求、市场缺口与政策导向三重力量共同作用,全面打开合成数据的行业时机[7] 数创弧光技术优势 - 公司构建了覆盖大模型训练全生命周期(包括继续预训练、有监督微调、强化学习微调)的数据合成方案,并延伸至合成后的数据筛选、质量评估与应用全链条[7] - 通过“语境图谱”技术把文档、项目、人员和业务知识连接起来生成问答或对话,使合成数据兼具逻辑性并能覆盖更多场景,实验数据显示该方法在多跳问答任务中准确率提高25.4%,同时成本降低85.7%[8] - 合成数据加密训练技术使大模型能够“理解”加密数据,无需解密即可完成训练,兼顾隐私保护与合规要求[10] - 高质量合成数据需要跨过质量、多样性与可靠性三道核心门槛,是一项投入巨大、工程链路复杂的系统工程[7] 产品与市场战略 - 已推出两款核心产品:Living KB专注于企业知识库的动态管理与智能应用,SynData Platform提供一站式合成数据生成服务,特别针对阿拉伯语、东南亚语系等低资源语言设计具备文化适应性的合成框架[10] - 采用二维坐标评估体系指导战略聚焦,横轴衡量数据稀缺性,纵轴衡量业务价值密度,将资源集中于“高数据稀缺性”与“高价值密度”交汇的象限,海外低资源小语种市场正落位于此高价值区间[11] - 国内市场是验证技术方案与打磨产品的重要场景,通过在金融、工业等高复杂度垂直领域落地积累经验,为海外市场拓展奠定基础[12] - 积极布局海外市场,聚焦低资源、小语种区域,尤其是以阿联酋为代表的阿拉伯语地区,当地语料量仅为英文的约1%[12] 商业化进展与护城河 - 国内已在金融等核心ToB场景完成落地,海外正稳步推进在中东等地区的商业化部署,已与头部云厂商、硬件厂商等建立深度绑定,并与数家中东头部客户如国家级政府数字部门、头部典型运营商推进合作[13] - 在小语种场景的技术挑战构成核心壁垒,通过知识增强与语境理解技术,在保持文化适配性的同时有效扩充高质量语料规模,突破方言体系下的数据限制[14] - 基于自研合成数据训练的阿拉伯语TTS与ASR模型已取得显著效果,先获得数据和技术突破的公司会建立起巨大的先发优势和“滚雪球效应”[14][16] - 团队兼具顶尖学术背景与产业实践经验,CEO江旭晖为中科院计算所博士、国家级科研项目核心成员,CTO徐铖晋博士为深圳市特聘专家、原华为“天才少年”[16] 未来发展规划 - 在模态层,公司将从文本延伸至多模态及具身智能,在架构层将从纯云架构向端云结合演进,构建从软件智能到软硬一体的技术路径[18] - 公司已经以文本为技术锚点,陆续完成语音、音频、图像等多模态能力的融合布局[17]
速递|AI教父Yann LeCun与Meta的“友好分手”,新AI公司瞄准持久记忆与复杂推理系统
Z Potentials· 2025-11-20 04:12
核心事件概述 - Meta Platforms首席人工智能科学家杨立昆确认将于年底离职,创办自己的AI初创公司 [2] - 杨立昆的新公司将专注于开发“世界模型”,这是一种旨在通过图像、视频等多模态数据理解物理世界的AI形式,与主要基于文本训练的大语言模型不同 [3] - 杨立昆表示其初创公司的目标是带来AI领域的下一次重大革命,开发能够理解物理世界、具备持久记忆、可进行推理并规划复杂行为序列的系统 [3] Meta公司的战略调整 - Meta发言人表示,公司计划与杨立昆的初创企业建立合作关系,并“能够获取其创新成果” [3][4] - Meta当前的人工智能重点已转向大语言模型,包括其Llama系列模型 [4] - 公司今年投入数十亿美元组建了新部门“Meta超智能实验室”,由Scale AI前CEO Alexandr Wang与GitHub前CEO Nat Friedman共同领导 [4] 事件背景与影响 - Meta组建新实体的背景是今年早些时候遭遇了一系列挫折,包括Llama 4模型延期发布且发布后反响令人失望 [5] - 杨立昆的离职对公司是重大打击,他被视为现代AI时代的奠基人物之一,常被称为“AI教父”,并于2019年与杰弗里·辛顿、约书亚·本吉奥共同获得图灵奖 [5] - 杨立昆解释离职原因称,高级机器智能研究在Meta之外进行最有意义,因其广泛影响力与Meta的商业利益只有部分重叠 [5]