Workflow
锦秋集
icon
搜索文档
谁在用、用来做什么、在哪儿增长?——OpenAI 与 Anthropic 的两份“用户地图”对比
锦秋集· 2025-09-17 00:44
AI普及速度与采用率 - AI在美国员工中的使用率从20%上升至40%仅用一年 远超电力、个人电脑和互联网的普及速度[1] - AI扩散既覆盖消费端也涵盖企业端部署和系统集成 呈现广泛且快速的特点[1] - OpenAI和Anthropic在2025年9月15日同步发布用户研究报告 分别聚焦消费端行为和企业端经济地图[1] 消费端与企业端使用差异 - ChatGPT非工作用途占比从53%升至73% 三大主要用途(实用建议、信息检索、写作)合计占77%[6][7] - Claude的计算机与数学任务占比达36% 企业API中该比例接近50% 凸显专业化倾向[6][8] - ChatGPT用户更年轻且新兴市场增长快 Claude高强度用户集中于高收入高数字化地区[12][14] 交互模式分化 - ChatGPT以协作式交互为主:52%为询问 35%为执行 14%为表达[9][12] - Claude自动化交互占比高:消费端一次性会话从27%升至39% 企业端达77%[10][12] - 用户行为从逐步指导转向赋予AI自主权 体现从协作助手向自动代理的角色转换[10] 技术路线与商业模式 - OpenAI坚持通用性战略 通过GPT系列吸引7亿普通用户 需求集中在写作和信息检索[16][17] - Anthropic差异化聚焦长上下文和编码能力 Claude Sonnet 3.5在编程自动化形成优势[18] - OpenAI部分转向企业端自动化编程 同时探索C端广告和分成模式[18] 关键应用场景趋势 - C端从"帮我写"转向"帮我理解" 询问类交互超50% 执行型请求降至30%[23][30] - B端从修复转向创造:新代码生成占比八个月翻倍 调试纠错下降近3个百分点[24][32] - 教育科研任务快速增长 教案生成和多媒体研究资料制作潜力显著[24] 地理分布与市场策略 - Claude的AUI指数与人均收入正相关 以色列为全球平均7倍 新加坡4.57倍 美国3.62倍[26] - 高AUI地区(如华盛顿特区、犹他州)扩展至科研教育运营 低AUI地区停留编程工具阶段[26] - 出海企业需优先攻略高AUI市场 低AUI市场从开发工具切入再外溢[26] 成本与上下文瓶颈 - 价格弹性仅-0.29 降价10%仅增加3%使用量 价格非企业采用主要障碍[27][31] - 输入增加1%输出仅增0.38% 上下文供给和系统集成成为真实生产瓶颈[27][35] - 竞争力取决于嵌入CRM、ERP、研发流程等系统的能力[31][35] 创业方向与产品定位 - C端需陪伴式知识助手(如协作学习) B端需端到端自动化引擎(如任务委派)[33][36] - 避免半自动工具定位 明确选择陪伴型或自动化型产品路径[25][36] - 刚需场景需持续演化 如写作转向知识验证 代码从辅助工具转向生产引擎[21][34]
别押错赛道: OpenAI 的25 亿条消息揭示 AI 的真实需求 | Jinqiu Select
锦秋集· 2025-09-17 00:17
AI 的真实需求到底在哪里? 过去两年,几乎所有讨论都在围绕"AI 如何提升工作生产力"展开。但 OpenAI 最新公布的 覆盖 7 亿用户、25 亿条日均消息的内部数据,却给出了一个颠覆性的答案 ——ChatGPT 的使用重心,并不在办公室,而是在生活里。非工作用途的消息比例在一年间从 53% 飙升到 73%,实用指导、信息查询和写作三大类合计接近八成, 而编程、陪伴等被行业热议的场景却出奇冷清。 这固然与 OpenAI 与 Anthropic 等竞争对手在产品定位与功能设计上的差异有关,但更直接的意义在于:ChatGPT 的数据揭示了用户当下真实的需求与痛点。数亿人 愿意反复在这里询问、查找和改写信息,本身就是一种强有力的信号。 当然,这并不等同于未来趋势。用户行为并不是天然的"未来轨迹",而是被产品形态所塑造。OpenAI 把 ChatGPT做成了"数字日用品",于是生活化需求被放大; Anthropic 强调任务自动化闭环,于是企业用例更突出。不同厂商在功能设计和叙事导向上的选择,会深刻影响需求曲线的走向。 基于OpenAI用户的使用习惯,我们发现: 锦秋基金(公众号:锦秋集;ID:jqcapital ...
别走弯路!Anthropic 官方揭秘:大模型哪里有用,哪里有钱 | Jinqiu Select
锦秋集· 2025-09-16 14:32
全球AI采用模式与地理分布 - AI采用速度前所未有 美国员工使用AI比例从2023年20%升至2025年40% [8] - 高收入国家人均AI使用显著领先 新加坡使用率为劳动年龄人口预期的4.5倍 以色列达7倍 [27][33] - 使用高度集中于技术先进经济体 北美、欧洲和大洋洲处于领先地位 非洲、拉美及亚洲部分地区使用率低于预期 [29][33] 任务类型演变趋势 - 代码生成占据主导地位 全球平均占比约三分之一 印度超过50%使用集中于编程任务 [3][21][52] - 创作类任务快速增长 新代码生成任务占比增加4.5个百分点(4.1%→8.6%) 教育材料开发增幅超6倍(0.2%→1.5%) [14] - 调试纠错任务占比下降2.8个百分点(16.1%→13.3%) 净效应向创作转移7.4个百分点 [14] 企业级部署特征 - 企业API调用中77%属于整体委派式自动化 增强协作型任务仅占12% [5][77] - 企业更关注能力与经济价值而非成本 某些任务调用成本高出50%仍被优先采用 [1][88] - API使用高度集中 Top15使用集群占全部流量一半 其中6%为调试Web应用 5%专注于AI系统开发 [69] 区域化应用差异 - 低收入国家聚焦单一场景 高收入国家发展多元应用 新加坡、以色列扩散至科研教育行政等领域 [2][3] - 美国各州应用呈现地域特色 加州偏重IT与数字营销(3.7倍基础数值任务) 佛罗里达侧重商业建议与健身(1.35倍) [53][54] - 巴西侧重翻译(6.4倍)和法律服务(5.0倍) 越南集中开发与教育 印度专注软件开发(2.4倍UI优化) [49][51] 人机交互模式演变 - 指令式自动化占比八个月内从27%升至39% 主要挤占任务迭代与学习份额 [15] - 高采用率地区偏好增强式使用 低采用率地区倾向自动化委派 控制任务结构后仍成立 [58] - 复杂任务依赖上下文整合 输入每增加1%输出仅增0.38% 呈现递减收益特征 [84][87] 经济影响与行业渗透 - AI使用与人均GDP呈正相关 人均GDP每增1% Claude使用增加约0.7% [34] - 企业AI采用率两年内从3.7%升至9.7% 信息行业达25% 住宿餐饮业仅2.5% [66] - 华盛顿特区人均使用全美最高 求职申请相关帮助占比为全美1.84倍 [37][56]
锦秋基金被投公司Sandwich Lab 获千万美元新融资 | Jinqiu Spotlight
锦秋集· 2025-09-16 14:16
投资动态 - 锦秋基金于2024年完成对Sandwich Lab的投资 [1] - 戈壁创投管理的AEF GBA基金及五源资本共同投资Sandwich Lab新一轮融资 累计金额超千万美金 [3][6] 公司概况 - Sandwich Lab成立于2024年 2025年3月推出首款产品AI广告投放Agent Lexi [3][7] - 公司愿景是通过AI帮助企业增长营收 计划推出Email Marketing Agent及财务/税务/法务/供应链/人力资源等多领域Agent [16] 产品与服务 - Lexi定位Meta生态广告投放服务 订阅费每月200美金起 面向全球中小企业主提供全自动广告投放解决方案 [9][10] - 产品采用"影子模式"帮助客户投放广告 用户仅需提供预算和目标范围即可自动完成分析/做图/文案/投放/优化全流程 [10][15] 运营数据 - Lexi上线三个月后付费用户覆盖94个国家 月环比营收增长达150%以上 [3][13] - 目标客群为从未投过广告的海外中小企业主 典型客户年营收约100万美金 [10][12] 战略定位 - 公司采用高价策略验证市场需求 明确"首先要贵"的定价思路 [15] - 聚焦长期经营场景 帮助具备基础营收能力的中小企业突破增长瓶颈 [12][16]
锦秋基金投资的宇树机器人开源世界模型-动作架构 UnifoLM-WMA-0|Jinqiu Spotlight
锦秋集· 2025-09-16 13:56
投资动态 - 锦秋基金已完成对宇树科技的投资 [1] - 基金为12年期AI Fund 以长期主义为核心投资理念 专注于突破性技术和创新商业模式的通用人工智能初创企业 [2] - 设立"Soil种子专项计划" 为早期AI创业者提供资金支持 助力创新想法转化为实际应用 [9] 技术突破 - 宇树科技开源UnifoLM系列世界模型-动作架构UnifoLM-WMA-0 专为通用机器人学习设计 [2][3] - 架构内置理解机器人与环境交互物理规律的世界模型 具备仿真引擎和策略增强两大核心功能 [3][6] - 仿真引擎作为交互式仿真器运行 为机器人学习提供合成数据 [6] - 策略增强功能可通过预测物理世界交互过程优化决策性能 [6] 应用展示 - 模型真机部署实现将木块按红黄绿顺序叠落 右上角小窗口显示未来动作视频预测 [4] - 完成整理橡皮和笔任务 同步展示世界模型对未来动作的预测 [4] - 实现将黑色相机放入包装盒操作 并实时呈现未来动作预测视频 [5]
大模型之后看机器人?Sergey Levine谈通用机器人规模化落地的真实瓶颈与破局方案
锦秋集· 2025-09-15 12:37
核心观点 - 机器人技术将在2030年实现家庭全自主管理 核心驱动力是"机器人数据飞轮"机制 即通过真实任务反馈实现持续迭代和自我强化 [1] - 机器人落地速度可能超越自动驾驶和大型语言模型 因物理世界反馈明确、容错率高且数据获取更容易 [2] - 技术路径基于"视觉-语言-动作"一体化基础模型 依托现有AI底座(如Gemma语言模型)快速开发应用 [3][15] - 硬件成本从数十万美元降至数千美元 降低创业门槛并加速市场验证 [7][33] - 通用机器人实现需突破"三难困境":毫秒级反应速度、长上下文记忆和大模型规模 解决方案依赖云端与本地智能结合 [6][27][28][29] 技术架构与能力 - Physical Intelligence的π0模型采用端到端Transformer架构 整合视觉编码器、语言推理和动作专家 实现感知-思考-行动闭环 [16][17] - 动作控制采用流匹配和扩散技术 生成连续高频指令驱动关节运动 精度远超离散文本符号 [17] - 模型展现"组合泛化"能力:例如自主清理障碍物、扶正容器、翻正衣物等未训练过的行为 [23][24] - 预训练语言模型提供先验知识(如物体识别、空间关系) 加速物理技能学习过程 [17][18] 发展路径与时间线 - 优先小范围真实场景应用 而非大规模模拟 通过精准数据反馈提高资源效率 [4] - 垂直领域机器人服务预计1-2年内落地 通用家庭管家级机器人需约5年 [10][11] - 模拟环境需结合真实世界数据基础 仅作为"排练厅"用于技能排演和反事实思考 [30][31][32] - 数据飞轮启动后 机器人能力将呈指数级提升 从单一任务跃迁至通用家务处理 [1][5][10] 行业比较优势 - 对比语言模型:机器人错误结果明确(如叠坏衣服) 易获得有效负反馈 而语言模型错误难以察觉 [12] - 对比自动驾驶:机器人容错空间大(如打碎盘子可接受) 且受益于现代感知系统和常识推理能力 [13][14] - 具身智能赋予目标导向的视觉过滤能力 从海量视频数据中高效提取关键特征 避免信息过载 [19][20][21] 硬件与经济影响 - 硬件成本十年内从40万美元(PR2机器人)降至3000美元 AI闭环控制降低对机械精度的依赖 [33] - 机器人将放大体力劳动者生产力 类似编程助手对软件工程师的增效作用 [11][34] - 地缘政治挑战在于关键硬件供应链集中 但机器人产业具备"自举"特性:用机器人制造机器人可形成正反馈循环 [35] 生态与竞争维度 - 竞争焦点从纯技术转向产业链、生态链和人才链综合布局 [7] - 教育体系需培养持续学习能力 以适应自动化转型带来的社会变革 [34]
Claude 的秘密:AI 聪不聪明,取决于你给它什么工具 | Jinqiu Select
锦秋集· 2025-09-12 08:48
转变思维:为 AI 智能体设计,而非为代码封装 Claude 最近的新功能可以直接创建和编辑包括 Excel、文档、PPT 乃至 PDF 在内的多种主流办公文件,进一步拓展了 AI 在实际任务中的应用场景。Anthropic 很早 就推出过很多小而美但切中用户需求的客户端工具例如artifact,其目标始终是将 AI 从"聊天机器人"转变为能解决实际问题的强大伙伴。 最近 Anthropic 撰写了一篇文章,分享了其在开发和优化智能体工具方面的经验与方法论。 核心是为不确定的、会推理的 AI 设计直观易用的工具,而不是像传统编程那样只考虑输入输出。 评估驱动:用真实且复杂的任务来衡量和迭代 工具好不好,要靠系统性的评估来验证。评估场景必须接近真实世界,足够复杂,才能发现真正的问题。 少即是多:构建整合工作流的工具,而非零散的功能点 与其提供一堆零散的 API 功能,不如创建一个能处理多步骤任务的强大工具,这能极大减轻 AI 的推理负担。 精心设计描述:工具的"说明书"和功能本身同样重要 工具的名称、描述和参数定义是 AI 理解其用途的唯一途径。清晰、准确的描述是提升工具调用成功率最有效的方法之一。 智能体的效 ...
融资20亿美元的Thinking Machines Lab首次公开:破解LLM随机性,实现可复现的“确定性”推理
锦秋集· 2025-09-11 09:19
文章核心观点 - 大型语言模型推理结果不确定性的根本原因并非行业普遍认为的"并发计算与浮点数误差",而是核心计算算子缺乏"批次不变性" [1] - 通过重写Transformer模型中的RMSNorm、矩阵乘法和注意力机制三个关键计算模块,实现"批次不变性",可确保计算过程不受批次大小干扰 [2] - 在标准环境中,一个请求重复1000次会得到80个不同版本的结果,而在批次不变方案下,1000次请求的结果完全一致 [2][75] 批次不变性技术原理 - 单个请求的计算过程受到整个"批次"大小影响,导致输出结果取决于随机打包的其他请求数量 [1][28] - 缺乏批次不变性的核函数会使系统在负载变化时产生不确定性,这与GPU、CPU或TPU平台无关 [33] - 实现批次不变性需要保证每个元素的规约顺序固定,不受核函数批次大小影响 [38] RMSNorm批次不变性实现 - 采用数据并行策略,将每个批次元素分配给单个核心处理,保持规约策略一致性 [37][39] - 当批次大小减小时,标准策略会导致核心空闲,而分割规约策略会破坏批次不变性 [43][45] - 解决方案包括忽略小批次情况或使用固定规约策略,但会牺牲峰值性能 [46] 矩阵乘法批次不变性实现 - 标准数据并行策略将输出张量分割成二维tile,每个tile规约保持在单个核心内 [49] - Split-K Matmul策略会破坏批次不变性,而张量核心指令切换也会导致不一致性 [51][54] - 通过编译固定核函数配置实现批次不变性,性能损失约20% [57][59] 注意力机制批次不变性实现 - FlashAttention2策略沿Q并行化并沿K/V规约,保持数据并行特性 [62] - 需要处理特征维度和序列维度双重规约,以及推理优化带来的序列切分变化 [64][65] - 采用固定分割大小策略而非固定分割数量,确保规约顺序一致性 [72][74] 实验结果验证 - 在Qwen/Qwen3-235B模型上测试,标准环境产生80个独特补全,批次不变方案实现1000次完全一致输出 [75] - 性能测试显示未优化确定性方案耗时55秒,优化后降至42秒,较默认26秒仍有差距但可接受 [78] - 真正同策略强化学习实现KL散度为0,显著提升训练稳定性 [79][80] 行业应用价值 - 该技术为需要高一致性的应用场景提供可行路径,如同策略强化学习、科学计算等 [3][79] - 解决训练与推理间数值计算差异问题,实现真正的逐比特一致性 [79][80] - 推动社区深入理解系统不确定性根源,提升机器学习系统可靠性 [83]
锦秋基金被投数美万物:破解 Nano Banana 实物化难题,让 3D 设计实现全民平权 | Jinqiu Spotlight
锦秋集· 2025-09-11 04:00
公司背景与融资情况 - 数美万物成立于2024年2月 创始团队包括抖音初创核心成员(CEO任利锋、运营负责人李恬、3D产品负责人张勃)[3] - 2024年完成天使轮融资(锦秋基金参与) 2025年完成Pre-A轮融资(美团龙珠领投 锦秋基金跟投 红杉中国等老股东继续跟投)[2][3][4] - Pre-A轮融资后公司估值达1.5亿美元[3] 核心技术平台Hitems - 通过生成式AI技术将创意商品化 提供从创作到生产再到消费的全链条服务[6] - 自研AI3D建模技术Hitem3D v1.5版本实现高精度建模 支持1536pro分辨率 细节还原度超越混元2.5和Tripo 3.0等模型[26][27][31] - 零门槛操作:用户通过图片/关键词/手绘稿生成3D模型 1分钟内完成两次点击即可获得高完成度模型[6][40] - 与3D打印公司拓竹达成合作 将API接入MakerWorld社区[42] 商业化与市场验证 - 平台提供趋势预测引擎 推荐高潜力品类(如键帽、新中式文创)[44] - 轻量化市场测试机制:"30人想要即送免费实物"降低试错成本[44] - 2025年3-4月"键帽出道大作战"活动吸引15000名用户参与 创作25000+键帽作品[23] - 联动IP方与品牌发起联名企划 嫁接成熟流量与商业渠道[44] 供应链创新 - 搭建全品类柔性供应链网络 支持30+材质工艺(陶瓷/金属/树脂等)[50] - 推出"1件起订+7天极速打样"服务 IP孵化成本从万元降至百元级[50] - 打破传统工厂批量门槛 解决中小创作者生产难题[46][48][50] 行业影响与定位 - 平台被类比为"创意经济时代的福特" 通过标准化流程释放全民创意潜力[51][52][53] - 实现3D设计全民平权 催生微型IP宇宙 推动创意经济生态多元化[52][56] - 核心价值:好(高质量建模)、快(72小时实物生产)、全(全链路服务)、省(百元级启动成本)[54] 市场活动与用户参与 - 2025年9月联合小红书科技薯发起"手办免费造"活动 免费送出100份实物手办[7][8] - 用户通过生成AI手办图参与抽奖 每周抽取50名中奖者(40名笔记创作者+10名评论区参与者)[8] - 提供个性化定制服务 用户可获取Nano Banana系列实物手办[13][60][61]
锦秋基金被投生数科技上线参考生图功能,国产Nano Banana来了 | Jinqiu Spotlight
锦秋集· 2025-09-11 02:29
公司投资与背景 - 锦秋基金于2023年完成对生数科技的投资 该基金为12年期AI Fund 以长期主义为核心投资理念 专注于突破性技术和创新商业模式的通用人工智能初创企业[1][2] 产品功能与技术突破 - Vidu Q1参考生图功能于2025年9月推出 支持单次最多7张参考图输入 打破国内生成上限 显著领先于仅支持1-3张参考图的竞品[2][11][22][23] - 功能支持多元素场景自由组合 包括人物、背景、道具的无缝融合 并能通过单张图实现多达10个以上物体的参考 实际参考能力无上限[25][31][34] - 在一致性、美学、真实性、清晰度、语义理解等关键指标上全面碾压Flux Kontext 并与Nano Banana相媲美 尤其在主体一致性上超越同类产品[13][36][38][39] 性能表现与案例验证 - 在多角色混淆、人物走样、服饰细节丢失等常见问题上表现卓越 几乎不存在误差 例如完美还原动漫角色手套、衣服等细节的1:1精准复刻[38][53] - 在还原度上实现质的突破 支持高度贴近原始输入的生成效果 解决业内常见的参考模糊和相似却失真问题 例如准确补全彩虹图中未出现的另一半[47][51] - 创意自由度极高 支持换装、换背景、换角色、换道具 甚至实现3D人偶手办、老照片修复、多角度视图生成等复杂应用[63][68][69][75] 行业应用与效率提升 - 功能适配电商、广告、媒体、消费品等多个行业 例如电商宣传图制作效率提升90% 传统素材制作需1周而Vidu Q1仅需1天完成全流程[169][173][179] - 支持多场景商业化应用 包括时尚杂志大片合成、产品宣传图生成、汽车渲染图多场景变换等 例如中秋月饼宣传图一键合成不同节日主题[170][180][182] - 一致性技术开启AI视频生产级应用新纪元 从参考生图到参考生视频实现精细化可控闭环 推动AI从娱乐工具向规模化生产力引擎转型[153][168][182] 市场竞争与行业地位 - 产品直接对标谷歌Nano Banana 在发布不到10天内实现国产替代 并在部分场景如画面理解力和一致性上展现更强能力[11][47][51] - 在VBench评测中 文生视频双榜第一 力压Sora和Gen-3 体现多模态可控技术的行业领先性[166]