Workflow
锦秋集
icon
搜索文档
锦秋基金被投公司地瓜机器人提出纯视觉机器人操作方法VO-DP | Jinqiu Spotlight
锦秋集· 2025-09-22 07:15
投资事件 - 锦秋基金于2025年完成对地瓜机器人的投资,该基金是一家拥有12年历史的AI基金,以长期主义为核心投资理念,专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [1] 公司概况与市场地位 - 地瓜机器人是业界领先的机器人软硬件通用底座提供商,其前身为2015年成立的地平线机器人 [2] - 公司构建了从芯片、算法到软件的完善产品体系,核心产品包括旭日智能计算芯片和RDK机器人开发者套件,算力覆盖范围从5到500 TOPS,可满足人形、四足狗、家庭服务等多种机器人计算需求 [2] - 旭日系列芯片累计出货量已超过500万片,平台拥有超过200家中小创客、200多家头部高校以及来自全球20多个国家的近100,000名个人开发者,创造了数百种形态的智能机器人产品 [2] 技术突破:VO-DP方法 - 公司联合同济大学推出了全新的纯视觉机器人操作方法VO-DP,该方法采用纯视觉方案,融合先进的视觉基础模型,突破了传统点云模型的局限 [2][4] - VO-DP方法的核心创新在于引入了基于Cross-Attention的融合模块,对来自VGGT模型的语义特征(DINOv2)和几何特征(Alternating Attention)进行有效融合与压缩,作为下游策略头的输入 [6][16] - 该方法设计了一种空间特征压缩模块,将融合后的特征适配下游任务输入,并研发了名为DRRM的多机多卡并行训练框架 [14] 技术优势与性能表现 - 纯视觉方案具有显著的硬件成本效益,RGB相机的硬件成本可降低数倍至数十倍,且无需多传感器标定,工程便利性更高 [11] - 在仿真实验中,VO-DP(3帧)与基于3D点云的DP3方法在精度上已持平,而VO-DP(1帧)的表现甚至略微超过DP3,证明了纯视觉方案在精度上可与3D方案对齐甚至超越 [5][30] - 在特定任务上,VO-DP表现更优,例如在Pick Apple Messy任务中,VO-DP(3帧)成功率达到80.0%±0.8,显著高于DP的31.0%±0.8和DP3的18.7%±2.9 [22][26] - VO-DP方法已成功部署到真实机械臂上,并能成功执行桌面收纳、混合堆叠等复杂任务 [5][35] 行业背景与研究路径 - 端到端的机器人操作学习是具身智能领域的关键研究方向,当前主流技术分支为VA和VLA [4][7] - 公司研究聚焦于VA,认为在单一任务场景下,对观测到行动的预测是更基础的问题,有助于深刻理解时空表达如何影响动作预测 [8] - 视觉基础模型(如VGGT)的快速发展为纯视觉方案提供了可靠预训练模型,其能力已从二维语义感知提升到三维空间感知 [10]
n8n 爆红,创业公司如何做“AI 版 n8n”?| Jinqiu Select
锦秋集· 2025-09-22 06:30
n8n公司发展概况 - 2025年3月完成约6000万美元B轮融资,估值约2.5-3亿欧元,8月由Accel牵头的新一轮融资将估值推高至约23亿美元[1] - 年度经常性收入(ARR)突破4000万美元,在数月内增长五倍[1] - 公司作为开源自动化平台代表,其热度持续攀升,反映出自动化工作流正成为AI应用的核心基础设施[1] 自动化平台行业趋势与创业机会 - 国内外多个团队正尝试将大语言模型(LLM)与自动化平台结合,以打造更智能的工作流和代理系统,形成“AI版n8n”的创业浪潮[2][3] - n8n已成为行业参照系,创业公司或直接对标,或在其基础上延展功能,试图抢占“自动化+AI Agent”的新入口[3] - 下一代产品的机会在于从“连接”转向“理解”和“推荐”,用户可通过自然语言告知系统目标,由AI生成并优化工作流,将智能代理嵌入高频场景[6][7] 市场需求分析(基于招聘数据) - 基于2025年4-5月收集的2209条招聘信息进行分析,招聘平台是主要需求来源,其中Upwork提供2072条机会,Reddit提供82条,n8n官方论坛提供55条[11][15][16] - 自由职业在市场中占主导地位,在2100条明确工作形式的信息中占比超过80%[19] - 在541条明确时间要求的信息中,大多数为短期或中期合作:一次性工作147条,兼职198条,全职196条[23][24] 定价模式与预算水平 - 按小时计费是最常见形式(839条信息),价格区间为最低17.68美元至最高45.03美元,平均31.36美元[27] - 按项目计费的信息有738条,价格区间为最低531.69美元至最高866.53美元,平均699.11美元[27] - 月薪制信息较少(20条),月薪区间为最低792.5美元至最高1182.5美元,平均987.5美元[27] 需求地域分布与时区特征 - 需求方地域分布显示美国是最大需求国(40条),其次为澳大利亚(14条)和英国(10条)[39] - 主要时区分布为印度标准时区(IST)1042条,美国东部时区(EST)677条,形成“欧美客户+印度执行”的典型模式[39] 主流业务用例与行业垂直 - 最频繁出现的自动化场景是API工作流、CRM更新和邮件自动化,这些需求具有“刚需+可扩展”特性[5][38] - 房地产和软件即服务(SaaS)行业对自动化的需求最为稳定[42] - 用户偏好低成本、快速交付和稳定运行的解决方案,核心诉求是“快、省、好”[5]
当机器人能自己教自己:DeepMind发布自我改进的具身基座模型
锦秋集· 2025-09-19 08:41
近日,Google DeepMind Generalist 团队发布新作《Self-Improving Embodied Foundation Models》,为该领域贡献了一个具有里程碑意义的框架: 一个真正可实现机 器人自主练习、自我奖励、并不断超越初始训练数据限制的双阶段后训练方法 。 通过系统性的算法设计与大规规模真实机器人验证,该研究提出将传统的行为克隆(BC)与创新的"步骤到-go预测"目标相结合,在监督微调(SFT)之后引入一个 名为"自我改进"的在线强化学习阶段。 该方法不依赖人工奖励设计,而是从预训练基础模型中自动导出奖励信号与成功判断,使多台机器人可在人类极简监督下并行练习。 在核心机制维度,文章系统展示了如何通过步骤到-go预测构建密集奖励函数、实现鲁棒的成功终止判断、并显著提升策略样本效率。仅增加10%的自主练习时间, 即可在Block2Block任务上带来超过30%的成功率提升,效果显著优于单纯扩大8倍模仿数据。 过去的机器人会模仿,却始终学不会举一反三。今天,真正的挑战是:如何让机器人像人一样,在反复尝试中自己变聪明。 进入2025年,具身智能的核心命题逐渐清晰: 如何让机器人通过 ...
锦秋基金被投公司「生数科技」完成新一轮数亿元A轮融资 | Jinqiu Spotlight
锦秋集· 2025-09-19 02:17
融资与投资背景 - 生数科技于近日完成新一轮数亿元人民币规模的A轮融资,由博华资本领投,并获得百度战投、北京市人工智能产业投资基金、启明创投等老股东持续跟投及产业合作方加码[2][5] - 锦秋基金作为一家12年期的AI Fund,于2023年年中投资了生数科技,是其早期机构投资人[1][2] - 锦秋基金设有"Soil种子专项计划",专为早期AI创业者提供资金支持,以帮助创新想法转化为实际应用[12] 公司概况与技术产品 - 生数科技成立于2023年3月,核心团队由来自清华大学、北京大学、帝国理工学院等全球顶尖高校及产业界的技术和产品人才组成[5] - 公司专注于多模态大模型及应用的自主研发,其核心产品Vidu具备AI图像生成、视频生成与音频生成等多项能力[5] - Vidu产品于2024年7月全球上线,全球首创「参考生」图片/视频概念,并在多主体一致性方面持续保持全球领先[5][8] 市场表现与用户数据 - Vidu产品已快速覆盖全球200多个国家和地区,拥有超3000万用户和6000家开发者及企业[5] - 通过Vidu累计生成的视频数量超过4亿,其核心功能参考生视频和参考生图的生成数量已超过1亿[5] - 在生成的内容中,商业内容素材生成量占比超过50%[5] 行业前景与战略规划 - 多模态生成技术在数字内容产业中的商业化进程正在加速,预计在未来三年内将重塑全球数字内容的生产方式,并全面渗透到各行各业[6] - 该技术领域展现出巨大的市场空间与全球性增长潜力[6] - 新一轮融资将用于模型研发和技术创新,探索多模态大模型的智能上限和应用广度,同时加强产品拓展、用户服务、产业合作和全球商业布局[6]
地瓜机器人X锦秋基金:一杯精酿,聊透机器人未来 | Jinqiu Spotlight
锦秋集· 2025-09-18 12:33
文章核心观点 - 锦秋基金已完成对地瓜机器人的投资 该基金作为12年期的AI Fund 以长期主义为核心投资理念 专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [1] - 地瓜机器人是业界领先的机器人软硬件通用底座提供商 构建了从芯片 算法到软件的完善产品体系 旨在让更智能的机器人开发更简单 [9] - 公司联合举办“地瓜精酿馆”线下交流活动 旨在为创业者 投资人和产业伙伴打造高质量 深度对话的闭门场 限定30席 仅面向优质报名者开放 [1][3][5] 公司业务与产品 - 地瓜机器人以旭日智能计算芯片和RDK机器人开发者套件为核心 形成了覆盖5到500 TOPS各算力段的完整产品布局 可满足人形 四足狗 家庭服务 陪伴 物流AMR等多种机器人计算需求 [9] - 旭日系列芯片出货量已超过500万片 超过200家中小创客 200多家头部高校以及来自全球20多个国家的近100,000名个人开发者在该平台上创造了数百种形态的智能机器人产品 [9] - 公司启动了地心引力计划 这是一个为机器人创业公司打造的全球生态创新项目 采用免费会员制 计划在未来五年内赋能千家企业 影响千万机器人消费者 [9] - 目前地心引力计划联合近40家国内外知名的创业孵化器 加速器 高校实验室 投资机构 行业合作伙伴与科技媒体 赋能200余家机器人创业公司 [9] 行业活动与生态建设 - “地瓜精酿馆”活动包括现场机器人互动秀 限定高质量交流 项目展示以及由顶级机器人公司创始人担任主持的深度对话环节 [5] - 活动流程设计强调高效对接 包括一分钟开场秀 云端复盘局 微醺里遇见和自由碰撞接站等环节 旨在打破边界 激发合作与灵感 [6] - 活动目标受众为具身智能 机器人 AI交互领域的创业者 寻找机器人赛道机会的投资人以及对机器人落地与商业化充满兴趣的产业合作方 [7] - 锦秋基金设有“Soil种子专项计划” 专为早期AI创业者提供资金支持 帮助团队将创新想法转化为实际应用 [18]
从 ChatGPT 到 Marble,李飞飞押注的下一个爆发点是 3D 世界生成?
锦秋集· 2025-09-18 07:33
文章核心观点 - 李飞飞创立的World Labs推出空间智能模型Marble 其核心突破在于通过一张图片或文本提示生成持久存在且可自由导航的3D世界 在几何一致性、风格多样性、世界规模和跨设备支持上显著优于同类产品[1][2] - Marble并非孤立产品 而是李飞飞"世界模型-空间智能-三维表征"思路的集中落地 代表从语言理解到世界理解再到AGI的演进路径[3][6] - 世界模型被视为AI发展的第三阶段范式 其核心在于三维表征与时空一致性 而不仅是多模态拼接 这将推动内容生产、机器人和AR/VR领域的变革[6][21][29] 大语言模型边界与空间智能必要性 - 大语言模型在写作、推理等任务中展现强大能力 但其基于一维序列的结构无法原生理解三维世界 语言作为有损编码方式难以传递几何、物理和时序因果信息[5][9][10] - 二维像素和视频输入不会自动生成三维结构 关键在模型内部表征需原生支持三维表达 满足可微渲染、视角一致性和物理一致性要求[11][14] - 空间智能是AGI的必要条件 因为世界本质是三维的 二维观测是不完备投影 且语言训练信号是纯生成的 无法替代对三维结构的直接建模[16] 世界模型的技术实现路径 - 数据策略采用混合路径:真实采集+重建生成+仿真合成 以解决三维数据匮乏问题 同时强调数据质量与一致性约束的重要性[20][26] - 算法层面注重"重建与生成合流" 同一套三维表示既能重建真实场景 也能生成虚拟世界 NeRF等方法让小规模算力也能实现原创突破[20][24] - 算力资源配置体现学术与产业分工:工业界侧重系统工程与产品化 学术界专注表示方法和跨模态原理研究[25] 产业发展与落地节奏 - 内容生产为首要落地场景 目标将3D内容生成成本从AAA游戏级降至创作者可及水平 应用覆盖游戏、虚拟摄影、工业设计和教育领域[6][29] - 机器人被视为天然应用场景 空间智能连接数字脑与物理界面 但需先打磨三维表示与交互能力 再承接高风险实体操作[30] - AR/VR作为后续发展阶段 需实现从静态场景到动态要素、可交互性和场景语义的逐步演进[29] 范式演进与投资逻辑 - AI发展遵循三要素共振规律:数据×算力×算法 ImageNet时代是二维标注数据驱动 世界模型时代是三维表示驱动[18][21][23] - 范式演进分为三阶段:监督学习(ImageNet)→生成式建模(扩散/GAN)→三维世界模型(重建×生成)[21][24] - 投资逻辑围绕"找到时代最被低估的数据形态" 三维表示被视为当前最具潜力的数据形态[21][23]
谁在用、用来做什么、在哪儿增长?——OpenAI 与 Anthropic 的两份“用户地图”对比
锦秋集· 2025-09-17 00:44
AI普及速度与采用率 - AI在美国员工中的使用率从20%上升至40%仅用一年 远超电力、个人电脑和互联网的普及速度[1] - AI扩散既覆盖消费端也涵盖企业端部署和系统集成 呈现广泛且快速的特点[1] - OpenAI和Anthropic在2025年9月15日同步发布用户研究报告 分别聚焦消费端行为和企业端经济地图[1] 消费端与企业端使用差异 - ChatGPT非工作用途占比从53%升至73% 三大主要用途(实用建议、信息检索、写作)合计占77%[6][7] - Claude的计算机与数学任务占比达36% 企业API中该比例接近50% 凸显专业化倾向[6][8] - ChatGPT用户更年轻且新兴市场增长快 Claude高强度用户集中于高收入高数字化地区[12][14] 交互模式分化 - ChatGPT以协作式交互为主:52%为询问 35%为执行 14%为表达[9][12] - Claude自动化交互占比高:消费端一次性会话从27%升至39% 企业端达77%[10][12] - 用户行为从逐步指导转向赋予AI自主权 体现从协作助手向自动代理的角色转换[10] 技术路线与商业模式 - OpenAI坚持通用性战略 通过GPT系列吸引7亿普通用户 需求集中在写作和信息检索[16][17] - Anthropic差异化聚焦长上下文和编码能力 Claude Sonnet 3.5在编程自动化形成优势[18] - OpenAI部分转向企业端自动化编程 同时探索C端广告和分成模式[18] 关键应用场景趋势 - C端从"帮我写"转向"帮我理解" 询问类交互超50% 执行型请求降至30%[23][30] - B端从修复转向创造:新代码生成占比八个月翻倍 调试纠错下降近3个百分点[24][32] - 教育科研任务快速增长 教案生成和多媒体研究资料制作潜力显著[24] 地理分布与市场策略 - Claude的AUI指数与人均收入正相关 以色列为全球平均7倍 新加坡4.57倍 美国3.62倍[26] - 高AUI地区(如华盛顿特区、犹他州)扩展至科研教育运营 低AUI地区停留编程工具阶段[26] - 出海企业需优先攻略高AUI市场 低AUI市场从开发工具切入再外溢[26] 成本与上下文瓶颈 - 价格弹性仅-0.29 降价10%仅增加3%使用量 价格非企业采用主要障碍[27][31] - 输入增加1%输出仅增0.38% 上下文供给和系统集成成为真实生产瓶颈[27][35] - 竞争力取决于嵌入CRM、ERP、研发流程等系统的能力[31][35] 创业方向与产品定位 - C端需陪伴式知识助手(如协作学习) B端需端到端自动化引擎(如任务委派)[33][36] - 避免半自动工具定位 明确选择陪伴型或自动化型产品路径[25][36] - 刚需场景需持续演化 如写作转向知识验证 代码从辅助工具转向生产引擎[21][34]
别押错赛道: OpenAI 的25 亿条消息揭示 AI 的真实需求 | Jinqiu Select
锦秋集· 2025-09-17 00:17
AI 的真实需求到底在哪里? 过去两年,几乎所有讨论都在围绕"AI 如何提升工作生产力"展开。但 OpenAI 最新公布的 覆盖 7 亿用户、25 亿条日均消息的内部数据,却给出了一个颠覆性的答案 ——ChatGPT 的使用重心,并不在办公室,而是在生活里。非工作用途的消息比例在一年间从 53% 飙升到 73%,实用指导、信息查询和写作三大类合计接近八成, 而编程、陪伴等被行业热议的场景却出奇冷清。 这固然与 OpenAI 与 Anthropic 等竞争对手在产品定位与功能设计上的差异有关,但更直接的意义在于:ChatGPT 的数据揭示了用户当下真实的需求与痛点。数亿人 愿意反复在这里询问、查找和改写信息,本身就是一种强有力的信号。 当然,这并不等同于未来趋势。用户行为并不是天然的"未来轨迹",而是被产品形态所塑造。OpenAI 把 ChatGPT做成了"数字日用品",于是生活化需求被放大; Anthropic 强调任务自动化闭环,于是企业用例更突出。不同厂商在功能设计和叙事导向上的选择,会深刻影响需求曲线的走向。 基于OpenAI用户的使用习惯,我们发现: 锦秋基金(公众号:锦秋集;ID:jqcapital ...
别走弯路!Anthropic 官方揭秘:大模型哪里有用,哪里有钱 | Jinqiu Select
锦秋集· 2025-09-16 14:32
全球AI采用模式与地理分布 - AI采用速度前所未有 美国员工使用AI比例从2023年20%升至2025年40% [8] - 高收入国家人均AI使用显著领先 新加坡使用率为劳动年龄人口预期的4.5倍 以色列达7倍 [27][33] - 使用高度集中于技术先进经济体 北美、欧洲和大洋洲处于领先地位 非洲、拉美及亚洲部分地区使用率低于预期 [29][33] 任务类型演变趋势 - 代码生成占据主导地位 全球平均占比约三分之一 印度超过50%使用集中于编程任务 [3][21][52] - 创作类任务快速增长 新代码生成任务占比增加4.5个百分点(4.1%→8.6%) 教育材料开发增幅超6倍(0.2%→1.5%) [14] - 调试纠错任务占比下降2.8个百分点(16.1%→13.3%) 净效应向创作转移7.4个百分点 [14] 企业级部署特征 - 企业API调用中77%属于整体委派式自动化 增强协作型任务仅占12% [5][77] - 企业更关注能力与经济价值而非成本 某些任务调用成本高出50%仍被优先采用 [1][88] - API使用高度集中 Top15使用集群占全部流量一半 其中6%为调试Web应用 5%专注于AI系统开发 [69] 区域化应用差异 - 低收入国家聚焦单一场景 高收入国家发展多元应用 新加坡、以色列扩散至科研教育行政等领域 [2][3] - 美国各州应用呈现地域特色 加州偏重IT与数字营销(3.7倍基础数值任务) 佛罗里达侧重商业建议与健身(1.35倍) [53][54] - 巴西侧重翻译(6.4倍)和法律服务(5.0倍) 越南集中开发与教育 印度专注软件开发(2.4倍UI优化) [49][51] 人机交互模式演变 - 指令式自动化占比八个月内从27%升至39% 主要挤占任务迭代与学习份额 [15] - 高采用率地区偏好增强式使用 低采用率地区倾向自动化委派 控制任务结构后仍成立 [58] - 复杂任务依赖上下文整合 输入每增加1%输出仅增0.38% 呈现递减收益特征 [84][87] 经济影响与行业渗透 - AI使用与人均GDP呈正相关 人均GDP每增1% Claude使用增加约0.7% [34] - 企业AI采用率两年内从3.7%升至9.7% 信息行业达25% 住宿餐饮业仅2.5% [66] - 华盛顿特区人均使用全美最高 求职申请相关帮助占比为全美1.84倍 [37][56]
锦秋基金被投公司Sandwich Lab 获千万美元新融资 | Jinqiu Spotlight
锦秋集· 2025-09-16 14:16
投资动态 - 锦秋基金于2024年完成对Sandwich Lab的投资 [1] - 戈壁创投管理的AEF GBA基金及五源资本共同投资Sandwich Lab新一轮融资 累计金额超千万美金 [3][6] 公司概况 - Sandwich Lab成立于2024年 2025年3月推出首款产品AI广告投放Agent Lexi [3][7] - 公司愿景是通过AI帮助企业增长营收 计划推出Email Marketing Agent及财务/税务/法务/供应链/人力资源等多领域Agent [16] 产品与服务 - Lexi定位Meta生态广告投放服务 订阅费每月200美金起 面向全球中小企业主提供全自动广告投放解决方案 [9][10] - 产品采用"影子模式"帮助客户投放广告 用户仅需提供预算和目标范围即可自动完成分析/做图/文案/投放/优化全流程 [10][15] 运营数据 - Lexi上线三个月后付费用户覆盖94个国家 月环比营收增长达150%以上 [3][13] - 目标客群为从未投过广告的海外中小企业主 典型客户年营收约100万美金 [10][12] 战略定位 - 公司采用高价策略验证市场需求 明确"首先要贵"的定价思路 [15] - 聚焦长期经营场景 帮助具备基础营收能力的中小企业突破增长瓶颈 [12][16]