Workflow
锦秋集
icon
搜索文档
锦秋基金臧天宇:2025年AI创投趋势
锦秋集· 2025-05-14 10:02
国内AI投资趋势观察 - 近60%的投资项目分布在应用层 得益于模型智能提升和调用成本下降 应用层迎来显著爆发期 [6] - 底层算力占比超10% 作为AI"能源"是推动模型训练和推理的基础要素 [6] - 具身智能(Physical AI)占比超10% 成为中美共同关注的热点领域 [6] - 2023年投资集中于大语言模型(LLM) 2024-2025年重心转向应用层 [6] 应用层投资细分方向 - Agent方向占比近40% 包括Coding Agent和Vertical Agent(营销/客服/法律/金融等) [8] - 创意工具占比20% 涵盖图像/视频/个性化商品等生成式AI应用 [8] - 内容与情绪消费占比20% 衍生出对话+剧情/游戏化等新内容形态 [8] 算力与具身智能布局 - 算力层关注存算一体/光计算等新架构 以提升推理效能 [9][23] - 具身智能重点投资软硬一体机器人产品 及上游关节/数据服务 [9] 中间层/工具链投资 - 大语言模型安全领域布局 防范提示词注入等新型风险 [10] - 强化学习基础设施投资 支持Vertical Agent持续优化 [10] AI投资核心变量 - 智能提升维度: 从预训练Scaling Law转向后训练优化 进入Test Time Scaling阶段 [14] - 成本下降维度: Token价格从5元/万Token降至0.8元/百万Token 降幅达10倍 [19][20] - 两大趋势叠加催生应用层机会 类比互联网/移动互联网变革 [26][27] 应用层机会框架 - 信息/内容/服务供给极大丰富: 编辑成本趋零/创作成本下降/新内容模态涌现 [30][31][32] - 分发模式进化: 从精准推荐到主动式服务 基于更细粒度用户建模 [34][36] Physical AI发展 - 通用机器人是终极目标 需解决真实数据获取与软硬件协同优化 [39][40] - 模型层进展显著: pi0.5模型验证数据重要性 DYNA-1实现单任务真机部署 [38]
Sam Altman:最具杠杆效应的仍然是重大的算法突破 | Jinqiu Select
锦秋集· 2025-05-13 04:07
核心观点 - OpenAI致力于打造用户首选的AI订阅服务和主要交互入口,构建平台生态系统以赋能开发者和掌握关键用户界面 [5] - 未来AI价值创造将呈现阶段性爆发:2025年聚焦智能体执行工作(编程)、2026年驱动科学发现、2027年大规模进入物理世界(机器人) [5][23] - 语音交互、编程能力、个性化定制是OpenAI三大战略方向,分别对应下一代交互方式、AI与现实世界连接手段及终极服务形态 [5][25][27][30] 市场与平台定位 - 目标成为核心AI订阅入口,构建激发财富创造的平台生态系统,掌握未来智能设备或操作系统级用户界面 [5] - 通过API深度集成推动标准化服务体系,可能催生类似HTTP级别的新协议以实现智能体间工具调用、认证支付等互联功能 [5][12] - 保留API业务的核心逻辑是实现服务融合,让用户通过OpenAI账户跨应用登录并接入ChatGPT界面 [9] 技术演进路径 - API基础设施向深度集成发展,未来或形成统一服务体系支持智能体协作网络 [5] - 算法突破仍是最大杠杆,可能存在10-100倍提升机会,与数据、计算构成三大成功要素 [20] - 多模态交互持续强化,传感器数据输入已通过API实现,未来将更系统化整合物理世界信息 [24] 产品战略方向 **语音交互** - 确定为未来核心交互方式之一,战略目标是开发人类水平语音系统 [5] - 语音+GUI混合模式将催生新设备形态,基础技术成熟后将引发用户行为迁移 [25][26] **编程能力** - 从垂直应用升级为核心战略,使AI从文本输出转向可执行代码生成 [27] - 进化路径:助手→智能体→独立应用程序,通过代码调用API实现现实世界操作 [5][28] **个性化定制** - 理想方案是小模型+万亿级上下文窗口,无需微调即可基于全量个人数据推理 [30] - 当前所有定制化方案均为过渡形态,最终实现跨场景的千人千面服务 [10] 商业化探索历程 - 早期尝试DALL-E后转向对话需求验证,ChatGPT推出验证用户与模型交互的强需求 [7][9] - GPT-3 API初期仅文案写作实现商业化,但Playground对话体验意外成为杀手级应用 [9] - 模型研发成本达十亿美元级,迫使公司寻求商业化路径支撑持续投入 [8] 研发管理方法论 - 保持小团队高密度创新,通过多项目并行避免组织冗余 [15] - 采用"向前工作"策略而非复杂长期规划,专注模型改进与产品迭代 [17][18] - 借鉴历史成功实验室原则,平衡研究人员自主探索与关键项目集中推进 [21] 行业趋势判断 - 大企业面临AI转型困境,决策流程缓慢导致被初创企业颠覆 [35][36] - 代际差异显著:年轻人将ChatGPT作为操作系统/人生顾问,年长者仅视为搜索替代品 [37][38][39] - 学术合作聚焦人文社科领域,通过开放模型访问支持艺术演变、社会偏见等研究 [31][32]
当AI遇上数学:大语言模型如何掀起一场形式化数学的革命? | Deep Talk
锦秋集· 2025-05-12 09:13
核心观点 - 大语言模型(LLM)与形式化数学结合正推动数学领域的范式变革,解决传统人工验证的瓶颈问题 [1][4] - 形式化数学通过严格逻辑和计算机辅助验证提升数学证明的可靠性和效率 [4][7] - 从Theorem Prover向Proof Engineering Agent转型是形式化数学的未来趋势 [11][17] - APE-Bench作为自动化证明工程基准,支持形式化数学的长期动态演进 [12][16] - LLM与形式化方法的结合将催生Certified AI,提升知识生产的可信度和效率 [17] 形式化数学的背景与挑战 - 现代数学证明规模庞大(如300页的开普勒猜想证明),传统人工验证效率低且易出错 [6] - 形式化数学通过公理系统和逻辑语言表达数学内容,借助计算机工具实现自动化验证 [8] - LLM的"幻觉"问题在数学领域尤为突出,需结合形式化方法确保生成内容的逻辑严密性 [6] 形式化定理证明的应用 - 典型案例包括Flyspeck项目(验证开普勒猜想)、液体张量实验(验证凝聚态数学引理)、PFR猜想众包验证 [13] - 形式化方法适用于数学理论证明和软件工程验证,确保逻辑一致性 [9] LLM驱动的最新进展 - AlphaProof在国际数学奥林匹克题目证明中达到银牌水平,DeepSeek-Prover V2在miniF2F基准成功率近90% [10] - LEGO-Prover项目利用LLM构建可复用的数学知识库,推动形式化数学向库级理论构建转型 [10] - 前沿研究探索LLM主动提出数学猜想和发现抽象结构的潜力 [10] Proof Engineering Agent转型 - 当前形式化工具面临人工成本高、协作效率低等问题(如Flyspeck项目耗费数十人年) [11] - 下一代工具需具备自我规划、修复和知识积累能力,支持大规模跨模块协作 [11] APE-Bench的设计与实施 - 分为三个阶段:单文件局部修改(APE-Bench I)、跨文件一致性维护(APE-Bench II)、完全自主Agent模式(APE-Bench III) [19] - 基于真实数学库(如Mathlib4)的历史修改记录,模拟实际Proof Engineering场景 [12] 未来影响与展望 - 数学领域:提升验证效率,推动理论创新和概念探索 [17] - 工业领域:应用于高安全系统(如操作系统内核、智能合约),提升安全性与可靠性 [17] - Certified AI将结合形式化验证与动态学习,成为可信的知识生产伙伴 [17]
给AI创业者的出海指南:45家美国孵化器详细介绍
锦秋集· 2025-05-08 14:35
美国孵化器生态体系 - 美国孵化器类型多样,包括VC-backed型、企业附属型、学术附属型、垂直行业型和混合模型等,具备完善的孵化流程和商业模式,能为创业公司提供资金支持、导师支持、市场资源对接和融资对接等全方位资源支持 [2] - VC-backed型孵化器由风险投资公司主导运营,通过投资入股为早期团队注入资金,凭借VC的投资网络帮助创业企业触达资本市场,但可能导致股权稀释和创始团队自主权让渡 [3] - 企业附属型孵化器由大型科技公司发起,以自身核心资源绑定创新企业构建技术护城河,提供强大技术资源支持但通常不提供现金投资且存在隐性绑定条件 [4][5] - 学术附属型孵化器依托高校或研究机构,提供实验室资源和前沿科研成果,但资金支持有限且商业化周期较长 [6] - 垂直行业型孵化器专注于特定领域如生物科技、清洁能源等,提供专业导师资源和人际网络,但市场空间可能受限 [7] - 混合模型孵化器结合资金、资源共享、市场对接等多种支持形式,资源覆盖面广但行业深度支持可能不足 [8][9] 活跃孵化器筛选标准 - 筛选标准包括成立时间(2000年及之后创立)、地域(硅谷、西雅图和纽约等主要创业生态中心)和投资阶段(专注于种子期或早期阶段风险投资) [10][11] - 最终确定排名前10的机构作为研究对象,深入分析其孵化模式、资源优势及投资策略 [11] 知名孵化器代表 - Y Combinator(YC)是全球最知名的孵化器之一,提供12.5万美元换取7%股权,额外投资37.5万美元基于无估值上限SAFE [17] - Techstars拥有全球加速器项目网络,提供8-12万美金换取6-9.3%股份,录取率仅3% [20] - MassChallenge是全球性非营利加速器,采用零股权模式,提供无股权附加条件的现金奖励 [22][25] - 500 Global以其全球化投资组合和增长营销专长闻名,提供结构化的课程和Workshops [28][30] - SOSV运营多个高度专业化的垂直领域加速器项目,如HAX(硬科技)、IndieBio(生命科学)等 [34][37] 差异化特色孵化器 - AngelPad由前Google高管创建,提供12万美元投资换取7%股权,并为每家初创企业额外提供超过30万美元资源支持 [70][75] - Antler采用"从零开始"模式,帮助有潜力个人寻找联合创始人、验证想法,在全球多个城市提供本地化支持 [73][76] - Neo由Facebook早期投资人创立,提供60万美元无上限SAFE投资,录取率不到2% [77][81] - South Park Commons关注创业者从"-1到0阶段"的过渡,提供40万美元启动资金换取7%股权 [83][86] - HF0 Residency专注于技术型连续创业者,采用12周全日制驻留模式,高强度专注开发 [89][91] 高校与企业孵化器 - Berkeley-SkyDeck为创业公司提供六个月加速计划,标准条款20万美金占7.5% [156][158] - Harvard Innovation Labs设有多个孵化项目,通过竞赛提供高达7.5万美元启动资金 [159][164] - MIT-delta v面向学生企业家,提供高达2万美元无股权资金和每月2000美元生活费 [163][169] - Google for Startups Accelerator提供技术辅导和最高35万美元Google Cloud资源 [183][185] - Microsoft for Startups Founders Hub提供Azure云资源、GitHub和Visual Studio访问,免股权 [189][191] 行业趋势与特点 - 美国孵化器生态呈现多样化类型和成熟孵化模式,能够提供全方位资源支持 [226] - 近年来硅谷VC机构开始设立自己的孵化器,目的是吸引顶尖创始人和团队,反制YC的市场垄断地位 [226] - 行业竞争激烈,孵化器需要有差异化特色和核心竞争力,同时入选孵化器的竞争也非常激烈 [226] - 大多数孵化器专注于创新技术领域如人工智能、SaaS、区块链等,高度重视PMF(产品市场契合度) [228] - 美国孵化器通常拥有全球化资源和网络,能为创业者提供国际市场拓展和全球投资者对接机会 [228]
AI视频生成的Vidu样本:攻坚视频生成核心难题,引领内容生产力变革
锦秋集· 2025-05-06 14:36
多模态AI技术重塑内容创作 - 多模态AI技术正以前所未有的速度重塑内容创作领域,从OpenAI Sora到吉卜力风图片,技术壁垒不断被突破 [1] - 视频生成作为技术难度与应用潜力并存的关键环节,吸引了全球广泛关注,但仍面临一致性、可控性和计算成本等核心挑战 [1] - 生数科技Vidu通过集中资源解决专业用户痛点(一致性、可控性、效率),在动画等领域建立差异化优势 [1] Vidu的核心定位与技术突破 - Vidu定位为"全球领先的AI内容生产平台",优先解决实际工作流中的关键痛点 [1] - 推出"参考生"(Reference to Video)范式,通过给定参考主体+文字驱动演绎,在可控与创意自由间寻求平衡,可能颠覆传统动画制作流程 [2] - 全球首创多主体参考技术及"主体库"功能,解决内容创作的"一致性"问题,确保角色、物体等在连续画面中保持稳定 [3] - Q1版本模型在语义理解、物理规律模拟和清晰度上改进,提升生成过程的"可控性"与结果的"可靠性" [3] 未来AI视频生成的发展趋势 - 行业在成本和速度方面有望实现10到100倍的优化空间 [4] - 未来将催生"实时可交互、高一致性的新内容平台",用户可主动介入、影响内容进程,甚至与其他用户协作共享 [7] - "生成即消费"模式可能改变当前内容平台生态,降低对特定创作者的依赖性,模糊生产与消费的界限 [5] - 2025年多模态内容领域两大趋势:AI视频内容爆发、涌现大量可消费商业化成片内容 [13] Vidu的技术创新与市场策略 - 主体库功能解决内容创作中的"一致性"难题,未来推出共享主体库支持创作者协作甚至共创IP [18] - 与动画协会、北影等机构及全球高校和专业动画工作室深入合作,探索AI剧集等内容形态 [19] - 市场策略是"把长板做到足够长",优先在动画领域做到最好,不追求大而全 [24] - 在广告营销、动画制作等领域,多模态生成技术已能带来3-5倍的效率提升 [23] 多模态技术的未来挑战与突破点 - 核心挑战在于一致性、实时性和可交互性的完美结合,并且需要在一个可负担的成本下实现 [9] - 未来技术突破点包括:持续的成本与速度优化、对物理世界规律更深层次的理解与模拟、真正的多模态融合与完整内容生成 [16] - 纯粹的文生视频应用者不多,"参考生"范式更具潜力 [10] - 多模态生成技术未来可能会把独立的数字人技术"吃掉" [12] 多模态技术的产业机会 - 通过API等方式将技术能力赋能给现有应用和服务,驱动增长和提升用户体验 [26] - 将多模态技术深度融入现有工作流,提升内部的内容生产效率和创意水平 [27] - "内容即服务"市场需求日益增长,技术提供方可扮演连接者和赋能者角色 [27] - AI普及会改变创作模式,"一人即团队"成为可能,深刻影响产业结构 [28]
AI的下一个风口?听前DeepSeek成员辛华剑解读数学推理 | Deep Talk
锦秋集· 2025-05-03 08:51
DeepSeek-Prover-V2-671B模型发布 - 公司发布专注于形式化数学推理的开源大型语言模型DeepSeek-Prover-V2-671B,参数量达6710亿 [1] - 该模型结合LLM泛化能力与形式化工具(如Lean),首次实现自然语言描述到机器可验证证明的大规模端到端转化 [2] - 形式化数学被视为AI"终极挑战",突破可能将数学研究效率提升数倍,并打开金融建模、芯片验证、密码学等高价值商业场景 [2] 大模型开发者活动 - DeepSeek前成员辛华剑将参与"大模型开发者与AI基金合伙人跨洋对谈",分享《大语言模型时代的形式化数学革命》 [2] - 辛华剑为DeepSeek-Prover系列模型开发主导者,现任爱丁堡大学AI博士生及字节跳动研究实习生,专注大模型在数学定理证明的创新应用 [2][4] - 锦秋基金合伙人臧天宇将同期分享2025年AI创投趋势 [3][4] 活动主办方背景 - 锦秋基金专注AI领域投资,在管基金为12年长期基金,59%项目为首次投资,采取多轮追加策略,已投资北美活跃AI基金 [6] - 剑桥中国人工智能协会(CCAIA)致力于链接中国AI产业与海外学界,采用轻量化社群模式促进中英资源流动 [7] - 清华大学学生通用人工智能研究会(THUAGI)以培养下一代通用AI人才为目标,依托清华AI研究院资源 [9] - 清华大学学生创业协会成立于1997年,为全国最早高校创业协会之一,28年来聚焦创业生态培育 [10] 活动流程 - 英国时间15:00/中国时间22:00开始辛华剑主题演讲,随后臧天宇分享AI创投趋势 [8] - 活动含圆桌对谈及观众提问环节,国内通过腾讯会议直播,需通过锦秋基金公众号报名 [5][6][8]
锦秋小饭桌开饭啦!吃饱了,咱们一起改变世界!
锦秋集· 2025-05-01 11:23
锦秋小饭桌活动概述 - 锦秋基金自2月26日起每周五在北京、深圳、上海三地组织创业者闭门饭局 已举办9场 旨在搭建高质量社交场域 [2] - 活动形式摒弃传统PPT演示 强调真诚对话 部分参与创始人后续获得锦秋投资 [3] - 5月9日推出AI Infra限定套餐 包含前沿趋势拆解、实践真知分享及生态资源对接 [5][6] AI应用开发洞察 - 当前AI产品护城河在于品牌心智 数据飞轮闭环尚未形成 [12] - 后训练技术需在PMF验证后实施 垂直领域更易构建差异化壁垒 [12] - 用户行为数据使用趋向端到端 中间过程需结构化处理 [13] AI Coding创业机会 - 创业公司应对大厂竞争策略:聚焦细分市场/快速迭代/打造垂直品牌 [18] - 模型能力面临瓶颈:复杂任务可靠性差 需理论突破而非数据堆砌 [19] - 国内2B市场存在特殊机会 军工/金融等领域基础功能即具价值 [23] Agent领域发展 - Protocol被视为Agent生态关键 需建立标准化互信机制 [30][32] - 垂直Agent更易构建数据闭环 通用Agent需明确任务边界 [36][37] - 硬件创新聚焦交互体验 眼镜品类预计1-2年内达千万量级 [44] 行业落地实践 - 某猎头公司AI系统使人岗匹配效率超越人类专家10% [26] - 餐饮供应链企业通过自研系统实现业务量10倍增长 人员零增加 [26] - 航天企业利用数字化技术大幅缩短发动机研发周期 [26] 硬件创新趋势 - 端侧AI芯片算力非主要瓶颈 200MHZ即可支持基础语音交互 [46] - 儿童AI玩具/情感陪伴硬件/3D打印机呈现显著增长 [45] - 7B模型可部署于消费设备 高阶AI仍需云端支持 [46] 资本市场观察 - 港股科技板块受AI落地预期推动 美股面临政策不确定性 [56] - 大厂加速囤积算力设备 2025年CAPEX预计保持20%+增速 [57] - 保险业被视为AI+金融优先落地场景 [58] 产品策略分析 - 30岁以下用户构成AI聊天产品核心人群 [66] - 模型调性决定用户粘性 训练数据差异化塑造产品特质 [69] - 开源策略有效扩大用户基础 DeepSeek案例显示免费模式优势 [62]
OpenAI揭秘Deep Research实现始末
锦秋集· 2025-04-30 07:09
Deep Research的起源与目标 - OpenAI团队放弃交易型赛道如订汉堡、订花 转而攻克知识整合 认为这是AGI必备前置技能 且"纯读取"比"直接下单"更安全 [3] - 产品愿景是打造"Slack同事式"统一智能体 能自主判断工具调用 保持状态与记忆贯穿始终 [3] - 选择研究型任务而非交易型任务因三方面考量:知识工作需求大 符合AGI科学发现目标 只读任务安全性更可控 [5][6] 开发方法论与数据策略 - 数据质量优先于数量 采用"小而准"策略 邀请专家手工标注高价值样例 强化学习让模型自寻最优策略 [3] - 每新增工具必配套数据集 训练模型调用组合回溯能力 人类专业知识在数据创建中起关键作用 [8][11] - 开发过程经历多次迭代 初期演示版仅用提示工程 后续才引入模型训练与工具开发 团队获数月不受干扰的专注期 [7] 强化学习微调实践 - 强化学习微调(RFT)适用场景:提示工程无效时 或10-15%性能差距对业务至关重要时 [3][9] - 数学编码等专项训练能泛化到写作等领域 但针对性训练效果更优 基因测序等超分布任务需优先考虑RFT [9] - RL算法数据效率高 但高质量数据策划工程量大 需与强大预训练基座模型协同 [12] 智能体架构设计 - 当前工具集包括文本浏览器和Python分析工具 未来将扩展工具集 需同步创建训练数据集 [8] - 记忆功能对复杂任务至关重要 避免用户重复输入 未来需解决长任务上下文窗口耗尽问题 [15][17] - 初期需显式确认建立信任 后期可逐步开放自主操作 安全护栏设置与能力提升需同步 [16] 性能表现与用户场景 - 医学研究和代码搜索等专业领域表现获专家认可 数据分析能力继承自基础模型o3的强大多任务训练 [25][26] - 擅长处理多约束条件查询 如特定商品搜索 能生成超长全面报告 实时信息补充价值显著 [27] - 训练中展现智能规划行为 如自主选择搜索词 但也存在不可预测错误 改进空间大 [28][31] 行业趋势与未来展望 - AGI路径因强化学习复兴更清晰 但需解决工具调用评估 数据精度等挑战 [12] - 未来一年可能推出通用智能体 编码与旅行规划等多任务统一处理 改进速度将超预期 [22] - 终极目标是执行API操作 访问私有数据 形成基础模型与微调能力的正向循环 [23][24]
AI定义汽车,2025汽车大模型技术与产品新趋势
锦秋集· 2025-04-29 14:36
2025上海车展AI大模型趋势 核心观点 - AI大模型成为汽车行业核心焦点 智能驾驶与智能座舱全面渗透 推动汽车软件开发范式变革[2] - 主机厂对Agent应用达成共识 技术落地速度超预期 但实时交互、算力部署等挑战仍存[4][7] - 端云协同架构成为主流 0 9B-8B小模型通过优化实现车规级芯片部署 避免盲目追求大参数量[4][14][15] 技术落地进展与挑战 超预期进展 - 主机厂接纳速度显著加快 2023Q4-2024H1形成明确落地共识 教育成本因全民大模型普及降低[8] - 应用方向聚焦三大领域:智能语音增强(开放域理解)、多模态交互(VLM应用)、端到端智驾(VFM融合)[8] - 生态协同创新加速 车载Agent技术标准快速建立 兼容MCP协议等行业规范[8] 现存挑战 - 算力瓶颈:主流座舱芯片(如高通8295)非为大模型设计 舱驾一体芯片(如8397)需平衡ADAS功能[12] - 数据难题:域集中式架构导致全车数据收集困难 垂直领域数据涉及隐私与高标注成本[11][13] - 实时性问题:推理延迟达300-500ms 幻觉问题与任务执行确定性待解决[7][10] 汽车AI Agent核心能力 产品形态 - GUI Agent突破第三方API限制 支持操作支付宝、导航等9大类APP 实现语音指令闭环[21] - 多模态融合:舱内视觉理解(乘客识别、安全带检测) 舱外环境感知(天气、隧道)[19][35] - 服务模式转型:从"人找服务"到基于场景感知的"服务找人" 实现主动提醒与情感关怀[20][22] 技术架构 - 端侧部署核心大脑 处理高频低延迟任务 云端承担大规模计算与知识更新[37][40] - 分层设计原则:延迟敏感与隐私数据在端侧 复杂计算与生态接入在云端[38][39] - 算力复用策略:利用座舱/智驾芯片空闲算力 停车时调用ADAS算力运行哨兵模式[15][66] 行业实践案例 亿咖通科技 - 构建AIOS全球化系统 集成Auto Agent/Auto Sense/Auto Flow/Auto ECO四大模块[42][75] - Cloudpeak中间件支持模型量化与跨平台部署 实现高通/英伟达/国产芯片适配[42][65] 面壁智能 - 专注0 9B-8B端侧小模型 通过强化学习构建"硅基家人"Agent 实现3K图像毫秒级解析[45][77] - 独创UI Agent架构 突破车机限制完成支付宝操作 结合情感计算提供拟人化服务[77] 未来发展方向 - 中央计算架构普及 推动"舱驾一体"大模型实现座舱与ADAS功能统一[67][69] - AGI技术演进:通过Next Token Prediction实现自主学习 减少人工标注依赖[70] - 交互范式革新:生成式HMI取代传统界面 构建"感知-决策-执行"全闭环体验[69][77]