Workflow
锦秋集
icon
搜索文档
让AI来邀请AI科学家田渊栋博士加入锦秋基金,这事儿靠谱吗?|Jinqiu Scan
锦秋集· 2025-10-23 15:12
文章核心观点 - 文章通过一个具体场景(使用AI模型为顶尖AI科学家田渊栋博士起草邀请信),评测了五款主流大语言模型在正式商务沟通中的表现,旨在探索AI是否能在理解人类情感、价值判断和沟通分寸感方面达到实用水平 [1][2][6][7][8] - 测评结果表明,不同模型在"正式得体"与"人情温度"的平衡上展现出显著差异,其中ChatGPT 5在整体均衡性和专业度上表现最佳,几乎可直接用于实际商务场景 [16][17][18] - 该实验超越了简单的文本生成能力测试,其深层目的在于验证AI在真实、复杂的人类沟通场景中,对目的、语气、逻辑和行动号召的综合理解能力 [42][43] 测评方法 - 测评选取了五款主流大模型:ChatGPT 5、Claude Sonnet 4.5、Gemini 2.5 Pro、通义千问Qwen 3-Max和文心一言4.5 Turbo,以确保在语言风格、逻辑表达与文化语境理解上具备多元对比价值 [10][11] - 测评采用统一的Prompt模板(中英文双语),为模型设定了相同的系统角色(经验丰富的沟通策略专家)和任务目标(起草一封给田渊栋博士的正式邀请信) [11][12][13] - 评估体系包含六个核心维度:个性化程度、价值主张清晰度、建立连接的能力、语气风格、结构完整度以及创造性与自然度 [11][16] 模型测评结果对比 - **ChatGPT 5**:综合表现最佳,在六个维度上得分最均衡(个性化8、价值主张9、连接感8、语气9、结构9、自然度8),其最大优势在于精准拿捏正式邀请所需的语气分寸,结构完整逻辑清晰,生成结果几乎可直接作为正式邀请函使用 [17][18] - **Claude Sonnet 4.5**:在"情感理解"上表现突出,连接感维度得分最高(9分),文字自然流畅、人文感强,对合作路径的阐述更为详实有说服力,但价值主张陈述略保守(7分) [11][17][27] - **Gemini 2.5 Pro**:结构与逻辑链条优秀(结构9分),但连接感与亲和力略弱(7分),行文偏"理工式",在表达情感时显得谨慎保守,使得文本缺乏温度 [17][38] - **通义千问Qwen 3-Max**:中文场景优势明显,语言得体,在各项维度上表现稳定(得分在7-8分之间),但英文版在细节精准度上稍逊 [17] - **文心一言4.5 Turbo**:中文正式公函风格稳定,但模板化明显,个性化与情感驱动较弱(相关维度得分均为7分),英文版本的节奏感和流畅度有待提升 [17][44] 公司战略与定位 - 公司(锦秋基金)是一家专注于推动人工智能通用智能(AGI)发展的双币种早期风险投资机构,其核心战略是将"算力"(核心资源)分配在与顶尖技术研究者、产品人和创业者的深度对话与连接上 [2][15][45] - 公司已建立起广泛的AGI领域投资组合,自2024年7月以来已投资约70家人工智能创新企业,覆盖机器人、多模态基础模型、AI基础设施等多个前沿方向 [42][46][47] - 公司通过"锦秋小饭桌"等常态化闭门活动构建创业者社群,并设立"Soil种子专项计划",旨在持续支持勇于探索边界、定义未来的创造者 [49][55]
AI们给锦秋基金的写稿建议,我们要不要听? | Jinqiu Scan
锦秋集· 2025-10-23 08:40
测评背景与目的 - 锦秋AI实验室使用其公众号"锦秋集"2025年1-9月的真实运营数据,对14款AI数据分析工具进行测评,旨在评估AI工具在实际业务场景中的应用效果[1] - 测评核心关注AI生成的分析报告是否达到交付标准、洞察是否深刻、以及生成速度、易用性、可视化效果等用户体验[2] - 测评设计了两轮提问,模拟真实工作场景中的两种典型需求:简易Prompt测试AI的自主发现能力,详细Prompt测试其专业深度和指令遵循能力[5][7] 测评工具范围 - 测评覆盖14款具有数据分析能力的AI工具,包括Claude Sonnet 4.5、ChatGPT-5、Gemini 2.5 Pro、智谱清言GLM-4.6、Coze、天工超级智能体、腾讯混元、阶跃AI、MiniMax、通义千问、Julius AI、WPS AI、办公小浣熊、Rows AI等[4] 简易Prompt测试结果 - 在简易Prompt测试中,Claude Sonnet 4.5整体逻辑与报告结构最接近人类分析师,能主动提出"品牌背书效应"、"热点关联"等关键因素[12] - WPS AI在中文语境与图表表达上最自然,能识别"人物故事类内容"的高互动与"白皮书素材"的高传播率[12] - MiniMax报告完整、图表丰富,会自动生成月度趋势线,是"慢工出细活"代表[12] - 办公小浣熊排版优雅、表达流畅,可量化涨粉率(研究报告类≈4%),实用且直观[12] 详细Prompt测试结果 - 在详细Prompt测试中,Claude Sonnet 4.5严格按8模块输出,分析精细到标题长度、发布时间段、涨粉来源,并基于相关性得出策略,几乎媲美人工专业报告[17] - MiniMax输出内容同样全面、图表丰富,策略层分析到位,是"分析型研究员"代表[17] - 阶跃AI紧跟结构要求,分析细致,稳定可靠[17] - WPS AI和办公小浣熊能按模块执行到位,但预测分析与模型层实现不足[17] AI工具能力差异与局限性 - 数据质检能力差异显著,部分工具如Claude、Julius、阶跃AI能主动发现数据问题并修复,而Rows AI仅能读取数据结构,无分析能力[19][10] - 中文情感分析能力极不稳定,各工具对同一份评论数据的情感判断结果天差地别,例如WPS AI判断正面评论占比5.10%,而智谱GLM-4判断为68.00%,运营者绝不能依赖单一工具的情感分析做决策[20] - 可视化能力分化,部分工具如MiniMax、WPS AI、办公小浣熊能直接生成图表,而Claude、ChatGPT等则提供代码生成[21] - 用户体验存在差异,Coze和MiniMax生成速度明显偏慢,腾讯混元需要特定Python库增加了使用门槛,国内工具如WPS AI、办公小浣熊在中文界面和图表显示上更友好[21] 对公众号运营的具体建议 - 内容策略应聚焦于"投资动态"(尤其是独家或重磅项目)、"深度研究/资源型内容"以及"内部动态/人物故事"这三类涨粉效果最好的内容[22] - 发布节奏建议采用"周日深度+周中热点/动态"的模式,数据显示周末(尤其是周日)发布深度内容的涨粉效果更佳[23] - 分享裂变是涨粉的核心驱动力,高分享文章的"每次分享带来阅读数"远高于平均水平,建议增加"可截图金句卡片"、"文末分享话题引导"等机制提升内容的社交货币价值[24] - 可通过优化标题(如加入具体数字、强价值承诺)和测试不同推送时间段来提升推送打开率[25] - 用户评论分析显示用户对活动报名、资源获取、内容深度有强烈需求,建议优化活动报名流程、建立资料库,并持续产出高质量深度内容[26]
OpenAI Atlas 深度测评:饼画得很大,但…...|Jinqiu Scan
锦秋集· 2025-10-22 14:21
文章核心观点 - ChatGPT Atlas是OpenAI推出的首款桌面浏览器,标志着公司战略从提供底层AI模型延伸至直接控制用户工作流与Web入口[1] - 该产品旨在成为"真正的超级助理",通过将ChatGPT深度融入浏览体验来实现"理解你的世界并帮助你实现目标"的效果[3] - 当前版本在产品成熟度方面存在明显差距,战略雄心与现实能力之间有不小距离,尤其是在基础体验的打磨上仍处于非常早期阶段[4][5][36][37] 三大核心能力测评总结 即时上下文感知(侧边栏对话) - 官方承诺ChatGPT能够伴随用户 anywhere across the web,并理解用户正在查看的内容[9][10] - 学术论文研读场景测试失败,无法成功读取和理解长篇英文学术论文网页内容,PDF文件同样无法直接交互,需要手动上传文件[12][13] - 信息流网站汇总场景中,仅提取五条概括性内容,覆盖面与深度严重不足,暴露信息抓取和关键点提炼的局限性[15][16] - 跨语言邮件润色场景表现出色,能够准确获取选定文本并完美执行翻译润色指令,生成专业商务英文邮件[17][18] - 页面级广域上下文感知能力初级不可靠,而文本级精确上下文感知能力出色,体现为"作用于选区"的工具而非"理解整个页面"的助理[23] 个性化浏览器记忆 - 官方宣称浏览器记忆功能能让ChatGPT记住用户访问网站的上下文,支持基于长期记忆的复杂指令[19][20] - 求职面试准备场景中生成的大纲内容高度同质化,缺乏对浏览过的具体公司和岗位的深度见解,未能体现浏览历史有效利用[22] - 节日礼品挑选场景能识别"美妆护肤品"大类兴趣,但推荐止步于品类层面,无法给出基于浏览记录的具体品牌或产品建议[25][26] - 记忆功能存在明显"颗粒度"问题,仅能进行关键词级别索引分类,缺乏对内容深层语义和用户潜在意图的理解推理能力[27] - 用户可随时开关记忆、按站点控制权限、清除历史记录,体现设计上的审慎态度[28] 自主智能体模式(Agent Mode) - 该模式面向ChatGPT Plus、Pro和Business订阅用户,旨在将浏览器从被动工具转变为能自主执行多步骤任务的智能助手[29] - 官方描述其强大能力可完成"计划晚宴找到杂货店添加所有食材到购物车并配送到家"等复杂任务[30] - 工作流程包括意图输入、规划与确认、自主执行、用户监督与控制四个标准化步骤[32] - 代表浏览器未来演进方向,即将浏览器从信息呈现工具转变为任务执行平台,是构建核心竞争壁垒的关键[33] - 成功需要三个核心前提:精确的环境感知、深刻的意图理解、稳健的任务规划与执行,但基于前两部分测试,当前实用性存疑[34][39] - 目前更像建立在尚不稳固地基上的宏伟蓝图,成功取决于未来版本对基础感知和理解能力的迭代速度[35]
OpenAI发布AI浏览器Atlas,我们要开启AI版“上网冲浪”时代了吗?|Jinqiu Select
锦秋集· 2025-10-22 04:30
AI浏览器行业动态 - Perplexity AI推出基于Chromium架构的AI浏览器Comet,默认集成其搜索引擎,已于2025年7月上线[1] - Atlassian以约6.1亿美元收购AI浏览器产品Dia的公司The Browser Company,强化AI浏览器领域布局[1] - OpenAI正式发布以ChatGPT为核心构建的智能浏览器ChatGPT Atlas,主打"网页陪伴"功能,用户可在任何网页唤出侧边栏获取上下文感知协助[1] ChatGPT Atlas核心功能 - 引入"浏览器记忆"功能,可记住用户访问的网页内容与任务进度,未来自动调取相关信息提升工作效率[3] - 支持"Agent模式",使ChatGPT能在网页上自动执行检索资料、规划会议等复杂任务,该模式面向Plus、Pro与Business用户开放预览[3] - 实现浏览器从被动工具向主动伙伴的转变,支持在当前窗口直接处理任务[1] 浏览器行业发展历程 - 1993年Mosaic浏览器通过图文混排能力首次让普通人直观浏览互联网,点燃公众热情[9] - 1994年网景通信公司推出Netscape Navigator,引入JavaScript和SSL安全协议,一度占据近九成市场份额[10] - 微软通过Windows操作系统深度捆绑Internet Explorer,执行"拥抱、扩展、消灭"策略,最终导致网景被AOL收购[11][13] - 2004年Mozilla基金会发布Firefox 1.0,以开放、标准、安全和可定制性为旗帜,推动Web标准回归[17] - 2008年Google推出Chrome浏览器,以惊人速度、简洁界面和沙箱安全架构迅速征服用户,市场份额长期稳定在六成以上[18] 当前浏览器市场格局 - Google Chrome全球市场份额达66.6%,覆盖超过36.9亿用户,在桌面端占65.67%,移动端占67.67%[30][33] - Safari以18.01%的全球份额位居第二,拥有约10亿用户,其成功高度依赖苹果硬件生态系统[34] - Edge全球份额5.23%,拥有约2.92亿用户,桌面端表现亮眼达13.77%,自2020年以来从1.45%持续增长至5.23%[36] - Firefox全球份额仅剩2.57%,约1.42亿用户,较2009年高峰期的32%大幅下滑,移动端份额仅0.53%[37] 区域市场特征 - 中国市场Chrome份额45.12%,未形成绝对统治,UC Browser和360安全浏览器分别占据7.42%和5.67%份额[51] - 印度市场Chrome份额高达89.34%,其他浏览器份额可忽略不计[51] - 美国市场Chrome占52.91%,Safari占31.22%,展现苹果在美国市场的强大号召力[51] AI浏览器的战略意义 - AI正扮演类似图形界面、V8引擎的革命性角色,使浏览器从信息检索通道转变为具备行动能力的通用执行平台[55][60] - 美国司法部提出"让Google出售Chrome"为行业带来变数,OpenAI公开表态有意接盘,认为这是展示"AI优先浏览器"的机会[61] - 掌控AI浏览器意味着抢夺下一代互联网入口控制权,可构建生态闭环战略支点,开辟智能广告投放、付费订阅等创新商业模式[65][68][69] 浏览器行业成功要素 - 技术创新是市场格局变化突破口,从Mosaic的内联图片到Chrome的V8引擎,每次技术质变都带来市场机会[47][48] - 分销渠道决定用户规模,IE借助Windows捆绑、Chrome依托Google生态、Safari凭借iOS默认安装都证明渠道控制力的重要性[49][50] - 用户体验是成功核心,无论技术多先进,用户选择最终由浏览器是否直观易用、界面简洁高效决定[52][53]
锦秋小饭桌x地瓜精酿馆第二弹|“技术的胜负,不在实验室,而在用户手里”
锦秋集· 2025-10-21 13:13
活动概况 - 锦秋小饭桌与地瓜精酿馆在深圳联合举办机器人主题派对,集结了40余位硬件资深玩家[1] - 活动参与方包括地瓜机器人多位副总裁、锦秋基金合伙人及投资副总裁、深圳模力营AI生态社区运营负责人以及40余位硬件创业者和技术专家[3][6][8] - 活动形式包括开麦环节展示项目背景与需求,以及烧烤露营局下的实战经验交流[8][11] 关于场景与产品 - 通用机器人适用于泛化通用场景,用于高度专用工厂将面临逻辑冲突与性价比低的问题,硬件可专用但软件智能必须坚持通用与泛化[15] - 场景选择应务实切入当下可验证的刚性痛点,而非追逐热门但泛化复杂的场景[16] - 情感型产品可围绕人类被倾听、被理解、持续连接的社交需求展开,结合游戏化机制提升留存[16] - 产品胜负关键在于是谁先创造净价值,用户需要最合适的产品而非最强技术[16] - 陪伴是达成沟通与信息获取的手段,不能作为结果型目标[17] - 产品需有清晰价值锚点,即明确的用户痛点和解决方案,才是产生依赖与付费意愿的基础[18] - 交互设计分为弱交互强治愈(通过体感触感等物理互动)和强认知交互(通过聊天深度理解用户)两类价值[18] - 模型人设需稳定且有边界,保持角色一致性并设定最小可行的文化与伦理边界[19] - 产品粘性源于有效帮助与低成本,记忆功能、IP形象、低使用门槛和可见进步比单纯陪聊更能提升留存[20] 关于创业经验 - 硬件创业应先判定真实需求与约束,再选择技术与方案,避免自嗨式研发[21] - 需要在性能、成本、稳定性之间面向场景做恰到好处的取舍和平衡[22] - 应让用户先使用产品,基于真实数据持续优化,比闭门造车更有效[23] - 发展应分阶段推进:短期抓可落地与情绪价值,中期聚焦刚需子场景,长期走向通用[24] - 供应链应采用国产MCU/驱动/AI模组建立备份方案,防范地缘与短缺风险[25] 关于量产与出海 - 量产之路应拥抱复杂性,通过降低系统复杂度来减少风险[26] - 需从必须解决什么这一单一核心痛点与可量化收益出发,否则后续环节会失控[27] - 应用最小可卖版本验证场景与付费意愿,POC阶段就把样机推向用户,设数据闸门及时调整[28] - 团队搭建要软硬一体,组建跨界团队,明确创始人边界[29] - 避免过度定制导致不可规模化,用模块化/软配置降低SKU复杂度[29] - 坚持市场数据优先,用事实而非情绪决策,在工程化前彻底解决前端问题[29] - 采用阶梯式投资,越往后越要敢否决,每个阶段保留否决权,用小钱买真相[29] - 把合规、关键器件、核心KPI等致命风险前置暴露,设立严格放行条件[30] - 众筹是消费电子出海热启动的高杠杆入口,需在三个月内聚合投放、内容、社群、口碑与公关[31] - 出海要和用户玩在一起,通过KOL与核心爱好者深度共创内容,让真实使用场景反哺营销[31] - 众筹是信任决定转化的期货生意,需用透明沟通、工程师背书与可验证信息建立强信任[32] - 众筹后应通过全球社群活动与UGC挑战,将初期热度转化为长期品牌资产,实现持续销售[32] 参与机构背景 - 锦秋基金是一家12年期的AI Fund,以长期主义为核心投资理念,寻找具有突破性技术和创新商业模式的通用人工智能初创企业[35] - 锦秋小饭桌是锦秋基金为创业者打造的常态化闭门社交活动,每周五晚在多地举办,聚集优秀创业者、技术大牛和产品创新者进行干货分享[36] - 地瓜机器人是业界领先的机器人软硬件通用底座提供商,提供5~128 TOPs多层级的智能计算平台,覆盖多种机器人场景,拥有超过200家中小创客、200+头部高校、近100,000名个人开发者[37] - 地心引力计划是地瓜机器人为创业公司打造的全球生态创新项目,采用免费会员制,已联合近40家机构,赋能200余家机器人创业公司[38]
锦秋基金领投企业Manifold AI流形空间连获两轮共亿元融资,打造下一代具身智能世界模型|Jinqiu Spotlight
锦秋集· 2025-10-20 12:18
投资事件 - 锦秋基金已完成对Manifold AI(流形空间)的投资 [2] - 锦秋基金是一家12年期的AI Fund,以长期主义为核心投资理念,专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [3] - Manifold AI近期的天使轮融资由锦秋基金领投,同创伟业、英诺天使基金跟投,种子轮由英诺天使基金领投、水木清华校友种子基金跟投,两轮融资共亿元,资金将用于下一代具身世界模型的训练与场景落地 [4] 公司技术与定位 - Manifold AI聚焦世界模型与具身智能,原创的具身世界模型技术旨在推动机器人大脑的规模化落地 [6] - 公司提出WorldScape具身基座世界模型方案,具备Reasoning-Dreaming-Acting三位一体能力,利用海量第一人称视角视频数据进行预训练,有望实现物理空间智能涌现 [10] - 预训练模型能力的提升使得绑定本体的动作映射只需极少量In Context Learning数据即可实现,大幅降低部署成本 [10] - 其技术孵化自清华大学电子系未来智能实验室,是世界范围内首个全域布局室外、室内、空域具身世界模型的团队,相关工作DriveScape、RoboScape、AirScape已发表于CVPR2025、NeurIPS2025、ACM MM2025等顶级会议 [10] - Manifold AI已率先接入NVIDIA Jetson Thor开发者套件用于具身世界模型的本体部署 [12] 行业背景与趋势 - 通用机器人面临本体多、数据少、应用分散的落地困局,基于视觉-语言-动作模型的方案存在预训练精度低、需大量本体数据进行模仿学习的问题 [6] - 海外如Tesla Optimus、Figure AI团队已转向使用海量第一人称视角视频数据的技术路线,从第一性原理出发模拟人类学习过程 [6] - 世界模型技术被视为本质解法,可使互联网上所有第一人称视角视频数据成为机器人学习素材,达到类GPT预训练范式所需规模 [7] - 近期行业进展包括OpenAI发布Sora2视频生成模型周活跃用户达8亿,Google发布Genie3世界模型将物理一致上下文视频窗口拉长至分钟级别,李飞飞World Labs发布RTFM世界模型实现单图实时生成可持久化交互3D空间,NVIDIA Cosmos和Meta V-JEPA2世界模型也在具身场景取得突破 [7] - 世界模型路线能撬动更多网络视频和人类训练数据,具有更大规模化潜力,其时空预测能力驱动交互更符合人类物理直觉 [16] 团队背景 - 创始人兼CEO武伟博士为前商汤科技高管,2015年加入商汤初创,有数百人团队管理经验,曾主导商汤开悟世界模型的研发和落地 [13] - 联合发起人包括清华大学教授、教育部长江学者,在AI模拟和世界模型方向早期整体布局,发表过包括十余篇Nature子刊在内的数百篇学术论文 [15] - 另一位联合发起人为清华大学信息学院助理教授,15岁考入清华,多次入选全球前2%顶尖科学家 [15] - 核心团队成员毕业于清华、北大、上交、港中大、UCLA等高校,曾在快手、Momenta、商汤等企业构建过超千万级用户的AI产品,具备机器人与大模型双重背景 [12] - 团队融合智驾产业落地经验和清华前沿实验室技术资源,是国内探索世界模型方向的先锋 [16]
锦秋基金被投企业宇树科技发布第四款人形机器人H2,机器人“天命觉醒”
锦秋集· 2025-10-20 09:26
投资动态 - 锦秋基金已完成对宇树科技的投资[3] - 锦秋基金作为12年期的AI Fund,以长期主义为核心投资理念,专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业[4] 产品发布与性能参数 - 宇树科技发布第四款人形机器人H2,身高180厘米,重量70公斤[5][8] - H2与前代H1相比在运动流畅性和仿生特征方面有显著升级[5][8] - H2关节总数达到31个,较今年7月发布的R1(26个关节)提升约19%[10] - 关节分布:双臂各6个关节共12个,双腿各7个关节共14个,躯干3个关节,另有2个未公开用途功能关节[12] - H1重量约47公斤,H2重量约70公斤,BMI为21.6[8][9] - H1最大速度3.3米/秒,H2动作更流畅灵活但未明确具体速度[9] - H2配备仿生人脸,动作细节更丰富,能完成舞蹈和功夫等复杂动作[9][15][16] 技术突破与应用前景 - H2的关节控制与平衡算法经过优化,能承载70公斤重量并实现多样化动作[25] - 应用场景扩展至工业自动化巡检、仓储搬运,以及娱乐演示和陪伴服务[27] - 机器人可替代人类在危险或封闭空间完成任务,提供更人性化的无障碍服务[27] - 中国智能机器人相关企业平均增长率达50%-100%[27] - 宇树科技产品线包括2023年8月发售的H1(全尺寸人形)、去年5月发售的G1、今年7月发布的R1(入门消费级)[23]
Andrej Karpathy :AI 智能体的十年战争、强化学习的困境与“数字幽灵”的觉醒
锦秋集· 2025-10-20 07:00
智能体发展时间框架 - 当前业界普遍认为今年是"智能体元年",但Andrej Karpathy判断这是"智能体的十年",意味着智能体的成熟将是一个长达十年的渐进过程,而非短期内突然爆发[6][7] - 智能体要成为真正的"数字同事"尚需约十年时间,因其核心能力模块尚未整合完备[8][9] 智能体缺失的关键能力模块 - 实现真正可用的智能体还缺失四个关键模块:多模态感知、记忆系统、持续学习与行动接口[1] - 具体缺失的能力包括:多模态能力(理解图片、视频、操作界面)、计算机使用能力(用鼠标、键盘或API操作数字世界)、持续学习(记住历史信息而非每次从零开始)、更强的认知能力(规划、上下文管理、长期目标追踪)[15] AI发展史上的关键转折点 - AI领域过去十五年经历了三次范式转折:深度学习崛起(AlexNet时代代表的感知革命)、强化学习与游戏兴起(行动革命)、大语言模型出现(表征革命)[11][12][13][14] - 真正的技术"实用化"总是比"概念提出"晚五到十年,智能体的演化不会例外[11] 强化学习的根本缺陷与改进方向 - 强化学习在实践中存在信息稀疏问题,其本质是把监督信号吸进一根吸管里,从长行为序列中只获取最后一点反馈,导致高噪声、低效率、极难稳定[20] - 人类基本不用强化学习,而是依赖反思与推理过程,形成过程监督而非仅看最终结果[21] - 未来强化学习的改进方向包括:细粒度奖励(每个阶段提供反馈)、多维度打分(评估效率、优雅度、可解释性)、自我评估循环(模型能自己复盘、修正、再训练)[47][48][49] 从模仿学习到反思学习的演进 - AI学习模式的演进路径为:从模仿学习(模型模仿人类对话风格)到强化学习(RLHF,结合模仿与奖励),下一步是让模型学会自我反思[23][24] - 模型需要具备"反思与回顾"结构,甚至类似"睡眠"的机制,将临时经验蒸馏进权重,但目前这些还停留在论文级别实验,尚未在真正的大模型规模上跑通[24][25] AI编程的现状与瓶颈 - AI辅助编程工具(如Copilot或GPT)目前作用有限,在独创系统或研究型代码编写上几乎帮不上忙,其最实用模式是半自动补全(程序员控制结构,模型辅助局部实现)[31][35][36][39] - 模型在创新结构上几乎无能,它擅长复刻常见模板,但理解不了新结构,容易自以为懂并建议不必要的API,导致代码臃肿复杂[38] - 编程的进化可视为一个"自主滑杆"的缓慢推进,AI持续压缩低价值劳动空间,但真正的架构与理解仍靠人类,未来编程可能演化为一种"思维交互"[41][42][43] 人类学习与AI训练的根本差异 - 人类学习是开放系统,具备多层次学习机制(内置硬件、社会化学习、反思梦境和创造再训练),而AI模型是一次性训练形成的封闭系统,不会真正持续更新认知[51] - 人类通过遗忘保持创造力优势,而AI记忆力太好反而妨碍泛化,未来可能需要让模型"学会遗忘"[28] AI的未来角色与社会影响 - AI的角色是"认知合作者",未来最现实的是一种共生关系:AI负责探索空间庞大、重复性高的任务,人类负责定义目标、做价值判断[52] - 未来社会分工会越来越像"混合认知体",每个个体由一个人加一组AI代理组成,像拥有个人操作系统一样协同工作[53] - 下一个十年是从"召唤幽灵"到"驯化幽灵"的阶段,需要建立社会层面的规则、价值观、使用边界,确保AI安全、可靠、合作、可信[54][55]
来锦秋,实际上手体验机器人遥操!
锦秋集· 2025-10-16 11:34
文章核心观点 - 遥操作技术是具身智能领域的核心技术 深度融合人机互动、数据收集与机器人学习[1] - 星尘智能将于2025年10月17日在北京举办沟通会 展示其基于遥操作技术的软硬件一体平台及新品[6][10] - 活动旨在提供深度体验 展示机器人如何通过遥操作进行模仿学习和强化学习 以加速行业应用与商业化落地[10][11] 遥操作技术的重要性 - 遥操作技术帮助机器人掌握模仿学习 通过模拟人类操作模式快速掌握新任务技能[2] - 遥操作系统为机器人强化学习提供丰富场景 使机器人能根据环境反馈自动调整和优化行为策略 提升自主决策能力[2] 星尘智能公司背景 - 星尘智能是绳驱AI机器人的定义者 业界首个量产绳驱AI机器人的公司[8] - 公司独特的绳驱传动设计模仿人类肌腱的运动与力控方式 使机器人能兼顾高表现力与高安全性 适合复杂灵巧操作和人机交互场景[8] - 其Astribot S1机器人已在科研、商业服务、文娱演出及工业等多个领域落地应用 结合AI大模型推动行业商业化[8] - 锦秋基金于2024年领投公司A轮融资 并于2025年继续追投A+轮融资[7] 沟通会核心亮点 - 活动将系统解析星尘智能"本体-数据-模型"技术闭环 包括绳驱传动本体性能优势、遥操作数据采集价值及DuoCore具身智能模型的快慢协同与元技能迁移能力[12] - 现场将首发两款新品:超远程遥操作系统支持第一人称精准操控和第三人称高动态控制双模式 传输延迟低且适配全人群 商业化半身产品则聚焦场景化需求以降低应用门槛[14] - 活动将提前披露公司参加国际顶级机器人会议IROS的计划 包括技术成果展示和行业观点分享[14] - 现场展示机器人如何在人类互动中收集反馈并优化行为 以及在复杂环境中执行任务并快速自我调整的能力[11]
当美国AI基建大跃进引发泡沫讨论,中国创业者该如何看?
锦秋集· 2025-10-15 15:58
AI基建投资热潮 - AI、资本、能源与地理以前所未有的方式被重新绑定,引发美国股市狂欢与增长[1][2] - 市场出现类似2000年光纤时代的特征:股价暴涨、土地升温、电力短缺,分析师开始讨论AI基建是否成为新泡沫[2] - 全球AI基建热潮可能代表AI"工业化"的起点,但也意味着不可预知的风险,中国早期AI创业者应冷静看清周期[5] 主要合作与投资动态 - OpenAI与NVIDIA计划部署10千兆瓦级系统,NVIDIA可能向OpenAI投资高达1000亿美元[8] - OpenAI联手Oracle、软银在全球新增五个AI数据中心,价值5000亿美元、容量10千兆瓦[8] - OpenAI"Stargate"计划吸引三星与SK集团加入,两家公司提供高带宽内存及半导体技术支持[8] - OpenAI与AMD达成战略合作部署6吉瓦算力规模GPU,AMD出让10%股权,协议价值超600亿美元[8][17] - OpenAI与博通合作部署10吉瓦规模自研AI加速器,博通承担芯片制造与封装工作[8] - OpenAI发布新五年规划,试图兑现累计1万亿美元投资承诺[8] - 贝莱德、Nvidia、xAI和微软组成的财团以400亿美元收购德克萨斯州Aligned数据中心[8] - CoreWeave和Poolside计划在德州建立500英亩天然气动力数据中心,Poolside以140亿美元估值融资20亿美元[8] - 英国云提供商Nscale与微软签署140亿美元协议,在德州部署10.4万块Nvidia GB300芯片,在葡萄牙部署12,600个GPU[8] 行业风险分析框架 - 最高风险集中在"全力押注者"(第一象限),尤其是CoreWeave和xAI SPV债务工具,这些实体90%-100%依赖AI行业繁荣,若市场波动可能在12-24个月内面临重大倒闭风险[15] - OpenAI存在"被迫重组"可能性,但凭借"大而不倒"地位仍能获得持续资金支持[15] - 微软、亚马逊等超大规模科技企业处于"堡垒阵营",对AI企业投资相较于自身现金流规模较小,且投资往往以云服务收入形式回流(循环融资)[15] - NVIDIA虽财务属"堡垒阵营",但存在系统性风险,被归为"发牌者",收入高度依赖AI行业繁荣,对客户1000亿美元股权投资意味着若客户倒闭将同时面临收入损失和股权缩水[15] - AMD等企业进行"生死押注",虽目前属投资级,但一次重大AI业务失败(如MI450芯片项目失利)就可能使信用评级从投资级降至垃圾级[15] 关键交易分析 - AMD为获得OpenAI的GPU采购承诺出让10%股权,这是CEO Lisa Su的重大冒险,因过去2.5年NVIDIA几乎占据AI数据中心增量收入的100%[22] - 预计今年NVIDIA营收将是AMD的10倍(NVIDIA 2100-2300亿美元 vs AMD 330亿美元)[22] - NVIDIA成功得益于整合软件、网络和代码设计的生态系统,现在算力单位已是整个数据中心而非单一芯片[22] - 若MI450芯片性能达标,AMD仅从OpenAI就可能获得1500亿美元增量收入,但该芯片能否与NVIDIA竞争"远未可知"[22] - AMD股价大幅上涨意味着OpenAI可能"近乎免费"获得大量GPU[22] - 每瓦性能是关键竞争因素,即便竞争对手芯片定价为零,超大规模企业仍会选择NVIDIA,因电力是当前稀缺资源[22] 市场需求与规模争议 - 算力需求未来将"极为庞大",未发明的新应用将推动需求增长,类似早期互联网基础设施催生社交网络和视频服务[22] - 杰文斯悖论适用:随着每token成本下降,AI将在更多效率低下场景中得到应用,进一步推高需求[22] - 与互联网泡沫时期光纤闲置不同,"如今全球不存在闲置的GPU",表明当前GPU供应能被需求即时消化[22] - 每个吉瓦规模数据中心需要约500亿美元投资(包括芯片、土地、电力和建筑设施)[30] - OpenAI、Elon Musk旗下企业正计划将数据中心规模扩大至10吉瓦,意味着单个数据中心投资规模可能达5000亿美元[30] - 若资本支出达数万亿美元,在硬件使用寿命(约20年)内,运营支出可能高达"数十万亿美元"[30] 供应链与能源制约 - 制约AI行业增长的不是制造下一代芯片的能力,而是能源投入和原材料投入[23] - 掌控关键供应链要素(如电力和特定组件)的企业将崛起并占据主导地位[23] - OpenAI与存储芯片制造商达成协议锁定了高带宽内存未来产能,使得Sam Altman能够"分配产能配额"并借此获得"收益分成"[23] - 对"电力"的掌控使供应商摆脱线性、低利润角色,开始要求获得AI企业股权增值收益[30] 循环交易争议 - "循环交易"指供应商向买方提供信贷或进行股权投资,买方再利用这些资金购买该供应商硬件的财务安排[25] - 此类交易在许多其他行业中是"标准操作且被广泛接受",如汽车OEM向经销商提供"库存贷款"[31] - 从合规角度(符合GAAP、证券法)来看,这些企业的操作是"合规的",有专业顾问团队且必须遵守Sarbanes-Oxley法案[31] - 核心担忧是英伟达实际上在向买方提供信贷支持,关键问题在于交易是否具有"经济实质"[27][31] - 与英伟达2025-2027年将产生的4500亿美元现金流相比,其当前对各企业的投资"微不足道",这些"小额股权投资"为行业生态系统提供润滑[31] - 相互关联的投资很常见,只要"产品存在终端需求"就具备合理性,AI行业并不缺乏需求[31] 财务可持续性质疑 - OpenAI预计2025年营收127亿美元,但若保持当前支出比例将产生286亿美元成本,净亏损约159亿美元[100] - OpenAI估值5000亿美元对应39.4倍营收倍数,而微软为12.7倍,谷歌为6.2倍[101] - OpenAI需实现394亿美元年营收才能以微软倍数验证5000亿美元估值合理性,当前存在267亿美元营收差距[101] - OpenAI预计要到2029年才能实现现金流为正,2025-2029年现金消耗累计估计为1150亿美元[105] - 要实现1250亿美元营收目标,需要5.21亿付费用户(按每月20美元计算),而当前ChatGPT付费用户仅1000万-1500万[104][106] - OpenAI毛利率为-125%,而传统SaaS企业毛利率为70%-80%[108][110] - 2025年上半年美国GDP增长的96%来自AI相关资本支出,若支出停止经济增长将接近衰退水平[122] - 无新增融资情况下,OpenAI现金仅能维持约12个月,需在2026年前筹集300亿-500亿美元才能维持运营[126]