Founder Park - 财报，业绩电话会，研报，新闻

Founder Park

搜索文档

Founder Park· 2025-09-11 07:17

公司背景与动态 - Thinking Machines Lab由OpenAI前CTO Mira Murati于2024年2月成立的人工智能初创公司[2] - 公司推出新博客栏目Connectionism，涵盖从核函数数值计算到提示工程等广泛研究主题[3] - 核心开发者Horace He（前PyTorch核心开发者，Meta离职）加入公司并主导技术研究[8] LLM推理不确定性问题分析 - 大语言模型推理中存在不可复现性，即使温度参数设为0，API仍非确定性[10] - 开源推理库（如vLLM或SGLang）在自有硬件上运行同样存在非确定性问题[11] - 传统假设认为浮点非结合性与并发执行导致不确定性，但未完全解释根本原因[13][16] 不确定性根本原因 - 浮点运算的非结合性导致数值计算差异，但非直接原因[17][21] - 原子加法操作在并发环境下导致运行间不确定性，但LLM前向传播过程通常无需原子加法[26][29][33] - 核心问题在于缺乏批次不变性：核函数输出受batch size变化影响，而服务器负载决定batch size[35][37][40] 批次不变性解决方案 - 实现批次不变性需确保RMSNorm、矩阵乘法和注意力机制与batch size无关[42] - RMSNorm需固定归约顺序，避免因batch size变化改变并行策略[46][50] - 矩阵乘法需编译固定核函数配置，放弃Split-K等优化以保持一致性[56][60] - 注意力机制需处理序列维度和特征维度归约，采用固定拆分大小策略而非动态调度[67][72] 实验验证与性能 - 使用Qwen3-235B模型测试，未优化时1000次采样产生80种不同结果，首次差异出现在第103个token[76][77] - 启用批次不变性核函数后，1000次结果完全一致[78] - 当前未优化版本性能下降，但未出现灾难性性能损失（vLLM默认26秒 vs 确定性版本42秒）[80][81] 应用价值与行业意义 - 确定性推理可实现真正的在策略强化学习，避免训练与推理间数值差异导致的策略偏移[82] - 解决不确定性问题有助于提升科学研究的可复现性和系统可靠性[85] - 公司开源批次不变性核函数库，提供确定性推理示例（GitHub仓库thinking-machines-lab/batch_invariant_ops）[74][75]

LLM推理不确定性

批次不变性

在策略强化学习

Artificial Intelligence

Artificial Intelligence

vLLM

SGLang

Seedream 4.0 来了，AI 图片创业的新机会也来了

Founder Park· 2025-09-11 04:08

AI生图领域技术进展 - AI生图领域连续出现爆款产品包括GPT-4o生成的吉卜力风格图像和Google旗下Nano Banana模型 [2][3][4] - Nano Banana模型具备文生图图生图多图合成高保真文字渲染能力并解决主体一致性问题被媒体称为图片模型的ChatGPT时刻 [4] - 火山引擎推出豆包·图像创作模型Seedream 4.0 支持文本图像组合输入实现多图融合创作参考生图组合生图图像编辑等核心能力 [5] Seedream 4.0技术特性 - 首个支持4K多模态生图的模型支持同时输入10张图片并一次性生成15张图片的高难度多图融合 [5][6] - 实现真正原生多模态支持在同一模型框架下支持图像创作编辑和多图融合生成适配复杂场景 [14] - 支持多图输出能力可根据简单提示生成系列故事分镜 [14] 多图融合与编辑能力 - 多图融合能力允许直接使用图片指导生成如将钢铁侠与布拉德皮特照片结合参考姿势生成破次元壁图像 [10][12] - 支持产品使用场景搭建如将设计好的衣服裤子搭配在给定模特身上查看效果 [16][18] - 精细编辑能力支持自然语言指令精准执行图像局部元素的增删修改和替换 [21][23] - 主体一致性能力在插画 3D和摄影等形态下保持特征一致性避免外观失真和语义错位 [28] 生成质量与商业应用 - 实现秒级出图输出分辨率扩展至4K级别达到商用出版水准 [36][39] - 引入自适应长宽比机制自动识别生成对象结构特征动态调整画布比例杜绝构图畸变 [39] - 支持从品牌Logo自动衍生整套周边产品视觉设计包括包装袋帽子纸盒等 [44][46] - 能够处理公式表格化学结构统计图等复杂排版提升文字渲染和排版精致度 [51][52] 生产力工具特性 - 支持产品说明书设计制作产品包装盒演示图生成以及二维线稿转化为三维手办造型图 [51][54][59] - 能够实现四格漫画一步生成并基于连续生图能力用生成图片作为关键帧 [62][64] - 支持卡通风格多格连环画生成以及带中文步骤说明的教程图生成 [64][66] API接口与创业影响 - Seedream 4.0同时支持图片生成API和流式响应API 支持多轮复杂对话任务 [70] - API接口范式变化允许在同一个对话中进行多轮图片修改和多图合成提升开发效率 [69][76] - 模型能力提升使图片产品可从一次性调用工具升级为带上下文的项目式创作工具 [71] - 对ComfyUI和LoRA产生影响 Comfy更多用于批量重复任务 LoRA用于精细化风格微调 [74]

AI Image Generation

Context Engineering

Artificial Intelligence

Artificial Intelligence

Seedream 4.0

Nano Banana

GPT-4o Image

Granola 为什么能赢：会议笔记，把产品做简单很重要

Founder Park· 2025-09-10 12:16

产品设计理念 - 产品设计核心是为"蜥蜴脑"设计，用户决定记笔记的窗口期只有500毫秒，界面需要极简且侵入性最小[4][9] - 产品在会议中保持"隐形"，不会派机器人加入会议，以实现跨场景通用性[10] - 公司砍掉了50%的功能以保持简洁性，避免功能繁杂破坏产品灵魂[13] - 产品定位为"智能增强记事本"而非"会议记录仪"，坚持不存储音频和视频，仅存储转录文本[11] 技术架构与AI模型策略 - 技术策略是尽快用上市场上最好的第三方模型，直到遇到瓶颈才会考虑自研微调[4][17] - 系统整合了多种AI模型（如OpenAI、Anthropic、谷歌），根据不同功能场景设置默认模型[18] - 公司花费大量精力设计提示词（Prompt），基于用户身份、职业、会议类型等上下文信息生成个性化笔记[20] - 业务中最昂贵的部分是高质量实时转录服务，而非LLM推理成本[24] - 对于复杂查询，公司选择将大量上下文直接塞入模型窗口，而非依赖RAG技术，以提升回答质量[22] 用户获取与增长策略 - 初期聚焦风投人士和创始人群体，认为服务好最难的用户群体就能满足其他角色需求[29] - 增长主要依靠用户主动推荐和笔记链接分享，而非病毒式传播机制[30] - 用户留存高的关键因素是产品有用性结合正确时间的推送提醒，会议场景提供明确使用触发点[32] 市场竞争与产品愿景 - 公司认为AI笔记赛道的头号竞争对手是苹果备忘录，而非其他AI笔记产品[6][36] - 产品愿景是构建"情境感知型工作空间"，会议笔记只是切入点和未来工作方式的垫脚石[35] - 应对竞争的关键是不只看当下产品能力，而是专注于为特定场景和用户打造极致体验[38] - 未来产品方向包括跨会议分析、深度研究模式以及基于上下文库实时生成文档[33] 产品开发方法论 - 产品和设计决策基于直觉，但直觉必须建立在大量用户反馈之上[4][14] - 公司创始人每周进行4-6次用户访谈，团队持续与用户交流以了解真实使用状态[15] - 公司区分"单向门"和"双向门"决策，对于可逆决策快速发布并观察用户反应[9]

从 AI 3D生成转型AI原生影视公司，Utopai Studios想「稍微」改造下好莱坞

Founder Park· 2025-09-10 12:16

公司转型与战略定位 - AI 3D 生成公司 Cybever 于 2022 年创立，近期转型为内容制作公司 Utopai Studios，并获得好莱坞改革派导演及前派拉蒙 CEO 投资 [2] - 公司推出两部 AI 影片计划，包括 100 分钟电影《科尔特斯》和 8 集科幻剧集《太空计划》，后者已预售欧洲市场 [7] - 公司致力于构建端到端影视制作 AI 架构，通过整合 AI 模型与自动化工作流大幅降低制作成本，同时保证质量不妥协 [8] 技术突破与行业挑战 - 当前 AI 视频模型在专业影视制作中存在三大核心技术瓶颈：质量、一致性和可控性 [12] - 通用视频模型为优化效率牺牲画面质量，而 Utopai 专注于服务专业影视创作者，通过减少压缩比例、增加特定训练数据和强化注意力编码机制提升模型质量 [13] - 一致性问题上，公司通过向模型注入带物理规律的 3D 数据，提升对空间、遮挡和碰撞的认知，避免物理世界不一致的幻觉问题 [13][14] - 可控性方面，公司用确定性执行导演意图取代随机"抽卡"模式，通过故事板和 3DPreviz 生成结构化指令，结合强化学习实现精准调整 [14] 市场机遇与内容创新 - AI 技术可能成为下一波内容爆发的催化剂，并催生新的内容类型 [6] - 电影《科尔特斯》基于 40 年前创作的故事，曾获迪士尼和亚马逊关注但未拍摄，融合故事、动作和历史元素 [5] - 技术变革将打破成本壁垒，使电影制作未来不再取决于预算多少，而在于想象力边界 [5] - 文生视频技术使 AI 成为创作核心驱动力，大幅降低创作门槛，为独立创作者和小型团队提供低成本实现宏大视觉表达的机会 [18] 行业生态与制作范式 - 当前 AI 影视领域存在模型与工作流割裂问题，公司采用苹果式"软硬件一体"生态理念，构建数据、模型、工作流与创作者的深度集成闭环系统 [11] - 自动化目标是在行业内实现 80%-90% 工作自动化，但质量永远是优先考量，不会妥协 [9] - 系统设计核心不是取代导演或艺术家，而是将其从工业枷锁中解放，回归创意王座 [15] - 公司追求人与 AI 形成共生进化关系，AI 生成无穷选项，但定义品味的永远是有艺术审美的人 [16][17] 影视制作革命 - 代表电影制作范式的根本性变革，打破成本壁垒和创作思维局限 [5] - 制作成本大幅降低，解放电影人从预算枷锁中，以前所未有速度和极低成本将剧本转化为高质量影像作品 [8] - 技术击穿成本壁垒后，电影项目绿灯决策将更多回归故事本身价值，曾被埋没的创意将迎来最好时代 [18] - 不仅是技术升级，更是创作自由的革命，拆掉想象力栅栏，将电影从"预算的暴政"中解救出来 [18]

没有法律背景、聊了100位律师后开始创业，他搞出了一家7亿美元估值的AI公司

Founder Park· 2025-09-09 12:53

公司概况与融资进展 - 法律科技AI公司Legora在成立不到两年时间内与全球250家律所达成合作包括Cleary Gottlieb和Goodwin等顶级律所[2] - 近期获得8000万美元B轮融资由ICONIQ和General Catalyst领投估值达6.75亿美元[2] - 公司创始人Max Junestrand年仅25岁且无法律背景通过保持谦逊态度与早期合作伙伴建立紧密反馈机制[2] 产品核心功能 - 产品分为网页应用和Word插件两大模块直接集成到Microsoft Word工作环境[4] - 网页应用从简单聊天功能发展为独立智能体能调用内外工具处理多步骤工作流如撰写完整备忘录[4] - 创新表格化审查功能可并行处理10万个查询确保系统稳定性并实现精准引用[7] - Word插件被称作"律师版Cursor" 在有限界面空间内实现复杂编辑功能如按20步策略手册处理合同[8] - 策略手册功能允许用户预设规则库自动检查合同合规性并提供修改建议已从法务团队扩展至销售、合规部门[16][17] 技术架构与创新 - 采用多模型热插拔架构交替使用AWS、Claude、Gemini、GPT和Mistral等模型[31] - 通过分类模型实现查询复杂度与模型能力的动态匹配既控制成本又保证效果[31] - 核心创新在于大规模运行能力而非提示工程能处理超长法律文件中的交叉引用和定义部分[7] - 随着token成本下降可同时执行文件、网络和判例法规的联合搜索并生成备忘录[10] 市场策略与销售模式 - 采用从高层切入的销售策略优先与律所创新部门或合伙人合作而非自下而上推广[19][20] - 通过打造"明星团队"示范效应带动其他部门采纳例如先与单个合伙人合作再扩展至全所[19] - 客户采购周期缩短至1-2年因技术迭代速度加快使长期合同失去吸引力[29] - 定位为律所战略合作伙伴帮助其在AI转型中保持竞争优势而非打价格战[14][39] 行业影响与竞争优势 - AI将法律工作从执行转变为审阅律师角色演变为工作成果的质量管理者[32][33] - 颠覆传统尽职调查模式使原本需要数天的手工审查变为标准服务客户不愿再为简单审阅支付高额费用[11] - 以30人工程师团队在开发速度上超越数千人规模的传统法律科技公司[27] - 关键竞争优势在于"变化率"而非当前功能即快速适应新技术和迭代产品的能力[3][30] 团队建设与招聘策略 - 团队从10人快速增长至100人平均每周入职两人[28][43] - 优先招聘前创始人背景员工因其具备解决问题的主动性和创业精神[45] - 建立多中心架构在纽约、伦敦、斯德哥尔摩设中心并配备本地化团队[44] - 寻求能利用AI实现10倍效率的通才型人才市场团队从30人规模优化至5人[48] 垂直领域创业方法论 - 通过深度行业学习进入垂直领域创始人曾采访100位律师理解行业痛点[22] - 建议避免与AI实验室直接竞争而是专注构建差异化价值[40] - 不应被单一模型供应商绑定需建立可灵活切换模型的技术架构[31][40] - 通过创意性使用模型建立护城河如医疗领域的专业术语转录和法律条款的特殊表述要求[41]

Agent 搭起来了，成本怎么控制？

Founder Park· 2025-09-09 12:53

AI 行业出海与增长策略 - AI 出海企业呈现爆发性产品驱动增长特征绝大多数采用 B2C 或 B2P 模式 [5] - 企业从项目第一天起即高度关注盈利形成"零日即盈利"的清醒思维 [5] - 企业更积极尝试 AI 工具进行广告投放从被动接受转向主动探索 [5] AI 广告投放技术革新 - AI 驱动搜索体验催生新广告形态如谷歌的 AI Overview 和 AI Mode 实现从关键词匹配到用户需求预判的转变 [9] - 传统搜索广告通过 AI MAX 重塑通过理解用户模糊搜索意图实现精准匹配带来更高效率的增量转化 [9] - AI 大幅降低创意素材生产成本竖版视频转横版格式使 ROI 提升 2-3 倍 [9] AI Agent 开发范式转变 - 开发思路从确定性编程转向概率性编排从告诉机器"如何做"转变为让 Agent 理解"做什么" [10] - 需系统性解决三大核心难题：可预测性稳定性与 Day-2 运维（AgentOps） [10] - 通过 ADK A2A 协议 Vertex AI Agent Engine 等工具实现开发部署运维全流程优化 [11] 多智能体协同技术方案 - 通过精心编写 Agent Card 确保总管 Agent 精准选择专家 Agent 需清晰描述能力与技能 [12] - 建立持续评估闭环通过评测集量化任务分发准确率优化 Agent Card 直至达到生产要求 [12] - A2A 协议本质是 Prompt Engineering 最佳实践需以 LLM 最易理解方式描述功能边界 [12] Agent 成本与性能优化 - 采用两步走策略：选择满足业务需求的性价比最高模型投入精细化上下文工程 [13] - 动态构建最简短相关的上下文避免输入冗余信息导致不必要的 Token 消耗和延迟增加 [13][14] - 通过精准检索记忆提取关键工具输出智能摘要历史对话等方式优化上下文构建 [17] 成本控制技术方案 - Cloud Run 可根据实时请求量在几秒内从零扩展到数百上千实例 [20] - 通过"无请求即零成本"模型将 AI Agent 运行成本降至为零 [20] - 利用动态伸缩能力平衡稳定性与成本控制提升 AI 服务弹性 [20] 生产环境 Agent 可靠性保障 - 通过选用先进模型 RAG 联网接地思维链提示等方式约束 LLM 幻觉和非确定性 [16] - 采用 MCP 标准化协议设计重试容错机制建立人类介入回路保障稳定性 [16] - 建立详尽日志与轨迹记录搭建自动化评测体系利用追踪工具实现 Agent 行为监控 [16]

企业、垂类应用都在用 AI 搜索做什么？

Founder Park· 2025-09-09 08:11

AI搜索市场现状 - AI搜索已成为被市场验证的用户需求并成为各类chatbot产品的标配功能[2] - 开源产品接入搜索能力后涌现出意想不到的惊喜使用场景但也出现与过往搜索产品不同的问题[2] - 用户对搜索的理解和使用方式出现新变化因各类chatbot产品都配备了搜索功能[3] 技术提供商格局 - 博查搜索为DeepSeek联网功能提供搜索技术支持在国内市场占据六成份额[4] - 博查搜索主要为AI产品提供搜索引擎技术服务客户包括AiPPT和Dify等知名产品[4] 行业实践案例 - Dify和AiPPT等产品通过博查搜索服务实现AI搜索功能[4] - AI产品接入搜索旨在解决特定问题企业自建AI搜索系统存在难度[7] - 实践案例显示AI搜索能点亮产品的"Aha"时刻创造突破性用户体验[7] 行业交流活动 - 行业将举办线上分享会探讨AI产品如何运用搜索技术[5] - 活动聚焦三大议题：AI搜索解决的问题点自建系统难度评估以及Dify和AiPPT的实践案例分享[9] - 目标参会人群包括AI创业者企业产品技术负责人及AI开发者[9]

Anthropic 断供，国产 Coding 模型的中场战事开启

Founder Park· 2025-09-08 12:30

Anthropic断供事件 - Anthropic于9月5日宣布禁止所有权结构受中国司法管辖区控制的企业使用其服务包括直接或间接持股超过50%的实体[2][3] - 该决定导致中国开发者和企业无法访问全球头部大模型包括全球领先的Coding大模型Claude[4] 国产模型平替Claude的竞争格局 - Claude在Coding市场占据绝对主导地位 Menlo Ventures年度报告显示Anthropic企业用户使用占比32% 超过OpenAI的25%[5] - 国产模型在代码生成能力、上下文长度和Agent工具调用能力上仍存在短板难以全面替代Claude[6][15] - 多家中国科技企业于2024年7-8月密集推出兼容Claude Code的模型：Kimi发布K2并提供完整接入指南[11] 阿里上线Qwen3-Coder并开放每天2000次免费调用[12] 智谱发布GLM-4.5并推出50元包月编程API[13] DeepSeek发布V3.1版本支持Anthropic API协议[14] Kimi的技术进展与战略定位 - Kimi于9月5日发布K2 0905版本在三个方面显著提升能力：编码能力超越Claude Opus 4[17] 上下文长度从128K升级至256K（超过Claude标配200K）[19] Tool Use能力保证100%格式正确并支持WebSearch Tool[19] - 输出速度提升至60-100 Token/s 保障编码流畅体验[20] - 2023年11月上线时即支持20万汉字上下文 2024年3月开启200万字上下文内测[25][26] 2024年6月成为国内首个提供Context Caching API的模型平台[30] - 模型开发专注文本和推理领域核心产品K2定位为专注Agent的非推理模型[34][36] - 通过开源策略吸引开发者生态加速技术创新和模型迭代[41] Agent能力成为行业竞争焦点 - Agentic能力被视为下一代AI核心竞争力要求模型具备自主决策、工具调用和复杂任务处理能力[42][44] - Claude已实现端到端智能任务编排能自主调用工具整合外部知识[44] - DeepSeek下代模型将聚焦Agent 仅需少量提示词即可执行复杂操作并自我进化[43] - 行业竞争从代码能力转向Agent构建与落地定义大模型核心价值[40][45]

光刻机巨头 ASML 领投，砸下 15 亿美元，Mistral AI 现在是「欧洲 AI 之光」了

Founder Park· 2025-09-08 07:30

ASML对Mistral AI的战略投资 - 光刻机巨头ASML斥资15亿美元领投Mistral AI的C轮融资成为其最大股东并获得董事会席位 [2][6] - 本轮融资总额约20亿美元融资后Mistral AI估值达140亿美元成为欧洲最具价值AI公司 [2][3][12] - 该投资被视为欧洲科技主权的战略布局旨在强化欧洲在全球AI和芯片领域的竞争力 [7][36][37] Mistral AI的技术优势与发展历程 - 公司成立仅两年核心团队来自Meta巴黎AI实验室和DeepMind 坚持开源理念 [15][17][19] - 2023年12月开源首个MoE大模型（87GB种子 8x7B架构）后获4.15亿美元融资估值达20亿美元 [25][26] - 开发多款代表性模型包括Mistral Large 2大语言模型、Pixtral多模态家族、Voxtral音频模型等 [32] - 旗下聊天助手Le Chat移动端上线两周下载量超100万次获法国总统马克龙公开支持 [30][31] 双方合作协同效应 - ASML可通过Mistral AI的数据分析与AI能力优化光刻设备性能提升芯片制造精度与效率 [11] - 合作结合Mistral高效AI模型与ASML光刻机制造实力有望在AI和芯片领域找到新突破口 [37] - Mistral AI推出AI基础设施Mistral Compute 覆盖GPU、调度系统及API服务强化底层支持能力 [35] 行业影响与定位 - Mistral AI被视为欧洲唯一能与OpenAI匹敌的AI初创企业技术能力对标ChatGPT [12][13] - 公司通过开源软件共享技术为外部开发者提供快速构建聊天机器人的完整工具链 [15][16] - 发布"氛围编码"应用Mistral Code 与Windsurf、Cursor等现有编码AI工具竞争 [34]

AI 创业，增长也是创始人的必修课

Founder Park· 2025-09-07 02:00

创业公司增长挑战 - 创业公司常高薪聘请有大厂经验的增长负责人但产品处于1.0版本阶段任务成功率低于50% 服务器仅支持数百用户便会宕机[2] - 创始人忙于管理、招聘、融资和第二增长曲线设计缺乏时间深入用户社区沟通和访谈[3][4] - 在AI产品成熟度不足的背景下创始人对用户获取-留存-转化链条认知不足可能导致错误归因[5] 增长研坊活动设计 - 活动于9月20-21日在北京举办采用限人数研坊模式早鸟优惠截至下周二[8][9] - 五位专家均服务过出海企业并操盘明星项目聚焦SEO/GEO实战、红人营销及Discord/Reddit社区运营[11] - 采用分组实战模式每组8人跨背景混搭包含技术、产品、增长、硬件和AI基础设施领域专家[16] - 设置组长引导讨论鼓励携带未解决问题参与强调失败案例的借鉴价值[16][17] 实战内容安排 - SEO环节包含技术审计实操大模型内容生成优化及网站问题分析[13] - 红人营销部分拆解底层逻辑和常见误区分析真实案例[18][44] - 多渠道营销环节设计AI辅助内容生产流程体验实用工具[18] - Discord社区搭建实战演练要求提前安装相关工具[37] 特邀嘉宾案例 - 可以科技的宠物机器人Loona在Kickstarter创消费机器人众筹纪录日本Makuake平台表现突出[21] - 设计类Agent产品Lovart被TheInformation点名以画布设计交互和视频生成能力快速出海[21] - AI眼镜Halliday在Kickstarter上线24小时销售额突破100万美元完成超2000单覆盖101个国家超1万用户[22] 课程内容体系 - 海外市场趋势洞察涵盖2025年市场预测和Reddit运营策略[38] - AI驱动增长策略包括自然流量增长路线图和内容工程化实践[39] - 广告投放策略覆盖北美、欧洲、东南亚、中东、拉美市场机会和三阶段投放方法[45] - GTM阶段多渠道组合策略和新版本发布方法[46] 参与者收益 - 获得可落地增长实操打法建立全员协同作战体系探索小预算渠道验证路径[27] - 通过Open Night开放麦环节自由分享出海经验与教训[19][20] - 链接同行专家资源建立持续解决问题的网络通路[29] 导师团队背景 - Julia Yin拥有10年美国市场增长经验专注SEO和用户转化服务20+中美创业公司[30] - 赵赫专注海外社区运营曾实现40万用户增长并构建ISV体系[31] - Lysa管理千万美元级KOL营销服务近百家科技品牌[32] - 韩宗良服务80%AI客户包括MiniMax、美图、智谱AI等同时为谷歌核心代理商[33] - 叶晨曦Leo运营月发行量6000万的AI Secret Newsletter 服务80多家AI公司包括阿里巴巴、Airtable等[34]