Workflow
Founder Park
icon
搜索文档
Mira Murati 创业公司首发长文,尝试解决 LLM 推理的不确定性难题
Founder Park· 2025-09-11 07:17
公司背景与动态 - Thinking Machines Lab由OpenAI前CTO Mira Murati于2024年2月成立的人工智能初创公司[2] - 公司推出新博客栏目Connectionism,涵盖从核函数数值计算到提示工程等广泛研究主题[3] - 核心开发者Horace He(前PyTorch核心开发者,Meta离职)加入公司并主导技术研究[8] LLM推理不确定性问题分析 - 大语言模型推理中存在不可复现性,即使温度参数设为0,API仍非确定性[10] - 开源推理库(如vLLM或SGLang)在自有硬件上运行同样存在非确定性问题[11] - 传统假设认为浮点非结合性与并发执行导致不确定性,但未完全解释根本原因[13][16] 不确定性根本原因 - 浮点运算的非结合性导致数值计算差异,但非直接原因[17][21] - 原子加法操作在并发环境下导致运行间不确定性,但LLM前向传播过程通常无需原子加法[26][29][33] - 核心问题在于缺乏批次不变性:核函数输出受batch size变化影响,而服务器负载决定batch size[35][37][40] 批次不变性解决方案 - 实现批次不变性需确保RMSNorm、矩阵乘法和注意力机制与batch size无关[42] - RMSNorm需固定归约顺序,避免因batch size变化改变并行策略[46][50] - 矩阵乘法需编译固定核函数配置,放弃Split-K等优化以保持一致性[56][60] - 注意力机制需处理序列维度和特征维度归约,采用固定拆分大小策略而非动态调度[67][72] 实验验证与性能 - 使用Qwen3-235B模型测试,未优化时1000次采样产生80种不同结果,首次差异出现在第103个token[76][77] - 启用批次不变性核函数后,1000次结果完全一致[78] - 当前未优化版本性能下降,但未出现灾难性性能损失(vLLM默认26秒 vs 确定性版本42秒)[80][81] 应用价值与行业意义 - 确定性推理可实现真正的在策略强化学习,避免训练与推理间数值差异导致的策略偏移[82] - 解决不确定性问题有助于提升科学研究的可复现性和系统可靠性[85] - 公司开源批次不变性核函数库,提供确定性推理示例(GitHub仓库thinking-machines-lab/batch_invariant_ops)[74][75]
Seedream 4.0 来了,AI 图片创业的新机会也来了
Founder Park· 2025-09-11 04:08
AI生图领域技术进展 - AI生图领域连续出现爆款产品 包括GPT-4o生成的吉卜力风格图像和Google旗下Nano Banana模型 [2][3][4] - Nano Banana模型具备文生图 图生图 多图合成 高保真文字渲染能力 并解决主体一致性问题 被媒体称为图片模型的ChatGPT时刻 [4] - 火山引擎推出豆包·图像创作模型Seedream 4.0 支持文本图像组合输入 实现多图融合创作 参考生图 组合生图 图像编辑等核心能力 [5] Seedream 4.0技术特性 - 首个支持4K多模态生图的模型 支持同时输入10张图片并一次性生成15张图片的高难度多图融合 [5][6] - 实现真正原生多模态支持 在同一模型框架下支持图像创作 编辑和多图融合生成 适配复杂场景 [14] - 支持多图输出能力 可根据简单提示生成系列故事分镜 [14] 多图融合与编辑能力 - 多图融合能力允许直接使用图片指导生成 如将钢铁侠与布拉德皮特照片结合参考姿势生成破次元壁图像 [10][12] - 支持产品使用场景搭建 如将设计好的衣服裤子搭配在给定模特身上查看效果 [16][18] - 精细编辑能力支持自然语言指令 精准执行图像局部元素的增删修改和替换 [21][23] - 主体一致性能力在插画 3D和摄影等形态下保持特征一致性 避免外观失真和语义错位 [28] 生成质量与商业应用 - 实现秒级出图 输出分辨率扩展至4K级别 达到商用出版水准 [36][39] - 引入自适应长宽比机制 自动识别生成对象结构特征 动态调整画布比例 杜绝构图畸变 [39] - 支持从品牌Logo自动衍生整套周边产品视觉设计 包括包装袋 帽子 纸盒等 [44][46] - 能够处理公式 表格 化学结构 统计图等复杂排版 提升文字渲染和排版精致度 [51][52] 生产力工具特性 - 支持产品说明书设计制作 产品包装盒演示图生成 以及二维线稿转化为三维手办造型图 [51][54][59] - 能够实现四格漫画一步生成 并基于连续生图能力用生成图片作为关键帧 [62][64] - 支持卡通风格多格连环画生成 以及带中文步骤说明的教程图生成 [64][66] API接口与创业影响 - Seedream 4.0同时支持图片生成API和流式响应API 支持多轮复杂对话任务 [70] - API接口范式变化允许在同一个对话中进行多轮图片修改和多图合成 提升开发效率 [69][76] - 模型能力提升使图片产品可从一次性调用工具升级为带上下文的项目式创作工具 [71] - 对ComfyUI和LoRA产生影响 Comfy更多用于批量重复任务 LoRA用于精细化风格微调 [74]
Granola 为什么能赢:会议笔记,把产品做简单很重要
Founder Park· 2025-09-10 12:16
Notion AI、Otter.ai、Plaud,不管是应用还是硬件产品,「会议记录工具」赛道已有的竞争者都太多 了。 Granola 作为一个刚刚推出一年多的新产品,迅速地成为了硅谷创业者、投资人常用的 AI 笔记产品。 为什么能在一众产品中打出差异化?独特的产品认知以及设计理念非常关键。 甚至,Granola 的创始人 Chris Pedregal 认为, 「 AI 笔记」在会议场景下的头号竞争对手,其实是苹果 备忘录(Apple Notes) ,而不是其他同类 AI 笔记产品。 「 用户在会议中决定记笔记的窗口期只有 500 毫秒 ,我们的竞争对手是「苹果备忘录」,它随时随地 都能用。这就是我们的设计起点。」 在 Chris Pedregal 看来,AI 要想帮到用户,关键在于「它掌握多少关于你的上下文信息」。即使是在当 下,「上下文」这个话题也还是被低估了,上下文的设计、筛选,本身就是一门学问。 一款真正好用的「AI 会议笔记」产品是怎么做的?在与 First Mark 的 Matt Turk 的对谈中,Chris 分享 了 Granola 背后的产品设计思考以及非常实用的技巧与经验。 如果用一句话总 ...
从 AI 3D生成转型AI原生影视公司,Utopai Studios想「稍微」改造下好莱坞
Founder Park· 2025-09-10 12:16
公司转型与战略定位 - AI 3D 生成公司 Cybever 于 2022 年创立,近期转型为内容制作公司 Utopai Studios,并获得好莱坞改革派导演及前派拉蒙 CEO 投资 [2] - 公司推出两部 AI 影片计划,包括 100 分钟电影《科尔特斯》和 8 集科幻剧集《太空计划》,后者已预售欧洲市场 [7] - 公司致力于构建端到端影视制作 AI 架构,通过整合 AI 模型与自动化工作流大幅降低制作成本,同时保证质量不妥协 [8] 技术突破与行业挑战 - 当前 AI 视频模型在专业影视制作中存在三大核心技术瓶颈:质量、一致性和可控性 [12] - 通用视频模型为优化效率牺牲画面质量,而 Utopai 专注于服务专业影视创作者,通过减少压缩比例、增加特定训练数据和强化注意力编码机制提升模型质量 [13] - 一致性问题上,公司通过向模型注入带物理规律的 3D 数据,提升对空间、遮挡和碰撞的认知,避免物理世界不一致的幻觉问题 [13][14] - 可控性方面,公司用确定性执行导演意图取代随机"抽卡"模式,通过故事板和 3DPreviz 生成结构化指令,结合强化学习实现精准调整 [14] 市场机遇与内容创新 - AI 技术可能成为下一波内容爆发的催化剂,并催生新的内容类型 [6] - 电影《科尔特斯》基于 40 年前创作的故事,曾获迪士尼和亚马逊关注但未拍摄,融合故事、动作和历史元素 [5] - 技术变革将打破成本壁垒,使电影制作未来不再取决于预算多少,而在于想象力边界 [5] - 文生视频技术使 AI 成为创作核心驱动力,大幅降低创作门槛,为独立创作者和小型团队提供低成本实现宏大视觉表达的机会 [18] 行业生态与制作范式 - 当前 AI 影视领域存在模型与工作流割裂问题,公司采用苹果式"软硬件一体"生态理念,构建数据、模型、工作流与创作者的深度集成闭环系统 [11] - 自动化目标是在行业内实现 80%-90% 工作自动化,但质量永远是优先考量,不会妥协 [9] - 系统设计核心不是取代导演或艺术家,而是将其从工业枷锁中解放,回归创意王座 [15] - 公司追求人与 AI 形成共生进化关系,AI 生成无穷选项,但定义品味的永远是有艺术审美的人 [16][17] 影视制作革命 - 代表电影制作范式的根本性变革,打破成本壁垒和创作思维局限 [5] - 制作成本大幅降低,解放电影人从预算枷锁中,以前所未有速度和极低成本将剧本转化为高质量影像作品 [8] - 技术击穿成本壁垒后,电影项目绿灯决策将更多回归故事本身价值,曾被埋没的创意将迎来最好时代 [18] - 不仅是技术升级,更是创作自由的革命,拆掉想象力栅栏,将电影从"预算的暴政"中解救出来 [18]
没有法律背景、聊了100位律师后开始创业,他搞出了一家7亿美元估值的AI公司
Founder Park· 2025-09-09 12:53
公司概况与融资进展 - 法律科技AI公司Legora在成立不到两年时间内与全球250家律所达成合作 包括Cleary Gottlieb和Goodwin等顶级律所[2] - 近期获得8000万美元B轮融资 由ICONIQ和General Catalyst领投 估值达6.75亿美元[2] - 公司创始人Max Junestrand年仅25岁且无法律背景 通过保持谦逊态度与早期合作伙伴建立紧密反馈机制[2] 产品核心功能 - 产品分为网页应用和Word插件两大模块 直接集成到Microsoft Word工作环境[4] - 网页应用从简单聊天功能发展为独立智能体 能调用内外工具处理多步骤工作流 如撰写完整备忘录[4] - 创新表格化审查功能可并行处理10万个查询 确保系统稳定性并实现精准引用[7] - Word插件被称作"律师版Cursor" 在有限界面空间内实现复杂编辑功能 如按20步策略手册处理合同[8] - 策略手册功能允许用户预设规则库 自动检查合同合规性并提供修改建议 已从法务团队扩展至销售、合规部门[16][17] 技术架构与创新 - 采用多模型热插拔架构 交替使用AWS、Claude、Gemini、GPT和Mistral等模型[31] - 通过分类模型实现查询复杂度与模型能力的动态匹配 既控制成本又保证效果[31] - 核心创新在于大规模运行能力而非提示工程 能处理超长法律文件中的交叉引用和定义部分[7] - 随着token成本下降 可同时执行文件、网络和判例法规的联合搜索并生成备忘录[10] 市场策略与销售模式 - 采用从高层切入的销售策略 优先与律所创新部门或合伙人合作 而非自下而上推广[19][20] - 通过打造"明星团队"示范效应带动其他部门采纳 例如先与单个合伙人合作再扩展至全所[19] - 客户采购周期缩短至1-2年 因技术迭代速度加快使长期合同失去吸引力[29] - 定位为律所战略合作伙伴 帮助其在AI转型中保持竞争优势而非打价格战[14][39] 行业影响与竞争优势 - AI将法律工作从执行转变为审阅 律师角色演变为工作成果的质量管理者[32][33] - 颠覆传统尽职调查模式 使原本需要数天的手工审查变为标准服务 客户不愿再为简单审阅支付高额费用[11] - 以30人工程师团队在开发速度上超越数千人规模的传统法律科技公司[27] - 关键竞争优势在于"变化率"而非当前功能 即快速适应新技术和迭代产品的能力[3][30] 团队建设与招聘策略 - 团队从10人快速增长至100人 平均每周入职两人[28][43] - 优先招聘前创始人背景员工 因其具备解决问题的主动性和创业精神[45] - 建立多中心架构 在纽约、伦敦、斯德哥尔摩设中心 并配备本地化团队[44] - 寻求能利用AI实现10倍效率的通才型人才 市场团队从30人规模优化至5人[48] 垂直领域创业方法论 - 通过深度行业学习进入垂直领域 创始人曾采访100位律师理解行业痛点[22] - 建议避免与AI实验室直接竞争 而是专注构建差异化价值[40] - 不应被单一模型供应商绑定 需建立可灵活切换模型的技术架构[31][40] - 通过创意性使用模型建立护城河 如医疗领域的专业术语转录和法律条款的特殊表述要求[41]
Agent 搭起来了,成本怎么控制?
Founder Park· 2025-09-09 12:53
AI 行业出海与增长策略 - AI 出海企业呈现爆发性产品驱动增长特征 绝大多数采用 B2C 或 B2P 模式 [5] - 企业从项目第一天起即高度关注盈利 形成"零日即盈利"的清醒思维 [5] - 企业更积极尝试 AI 工具进行广告投放 从被动接受转向主动探索 [5] AI 广告投放技术革新 - AI 驱动搜索体验催生新广告形态 如谷歌的 AI Overview 和 AI Mode 实现从关键词匹配到用户需求预判的转变 [9] - 传统搜索广告通过 AI MAX 重塑 通过理解用户模糊搜索意图实现精准匹配 带来更高效率的增量转化 [9] - AI 大幅降低创意素材生产成本 竖版视频转横版格式使 ROI 提升 2-3 倍 [9] AI Agent 开发范式转变 - 开发思路从确定性编程转向概率性编排 从告诉机器"如何做"转变为让 Agent 理解"做什么" [10] - 需系统性解决三大核心难题:可预测性 稳定性与 Day-2 运维(AgentOps) [10] - 通过 ADK A2A 协议 Vertex AI Agent Engine 等工具实现开发部署运维全流程优化 [11] 多智能体协同技术方案 - 通过精心编写 Agent Card 确保总管 Agent 精准选择专家 Agent 需清晰描述能力与技能 [12] - 建立持续评估闭环 通过评测集量化任务分发准确率 优化 Agent Card 直至达到生产要求 [12] - A2A 协议本质是 Prompt Engineering 最佳实践 需以 LLM 最易理解方式描述功能边界 [12] Agent 成本与性能优化 - 采用两步走策略:选择满足业务需求的性价比最高模型 投入精细化上下文工程 [13] - 动态构建最简短相关的上下文 避免输入冗余信息导致不必要的 Token 消耗和延迟增加 [13][14] - 通过精准检索记忆 提取关键工具输出 智能摘要历史对话等方式优化上下文构建 [17] 成本控制技术方案 - Cloud Run 可根据实时请求量在几秒内从零扩展到数百上千实例 [20] - 通过"无请求即零成本"模型将 AI Agent 运行成本降至为零 [20] - 利用动态伸缩能力平衡稳定性与成本控制 提升 AI 服务弹性 [20] 生产环境 Agent 可靠性保障 - 通过选用先进模型 RAG 联网接地 思维链提示等方式约束 LLM 幻觉和非确定性 [16] - 采用 MCP 标准化协议 设计重试容错机制 建立人类介入回路保障稳定性 [16] - 建立详尽日志与轨迹记录 搭建自动化评测体系 利用追踪工具实现 Agent 行为监控 [16]
企业、垂类应用都在用 AI 搜索做什么?
Founder Park· 2025-09-09 08:11
AI搜索市场现状 - AI搜索已成为被市场验证的用户需求 并成为各类chatbot产品的标配功能[2] - 开源产品接入搜索能力后涌现出意想不到的惊喜使用场景 但也出现与过往搜索产品不同的问题[2] - 用户对搜索的理解和使用方式出现新变化 因各类chatbot产品都配备了搜索功能[3] 技术提供商格局 - 博查搜索为DeepSeek联网功能提供搜索技术支持 在国内市场占据六成份额[4] - 博查搜索主要为AI产品提供搜索引擎技术服务 客户包括AiPPT和Dify等知名产品[4] 行业实践案例 - Dify和AiPPT等产品通过博查搜索服务实现AI搜索功能[4] - AI产品接入搜索旨在解决特定问题 企业自建AI搜索系统存在难度[7] - 实践案例显示AI搜索能点亮产品的"Aha"时刻 创造突破性用户体验[7] 行业交流活动 - 行业将举办线上分享会 探讨AI产品如何运用搜索技术[5] - 活动聚焦三大议题:AI搜索解决的问题点 自建系统难度评估 以及Dify和AiPPT的实践案例分享[9] - 目标参会人群包括AI创业者 企业产品技术负责人及AI开发者[9]
Anthropic 断供,国产 Coding 模型的中场战事开启
Founder Park· 2025-09-08 12:30
Anthropic断供事件 - Anthropic于9月5日宣布禁止所有权结构受中国司法管辖区控制的企业使用其服务 包括直接或间接持股超过50%的实体[2][3] - 该决定导致中国开发者和企业无法访问全球头部大模型 包括全球领先的Coding大模型Claude[4] 国产模型平替Claude的竞争格局 - Claude在Coding市场占据绝对主导地位 Menlo Ventures年度报告显示Anthropic企业用户使用占比32% 超过OpenAI的25%[5] - 国产模型在代码生成能力、上下文长度和Agent工具调用能力上仍存在短板 难以全面替代Claude[6][15] - 多家中国科技企业于2024年7-8月密集推出兼容Claude Code的模型:Kimi发布K2并提供完整接入指南[11] 阿里上线Qwen3-Coder并开放每天2000次免费调用[12] 智谱发布GLM-4.5并推出50元包月编程API[13] DeepSeek发布V3.1版本支持Anthropic API协议[14] Kimi的技术进展与战略定位 - Kimi于9月5日发布K2 0905版本 在三个方面显著提升能力:编码能力超越Claude Opus 4[17] 上下文长度从128K升级至256K(超过Claude标配200K)[19] Tool Use能力保证100%格式正确并支持WebSearch Tool[19] - 输出速度提升至60-100 Token/s 保障编码流畅体验[20] - 2023年11月上线时即支持20万汉字上下文 2024年3月开启200万字上下文内测[25][26] 2024年6月成为国内首个提供Context Caching API的模型平台[30] - 模型开发专注文本和推理领域 核心产品K2定位为专注Agent的非推理模型[34][36] - 通过开源策略吸引开发者生态 加速技术创新和模型迭代[41] Agent能力成为行业竞争焦点 - Agentic能力被视为下一代AI核心竞争力 要求模型具备自主决策、工具调用和复杂任务处理能力[42][44] - Claude已实现端到端智能任务编排 能自主调用工具整合外部知识[44] - DeepSeek下代模型将聚焦Agent 仅需少量提示词即可执行复杂操作并自我进化[43] - 行业竞争从代码能力转向Agent构建与落地 定义大模型核心价值[40][45]
光刻机巨头 ASML 领投,砸下 15 亿美元,Mistral AI 现在是「欧洲 AI 之光」了
Founder Park· 2025-09-08 07:30
ASML对Mistral AI的战略投资 - 光刻机巨头ASML斥资15亿美元领投Mistral AI的C轮融资 成为其最大股东并获得董事会席位 [2][6] - 本轮融资总额约20亿美元 融资后Mistral AI估值达140亿美元 成为欧洲最具价值AI公司 [2][3][12] - 该投资被视为欧洲科技主权的战略布局 旨在强化欧洲在全球AI和芯片领域的竞争力 [7][36][37] Mistral AI的技术优势与发展历程 - 公司成立仅两年 核心团队来自Meta巴黎AI实验室和DeepMind 坚持开源理念 [15][17][19] - 2023年12月开源首个MoE大模型(87GB种子 8x7B架构)后获4.15亿美元融资 估值达20亿美元 [25][26] - 开发多款代表性模型包括Mistral Large 2大语言模型、Pixtral多模态家族、Voxtral音频模型等 [32] - 旗下聊天助手Le Chat移动端上线两周下载量超100万次 获法国总统马克龙公开支持 [30][31] 双方合作协同效应 - ASML可通过Mistral AI的数据分析与AI能力优化光刻设备性能 提升芯片制造精度与效率 [11] - 合作结合Mistral高效AI模型与ASML光刻机制造实力 有望在AI和芯片领域找到新突破口 [37] - Mistral AI推出AI基础设施Mistral Compute 覆盖GPU、调度系统及API服务 强化底层支持能力 [35] 行业影响与定位 - Mistral AI被视为欧洲唯一能与OpenAI匹敌的AI初创企业 技术能力对标ChatGPT [12][13] - 公司通过开源软件共享技术 为外部开发者提供快速构建聊天机器人的完整工具链 [15][16] - 发布"氛围编码"应用Mistral Code 与Windsurf、Cursor等现有编码AI工具竞争 [34]
AI 创业,增长也是创始人的必修课
Founder Park· 2025-09-07 02:00
创业公司增长挑战 - 创业公司常高薪聘请有大厂经验的增长负责人 但产品处于1.0版本阶段 任务成功率低于50% 服务器仅支持数百用户便会宕机[2] - 创始人忙于管理、招聘、融资和第二增长曲线设计 缺乏时间深入用户社区沟通和访谈[3][4] - 在AI产品成熟度不足的背景下 创始人对用户获取-留存-转化链条认知不足可能导致错误归因[5] 增长研坊活动设计 - 活动于9月20-21日在北京举办 采用限人数研坊模式 早鸟优惠截至下周二[8][9] - 五位专家均服务过出海企业并操盘明星项目 聚焦SEO/GEO实战、红人营销及Discord/Reddit社区运营[11] - 采用分组实战模式 每组8人跨背景混搭 包含技术、产品、增长、硬件和AI基础设施领域专家[16] - 设置组长引导讨论 鼓励携带未解决问题参与 强调失败案例的借鉴价值[16][17] 实战内容安排 - SEO环节包含技术审计实操 大模型内容生成优化及网站问题分析[13] - 红人营销部分拆解底层逻辑和常见误区 分析真实案例[18][44] - 多渠道营销环节设计AI辅助内容生产流程 体验实用工具[18] - Discord社区搭建实战演练 要求提前安装相关工具[37] 特邀嘉宾案例 - 可以科技的宠物机器人Loona在Kickstarter创消费机器人众筹纪录 日本Makuake平台表现突出[21] - 设计类Agent产品Lovart被TheInformation点名 以画布设计交互和视频生成能力快速出海[21] - AI眼镜Halliday在Kickstarter上线24小时销售额突破100万美元 完成超2000单 覆盖101个国家超1万用户[22] 课程内容体系 - 海外市场趋势洞察涵盖2025年市场预测和Reddit运营策略[38] - AI驱动增长策略包括自然流量增长路线图和内容工程化实践[39] - 广告投放策略覆盖北美、欧洲、东南亚、中东、拉美市场机会和三阶段投放方法[45] - GTM阶段多渠道组合策略和新版本发布方法[46] 参与者收益 - 获得可落地增长实操打法 建立全员协同作战体系 探索小预算渠道验证路径[27] - 通过Open Night开放麦环节自由分享出海经验与教训[19][20] - 链接同行专家资源 建立持续解决问题的网络通路[29] 导师团队背景 - Julia Yin拥有10年美国市场增长经验 专注SEO和用户转化 服务20+中美创业公司[30] - 赵赫专注海外社区运营 曾实现40万用户增长并构建ISV体系[31] - Lysa管理千万美元级KOL营销 服务近百家科技品牌[32] - 韩宗良服务80%AI客户包括MiniMax、美图、智谱AI等 同时为谷歌核心代理商[33] - 叶晨曦Leo运营月发行量6000万的AI Secret Newsletter 服务80多家AI公司包括阿里巴巴、Airtable等[34]