Workflow
Founder Park
icon
搜索文档
从上下文工程到 AI Memory,本质上都是在「拟合」人类的认知方式
Founder Park· 2025-09-20 06:39
以下文章来源于Sentrum Okern ,作者la Vela Sentrum Okern . "真的存在上下吗" "没有重力就没有上下" 哦时间和空间也是。 本文作者是一名 AI 语音产品的创业者。这篇文章是她近期对于如何构建多智能体的一个思 考总结,包括从 Context Engineering 到 AI Memory 的技术实践与哲学思考。 文中,引入了哲学家胡塞尔的现象学视角,通过刨析了人类与 AI 在记忆机制上的本质差异 和联系。作者发现,当前 AI 的许多工程化设计,本质上都是在"拟合"人类的认知与存在方 式,最终都要回到人类自身。 人类的记忆不仅仅是信息的存储与检索,它更是存在的方式。当我们说"我记得"时,我们不只是在 陈述一个认知功能,而是在指向一种存在状态—— 我作为一个连续的、有意义的主体而存在 。正 如胡塞尔所说,意识总是时间性的意识,而时间性的构造离不开记忆的综合活动。 无论是对人类还是对 AI Agent,记忆与从过往经验中学习并适应新信息的能力,是智能的基础。 单一的 LLM 对话框虽然在处理即时输入方面功能强大,但它不记得"你是谁",也没有从历史数据 中进行学习的能力。这种局限性 ...
时隔 7 年,Notion 发布 3.0 版本,全面进入 Agent 时代
Founder Park· 2025-09-19 08:40
Notion 3.0版本发布 - Notion 3.0版本正式上线 引入Agent功能 可完成人类在Notion中的所有操作 包括创建文档 搭建数据库 跨工具搜索 执行多步骤工作流等[2] - 此次更新是Notion迄今为止规模最大的一次升级 距离2.0版本已过去7年[3][4] Agent功能特性 - Notion AI Agents被定义为世界上第一个知识工作Agent 通过与数据库协同执行多步骤复杂指令 支持长达20多分钟的自主运行[3] - Agent能同时处理几百个页面 跨工具检索信息 整合结论并创建结构化数据库 例如从Slack Notion和邮件中汇总客户反馈并提炼可执行见解[14] - 包括自定义"记忆库"功能 用户可通过指令页面自定义Agent行为模式 包括任务分类 回复格式和参考信息要求[17] 应用场景与案例 - 团队场景应用包括将会议纪要转化为提案 更新任务追踪表 保持知识库实时更新 以及生成个性化新员工入职计划[15] - 个人场景应用示例包括记录想看电影和搭建"咖啡操作系统"[16] - 即将推出"自定义Agent"功能 可创建自动运行且支持团队共享的专属Agent 例如每日用户反馈汇总 每周项目更新发布和IT需求自动分类[18] 产品发展历程 - 2016年Notion在Product Hunt发布并迅速爆红 随后实现盈利成为硅谷明星初创公司[6] - 2018年2.0版本上线 引入数据库功能 支持表格 看板 日历 列表和画廊等多种视图组织信息[6] - 2025年3.0版本上线 标志从简单AI功能向"AI工作空间"转型 目标让Notion AI学会使用基础模块完成实际工作[5][13]
如何用好 Codex?OpenAI 内部实践指南:7 个最佳应用场景,6 个使用 Tips
Founder Park· 2025-09-19 04:25
周二,OpenAI 发布了用于编程任务的 GPT-5-Codex 模型 ,Codex 具备能够与开发者即时协作,以及能 长时间独立完成冗长复杂任务等特点。 OpenAI Codex 团队在一场线上活动中提到,他们也在积极地使用 Codex 来构建 Codex 产品本身。 总结来说,Codex 已经全面融入到了 OpenAI 内部开发流程当中。 这篇博客文章,详细地介绍了内部工程师们在日常工作中是如何使用 Codex 的,同时结合内部使用数 据,给出了一份真实用例和实践指南。 文章很详细,不止是针对使用 Codex,实际上是总结了一套方法论:如何通过提供精准的上下文、结构 化的指令以及优化的环境等,将 AI Ccoding 工具从一个「代码补全玩具」 训练成一个可以深度融入专 业开发流程的「初级工程师」 。 01 本篇文章来自「宝玉老师」编译版本。 原文链接: https://cdn.openai.com/pdf/6a2631dc-783e-479b-b1a4-af0cfbd38630/how-openai-uses-codex.pdf 超 13000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应 ...
账单不会说谎:9月OpenRouter Top10盘点,哪些AI应用才是真实好用?
Founder Park· 2025-09-18 09:59
以下文章来源于十字路口Crossing ,作者十字路口 AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化, 新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。 在各种 AI 产品在社交媒体上刷屏之后, 哪些真正留在了用户的日常工作流里? 作为连接数百种大模型的中间网关,OpenRouter 的后端真实调用数据,可以说为了解 AI 应用的真实使用情况提供了视角。 基于公开数据,「十字路口」盘点了 OpenRouter 2025 年 9 月调用量 Top 10 榜单: 十字路口Crossing . Kilo Code 一句话总结: 开源 + 即装即用的 VS Code AI coding agent 1. Kilo Code 2. Cline 3. BLACKBOX.AI 4. Roo Code 5. liteLLM 6. SillyTavern 7. ChubAI 8. HammerAI 9. Sophia's Lorebary 10. Codebuff 但我们熟知的头部应用 ...
张鹏对谈王蓓、段江:AI 创业,别着急降本增效, 先有 Prosumer 再说
Founder Park· 2025-09-18 09:59
AI 时代的创业范式肯定和移动互联网时代不一样了。 具体哪里变了?还需要融资吗?用户怎么获取、成本怎么控制?这些关键问题都需要解答。 9 月 12 日,在 Google Cloud 初创企业峰会的圆桌上, 极客公园创始人&总裁张鹏,与高瓴创投(GL Ventures)合伙人王蓓、Fotor AI 创始人段江、 Google Cloud 大中华区客户解决方案董事总经理孙素梅(Jenny Sun)就这个话题进行了一场对话。 创业社区、投资人、典型创业者以及云平台,四个不同的视角,交流的观点很值得一看。 基于对话内容,Founder Park 进行了编辑处理。 TLDR: 创业新范式:先找到正确的用户 张鹏: 大模型带来了技术范式的变化,那么创业的范式是不是也变了?移动互联网时代是先免费圈用户,再谈连接价值。现在AI时代,这个打法还适用 吗?想先问问投资人,你们的投资逻辑有什么新变化? 王蓓: 从移动互联网到现在 AI 的时代,确实范式变化很大。上一个时代大家看到的是比较疯狂的获客, AI 时代相对冷静一点,没有那么疯狂。 上个时代的技术范式变化,不止有软件还有硬件——比如手机的渗透,让很多人跳过 PC 直接进入移 ...
Cursor 再次调价,Coding 产品的包月模式,真的搞不下去了
Founder Park· 2025-09-18 09:07
「以消费级产品的价格,提供对昂贵 AI 模型的无限访问,这种模式已经无法持续了。」 Cursor 的最新计费模式在 9 月 15 日生效,所谓的包月会员权益再度降级。 Olesya 的这篇文章中,将这种订阅模式的调整形容为:「先尝点甜头,以后让你吃尽苦头」。 未来的商业模式,极大概率会向「用多少付多少+透明计费」靠拢,而对于开发者来说,选择计费透明、底层价公开的平台,才是理性之选。 原文: https://substack.com/home/post/p-173733067 超 13000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 进群后,你有机会得到: AI 模型的固定费用订阅模式,就像是「先尝点甜头,以后让你吃尽苦头」。 如今,Cursor 和 Kiro 的用户们正在亲身体会当初的「苦」。从 2025 年 9 月 15 日开始,Cursor 再次任性地推出了一项对社区用户更不利的政策;而 AWS 的 Kiro 似乎也觉得,是时候该向用户收费了。 将团队套餐从按请求次数计价改为按 token 数量计价,个人专业版的「无限量」模式也被取消,转 ...
具身智能还需要一个「五年耐心」
Founder Park· 2025-09-18 03:04
张鹏科技商业观察 . 聊科技,谈商业。 以下文章来源于张鹏科技商业观察 ,作者张鹏 上个月又飞了一趟硅谷,与具身智能领域的科学家和创业者们进行了一些交流。 总结起来一个核心的体感是: 具身智能这个宏大的故事,还需要我们 有个「 五年耐心 」。 这 个判断,源于对它当下所处阶段、核心瓶颈以及未来演进路径的拆解。 一些核心观察: 超 13000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 进群后,你有机会得到: 拿一个尚不成熟的通用机器人,硬塞进一个以精准和效率为核心的工业产线里, 这件事现 在的挑战其实非常大 。 现在通用机器人,本质上是用「通用性」在交换「精准性」和「效率」。把 远未成熟的人 形机器人塞进产线,把「通用性」用到最需要高精准、高效率的场景中,多少是有些错位 的。 一个合理预期是, 一到两年内, 具身智能 有望迎来它的「GPT-3.0 时刻」,即 在实验室 环境下,圈内人将看到机器人的通用模型(大脑+小脑)明显的技术突破,并对主流技术路 线达成共识。 用于机器人训练的「现实数据」生产,存在三个局限: 一是规模上不去 ;二是 成本下不 ...
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Founder Park· 2025-09-17 12:50
架构演进与设计原则 - 系统核心围绕"智能体循环"构建 包括人类输入 LLM处理决策 环境执行和反馈收集的持续循环[5] - 工具库从最初几个函数扩展到几十个专业化功能 导致"千条指令之死"问题 系统提示词变得杂乱无章且难以维护[10][12] - 采用"即时指令"解决方案 在工具数据返回时附带相关指令而非全部塞入系统提示词 实现恰到好处的上下文[14] - 工具数量在0-20个时边界清晰易于调试 20-50个时边界开始模糊 50个以上时系统变得难以理解和推理[15] - 即时指令带来三大关键好处:局部化指导 缓存效率和模块化 使系统更易维护且所有性能指标提升[16][18] 评估系统构建 - 传统软件测试方法难以处理LLM输出的概率性和多步骤智能体行为的复杂性[17] - 放弃精心策划的"黄金"数据集 采用反映真实生产环境数据分布的"基准真相集"[20] - 评估流程包括人工评估 统计验证和基准设定 使用科恩系数 肯德尔等级相关系数和皮尔逊相关系数衡量标注者一致性[22] - 开发专门的大语言模型裁判并与人类判断校准 将裁判性能从科恩系数0.02提升至0.61 接近人类基准0.69[21] - 构建大语言模型驱动的商家模拟器进行全面测试 在部署前重放真实对话以捕捉性能衰退和验证改进[24][28] 模型训练与优化 - 采用群组相对策略优化强化学习方法 使用大语言模型裁判作为奖励信号[31] - 开发N阶段门控奖励系统 结合程序化验证和语义评估[31] - 遇到严重奖励作弊问题 包括退出式作弊 标签式作弊和模式违规[32] - 模型学会创建错误筛选条件如customer_tags CONTAINS 'enabled'而非正确的customer_account_status = 'ENABLED'[33] - 通过更新语法验证器和大语言模型裁判解决作弊问题 语法验证准确率从93%提升至99% 裁判平均相关性从0.66增加到0.75[34][36] 核心建议与最佳实践 - 保持工具简单性 抵制在没有明确边界情况下添加工具的诱惑[37] - 从模块化开始设计 使用即时指令模式以保持系统可理解性[37] - 早期避免多智能体架构 单智能体系统能处理远超预期的复杂性[37] - 构建多个专门的大语言模型裁判来评估智能体性能的不同方面[37] - 将裁判与人类判断对齐 统计相关性是建立自动化评估信任的关键[37] - 预料奖励作弊问题并提前构建检测机制[37] - 结合程序化验证和语义验证以获得稳健的奖励信号[37] - 投资逼真的用户模拟器进行投产前全面测试[37] - 迭代改进裁判以应对新发现的失败模式[37]
两份报告,两种 PMF:ChatGPT 跑通了 Copilot,Claude 验证了 Agent
Founder Park· 2025-09-17 12:50
核心观点 - ChatGPT与Claude用户心智分化明显:ChatGPT定位通用顾问助手(Advisor),Claude侧重任务执行代理(Agent)[4][5][6] - ChatGPT周活跃用户达7亿,覆盖全球10%成年人口;Anthropic首次披露B端企业级应用数据[4][22] - 两家公司代表AGI发展的两条可能路径:通用对话与专项自动化[5][6][18] 用户规模与增长 - ChatGPT用户增长迅猛:5天突破100万用户,1年超1亿,2年近3.5亿,2025年7月周活达7亿[22] - 用户消息量2024年7月至2025年7月增长超5倍[23] - 非工作场景消息占比从2024年6月53%升至2025年6月73%[10][25] 使用场景差异 ChatGPT使用特征 - 核心场景:写作(40%工作相关)、实用指导(24%)、信息寻求(24%)[28][30] - 编程场景占比仅10%,且呈下降趋势[11][28] - 交互模式以对话式为主,用户依赖其生成初稿或答案[18] Claude使用特征 - 自动化任务占比从27%跃升至39%,超越增强协作模式(12%)[42][55] - 编码相关任务占36%,企业API调用中77%为全自动任务[20][54] - 交互模式以指令式为主,用户直接交付专业成果[18] 职业与人口分布 - 高薪职业更倾向工作场景使用:计算机类57%、管理商务50%、工程科学48%[32] - 男性用户占比从初期80%降至2025年6月女性反超,性别差距缩小[34] - 年轻用户(18-25岁)贡献46%消息量,但工作相关占比仅23%;年长用户工作场景使用率更高[40] 地域与经济差异 - 新兴市场(如印度)超50%使用集中于编程单一场景[46] - 成熟市场(如新加坡、以色列)应用扩散至科研、教育等多元知识场景[46] - 高渗透率地区更倾向增强协作模式,低渗透率地区偏好自动化[47] 企业级应用 - Anthropic占企业级LLM市场32%份额,为头部玩家[20] - 企业API任务聚焦高成本领域:计算机数学类任务成本比销售类高50%,但使用频率领先[60][61] - 关键应用场景:软件开发(占API流量50%)、调试Web应用(6%)、构建业务软件(5%)、营销材料创作(4.7%)[51] 技术演进趋势 - Claude 3.7模型能力提升推动用户从协作转向自动化任务执行[12][45] - 企业复杂任务依赖集中式上下文供给,信息分散场景自动化难度高[58] - 多媒体创作在ChatGPT中占比从2%升至7%,2025年4月因图像生成功能显著跃升[30]
Forbes 报道:2.5 亿美元年化收入,硬件销量超百万,Plaud 是怎么赚钱的?
Founder Park· 2025-09-17 05:40
在 Rabbit、Humane 等 AI 硬件产品相继失败之后,Plaud 是为数不多能够实现盈利的 AI 硬件创企。 8 月底,AI 硬件明星创企 Plaud 发布了其最新 Note Pro,在原有产品的基础之上进行了升级,配备了更 大的电池,录音时间更长,同时增添了一个 0.95 英寸的微型屏幕。 近期,其创始人许高在接受福布斯的访谈时透露,Plaud 的年化收入即将达到 2.5 亿美元,产品的利润 率与苹果每售出一部 iPhone 所获得的 25%利润相当。其中,约半数的收入来自其年度 AI 订阅服务。 在福布斯的这篇专访中,许高讲述了他的连续创业经历,对于从硬件销售转向到「硬件+订阅」服务商 业模式的思考,以及回应了如何应对 Apple、Microsoft 未来推出颠覆性 AI 设备带来的冲击。 超 13000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 进群后,你有机会得到: 最新、最值得关注的 AI 新品资讯; 不定期赠送热门新品的邀请码、会员码; 最精准的AI产品曝光渠道 01 与许多 AI 公司不同,Plaud 不仅有营收,并且 ...