Workflow
Founder Park
icon
搜索文档
YC合伙人吐槽:今天的AI应用不行,不是AI的问题,而是产品设计能力不行
Founder Park· 2025-05-09 20:21
在AI时代,很多人都有一个问题,AI原生应用到底长什么样? 不久前,YC合伙人Pete Koomen提出了一个很有意思的看法: 当下很多AI产品的困境并不在于模型能力不行,而是产品设计能力不行。 原因在于,这些产品仍然基于过去的产品逻辑来设计,而没有充分考虑到用户的实际需求。 比如,传统的产品开发往往需要程序员预先设计好系统提示符,但这些早被设计好的提示词在实际应用中,却很难真正满足用户个性化的需求,甚 至成为了大模型潜力释放的最大阻碍。 以下文章来源于乌鸦智能说 ,作者智能乌鸦 乌鸦智能说 . 人人都能读懂的AI商业 这就像19世纪80年代的蒸汽马车,人们只想着用发动机取代马匹作为动力驱动,却没有考虑重新设计车辆以应对更高的速度。 在这篇文章里,Pete Koomen就用了自己的亲身经历,分享了他对AI原生应用的理解。 Founder Park 正在搭建开发者社群,邀请积极尝试、测试新模型、新技术的开发者、创业者们加入,请扫码详细填写你的产品/项目信息,通过审核 后工作人员会拉你入群~ 进群之后,你有机会得到: 01 从 Gmail 的 AI 功能说起 比起大多数AI应用,我更喜欢自己用AI开发软件。 当我 ...
下周聊:大模型进入 RL 下半场,模型评估为什么重要?
Founder Park· 2025-05-09 11:55
大模型进入RL下半场 - 行业关注点从模型算法转向实际效用,重新定义问题和设计真实用例的评估变得尤为重要[1] - 现有评估体系需解决如何有效衡量Agent产品的ROI,指导创企和AI应用企业的产品开发落地[1] - Superclue推出中文通用AI智能体测评基准AgentCLUE-General,深度剖析主流Agent产品能力[1] 行业活动与资源 - SuperCLUE联合创始人朱雷将分享大模型和Agent评估中的核心难题,活动时间为5月15日20-22点线上举行[2] - 相关阅读资源涵盖企业Agent落地实践、AI玩具赛道分析、中国AI投资人现状及开源大模型趋势等话题[3] 技术趋势与竞争格局 - OpenAI发力tool use引发行业对Manus等工具是否被模型取代的讨论[3] - Qwen 3发布显示开源可能成为中国大模型公司破局的最优解[3] - 通用Agent如Manus、Fellou、Genspark的能力差异成为行业关注焦点[3]
红杉资本年度分享:应用层才是价值高地,下一阶段是Agent
Founder Park· 2025-05-09 11:55
核心观点 - 应用层是AI创业的价值高地,解决具体行业痛点的AI应用将沉淀真正价值[4][24][60] - 智能体经济正在崛起,垂直领域智能体将成为重要趋势[63][64][73] - AI市场规模将远超云计算初期,未来10-20年可能达到数万亿美元级别[14][15] 市场机遇 - AI服务市场起点规模预计是云计算初期的10倍,未来可能覆盖软件和人力资源两大预算领域[14] - 全球互联网用户已达56亿,为AI技术传播提供了前所未有的基础条件[19] - ChatGPT日活/月活比例已接近Reddit水平,显示AI应用用户粘性显著提升[44] 创业策略 - 应聚焦垂直领域,提供端到端解决方案而非单纯工具[24][30] - 构建数据飞轮是关键竞争壁垒,需与核心业务指标直接相关[30][37] - 95%创业工作与传统公司相同,仅5%属于AI特有要素[26][31] 产品方向 - 首批AI杀手级应用已出现,如ChatGPT、Harvey、Glean等[61] - 编程领域率先爆发,AI显著降低了软件开发门槛[53][56] - 语音技术突破"恐怖谷"效应,实现更自然的人机交互[52] 技术发展 - 智能体需解决持久身份、通信协议和安全三大技术挑战[75][76] - 基础模型在应用层的竞争加剧,推理技术成为关键[24][59] - 预训练发展放缓,合成数据、工具使用等新方向受关注[57] 行业趋势 - 垂直领域智能体表现已超越人类专家水平[67] - 智能体经济将形成独立的经济体系,与人类紧密协作[73] - 劳动力富足时代来临,审美品味可能成为稀缺资源[68]
PH最佳产品周榜(4.28-5.4),华人AI编程产品登顶
Founder Park· 2025-05-08 10:42
核心观点 - Product Hunt 近一周(4.28-5.04)最佳产品 Top10 盘点,涵盖 AI 代码审查、生产力工具、社交媒体管理等多个领域 [3] - 上榜产品多为 AI 驱动,聚焦自动化、智能化解决方案,解决行业痛点 [8][12][16] - 华人团队开发的 AI 代码审查工具 mrge 位列榜首,获得 917 个 Upvote [6][9] 产品分类总结 AI 开发工具 - mrge:面向高效开发团队的 AI 代码审查工具,自动化 PR 审核流程,解决人工代码评审效率瓶颈,获得 917 个 Upvote [6][8][9] - Daytona:专为 AI 生成代码设计的弹性云基础设施,亚 90 毫秒启动,裸机性能,获得 665 个 Upvote [18][20][21] - Bruno:本地化、原生 Git 集成的开源 API 客户端,获得 629 个 Upvote [25][26] 生产力工具 - Raycast for iOS:macOS 生产力套件的移动延伸,跨端无缝衔接,获得 776 个 Upvote [10][12][13] - Ztalk.ai:支持主流会议平台的 AI 实时语音翻译桌面应用,30+ 语言覆盖,获得 541 个 Upvote [31][32] 社交媒体与营销工具 - Postiz v2:AI 社交媒体内容排程工具,支持 20+ 平台,获得 741 个 Upvote [16][17] - Airpost:AI 驱动的短视频广告生成工具,可快速生成 30+ 条广告,获得 599 个 Upvote [29][30] AI 集成与优化工具 - Integrations by Anthropic:让 Claude AI 直接连接和操作第三方应用,获得 523 个 Upvote [38][39] - Salespeak Website AI Grader:AI 驱动的 SEO 和可用性检测工具,获得 516 个 Upvote [35][36] - Kotae:无需代码即可集成的 AI 网站聊天机器人,获得 461 个 Upvote [41][42]
Agent 如何在企业里落地?我们和火山引擎聊了聊
Founder Park· 2025-05-08 10:42
核心观点 - Manus的影响力被低估,其让大众真正看到Agent的重要性和可能性 [1][2] - 企业落地需要垂直领域真正懂场景的Agent,火山引擎发布的Data Agent是代表 [3] - Data Agent解决企业数据难题,包括统一管理平台、兼容非格式数据、自然语言查询等 [6][9] Data Agent功能 智能分析Agent - 涵盖智能分析Agent和营销策略Agent,前者主打数据分析,后者提供营销策划 [10] - 智能分析Agent类似chatbot,连接企业数据后可用自然语言对话进行数据分析 [11] - 测试案例显示可快速完成跨表查询任务,5分钟内给出查询和分析结果 [14][20] - 不仅能查询数据,还能解读数据并给出具体建议,如针对不同人群的销售策略 [32] 营销策略Agent - 处理新老用户和活动数据,提供从策划到执行的全流程服务 [39] - 测试案例显示可自动生成营销方案,包括客群筛选、触达内容编辑等 [44][54] - 生成的营销文案直击痛点,如针对不同敏感度客户的精准营销方案 [60][68] - 未来将加入营销后数据分析环节,实现营销活动全流程闭环 [69] Data Agent技术 - 采用MCP架构提升工具调用能力,适合调用稳定性好的服务 [72][73] - 通过工程化手段控制大模型幻觉问题,如单次数据准确性核查等 [71] - 数据库形态将变化,需要融合存储结构化、非结构化等多模态数据 [79][80] - 未来发展方向是自主学习和智能体协同,突破单一Agent能力边界 [87][89] 落地策略 - 大公司追最佳实践,小公司先用起来,数字化程度不同采取不同策略 [74][75] - 不会直接取代传统BI和ChatBI,而是长期共存服务不同场景 [76][77] - 开发团队需拥抱不确定性,深入理解模型原理而非简单加Prompt [82][85] - 产品方向是做更好的大模型容器,而非过度投入补模型短板 [86]
爆火的 AI 玩具赛道,全行业都在等一个「成功者」
Founder Park· 2025-05-07 12:58
AI玩具创业热潮现状 - 过去一年年轻人将AI玩具创业视为热门出路 大量互联网背景创业者涌入该领域[2][3] - 科技展会中AI玩具展位客流量最大 但实际推出可售卖产品的团队寥寥无几[5] - 创业者面临语音模型发展不及预期的压力 影响产品上市进程[7] 首批AI玩具产品特征 - 本质是"毛绒玩具+语音盒子"结构 如奥飞娱乐的AI喜羊羊、实丰文化的AI魔法星[10] - FoloToy推出Magicbox智能对话盒子 可内置于任何玩具中[11] - 主打聊天、讲故事功能 与接入大模型的蓝牙音箱功能相似[12] 市场反馈与问题 - 四五百元价位产品退货率可能超30% 存在交互复杂、响应迟钝等问题[7] - 华强北技术方案商以100多元低价快速占领市场 挤压互联网创业者空间[7][8] - 中低端厂商将AI作为营销噱头 产品价格普遍在100元左右[14] 技术瓶颈与行业挑战 - AI玩具厂商依赖第三方语音识别和大模型 无法自主控制对话效果[15][16] - 大模型开源导致技术门槛降低 DeepSeek开源后涌现大量技术方案商[18][19] - 硬件开发门槛降至极低水平 如"小智AI"项目设备接入量两月增10万台[20] 行业发展趋势 - 单纯以硬件集成和大模型为卖点的商业模式难以为继[20] - 情感陪伴和玩法创新成为新方向 如Fuzozo专注多模态情感模型[21][22] - 行业处于早期产品定义阶段 需围绕IP打造文化内容形成品牌护城河[23]
关于 AI 编程的最本质提问:Cursor 到底有没有护城河?
Founder Park· 2025-05-07 12:58
Cursor的护城河分析 - 产品粘性:以AI-first方式构建的独立编辑器深度集成LLM,提供下一操作预测、一键代码重写等原生功能,用户留存率高且切换成本高[7] - 社区与反馈循环:通过论坛和Discord快速迭代功能,形成用户共同开发模式,UI/UX领先于大型竞争对手[8] - 数据与技术积累:用户行为数据微调AI模型,收购Supermaven获得Babble低延迟代码模型,优化上下文窗口和隐私模式[9] - 先发优势与团队执行力:解决AI提示词管理等复杂集成问题,团队专注AI编码体验[10] Cursor面临的挑战 - 底层LLM商品化:开源模型如Code Llama、StarCoder快速追赶专有模型性能,技术优势易被复制[11] - 激烈竞争:微软VS Code新增AI功能,GitHub Copilot拥有180万付费用户,亚马逊CodeWhisperer等竞品涌现[12] - 平台依赖风险:基于VS Code构建可能受API条款变更影响,功能创新易被巨头模仿[13] - 用户锁定薄弱:开发者工具切换成本低于社交平台,开源社区共享模型改进削弱数据优势[14][15] Cursor的未来战略 - 平台化与生态:开放API/SDK构建开发者生态系统,集成协作功能如实时调试和代码演示[16] - 数据飞轮深化:基于用户行为微调专属模型,提升企业级集成如代码审查和CI/CD管道[16][17] - 市场扩展:从个人工具转向团队平台,增加与项目管理工具的粘性[16] - 端到端体验:覆盖开发全流程包括云托管,提高用户迁移成本[17] 行业竞争格局 - 技术趋同:LLM编码能力成为基础设施,差异化依赖数据与生态[11] - 巨头主导:微软GitHub、OpenAI等通过现有用户规模和数据积累形成壁垒[12][14] - 创新压力:初创公司需持续迭代功能并构建结构性优势以维持领先[13][16]
普及了语音通话技术,曾经有6亿用户的Skype正式关停
Founder Park· 2025-05-07 06:15
Skype的关停与历史回顾 - 微软于5月5日正式关闭Skype服务 但Skype for Business业务不受影响 用户可迁移至Microsoft Teams免费版 [1] - Skype成立于2003年 曾是全球语音通话领域的领导者 定义了在线通信时代 最终结束运营 [2] - 2007年Skype处于巅峰期 提供高质量语音及视频通话 覆盖全球大多数用户 支持跨平台运行 2009年拥有4 05亿用户 占全球跨国通话时长的8% [6][7] Skype的技术架构与市场策略问题 - Skype采用P2P技术架构 早期节省成本但后期难以维护 微软迁移至云端代价巨大 [9] - 移动时代到来后 P2P架构与手机系统不兼容 全球移动网络复杂性加剧了技术问题 [9] - 微软收购后策略失误 关闭Windows Live Messenger押注Skype 但陷入功能堆砌与界面频繁改动的困境 [9] Skype的定位与产品管理问题 - 产品定位混乱 官方宣称面向个人用户 但实际主要用户为中小企业 战略上禁止开发企业功能 [15][17] - 微软收购后重心转向拉新而非技术优化 功能堆砌导致用户体验下降 代码老化引发频繁崩溃 [19] - 疫情期间用户激增 但因技术债务和团队缩编错失机会 用户转向Zoom [21] 微软的战略调整与Teams的崛起 - 微软选择自研Teams而非收购Slack Teams沿用Skype后台但获得全力支持 借助Office 365捆绑快速发展 [25] - Skype虽仍有几千万月活用户 但在微软业务版图中价值有限 最终因资源倾斜和变现压力加速没落 [23][24] - Teams取代Skype成为微软通信核心 反映公司战略重心转向企业市场 [10][22] 行业影响与历史评价 - Skype曾提出"一站式通信系统"愿景 但最终被封闭平台生态取代 如Zoom GoogleMeet WhatsApp等 [11] - 行业评价Skype为"伟大的商业失败者" 其独立通信基座的理念仍具前瞻性 但难以在商业化环境中持续 [12][13]
谷歌上线 Gemini 2.5 Pro 新版本,编码能力超 Claude 3.7 Sonnet
Founder Park· 2025-05-07 03:17
产品发布 - 谷歌提前推出Gemini 2.5 Pro Preview(I/O版),重点提升编码和多模态推理能力 [1] - 新版本在LMArena编程排行榜和WebDev Arena排行榜均位列第一,得分超过Claude 3.7 Sonnet [1][9] - 开发者可通过Google AI Studio和Vertex AI使用Gemini API构建应用 [1][21] 技术能力 - 成为首个横扫文本、视觉和WebDev领域的单一模型 [4][10] - 在WebDev Arena排行榜位列第一,专门衡量构建美观且功能强大Web应用的能力 [12] - 与之前版本相比得分上涨147分 [13] - 在VideoMME视频理解测试中获得84.8%的得分 [19] 应用场景 - 只需手绘草图即可构建"绘图变音频"网页应用 [5] - 通过单句提示词实现游戏开发、对象模拟等功能 [6] - 可从YouTube视频创建交互式学习应用 [18] - 能复刻Windows 95风格视频播放器等复杂UI设计 [21] 市场反馈 - 因用户热情高涨,公司决定提前发布原计划在Google I/O大会推出的版本 [22][23] - 已被Cursor背后公司、Cognition和Replit等采用 [15] - 此前Gemini 2.5 Pro在直播中通关《宝可梦蓝》游戏,打破Claude记录 [24]