Workflow
Founder Park
icon
搜索文档
估值 7 亿美元的 AI 语音输入产品:语音输入的关键问题是听写,不是转录
Founder Park· 2025-12-04 13:23
行业趋势:后键盘时代与语音交互的崛起 - 键盘被视为一种过渡性的“权宜之计”,是人机交互的巨大瓶颈,而语音被认为是更流畅、更好的交互方式 [5] - 语音交互对老年人、阅读障碍患者等群体更具包容性,能降低使用门槛 [6] - 从打字转向语音,对于日常沟通中99%的场景而言,是一次纯粹的、无损失的升级,仅在需要“像素级”精确性的法律文件起草或依赖书写过程厘清思维的日记等极小众场景下,键盘仍有价值 [9] 公司Wispr Flow:产品理念与市场表现 - 公司核心产品Wispr Flow是一款AI语音输入产品,其ARR(年度经常性收入)在5个月内翻了10倍,公司估值超过7亿美元,总融资达8100万美元 [2] - 自今年6月以来,产品收入环比增长近40%,用户一年后留存率高达70% [3] - 产品致力于解决“听写”问题,而非简单的“转录”,目标是理解用户真实意图,成为一个具备全局上下文的智能助理层 [3][4][11] - 产品关键指标“零编辑率”(即用户无需修改的比例)从年初的约45%提升至目前的89%,远超苹果、谷歌、OpenAI等公司约5%或10%的水平 [10][11] - 用户从看到Wispr生成信息到按下发送的平均时间仅半秒,显示出对系统的高度信任 [11] 产品价值与用户洞察 - 语音输入的核心价值在于消除思考时的认知负荷,让用户专注于创作,而将编辑工作交给AI,从而帮助用户进入心流状态,感觉生活更轻松 [8] - 语音能自然提供丰富的上下文,极大提升了与AI协作(如编写代码提示词)的质量和效率,解决了用户因懒惰或不耐烦而不愿输入完整提示词的问题 [13] - 语音沟通比文字打字更具人情味和情感温度,实验表明使用语音回复客户的销售团队被客户评价为“最有人情味的”,有助于恢复沟通中丢失的人性与个性 [21][22] 用户采纳路径与行为改变 - 推动用户采纳并产生依赖有三个关键的“顿悟时刻”:1)无可挑剔的初次体验带来的冲击;2)用语音解决实际痛点,使其从“很酷的玩具”变为“离不开的工具”;3)键盘使用率显著下降至5%以下,实现真正的行为改变 [14][15] - 在所有用户中,平均72%的文本输入通过Wispr Flow完成,表明其正在实质性地替代键盘 [17] - 公司正通过向财富500强企业部署产品及配套麦克风等方式,推动语音在办公环境的全面采纳 [18][19] 公司愿景与未来展望 - 公司的长期愿景是成为用户可以绝对信任、无处不在的智能助理,未来将适应无屏幕的沉浸式计算设备(如智能眼镜、智能戒指)环境 [11] - 公司致力于在未来两年内推动语音AI产品的普及,希望人们看到他人对着电脑说话时,能自然地联想到是在使用Wispr [20] - 公司认为其挑战技术构建规范的方式,在苹果、谷歌等大公司内部因官僚体系而难以实现,这是其作为独立公司存在的价值 [14]
具身智能专项赛事、创业营,近期优质 AI 活动都在这里
Founder Park· 2025-12-02 11:20
全球开发者先锋大会 (GDPS 2025) - 由上海市人工智能行业协会主办,将于2025年12月12日至14日在上海举办 [1][7] - 活动是行业内首个聚焦具身智能技能领域的专项赛事,聚焦9大真实场景同场竞技 [12] - 面向具身智能/机器人领域开发者,包括团队、企业、研究机构和个人 [8] - 活动亮点包括丰厚大赛专项奖金、算力券、语料券、模型券补贴,以及上海模力社区、AI小镇等孵化器免费入驻机会 [12] 极客公园创新大会 2026 - 由极客公园主办,将于2026年12月6日至7日在北京举办 [5] - 活动亮点是探讨技术迭代,嘉宾包括何小鹏、王小川、罗永浩等行业先锋 [5] - 面向人群为科技行业从业者、创业者、爱好者、投资及求职人员 [11] - 活动旨在帮助参与者在AI时代找到方向、队友和机会 [5] Global Immersion @CES2026 - 由极客公园Global Ready社区组织,将于2026年1月5日至11日在拉斯维加斯和洛杉矶举行 [2][9] - 行程包括CES 2026看展、7场闭门交流或主题夜谈 [2] - 适合希望了解世界消费硬件最新情况、渴望出海考察市场的战略决策者与探索全球化增长的新锐力量 [17] 蓝驰不鸣创业营(第五期·AI) - 由蓝驰创投主办,地点在北京,正式开营时间为2026年1月 [18][24] - 活动提供高质量头脑风暴,与顶级AI创业者交流,并通过Office Hour、Demo Inn、Workshop等环节进行共创 [18][19][20] - 蓝驰创投将拿出1亿元资金支持创业营,并提供包括产品、GTM、团队及融资在内的方法论指导 [22] - 面向成长于1997年后的AI-native创业者,要求消耗token量是身边人的百倍,并具有快速验证、主动实践的特点 [25] NVIDIA初创加速计划 - 由NVIDIA主办,报名已开启,面试沟通在12月,正式开营在2026年1月 [23][24][26] - 会员可获享免费的NVIDIA深度学习培训中心课程、SDK访问权限、精选硬件和软件优惠价格、GPU云折扣、投融资对接等权益 [26] - 计划面向创业公司,在报名链接中推荐机构填写“极客公园”或“Founder Park”可更快通过审核 [27]
把 AI 邮件工具做到 3500 万美元 ARR,Superhuman:找到 PMF 其实有明确的方法论
Founder Park· 2025-12-02 11:20
文章核心观点 - 创业公司成功的关键在于系统性地寻找并优化产品与市场契合点(PMF),而Superhuman的案例提供了一个可操作的框架来衡量和提升PMF [1][2][4] - 通过一个核心问题(“如果明天用不了产品,你感觉如何?”)来衡量PMF,并将回答“非常失望”的用户比例作为关键领先指标,40%是PMF的基准线 [23] - Superhuman通过其“PMF引擎”框架,将PMF分数从22%提升至58%,证明了系统化方法的有效性 [26][54] Superhuman的PMF战略 - **用户调研**:公司通过对目标用户进行超过500次深度访谈,精准了解用户邮件习惯和核心痛点,并据此调整产品方向和功能优先级 [3][9] - **原型优先开发模式**:采用Figma模型和命令行界面工具快速构建轻量级原型,并进行100多次可用性测试,基于高级用户的肌肉记忆和偏好进行快速迭代 [10] - **产品核心定位**:将“速度”定为产品核心,将UI响应时间优化至100毫秒内,比传统Gmail快两倍,并围绕效率开发了拆分收件箱、跟进提醒、模板片段及一系列AI功能 [3][11] PMF衡量框架 - **关键指标**:采用Sean Ellis的方法,通过用户调研问卷计算回答“非常失望”的用户比例,该比例超过40%是PMF达成的领先指标 [23] - **精准细分市场**:通过分析“非常失望”的用户画像来定义“高期望客户”,将市场范围收窄至最能体会产品核心价值的群体,使PMF分数从22%提升至33% [28][31][33] - **分析用户反馈**:重点关注“非常失望”用户认可的核心价值(如速度、专注、快捷键),并忽略“非目标用户”的反馈,同时争取“有点失望”但看重核心价值的用户 [36][37][39][40] PMF优化四步法 - **巩固优势与弥补短板**:产品路线图一半资源用于加倍投入用户已喜爱的功能(如速度、快捷键),另一半用于解决阻碍用户的问题(如开发移动App、日历功能) [48][49][52] - **优先级评估**:使用“成本-影响力”分析法确定任务优先级,优先处理低成本、高影响的“快赢”项目,影响力评估结合数据驱动(需求量)和产品直觉 [50][51] - **持续迭代**:将PMF分数作为公司最重要的指标进行持续跟踪,并设定专门OKR,每个季度重复此流程以确保产品优化速度快于用户期望提升速度 [53][54][58] 产品设计与管理 - **高门槛用户引导**:采用一对一视频Onboarding会议(30-45分钟)来精准筛选目标用户并实时收集反馈,极大提升用户留存率 [12] - **功能开发重点**:极致优化速度至50毫秒以内,开发全面的键盘快捷键覆盖更多场景,并推出Snippets等深度自动化功能提升效率 [55] - **目标市场选择**:专注于为少数“极度渴望”的核心用户(如追求效率的高管、创始人)打造产品,而非满足多数人“有点想要”的需求 [35]
DeepSeek V3.2 正式版发布,V4 还没来,但已经是开源模型里 Agent 能力最强了
Founder Park· 2025-12-01 13:14
DeepSeek-V3.2系列模型发布 - 公司于2025年12月1日发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个正式版模型,核心聚焦于推理与Agent能力的提升 [2] - 此次发布是V3系列持续一年的迭代,而非推出V4大版本,公司2025年采取了小版本迭代和功能累加的路线 [1][4][6] - 正式版模型已在网页端、App和API上线,Speciale版本以临时API形式开放 [3] 模型架构与技术特点 - DeepSeek-V3.2引入了DeepSeek Sparse Attention技术,大幅提升了长文本处理效率 [1] - 模型架构为MoE,并进行了强化与DSA等改进,目标是平衡推理能力与输出长度,适合日常问答和通用Agent任务 [9][10] - 本次更新的核心突破是将思考过程融入工具调用,模型能够同时支持思考模式和非思考模式的工具调用 [3][15] - 公司提出了一种大规模Agent训练数据合成方法,构建了大量“难解答,易验证”的任务,以提升模型泛化能力 [16] 模型性能表现:推理能力 - 在公开的推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro [10] - DeepSeek-V3.2-Speciale作为开源模型,在IMO 2025、CMO 2025等主流推理基准测试上的性能表现媲美Gemini-3.0-Pro [3][11] - 相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间 [10] - 基于V3.2-Exp-Base开发的数学模型DeepSeek-Math-V2实现了IMO金牌级的水平 [3] - Speciale版本在多项顶级学术竞赛中达到金牌水平,包括IMO 2025、ICPC 2025等,其中ICPC和IOI的成绩分别达到了人类选手第二名和第十名的水平 [11] 模型性能表现:工具调用与Agent能力 - 在各类智能体工具调用评测集上,DeepSeek-V3.2达到了目前开源模型的最高水平,大幅缩小了与闭源模型之间的差距 [3][18] - 模型未针对测试集进行特殊训练,在真实场景中显示出了较强的泛化能力 [3][18] - API支持DeepSeek-V3.2思考模式下的工具调用能力 [3] 不同版本模型定位与对比 - DeepSeek-V3.2目标为平衡推理与输出长度,适合日常使用 [10] - DeepSeek-V3.2-Speciale是V3.2的长思考增强版,并结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型的推理能力推向极致 [11] - Speciale版本针对高度复杂任务优化,消耗的Token更多、成本更高,目前仅供研究使用,不支持工具调用,未针对日常对话优化 [12] - 公司此前发布的V3.1版本统一了R1和V3,成为一个混合推理模型,这与当下闭源模型(Gemini、Claude和GPT-5)的大势所趋一致 [6] 行业影响与未来展望 - 公司自2025年1月20日发布DeepSeek R1后,正式引爆了国内开源模型的热潮,Kimi、MiniMax等也相继开源并取得了不错的成绩 [4] - 行业对DeepSeek下一个大版本(如V4或R2)抱有期待,潜在方向可能包括多模态、更长的上下文或更厉害的Agent能力 [8]
Stripe 闭门分享:营收增长快的 AI 企业,往往在定价、变现上做对了这三点
Founder Park· 2025-12-01 03:05
AI产品定价策略的演变与复杂性 - AI产品的定价模式变得比以往更复杂,按量计费、按人头计费、按结果付费等不同策略直接影响产品增长[1] - AI技术正在重新定义产品交付的价值和用户预期,使得变现模式和定价策略更加灵活多样[6] - 许多AI初创公司在启动变现时,最没把握的第一步是如何定价,常简单模仿竞品[7][9] 高增长AI公司的定价共性 - 高增长公司能够快速灵活地调整变现方式和定价结构,将如何收费变为与用户价值共创的动态过程[11] - 在Stripe Billing增速前10%的用户中,约80%的公司采用分层定价作为主要策略[11] - 高增长公司采用基于用量定价的可能性是其他公司的近两倍[11] - 高增长公司采用混合定价模式的比例几乎是对照组的两倍[14] - 64%的高增长公司至少会提供10个SKU,多样化的产品组合能带来更多销售机会[15] - 高增长公司倾向于支持多币种销售,以结合当地购买力灵活定价,提升转化率[15] 分层定价与用量定价的优势 - 分层定价能更好地将价格与用户感知的价值对齐,有效降低用户入门门槛[11] - 用量定价让用户只为实际使用的服务付费,能直接体现投资回报率[11][13] - 当产品用量持续增长时,用量定价能将支出与实际获得的价值挂钩,形成清晰对等关系[13] - 分层定价为用户提供支出上限的确定性,而用量计费在价值明确后更易被接受[17] 基于成果的定价与混合模式 - 变现模式正从基于使用量走向基于成果,企业为结果付费,例如Intercom按成功解决的用户问题数量计费[13] - 基于成果的定价模式非常复杂,需要清晰定义成果并设计价格体系,初创公司在找到PMF前不建议直接采用[13] - 混合模式结合基础订阅费与超额用量收费,能同时保证收入可预测性和灵活性,对AI企业尤为重要[14] - 混合模式的核心是平衡降低用户门槛、让用户感知价值与ROI、确保企业营收可预测性与利润空间[18] 市场扩展与本地化策略 - 高增长公司积极拓展全球市场,支持本地货币结算以减少结账摩擦[15] - 公司会根据不同市场的用户偏好灵活调整变现模式和定价策略,例如短剧出海从按集解锁转向订阅制[20][21] - 公司普遍具备快速响应用户需求的能力,会推出情境式折扣(如限时优惠)来提升采用率、留存率和活跃度[19] 出海税务合规流程 - 企业出海需处理税务合规问题,流程包括监控纳税义务、税务注册、税务计算、税务申报与缴纳[22][23][24] - 并非所有地区都需要立即交税,只有当交易量超过当地设定的阈值时才需要注册并缴税[22] - 美国税务非常复杂,某些州的一笔交易可能涉及多达七种不同的税,虚拟商品通常使用账单地址来区分税率[23] - 建议企业在集成支付时至少先收集账单地址,以便后续准确统计各地区交易量并判断纳税阈值[25] - Stripe Tax产品会主动提醒哪些地区需要处理税务事宜,企业可针对性完成注册和开启计税功能[25] 出海产品定价与税收模式 - 美国、加拿大等地区普遍习惯不含税定价,B2B模式中常见,交易明细更透明[26] - 欧盟国家的B2C模式大多采用含税定价,价格本身已包含税费,新加坡的B2C场景也通常是包税定价[26] - Stripe最常见的费率模式是打包价(一口价),例如美国为2.9% + 30美分/笔,新加坡为3.4% + 30美分/笔[26] - 也支持IC++费率模式,将付给卡组织、发卡行的基础成本转嫁给商户,再约定固定利润,但初创公司多选择更易预估的打包价[26][27] 注册主体选择与账户开通 - Stripe支持近50个国家和地区的公司主体直接开通账户,中国AI企业出海主体常选择香港、新加坡及美国[28] - 中国大陆主体目前不能直接开通Stripe账户,可使用Stripe Atlas在美国特拉华州快速注册公司后开通[28] - 选择主体时需综合考虑注册便利性、Stripe费率及企业所得税,新加坡或香港的整体税负可能更划算[30] - 开通账号有两种体系:自主账号适合技术能力强的团队;商务账号通过Stripe商务团队协助开通,能提前规避风控问题,稳定性更高[41][42] 跨境支付费率、限额与风控 - Stripe单笔交易上限为999,999美元,对绝大多数ToC AI产品的客单价而言基本不会触及[31] - 费率与公司主体所在地密切相关,欧洲主体费率通常最低、美国居中、亚太地区跨境收单费率相对更高[31] - 最优方案是主体所在地、主要收款币种、用户分布区域三者匹配,以避免汇损[31] - 安全性方面,Stripe拥有PCI DSS Level 1合规认证,用户支付信息端到端加密,合规责任由Stripe承担[32] - 为降低账户被锁概率,建议提前联系Stripe商务团队开通账号,并控制好关键指标如争议率[41][42] 多币种定价与汇率策略 - 可使用Stripe的Adaptive Pricing(动态定价)锁定商户收入,同时在消费者端动态展示本地货币价格以提升转化率[33] - 例如,美国商户卖50美元产品给欧洲用户,结账时可提供固定50美元或实时换算的欧元价格选项[33] - 在汇率波动剧烈的地区(如南美),可通过Stripe支持用稳定币(如USDC)支付,商户端自动兑换为美元,确保收入稳定[34] 预充值Credit消耗与硬件收款 - 对于“固定收费+用量计费”的混合模式,Stripe能实现精准的用量计费与余额监控,自动生成发票[35][36] - Stripe自带符合IFRS 15和ASC 606标准的收入确认功能,可自动化账务结算,并与Xero、NetSuite等ERP系统集成[36] - AI硬件产品的收款可通过Stripe一次性完成,Stripe Tax能根据买家地址和商品税务属性自动计算税费[37] 本地支付方案与多主体收单 - 提高付费转化率需支持本地主流支付方式,如中国的微信支付/支付宝、新加坡的PayNow、巴西的Pix[38] - 初创阶段通常用一个主体(如香港或新加坡公司)的Stripe账号统一收取全球款项[39] - 当业务规模增长(如月交易量达几十万甚至上百万美元),可考虑注册多个主体实现本地对本地收单以优化费率与支付成功率[39] - 多主体收单会带来更高的维护成本(如各国企业所得税),需在收入达到一定规模且市场分布分散时评估采用[40]
CB Insights 发布 45 家潜力初创企业名单,70% 已进入商业化部署阶段
Founder Park· 2025-11-30 01:04
文章核心观点 - CB Insights发布了2025年未来科技新星榜单,评选出45家高潜力初创公司,这些公司代表了当前最具颠覆性和增长潜力的技术趋势 [2] 榜单概况与评选标准 - 榜单名称为“CB Insights Future Tech 25”,旨在识别处于早期阶段、有望定义未来十年的科技公司 [2] - 评选标准包括技术创新性、市场潜力、团队背景、竞争格局和投资者支持等多个维度 [2] 主要技术趋势与代表公司 - **人工智能与机器学习**:多家公司致力于推动AI基础设施、开发工具和行业应用的突破 [2] - **量子计算**:入选公司正开发实用型量子计算机和软件,以解决经典计算机难以处理的复杂问题 [2] - **合成生物学与生物工程**:利用工程学原理设计生物系统,在医疗、农业和材料科学领域创造新产品 [2] - **下一代机器人**:公司专注于开发更灵活、智能且能与人类安全协作的机器人系统 [2] - **空间技术与卫星**:低成本发射和小型化卫星正使太空变得更容易进入,催生新的数据和服务 [2] - **先进能源与储能**:初创公司正在开发更高效、可持续的发电和储能技术,以支持能源转型 [2] - **Web3与去中心化技术**:超越加密货币,该领域公司正在构建去中心化的互联网基础设施和应用 [2] - **隐私与安全计算**:在数据驱动时代,保护隐私和安全的技术变得至关重要,相关公司提供创新解决方案 [2] 初创公司特点 - 入选的45家公司普遍处于发展的早期阶段,但已展现出解决重大全球性挑战或创造全新市场的潜力 [2] - 这些公司吸引了顶级风险投资机构和战略投资者的关注与资金支持 [2]
Lovable 增长负责人:Vibe Coding 产品还没找到 PMF,核心用户每个季度都在变
Founder Park· 2025-11-28 12:47
行业核心动态 - AI Coding工具累计营收突破31亿美元,Vibe Coding初创企业估值一年内增长350% [1] - 明星产品Lovable的ARR已超过1亿美元,但公司增长负责人Elena Vera认为PMF(产品市场契合)仍不确定,定义每周都在变化 [2][3][10] - 行业面临的核心挑战是底层模型能力快速迭代,产品价值提升更多依赖模型进步而非自身开发,导致竞争壁垒降低且用户预期急速变化 [3][17] PMF范式转变 - 传统PMF标志为ARR达100万美元且用户留存良好,可享受数年红利;但在AI领域,PMF变为需持续维护的"订阅服务",即使收入数亿美元也难以稳固 [7][8][9][10] - 公司发展模式从线性阶段推进转变为每季度重走"达成目标、规模化、创新"全流程,增长重心转为保住现有PMF而非扩张 [11] - 稳定PMF的信号包括技术进步从指数爆发转向渐进、AI交互模式稳定、模型发布周期延长、企业客户关注点从技术震惊转向ROI [27] 用户与市场变化 - "相邻用户理论"失效,因模型厂商每发布新模型即改变产品价值点,核心用户画像每个季度都在变化,企业难以向外扩展新圈层 [12][13][14] - 市场端客户习惯变化周期从数年缩短至数周,精度和抗"幻觉"能力快速成为基础预期,导致GTM团队需每季度重写宣传语和销售话术 [17][18] 产品战略与品类演化 - Vibe Coding品类尚未定型,其能力边界随LLM进步每周变化,并开始吞噬网站构建工具、无代码工具等传统品类 [21][22] - 软件行业可能走向"Micro-SaaS"模式:Agent简化垂直界面开发,用户通过提示框即可创建应用,降低开发门槛使过度专业化SaaS面临被替代风险 [23] - 产品发布策略分级:一级发布(每三个月关键功能)、二级发布(酷功能但不决定成败)、三级发布(每日小调整),以高频更新维持市场活跃度 [26][34] 增长模式重构 - 用户激活环节移交产品团队,因AI产品交互浓缩为聊天框,增长团队转向构建PLG生态系统(自助服务、留存、客户教育等) [29][30][31] - 传统增长渠道(SEO、付费广告)效果减弱,新增长依赖口碑传播、创始人社交影响力、创作者经济(如TikTok、YouTube演示) [33][35][36] - 品牌建设视为产品核心工作,通过每次交互体验传递品牌价值,口碑成为打破信息过载的关键渠道 [31][32][35] 竞争护城河 - 速度成为核心优势,Lovable每日发布更新,通过快速假设-冲刺-学习循环应对目标动态变化,将发布速度作为竞争优势 [24][25] - 先发优势关注点转向平台新功能(如OpenAI应用商店),消费者发现方式从搜索转向对话AI,社交平台官方账号发帖效果减弱 [38][39]
AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金
Founder Park· 2025-11-27 12:33
行业趋势与市场动态 - 大模型技术驱动下,输入法赛道在2025年下半年重新成为市场焦点,行业关注度显著提升[1] - 语音输入领域近期消息密集,国内外厂商动作频繁:字节豆包输入法结束内测正式上线,微信输入法持续迭代,智谱内测AI输入法;海外Wispr完成2500万美元A轮融资累计融资达8100万美元,Typeless在Product Hunt上线首日登顶[2] - 当前市场产品可划分为三大阵营:桌面端SaaS派(如Wispr、Typeless)、移动端大厂派(如豆包、微信输入法)、小成本极客派(如Whisper Keyboard、闪电说)[4] 产品性能测试与评估 - 在模拟科技公司产品经理焦虑状态下会议发言的极端测试中,桌面端最佳产品为Typeless,移动端最佳为豆包输入法[6] - Typeless延迟时间为3.05秒,具备强力净化功能,能删除废话、修改大小写和标点格式,输出质量最佳[6][8] - 豆包输入法延迟时间为2.05秒,是唯一能根据上下文逻辑准确区分发音相似词汇的产品,中文识别能力突出[6][8] - 微信输入法延迟时间仅1.08秒,响应极快,中文识别准确,但英文全小写是硬伤,适合聊天场景[6][8] - Wispr延迟时间高达10.14秒,严重影响交互心流,中文成语理解和逻辑处理出现偏差[6][8] - 闪电说延迟时间为3.13秒,但在测试中表现欠佳,将专业术语听漏或听错[6][8] - 苹果自带听写表现最差,完全无法处理专业术语[6][14] 桌面端产品战略与特性 - 桌面端创业公司瞄准知识工作者,通过SaaS订阅模式提供高附加值服务,声学环境相对稳定利于专注语义处理[18] - Wispr累计融资8100万美元,拥有270家福布斯500强公司客户,核心亮点为根据应用程序自动调整转写文本语气和风格[19] - Typeless在3.05秒处理时间内完成去口语化、自动纠错和格式排版,提供“精修后”文本降低二次编辑成本[25][27] - 桌面端产品普遍追求无感使用体验,UI最小化,通常只需按下一个键即可直接输入[35] - 国内出现智谱AI输入法等跟随者,界面设计和引导流程复刻Typeless,但稳定性与细节打磨尚有差距[36] 移动端产品战略与特性 - 移动端大厂竞争基于战略层面考量,输入法是连接用户与生态的超级入口,场景复杂度远高于桌面端[38] - 豆包输入法在移动端提供最佳中文语音输入体验,语义理解能力惊艳,但iOS端受限于后台机制需跳转App[39][42] - 微信输入法核心任务为提供最流畅社交体验,深度整合微信生态功能如表情包推荐、跨设备剪贴板同步[47][50] - 移动端产品普遍采取“速度优先”策略,牺牲格式严谨性换取毫秒级响应速度,契合即时通讯需求[55][56] - 移动端输入法UI占用半个屏幕,功能更丰富包括搜索、斗图、字体花样等,用户体验细节密集[46] 技术范式与未来展望 - 大模型技术将语音输入从自动语音识别升级为理解与重构,机器开始“听”逻辑而非仅“听”发音[63] - 技术范式转移使AI能容忍用户口吃、倒装、方言及中英混输,并基于上下文自动修正错误[64] - 交互流程发生根本性价值重构,从“语音转文字”进化为“语音转思考”,输入法正成为回归人类本能的自然交互界面[65]
AI 顶尖科学家、前 OpenAI 联创 Ilya Sutskever 的 18 个最新思考
Founder Park· 2025-11-26 13:06
AI行业发展阶段与范式转变 - Scaling(扩展)时代已结束,单纯将规模扩大100倍不会带来模型能力的质变[4][8] - 行业从2020年至2025年是扩展时代,而2012年至2020年是研究时代[9] - 行业正重新进入研究时代,特征是尝试多种方法并观察有趣现象的发生[11] - 当前真正瓶颈是模型泛化能力远不如人类,而非算力[4][13] 技术研发方向与核心挑战 - 预训练数据终将耗尽,行业正在探索魔改版预训练用于强化学习等其他方法[7] - 模型能力呈"锯齿状",评测表现与真实世界表现存在巨大断层[27][30] - 泛化能力包含两个子问题:样本效率低以及难以教会模型所需技能[25] - 人类样本效率极高,可能源于进化赋予的核心先验知识或更好的机器学习算法[26] 价值函数与情感的作用 - "情感"作为一种价值函数未来一定会被广泛使用,简单但能在广泛情境下发挥作用[4][18] - 价值函数能让强化学习更高效,无需等待任务完成即可提供实时反馈[16][17] - 人类情感对于生存和有效行动至关重要,类比为大模型中的价值函数[15] - 价值函数的使用界限开始模糊,可能是新配方的关键组成部分[10] AI公司竞争格局与商业模式 - 沿用"盲目扩大规模"路线的公司可能获得惊人收入但不一定有利润[4] - 未来竞争将导致价格下降,公司需在同质化竞争中寻找差异化[34] - 可能出现专业化竞争格局,不同AI公司专注不同复杂领域[34] - 大规模部署AI可能带来经济飞速增长,但增长速度难以预料[35] 超级智能发展与对齐目标 - 未来5-20年可能出现具备人类级别学习能力并能走向超智能的系统[44] - 最终对齐目标是让超级智能真正关心和感知所有生命[4][43] - 构建关爱感知生命的AI比只关爱人类的AI更容易,因为未来大多数感知体将是AI自身[43] - 渐进式部署AI比纯粹思考更重要,让世界感受AI能力是关键[4][39] 研究方法与公司战略 - 好的研究品味需要美感、简洁、优雅以及从大脑汲取的正确灵感[37][38] - SSI公司专注于研究,技术路线与众不同且全力以赴[57][58] - 公司认为分阶段发布模型至关重要,部署过程本身就是试错和学习时期[53][56] - 持续学习非常重要,AI应像绝顶聪明的15岁少年那样充满干劲地学习[56]
极客公园创新大会全议程公布!罗永浩来了
Founder Park· 2025-11-26 05:31
大会热度与市场关注度 - 极客公园创新大会2026届门票售罄速度创16年纪录,提前15天全部售空,反映出市场对本次大会主题及嘉宾阵容的高度关注和强劲需求 [2] 核心议题:人工智能的现状与未来 - 大会主题围绕“非共识”追问,强调技术突破始于挑战旧系统的勇敢探索 [7][8] - 核心议题覆盖AI如何探索人类想象力、物理AI改变生活、AI 3D创作、多智能体时代的机遇与挑战、AI时代的创作主权以及AI带来的信息过载与注意力管理等前沿话题 [9][11][12] - 设立“未来15007”板块,对下一代AI原生应用、交互OS、AI搜索范式、脑机接口、可控核聚变及AI手机等未来技术进行预演和推演 [17][18][19] AI产品与应用创新 - 大会展示一批新鲜出炉的AI产品,包括能写代码的Coding搭子、会干活的Agent助理以及各类令人惊叹的应用 [11] - 举办“AI产品快闪”环节,集中展示包括flomo、PallasAI、Doka相机、LavieAI、OdyssLife、MuleRun、remio在内的多款AI新产品,涉及思考辅助、内容生成、摄影构图、虚拟模特、智能硬件、Agent平台及个人工作助理等多个细分领域 [13][14][15] AI硬件与交互进化 - 探讨交互载体从屏幕向眼镜、机器人、汽车座舱的演进,这被视为一场交互本质的进化 [21] - 专场讨论涵盖AR眼镜(如XREAL)、AI学习硬件(如TeeniAl听力熊)、AI机器人、外骨骼(如Hypershell)等硬件品类,关注硬件如何融合AI大脑以及AI硬件的现实与理想 [22] - 设立“硬控AI”与“空间智能”专场,深入探讨AI硬件风口下的机会与挑战,以及从文字智能到空间智能(如机器人、AI眼镜)的落地路径 [38][40][42][43][44] 组织变革与个体机遇 - 探讨AI Agent重塑工作流,使“一人公司”成为可规模化的现实,并聚焦于个体如何在组织内突围、构建商业闭环以及建立AI无法复制的护城河 [26] - “超级个体”专场讨论AI如何让个体在组织内变得无可替代、AI时代个体的成长路径以及AI时代创造力的来源 [26][27] - “重塑关系”专场探讨AI作为“硅基崛起”新主体,如何塑造人与AI的新连接与协作关系,议题包括AI作为社会一份子的未来、To B场景下的Agent价值以及AI陪伴需求 [30][31][32] 嘉宾阵容与生态合作 - 大会汇聚了来自字节跳动、小鹏汽车、影石Insta360、百川智能、OPPO、Meta、源码资本等知名科技公司、创业公司及投资机构的创始人、高管及专家 [9][18][19][22][31] - 联合出品、主办及合作方包括变量资本、798文化科技、小红书、小宇宙、MINIMAX等众多投资机构、文化科技平台、内容社区及技术公司,显示出广泛的行业生态连接 [46][47][48][49][50][51][53][54][55] - 合作媒体覆盖新浪科技、虎嗅、凤凰网科技、量子位、界面新闻、机器之心等主流科技与财经媒体,保证了大会内容传播的广度与深度 [57][58]