Workflow
Founder Park
icon
搜索文档
OpenAI发布o3-pro:复杂推理能力增强,o3价格直降80%,计划夏天发布开源模型
Founder Park· 2025-06-11 03:36
o3-pro模型发布 - o3-pro作为推理模型o3的升级版,在处理复杂问题、给出精准回答方面表现更强,尤其在科学研究、编程、教育和写作场景优势明显[1][3] - 支持调用ChatGPT全套工具(网页搜索、文件分析、图像推理、Python编程等),执行力和整合能力更强[5] - 响应速度比o1-pro稍慢,更适合对答案准确性要求高的场景[7] - 采用"四次全对"评估标准,大幅提升推理一致性要求[10] - 目前不支持临时对话、图像生成和Canvas功能,图像生成需使用GPT-4o、o3或o4-mini模型[13] 商业应用与定价策略 - o3模型价格直降80%,现为输入百万tokens 2美元,输出百万tokens 8美元[23][24] - o3-pro定价为输入百万tokens 20美元,输出百万tokens 80美元,比o1-pro便宜87%[28] - Plus用户的o3模型使用速率限制提升一倍[28] - 建议使用"后台模式"处理耗时任务以避免请求超时[28] - 公司ARR从55亿美元增长至100亿美元,增幅近80%[35] - 付费商业用户从200万增至300万[39] 技术合作与基础设施 - 与Alphabet达成合作引入Google Cloud作为额外云服务提供商[32] - 推进5000亿美元规模的星门计划,与CoreWeave签订数十亿美元算力采购协议[35] - 算力资源优化是降价主要原因,推理服务架构全面升级[29] 开源计划与AI发展展望 - 计划2024年夏季晚些时候发布公开权重的开源模型[44][45] - 预计2025年出现能进行认知工作的智能代理,2026年产生原创见解的系统,2027年现实世界执行任务的机器人[47] - AI加速科学进步与生产力提升将带来巨大生活质量改善[47] - 数据中心生产自动化将使智能成本接近电力成本[50] - 公司定位为超级智能研究公司,致力于构建高度个性化、人人易用的"大脑"[54]
WaveSpeedAI 成泽毅:AI Infra 本来就是一门能挣钱的生意
Founder Park· 2025-06-10 12:59
核心观点 - 技术人追求价值证明而非安稳,大厂天花板促使成泽毅创业[1][2] - 推理加速是AI商业化关键环节,海外市场更认可Infra价值[15][20] - 通过开源验证技术市场潜力,全球化策略从Day One确立[11][21] - 轻资产团队+重系统架构,实现成本1/5的极致性价比[28][46] - 视频生成市场爆发前夜,降本需求催生百亿美元蓝海[42][47] 职业转折与创业动机 - 阿里两年升两级后遭遇成长瓶颈,团队膨胀稀释个体价值[1][6][7] - 创业公司商业化路线模糊,被动等待市场的心态成束缚[3][17] - GitHub项目24小时700星验证技术独立价值[8][11] - 国内Infra价值被低估,海外客户愿为稳定高效付费[12][20] 公司定位与商业模式 - 专注图片/视频生成推理加速,25年2月上线3月营收5万美元[4] - 寄生式合作策略:嵌入大客户系统分润,避免平台竞争[32] - 7人全栈团队实现小时级响应,远程协作降低沟通成本[29][30] - 与Datacrunch/Replicate等合作,技术授权+算力弹性调度[32][35] 技术架构与竞争优势 - 10万行代码自研PyTorch原生推理框架,拒绝ONNX复杂化[34] - 延迟从6秒优化至2.4秒,单位成本降至行业1/5[46][48] - 服务Freepik日处理200万图像,GPU支出节省数千美元/小时[48] - 系统兼容Google Veo/Minimax等主流商业模型[32] 市场洞察与行业趋势 - AI视频生成成本痛点:Veo 2模型10秒视频成本达5美元[43] - 全球视频生成市场规模2030年将达百亿美元,CAGR超30%[42] - 多模态技术需求爆发,开发者计划赋能超1万名创作者[55][56] - 国内企业忽视长期维护,海外认可Infra为商业化突破口[19][20] 运营策略与未来规划 - 先盈利后融资:4月实现数百万美元天使轮时已现金流为正[4][27] - 开源引流+快速商用验证,拒绝重资产GPU采购[24][35] - 规划Agent生态/建站工具,强化开发者支持体系[56] - 定位中国AI全球化范本,目标国际市场份额[57][58]
AI 创业者的反思:那些被忽略的「快」与「长」
Founder Park· 2025-06-10 12:59
产品方向与技术应用 - 在AI创业中,速度和长文本上下文处理能力是关键因素,忽视这两点会导致产品失败 [1] - ChatGPT因响应速度快而获得高使用率,而Perplexity因加入Cloudflare检查导致使用率下降 [3][4] - 长文本上下文处理能力(如Gemini 2.5 Pro的1M token支持)显著提升产品体验,远超RAG/企业知识库方案 [7] AI对白领工作的影响 - AI并未取代白领工作,而是扩大了目标市场规模(TAM),例如bland.ai通过AI电话提升司机接单效率 [5] - AI使低ARPU商品也能提供强销售和客制化体验,颠覆传统分销模式 [6] - AI员工可低成本支持本地化陆军业务,弥补传统出海模式的不足 [6] 模型能力与产品设计 - 产品需求描述需结合模型实际能力,单纯PRD无意义,需通过AB测试验证 [8] - C端产品经理需提升对模型能力的认知,模型调优比UI/UX更能带来正向收益 [9] - 投资人应关注模型能力(快/长/智)带来的C端体验变量,而非仅看产品定位和流量 [9] 行业趋势与竞争策略 - 开源模型将导致模型层被管道化,价值将集中在应用层和workflow capture [7] - 最强AI产品需最大化发挥模型超能力,类似推荐算法时代的UGC短内容生态 [10] - 谷歌CEO Sundar Pichai认为应专注打造最佳模型,场景和商业模式自然跟随 [10] 创业反思与认知提升 - 早期对ChatGPT的判断过于莽撞,实际价值在于丝滑体验和快速加载 [4] - 行业对长上下文能力的认知滞后,直到Gemini 2.5 Pro发布才验证其重要性 [7] - Eric Schmidt早指出AI发展方向为更少幻觉、更长上下文和多模态,但实践验证后才被广泛接受 [8]
奇绩创坛 2025 春季路演:Agent、具身、Infra、AI4S,57 个项目完整介绍
Founder Park· 2025-06-09 13:37
奇绩创坛2025春季创业营路演日概览 - 57家公司参与路演,项目集中在场景智能(22家)、空间/具身智能(16家)、认知智能(18家)、科学智能(4家)四大方向[3] - 覆盖AI Agent、智能硬件、AI4S、机器人、先进制造、AI Infra等关键赛道[3] - 展示28个前沿科研项目,包括神经量子态引入大语言模型压缩、原子尺度统一建模分子蛋白基因等创新技术[3] 电机与动力系统创新 - 凌创电机开发轴向磁通电机技术,体积重量减半、成本降低70%,效率与轻量化达全球领先水平[8] - 无磁直驱电机采用高压电场电荷力替代电磁力,扭矩提升40%,堵转零发热,续航提高50%,专注人形机器人关节应用[245] - 通关达工业技术研发堆叠电极型电液压人工肌肉,获中美发明专利,具备静音、节能、防水等技术优势[160] 航天与太空科技 - 冕巢航天研发100%可复用火箭末级,已为卫星企业提供高效发射服务及高空实验平台[100] - 天罗地网构建天地基一体智能太空监测网,自主研发地基卫星观测系统与天基飞跃载荷,实现高时效性空间目标监测[169] - 殿推航天开发卫星电推进器,产品分霍尔推进器、离子推进器、脉冲等离子推进器三类,瞄准星链技术迭代路线[12] AI与工业融合 - 埃逻科技打造AI工业设计引擎,已在预制装配住宅、太阳能光伏幕墙领域实现百万级订单交付[16] - 志丞科技通过大模型解析工业图纸生成BOM/BOP,已训练10万+机加工图纸,直连产线设备形成自主化闭环[250] - 星炬智械提供AI产线设计多智能体平台,沉淀20年自动化产线经验,为客户提供从优化到智能工厂重构的全周期方案[211] 具身智能与机器人 - 万物有灵开发形态可变可重构机器人,采用单元化设计架构与快慢系统具身大模型,动态适应多场景任务需求[71] - SOMA Robotics推出千元级桌面机械臂与具身算法开发系统,构建分布式训练范式,支持数据资产流通与模型协同迭代[91] - Flexim研发全球首款具身连续体机械臂,成本显著低于行业水平,安全性支持人机共存环境,已获超千万元战略合作[202] AI原生工具与平台 - 魔法葫芦开发感知驱动第二大脑工具,通过拍照+录音捕捉信息,AI主动推送建议,未来拓展至穿戴设备与脑机接口[22] - Memobase提供AI应用用户上下文数据平台,开源版本支持结构化用户画像,日调用量达60万+,服务4万+用户记忆[254] - Datapresso专注工具调用数据合成基建,构建完整数据流水线,服务头部大模型公司与垂直Agent企业需求[178] 医疗健康与生物科技 - In.Doctor研发8um级智能隐形眼镜监测系统,集成多疾病指标监测与行为辅助功能,获第三方检测认证[181] - CinoCore Health开发临床医疗Agent平台,成果获BMC Medicine等顶级期刊认可,服务肿瘤数字疗法研发[144] - Diatom Biolab基于数字微流控技术开发生物服务器,可执行高通量模块化生物实验,效率实现指数级增长[49] 教育娱乐与内容创作 - 析析教育智能通过Chatbot与墨流画板提高学习效果,独创数学思维体系获80万人认可,培养2亿青少年深度思考能力[30] - 镜绽科技开发3D角色动画引擎,用户拍照即可将实体玩偶"复活"为虚拟角色,首创无骨骼动作迁移技术[35] - Elser.AI打造消费级动漫生成Agent,以1%传统成本制作动漫成片,集成观看、IP互动与社交功能[225] 边缘计算与芯片 - 蔚澜芯源研发Dataflow架构边缘计算芯片,能效提升最高30倍,已完成全球能效最高Dataflow芯片流片[66] - 时维感知采用第三代人工智能SNN架构开发传感芯片,功耗降低100倍,灵敏度提升一倍,保持MHz级采样速率[155] - 澜紫微电子开发AI驱动半导体工艺仿真软件,覆盖光刻/刻蚀/薄膜沉积流程,对标ANSYS/COMSOL等国际产品[106]
谷歌悄咪咪上线了 10 款 AI 应用,下一个 NotebookLM 可能在里面
Founder Park· 2025-06-09 13:37
Google Labs AI应用平台 - Google Labs是谷歌官方的AI实验平台,聚焦生成式AI项目,定位为AI创意孵化器,用于测试基于最新AI模型的新奇产品 [6][7] - 平台已上线10+款高完成度AI应用,涵盖创意设计、内容生成、教育娱乐等领域,包括Whisk、Gen Type、Mixtape等工具 [3][5] - 历史成功案例显示,Gmail等成熟产品早期均通过该平台验证,当前重点转向生成式AI方向 [7] 核心AI产品功能解析 创意生成工具 - Whisk实现低门槛AI生图,支持图片上传作为风格参考,结合Imagen 3模型生成融合图像,集成Veo 2技术可添加动态效果 [10][13][18] - Gen Chess提供象棋生成器,支持经典/创意双模式,输入IP名或食物等关键词即可生成主题棋子,含AI对战功能 [54][55][67] - Gen Type通过材质描述生成A-Z全套字体,如"吐司葡萄果酱"风格字母,输出PNG素材 [72][73] 垂直场景应用 - Food Mood实现跨国菜系融合,选择国家组合+食材可生成完整食谱,支持素食/无麸质等需求 [41][42][43] - Talking Tours提供AI导游服务,覆盖全球地标VR实景,支持实时画面生成新解说词 [77][79][83] - Career Dreamer基于现有职业生成技能图谱,推荐AI内容策略师等关联岗位 [85][86][90] 内容生产工具 - National Gallery Mixtape将名画转为AI音乐,支持6幅画作混音,显示"钢琴""弦乐"等特征标签 [37][38] - Illuminate播客工具可设定访谈风格,支持学术论文等文本转对话音频,区分随性/专业模式 [102][103][104] - Stitch通过文本生成UI草图,如披萨课程落地页、植物养护仪表盘等界面原型 [107][108][112] 技术实现与交互特性 - Whisk采用图片解析+提示词优化技术,准确还原橘猫毛发细节等特征,动画效果精准控制局部元素 [22][24][28] - Learn About构建结构化知识框架,提供简化/深入/可视化三种内容呈现方式 [94][96][99] - 产品普遍强调低交互门槛,如Food Mood随机生成功能、Gen Chess预设提示词模板等 [42][55][72]
项目不重要,今年的 AI 投资,还是在投人
Founder Park· 2025-06-09 12:34
招募要求 - 招募9位新锐Founder,独立开发或拥有团队均可 [7] - 专注于泛Gen AI赛道,垂类场景和产品形态不限,有可展示的产品Demo更佳 [7] - 入选者需配合大会流程,进行约20分钟的产品展示及线下互动 [7] 招募流程 - 报名时间:5月23日-6月10日18:00 [7] - 最终通知:6月13日18:00,过期未通知即为未入选 [7] - 流程包括资料提交、资料初审、线上面试、项目复审、入选通知 [7] - 通过初筛后,团队将通过微信、邮件等形式联系,需保持联络畅通 [7][8] 时间地点 - 活动时间:2025年6月20日下午 [7] - 活动地点:北京798·751园区 [7] 活动形式 - 每位Founder有20分钟时间分享产品进展和创业思考 [7] - 分享结束后,互动嘉宾将就场景、产品、技术、商业前景等维度提问 [7] 入选福利 - 通过初筛的项目将获得「创业者加速资源包」标准版 [6] - 线下展示项目将获得「创业者加速资源包」进阶版 [10] - 包括模型及算力调用支持、Founder Park社区曝光、模型算力免费调用等 [10] - 提供产品设计、增长辅导、海外增长支持 [10][12] - AGI Founders Fund投资绿色通道及LP Office Hour(总计3小时) [10] - Founder Park社区优先采访及技术产品、算力、增长顾问等支持 [10]
硅基流动完成新一轮数亿元融资,阿里云领投
Founder Park· 2025-06-09 10:06
融资情况 - 硅基流动完成数亿元人民币A轮融资,由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问 [1][2] - 公司2024年底完成亿元Pre-A轮融资,投后估值达2亿美元 [1] 公司战略与目标 - 融资资金将用于加大研发投入,拓展海内外市场,目标是成为开发者首选的生成式AI开发平台 [1][2] - 公司将持续深耕AI基础设施技术创新,降低开发者与企业AI应用的开发与部署门槛 [6] 技术与产品创新 - 自主研发高性能推理引擎,显著提升芯片计算效率,完成国产芯片深度适配,实现国产算力从"可用"到"好用"的突破 [3] - 2025年2月推出基于国产算力的DeepSeek-R1 & V3服务,用户体验和性价比达到国际主流GPU水准 [3] - 研发一站式异构算力纳管平台,通过弹性算力调度技术提升算力运营效率,整合碎片化算力资源 [3] - 大模型云服务平台SiliconCloud上线上百款主流开源大模型,提供从模型精调到部署的一站式解决方案 [5] - 一站式工作流设计平台BizyAir支持云端GPU资源与本地ComfyUI协同,解决本地算力瓶颈问题 [5] 业务进展与市场表现 - SiliconCloud平台总用户数突破600万,企业客户数达数千家,日均Token生成量上千亿 [5] - BizyAir支持阿里巴巴通义万相视频生成工作流,并支持自定义LoRA模型 [5] - 公司已在大语言模型、文生图、视频生成等领域实现应用落地,服务互联网、金融、制造、文娱等行业头部客户 [6] 行业背景与机遇 - 阿里巴巴通义千问Qwen、DeepSeek等开源大模型崛起以及AI推理算力需求激增,推动公司业务爆发式增长 [2] - 公司致力于推动AI技术深度应用,加速千行百业智能化升级 [6]
Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?
Founder Park· 2025-06-06 15:03
Google AI战略与产品进展 - Google通过整合Brain和DeepMind团队成立Google DeepMind 显著提升AI研发能力[5][6][9] - 公司TPU基础设施投资已持续十年 目前正扩大规模以支持大模型训练[6][8][12] - Gemini系列模型处理token量从12个月前的9 7万亿/月暴增至480万亿/月 增长50倍[27][28] - 推出Gemini 1 5 Pro、Flash等差异化产品线 Pro模型能力达Ultra的80%-90%但成本更低[30][31] 搜索业务AI化转型 - 搜索未来将部署多路径检索模型 整合网络信息并引导至有价值内容[4][14] - AI概览功能已嵌入广告 用户反馈积极并推动产品增长[15][16][18] - AI模式作为独立标签页测试 成熟后将逐步迁移至主搜索页面[18][21] - 非英语用户受益显著 Gemini多模态能力打破语言信息壁垒[15][22] 技术突破与行业影响 - 30%代码由AI辅助生成 整体工程效率提升10%[32][33] - 计算领域下一个交互范式是AR Project Astra项目将重塑Android XR生态[36][37][38] - 自动驾驶领域Waymo完成1000万次付费服务 最后20%技术攻坚比初期80%更耗时[39][40] - 当前处于AJI(非均衡AI)阶段 2030年前或难实现AGI但各维度将现飞跃[42][43][44] AI长期价值与产业变革 - AI独特之处在于递归式自我改进 将超越电力成为人类史上最重要技术[57][58] - 创造力门槛降低将释放全球80亿人认知潜力 内容创作群体或达十亿级[60][62][64] - 未来顶级内容体验仍依赖人类特质 AI生成与人类创作将长期共存[63][64][66] - 模型推理能力构建基于科学原理而非硬编码规则 尤其在数理领域[25][26][29]
AI Pin 们折戟后,第二代 AI 硬件闷声发了大财
Founder Park· 2025-06-06 15:03
AI硬件行业趋势演变 - 第一代AI硬件以"取代手机"为口号但遭遇市场挫折 Humane的AI Pin退货率极高最终被惠普收购 [1][2][4] - 第二代AI硬件转向垂直场景 2023年plaude营收达7000万美元 讯飞AI耳机用户突破100万 meta AI眼镜出货量超200万台 [5] - 行业共识从"颠覆性创新"转向"场景化深耕" 涂鸦智能平台驱动3000多类设备覆盖工业传感器到智能喂鸟器等碎片化需求 [8][9] 产品策略差异 - 失败案例特征:强求通用性 Humane的AI Pin试图替代手机功能导致体验崩塌 [4] - 成功案例特征:专注单一场景 小智AI项目3个月接入设备增长20万台 讯飞耳机年营收翻倍 [5] - 硬件边界理论:涂鸦智能COO杨懿强调"硬件必须交付具象结果" 智能喂鸟器需精确识别鸟类而非空谈AI [8][9] 交互范式变革 - 手机属于强交互设备 需要用户持续操作界面 [13] - AI硬件呈现弱交互特性 如智能家居系统自动调节温度湿度无需手动控制 [13] - 谷歌CEO预测计算将融入物理世界 通用机器人或成下一代平台但至少还需6年发展 [13][14] 操作系统演进 - 新型AI操作系统雏形显现 以ChatGPT/Copilot/Gemini等助手为核心跨设备调度 [16][17] - 巨头布局路径:OpenAI打造"AI时代Windows" 微软将Copilot植入Windows系统 Google全栈整合Gemini模型 [18] - 操作系统定义重构 从设备预装软件转变为云端任务调度系统 入口权从App点击转向AI代理 [21] 生态构建策略 - 开源成为关键路径 小智AI开源后用户DIY开发出智能家居/AI陪伴等场景 [23][25] - 涂鸦智能TuyaOpen框架集成多模型 支持新加坡建屋管理局等商业案例实现节能 [25] - 行业转向接入"隐形OS" 而非打造独立硬件 字节扣子平台降低开发门槛加速生态扩张 [25][26]
AGI Playground 2025,罗永浩来了!
Founder Park· 2025-06-05 20:53
Founder Park /AGI Playground 2025 动意以 Agenda 6.20 PM lec 特别单元 22822882 Founder Show x se np 新锐与成熟创业者的 28 深度探讨 30 6.21 AM 主题分享: Why Chapter 2 ? 6.21 PM Al 硬件 垂直 Agent 全球化 50 6.22 AM al Al Cloud 100 China x AGI Playground 6.22 PM 创业新范式 | 出海新方法 | After Party 6.21 22 PM 露天 Social Playground 喝点东西, 坐下唠! Founder Park /AGI Playground (2025 Buy Tickets Now 15 16 17 18 19 20 21 23 Founder Park Founder Park 2 % % 2 % % % /AGI Playground /AGI Plavaround /2025 '2025 /早鸟单日票 早的印度 /6月22日 /6月21日 31 32 33 x751 × 751 34 35 36 ...