模型小型化

搜索文档
人间清醒朱啸虎:AI应用即将大爆发,下个“小红书”今年应该已经成立了!
创业邦· 2025-09-15 03:41
AI行业天花板与新机遇 - 当前AI能力上限已基本明朗 Transformer架构下的通用人工智能AGI能力提升空间非常小 核心问题在于数据瓶颈和推理天花板 [7] - 大模型能力迭代速度放缓反而降低创业公司产品覆灭风险 应用层机会将大量涌现 [7] - 未来两三年模型小型化是重要趋势 通过精简数据降低使用成本提升用户体验 对中国创业者是性价比更高方向 [7] 应用层爆发趋势 - 2024年AI应用Token消耗量在中美大规模爆发 行业从卷大模型研发转向卷Token消耗和应用落地 [9] - 2023年爆发以文字类AI应用为主 如会议纪要工具 美国Bridge医疗谈话纪要和国内钉钉会议纪要等技术难度低但商业化能力强 [9] - 2024年语音类AI应用爆发 语音模型成熟度使80%用户无法分辨AI与真人 未识别AI的呼叫挂断率仅25% 识别后挂断率达80% [10] - 2024下半年或2025年视频类AI应用将爆发 当生成延迟降至1秒时将颠覆内容生成方式 [10] 创业者护城河构建 - AI应用长期壁垒都在技术之外 所有AI应用本质是调用底层模型的"套壳应用" 靠AI本身无法形成壁垒 [13] - 护城河需通过深度整合工作流与编辑能力构建 如AI生成后5%-10%细节需人工编辑工具优化交付结果 [14] - 复杂工作流或行业数据能构成壁垒 如医疗领域AI自动转文字病历需结合医疗知识和合规流程 [14] - 专有硬件与场景结合是重要方向 如会议纪要降噪卡片 AI电子名牌赋能销售流程监控 [14] - "脏活累活"具有战略价值 类似Uber等成功企业一半是线下苦活 大厂不愿干而创业公司有机会 [15] AI Agent发展路径 - 大模型会吃掉90% Agent 当前Agent企业类似早期互联网个人站长 缺乏独特壁垒易被模型巨头吸收 [17] - Agent应专注垂直细分领域避免被通用模型打穿 通用Agent面临无关风险而垂直场景Agent具有粘性 [17] 商业化评估标准 - 留存率是核心指标 许多AI公司存在"Vibe Revenue"问题 用户首月付费后第二个月不再续费 [20] - 真正适合商业化的是"无聊科技" 如客服中心对话Agent 销售Oncall Agent等看似不性感但易商业化场景 [22] - 硅谷VC要求产品上线后达到200万美元ARR才投资 中国创业者需在12个月内达到500万美元ARR否则无人关注 [24] - 快速验证商业模式实现盈利是持续发展关键 创业门槛降低但竞争异常残酷 [24][25] - 对具身智能持谨慎态度 商业化路径不明朗 但支持特定用途AI硬件投资 [27] 中国创业者优势与策略 - 中国创业者更擅长To C应用 在AI以外搭建用户体验和游戏化玩法差异化 [30] - 智能硬件领域中国有供应链成本效率优势 大湾区100公里内可解决所有供应商问题 [30] - 出海是重要策略 海外市场竞争较低 应远离大厂直接炮火避免模型战争 [32] - 产品差异化在AI以外 人的需求不变但AI能提供更好体验和产品形态 [33] 创业方向建议 - 关注模型小型化和多模态趋势 端侧部署 延迟优化和数据精简决定商业化成败 [36] - 深耕医疗教育电商制造等垂直场景 结合行业知识构建工作流比单纯换皮更有价值 [36] - 融合硬件打造体验差异化 软硬结合是AI从云走向端侧的重要趋势 [36] - 注重商业闭环 早期留存率和付费续费是判断项目价值关键 [36]
朱啸虎论AI创业:避开大厂竞争,如何在AI外构建竞争优势?
搜狐财经· 2025-09-01 12:49
AI行业发展趋势 - GPT-5未达预期突破 核心智力提升空间有限 主要优化用户体验和成本 [3] - Transformer架构的AGI能力上限已明确 未来进步空间极为有限 [3] - 模型小型化成为未来两三年关键趋势 通过精简数据降低使用成本 [3] - 中国每日大模型Token消耗量突破30万亿 呈现爆发式增长 [4] - 文字类AI应用去年爆发 语音类今年崛起 视频类预计下半年至明年爆发 [4] 创业环境与竞争态势 - AI Agent创业门槛和成本降低 但市场竞争愈发激烈 [1][4] - 硅谷VC要求产品上线且达到200万美元ARR才考虑投资 [4] - 中国创业公司短期内可达到200万美元ARR 但需12个月内实现更高ARR才能获得持续关注 [4] - 真正爆发式增长的应用门槛极高 需在AI外建立护城河如编辑能力、复杂工作流整合能力 [5] - 会议纪要、AI专有硬件等领域技术门槛低但实用价值大 商业机会多 [5] 投资策略与成功案例 - 投资AI创业公司成功案例寥寥无几 绝大多数将回归地面 [1] - 模型能力上限明确反而为创业者提供更多涌现机会 [3] - AI创作者社区公司通过复杂编辑能力满足用户图片生成优化需求 [5] - AI眼镜等硬件产品在大湾区供应链优势下具备快速解决问题能力 [5] 技术挑战与突破方向 - 数据瓶颈和推理天花板成为主要问题 盲目增加参数和数据量可能损害模型性能 [3] - AI内容实时生成存在延迟 但未来两三年内延迟将大幅降低 [4] - 海外大厂探索AGI前沿 国内应聚焦模型小型化路线 [3]
最新发声!金沙江朱啸虎:远离大厂“炮火”,建立AI之外的“护城河”
搜狐财经· 2025-08-31 10:04
AI产业趋势 - AI大模型能力上限已基本明朗 GPT-5在核心智力上提升空间非常小 更多是用户体验和成本优化[4] - 模型小型化是未来两三年重要趋势 通过精简和提炼数据降低使用成本 国内更适合走此路线[4] - 数据瓶颈和推理天花板限制发展 盲目增加模型参数和数据量可能损害性能[4] 应用层发展 - AI应用Token消耗量大规模爆发 中国每日大模型消耗Token突破30万亿[6] - 文字类AI应用去年已成熟 今年语音类应用开始爆发 语音模型几乎无法分辨人声差异[6] - 视频类AI应用预计今年下半年或明年爆发 未来延迟可能降至1秒左右 颠覆内容生成方式[7] 创业环境变化 - AI Agent应用创业门槛大幅降低 3人团队即可创业 创业公司数量比以往多一个数量级[9] - 竞争更加残酷 硅谷VC要求产品上线后达到200万美元ARR才投资 中国公司3个月可达此标准[9] - 用户留存是核心挑战 第二个月续费率低 召回用户成本可能达10倍以上[9] 商业化路径 - 头部公司产品年增长可达10倍以上 稍大公司也能增长四五倍[10] - 技术成熟领域更易商业化 如会议纪要自动生成病历 节省医生时间[12] - AI专有硬件发展迅速 包括会议纪要卡片 AI电子名牌 AI眼镜等 需依托大湾区供应链优势[12] 竞争策略 - 需远离大厂直接竞争 所有护城河都要在AI之外寻找[1][12] - 编辑能力和复杂工作流整合能力可形成壁垒 如AI图片生成最后5%的细节微调[12] - 核心是定义好产品而非技术是否性感 需聚焦实际交付结果和用户付费意愿[9][12]
最新发声!金沙江朱啸虎:远离大厂“炮火”,建立AI之外的“护城河”
中国基金报· 2025-08-31 10:00
AI产业现状与趋势 - 当前Transformer架构下的AGI能力上限已基本可见 GPT-5在核心智力提升空间有限 更多是用户体验和成本优化[5] - 模型小型化是未来两三年重要趋势 通过数据精简和提炼降低使用成本 国内更适合走此路线提升性价比[6] - 大模型消耗量爆发式增长 中国每日Token消耗突破30万亿 部分企业单日消耗超百亿 较去年增长数十倍[8] 应用层发展路径 - 应用发展呈现从文字到语音再到视频的演进脉络 文字类应用去年已成熟 语音类今年爆发 视频类预计明年爆发[8][9] - 语音应用效果取决于拟真度 用户识别出AI的挂断率达80% 未识别的挂断率仅25%[8] - 视频生成延迟目前需10-30秒 未来两三年可能降至1秒以内 实现近乎实时交互[9] 创业环境变化 - 创业门槛显著降低 3人团队即可开发AI应用 创业公司数量较移动互联网时代增加一个数量级[11] - 投资门槛提高 硅谷VC要求产品达到200万美元ARR才投资 国内企业3个月可达此标准但12个月需达到500万美元ARR[11] - 用户留存成为关键挑战 第二个月续费率低 挽回用户成本可能达获取成本的10倍[12] 核心竞争力构建 - 技术壁垒难以建立 需在AI之外寻找护城河 如编辑能力、工作流整合能力等[14] - 商业化成功案例集中在实用场景:医疗病历自动生成、会议纪要硬件、AI电子名牌、电商客服等[14] - 硬件创业依赖供应链优势 大湾区100公里内聚集全部供应商 可快速解决量产细节问题[14] 产品与市场匹配 - 产品需超越"炫酷"演示 实际交付结果需达到用户付费标准 头部公司年增长率可达4-10倍[12] - 简单但有效的产品更易推广 如电商AI客服准确率99%且价格低廉 已获广泛采用[14] - 产品定义比技术先进性更重要 需聚焦真实需求而非追求"性感"技术[14]
70B模型能当零售业区域经理!小模型加速端侧落地,芯片不一定要GPU
第一财经· 2025-06-04 08:47
模型小型化与成本优化 - 14B模型使用显卡在零售业应用成本可控制在万元级别 若不用显卡 CPU可运行7B 8B模型 [1] - 8B模型适用于人流预测 商品检验 导购 14B可做简单报表分析 32B提供图谱指引 数据预警 70B可模拟区域经理角色 [2] - 32B模型在成本 效率 精准度间平衡较好 采用4张A770显卡方案可支持36-48台设备 整机成本4万-5万元 [8] - 单张酷睿Ultra SoC可支持14B模型 每秒生成12个token 无需独立显卡时CPU可直接运行7B 8B模型 [9] 零售业AI应用场景 - 零售场景AI最早实现商品自动识别 后扩展至AI自助防损 源于芯片算力冗余 [3] - 生鲜识别为最早落地应用 通过摄像头采集图像计算SKU 后续发展AI+通道识别 AI团餐识别方案 [3] - AI自主防损解决2%-3%未成功扫描问题 ToF传感器识别80%无意扫描异常 某超市每日平均止损65次 人力介入后日止损1066元 [5] - 大模型技术提升传统AI应用能力 如遮挡物品识别 1 5B模型仅能简单问答 7B 8B可文案生成 14B具备总结能力 32B-70B达专业水平 [7] 端侧芯片技术发展 - 端侧小模型对算力要求不高 独立GPU非必选项 与数据中心方案差异明显 [2] - Intel 18A制程进入风险试产 2024Q4量产 14A计划2027年试产 Panther Lake处理器将支持POS机运行大模型实现数字导购 [9] - 端侧推理CPU进步显著 但架构组成多元 x86目前主导笔记本市场 Arm阵营因省电特性有望快速成长 预计2029年Arm架构笔记本占40%份额 [10] 行业合作与案例 - 绝味食品与腾讯智慧零售发布AI垂直大模型 应用于顾客互动 智能排班 库存预测 [7] - 天虹股份子公司开发百灵鸟AI大模型 用于AI搜索推荐 导购功能 [7] - 工控主板厂商吉方工控采用英特尔CPU+显卡方案 评估万元级成本可服务20人公司 替代门店员工10万元/年成本 [8]