Workflow
当宇树王兴兴、数美万物任利锋他们来到锦秋小饭桌……
锦秋集·2025-08-12 14:09

锦秋小饭桌活动概览 - 锦秋基金每周五在北京、深圳、上海、杭州等地举办AI创业者闭门社交活动,已连续举办25场,聚焦多模态技术、AI计算架构、具身智能及AI硬件等前沿话题 [3] - 活动形式为创业者、技术专家和产品创新者围绕实景案例分享干货,避免商业互吹,强调真诚交流与创业经验 [3] - 未来活动预告包括8月15日北京Agent专场、8月22日上海运动AI专场、8月29日北京产品力专场及9月5日上海AI应用吐槽大会 [4][5][6][7] 具身智能发展 - 数据分为三层:低精度人类数据、高精度人类数据和真机遥操作数据,其采集成本和质量直接影响模型价值 [16] - 灵巧手产品成熟度低,高自由度设计未满足实际需求,低自由度产品功能近似夹爪,实用性受限 [16] - 触觉传感器需优先关注线性度和量程,绝对精度和切向力感知非核心因素,人类切向力感知依赖推断而非直接传感 [16] - 生成式世界模型需大量数据和算力,适合大厂主导探索,人形机器人需满足家庭基础要求如防跌倒、防燃烧及自主充电 [16] AI硬件创新 - 产品差异化依赖细节设计,例如Lovot机器人通过挠痒反馈和眼神交互提升情绪调动能力 [23] - 端侧算力需求增长,因视觉模态涉及隐私问题,云端处理存在存储和计算成本压力 [24] - 可穿戴硬件受限于小体积元器件,电池技术影响美观与体验,记忆解决方案需平衡成本与体验 [25] - 记忆系统需结合主观与客观数据,纯客观数据无意义,需理解用户mindset实现个性化 [26] - 细分市场策略有效,如高驰手表专注越野跑人群从Garmin抢占市场,美国航模市场依托高客单价和club文化 [27][28] - 创业者应选择非小米覆盖市场,避免中间路线摇摆,功能性与非功能性需明确二选一 [22][29] AI计算架构与算力需求 - 算力需求分生产力视角和消费视角:前者替代脑力劳动者所需算力有限,后者因每人调用多个AI Agent处理琐事可能创造无限算力消耗 [35] - 头部公司内部高端AI卡(如英伟达)争夺激烈,算力资源远未饱和 [36] - 模型训练进入下半场,互联网可用数据耗尽,需超越人类先验知识探索新解决方案 [38] - 强化学习成为下一代核心范式,奖励机制设计需平衡避免Reward Hacking或学习停滞 [39] - 下一代GB300集群采用液冷技术,但大规模运维经验不足,华为披露集群平均无故障时间小于24小时 [41] - 服务型AI(情商模型)侧重沟通能力,几十B参数即够,科研/生成式AI(智商模型)需高算力支持实时交互式生成 [42] - HBM5/6技术路线集成PIM功能,未来HBM堆栈可能新增HBF层存储模型权重,Transformer数据访问模式不规律挑战PIM架构 [43] 多模态技术落地 - 视频生成面临UGC痛点:生成速度慢和成本高,闭源方案即梦速度最快,实时生成需推理速度突破 [52] - 多模态交互升级方向包括视频生成与理解一体化,基于用户视频生成定制内容如衍生剧情和角色互动 [53] - 内容社区依赖评论区和高频互动提升活跃度,新平台采用"PGC起步-UGC引入-AI定义价值"模式 [54] - 用户行为呈现性别差异:女性偏好幻想和情感陪伴,男性倾向对抗性互动,平台需降低创作门槛并增强多样性 [54] - AI商业壁垒体现在数据、标注和场景深度,头部团队投入资金进行高质量标注训练模型 [55] AI应用场景与数据 - 手机AI调用中10%为口算计算器场景,大模型chatbot主要应用OCR,视觉模态落地监控和学习机拍照搜题 [30][31] - 数据标注质量对多模态模型至关重要,需对图片进行详尽多维标注 [51]