Workflow
42章经
icon
搜索文档
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:02
技术原理 - 强化学习(RL)是用于解决多步决策问题的算法框架,与传统机器学习不同,无标准答案但有反馈机制评判结果[3][7] - 大语言模型(LLM)本质是预测下一个词,存在不遵从指令的缺陷,通过与 RL 结合解决该问题[8][9][10] 行业应用 - RL+LLM 应用广泛,海外 OpenAI 的 RL 已从纯推理进化到 Agent 范式,实现多轮交互和上网互动[21] - 国内豆包和 DeepSeek 等团队在探索 RL+LLM 的新可能性,不同公司在该路径上出现编程、Agent、通用泛化能力等分支[21][26][27][28] 发展趋势 - 预训练的规模法则收益变小,但仍有数据和模型小型化两个发展方向;RL 的规模法则处于初始阶段,决策能力将持续提升[26] 人才与基建 - RL 人才稀缺,因门槛高、工业界应用少、对工程要求高;开源工作可降低使用门槛,如 AReaL - boba 框架[33][34][35][36] 训练与评估 - RL 训练中基建最重要,其次是数据和算法;评估可看准确率和多轮交互体验[29] 组织架构 - 大模型团队最好将 LLM 和 RL 两条线融合,至少设预训练和后训练团队,再按目标细分[31]
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 12:01
强化学习(RL)基础概念 - 强化学习是机器学习中解决多步决策问题的算法框架 其特点在于没有标准答案 通过最终反馈机制评判结果好坏[6] - 与传统监督学习不同 RL不需要标注数据 而是通过环境交互获得奖励信号 更接近人类解决问题的逻辑[6][7] - 典型应用场景包括游戏(如乒乓球)和复杂任务(如行程规划) 每个决策步骤会影响最终结果[6] RL与LLM的结合发展 - OpenAI首次在InstructGPT中将RL与LLM结合 解决大模型指令遵从问题 衍生出RLHF技术[10][11] - RLHF通过人工标注数据训练奖励模型 使LLM输出更符合人类需求 但本质是对齐而非增强模型能力[12][13] - RL实现"慢思考"机制 通过延长推理过程(token量增加)提升LLM准确性 形成inference time scaling范式[14][15] 行业技术路径分化 - OpenAI聚焦Agent范式 实现多轮交互和虚拟世界操作 完成从单轮到多轮的跃迁[20][21] - Anthropic专注编程能力 在简单问题快速响应与复杂问题深度思考间取得平衡[17][30] - DeepSeek探索通用泛化能力 通过理科训练与文科调校结合实现平衡输出[18][31] 技术实现关键要素 - 基建框架决定迭代效率 7B模型训练周期从7天缩短至2天可提升3倍试错机会[33] - 数据质量比数量更重要 针对性训练数据可显著提升模型性能[33] - 理解能力依赖LLM预训练 决策能力依赖RL 二者形成乘法效应缺一不可[23][24] 行业应用与人才现状 - RL人才稀缺源于技术门槛高 论文引用量比NLP/CV少一个数量级 工业级应用场景有限[39][40] - 开源框架AReaL-boba实现7B模型SOTA性能 推动RL技术普及[43] - 创业公司需把握技术窗口期 在终局到来前快速验证产品 而非追求长期技术优势[37][38] 企业组织架构建议 - 预训练与后训练团队需紧密协作 成员需具备跨领域知识避免能力盲区[36] - 按目标划分专业团队(多模态/RLHF等) 同时保持技术路线的灵活性[36] - Agent公司需储备RL人才 尽管当前技术门槛较高但未来可能成为标配能力[37]
世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮 | 42章经
42章经· 2025-03-30 22:25
「东升西落」叙事 - 市场近期开始讨论「东升西落」叙事 指中国资产预期回升而美国资产因宏观不确定性承压 [1][2] - 美国市场因Trump政策调整(关税 财政去杠杆)转向宏观担忧 AI叙事弱化 股市波动加剧 [3] - 中国市场此前预期过低 DeepSeek等事件推动价值重估 形成与美国镜像的走势 [4][5][6] 中美AI发展路径差异 - 美国AI聚焦scaling law和AGI 依赖高成本算力堆砌 但模型能力提升不及预期 [8][9] - 中国AI侧重应用与PMF DeepSeek通过工程优化大幅降低成本 快速商业化落地 [7][8] - 美国OpenAI延迟交付GPT-5 中国DeepSeek超预期表现打破低预期 [9] 标志性公司分析 - **DeepSeek**:开源模型降低行业门槛 腾讯等大厂直接基于其开发应用 跳过模型军备竞赛阶段 [27][28] - **Manus**:聚焦AI普惠化 目标覆盖未接触AI的用户群体 与硅谷AGI叙事形成鲜明对比 [11][12][13] - **互联网大厂**:阿里宣布加大AI Capex后股价上涨 市场预期从价值股转向创新驱动 [25][26] 二级市场趋势 - **预期变化**:美国AI预期已透支 中国正经历从0到1的填平过程 本土科技股对标美国2023年ChatGPT时刻 [20][22][23] - **产业趋势**:中国专精特新企业(如宁德时代)通过技术突破或出海确立领先地位 呈现顺周期特征 [37] - **宏观趋势**:中国消费信心改善 房价回升 DeepSeek点燃市场情绪 但需关注长期经济结构转型 [35][36] 投资机会与风险 - **AI领域**:模型价值分配 原生应用(如Agent)及垂直行业(医疗 金融)应用是三大关注方向 [47][48] - **非AI领域**:美国生物医药 航空航天及中国政策支持行业(如民营企业家座谈会提及公司)存在机会 [48] - **市场行为**:信息处理加速导致板块轮动加快 企业蹭热点讲故事现象可能增多 [40][41] 中美技术分工与卡脖子问题 - 中国主导AI商业化探索 推理卡(如寒武纪)性能提升缓解算力瓶颈 预训练仍依赖英伟达 [31][32][33] - 美国在互联通信技术垄断 但中国推理场景对高性能卡需求较低 形成差异化竞争 [31][32]
世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮 | 42章经
42章经· 2025-03-30 14:25
东升西落叙事 - 美国市场从24年开始因AI领先和美元强势吸引全球投资,但Trump上台后政策调整引发宏观不确定性,导致股市剧烈震荡[2][3] - 中国市场24年股价开始回升,今年因DeepSeek发布彻底引爆,反映此前对科技行业预期过低的价值回归[5][6] - 中美AI发展路径差异显著:美国专注scaling law和AGI,中国聚焦应用落地和成本优化[8][9] 中美AI发展差异 - 美国AI发展路径依赖高成本投入(算力/数据),但模型能力提升不及预期[9] - DeepSeek通过工程优化大幅降低成本,实现更好性能输出,打破高成本叙事[9] - 中国AI应用注重覆盖更广泛用户群体,如Manus团队专注让未接触AI人群使用产品[10][11] 标志性产品分析 - DeepSeek开源模型使腾讯等公司跳过模型军备竞赛阶段,直接进入应用开发[26] - Manus采用脉冲式增长策略,通过Prosumer群体快速传播,但被误读为OpenAI对标对象[12][15] - Cursor等产品以极低市场成本实现高ARR收入,展示中国AI商业化路径优势[12] 二级市场表现 - 美国市场因前期AGI预期过高,当前面临预期调整;中国市场预期正从0开始填平[19][20] - 阿里云宣布增加AI Capex后股价上涨,反映市场对国内AI预期转向乐观[23] - 国内互联网公司从价值股重新获得成长股属性,AI推动估值逻辑变化[24] 产业趋势分析 - 推理芯片领域国内呈现"百卡齐放"局面,寒武纪等公司股价表现亮眼[28] - 专精特新企业通过技术突破和出海确立行业领先地位,如宁德时代[34] - AI推动产业趋势明确,但对中国资产重要性仍低于美国,需关注消费等宏观指标[35] 市场波动特征 - 板块轮动速度加快,信息传播和处理效率提升导致市场共识形成更快[37] - 高波动环境下企业经营策略可能转向蹭热点和讲故事[38] - 从业者对产业判断更精准,如云厂商CXO提前布局光模块投资[44] 投资机会展望 - 模型产业链价值、原生应用发展和垂直行业应用构成三大关注方向[43] - 生物医药、航空航天等非AI领域同样存在结构性机会[43] - 二级市场投资技巧可学习,但全职炒股可能导致认知密度下降[46]
硅谷顶尖孵化器奇遇 | 42章经
42章经· 2025-03-09 20:53
孵化器HF0的核心价值 - HF0通过12周高强度封闭式"容器"环境重塑创业团队思维模式 强调时间空间扭曲感与唯一增长目标[7][10][17] - 关键机制包括:每周demo dinner强制2分钟增长汇报制造peer pressure 每周check-in聚焦单一量化KPI[21][23][35] - 不直接教授业务方法 而是通过筛选顶尖创业者+硅谷氛围+案例启发建立"信念感" 类似《太空大灌篮》心理暗示[12][14][18] 增长方法论突破 - 价格策略革命:会员费直接翻倍实现日收入翻倍 后续优化定价模型贡献3-4倍增长[51][56][59] - Influencer营销SOP化:从月联系几十人提升至日联系100人 建立20个精准邮件模板并追踪转化率[62][63][64] - 产品化思维转变:将付费广告ROI做到2倍 流失用户召回邮件系统开发[65][67][68] 中美创业生态差异 - 融资流程差异:美国强调2分钟pitch的sharp表达 问题聚焦天花板/团队/竞争环境但流程高度标准化[71] - 华人团队挑战:地缘政治导致合规成本高 需长期线下社交建立信任而非能力歧视[73][75][77] - 产品化认知:Perplexity等成功案例证明"细节见真章" AI时代工程化微创新仍可构建壁垒[79][80][81] 团队成长路径 - 前5周基础设施搭建期收入停滞 第6周思维跃迁后实现每周翻倍 最终3个月10倍增长[24][45][56] - 关键转折点:受Quora增长故事启发 穷举20种方案并优先测试高概率选项[47][48][49] - 长期影响:虽无法维持15小时/天工作强度 但每年规划加速周期延续方法论[38][42][43]
以人为本——全职及实习生招聘 | 42章经
42章经· 2025-03-09 20:53
业务模式 - 公司业务核心围绕"找到最优秀的人并与其建立关系"展开,通过媒体、播客、活动、融资支持、投资等多种形式与优秀人才互动[1] - 媒体业务不追逐热点,专注于为优秀人才提供发声平台,依靠人的质量驱动内容质量[1] - 业务逻辑强调人的价值优先,认为优秀人才能够穿越周期并解决各类问题[1] 人才筛选标准 - 候选人需具备对行业(一级市场或AI领域)的真诚热爱,视热爱为优秀的基础条件[1] - 要求外向型社交能力或内向者主动社交意愿,强调线下交流对机会获取的关键作用[2] - 需兼具深度思考能力与持续学习习惯,避免无效社交[2] - 重视对人的研究兴趣,要求具备快速识别群体中优秀个体的洞察力[2] - 运营思维被列为必备能力,强调目标管理、资源杠杆运用等系统性方法[2] - 要求成熟度与自我认知,明确个人需求并理解他人需求[2] - 语言表达被视为核心能力,突出沟通效率的价值[2] - 接受多元化上进动机(金钱/面子/生活压力等)[3] 业务现状与机会 - 已建立国内顶级AI播客与AI创始人社群[3] - 通过FA服务与直接投资覆盖大量优秀AI创始人[3] - 开放媒体/社群/FA/投资等多元业务合作,提供高于市场平均水平的待遇[3] - 北京地区候选人优先考虑,接受非传统应聘渠道联系[3]
硅谷顶尖孵化器奇遇 | 42章经
42章经· 2025-03-09 12:53
孵化器特色 - HF0 强调“container”概念,提供 12 周全身心投入工作的容器氛围,让创业者专注公司增长[7][8][11] - 植入信念感,用严苛筛选聚集优秀创业者,以最新方法论和先进案例启发创业者相信增长可能[13][17] - 有每周一的 demo dinner 和每周二的 weekly check - in 活动,前者带来社交压力,后者梳理 12 周 KPI 并强调量化[22][24] - 安排大量 office hour 让团队与硅谷大佬一对一交流,每周五有 family dinner 类似聚会[32][33] 增长实践 - 第六周通过穷举增长招数,尝试提高会员费一倍,日收入翻倍,后续每 1.5 周约有一次收入翻倍,最终 3 个月收入涨 10 倍[42][43][53] - 优化定价模型,取消试用、月卡等,带来至少三四倍增长[57] - 借鉴 Blake Anderson 经验打造联系 KOL 的 SOP,成为增长核心支柱之一[61][62] - 投放 KOL 高转化率视频做付费广告,ROI 达 2 倍,升级产品功能并挖掘老用户价值[63] 行业观察 - 美国投资人强调把事情做简单,安排流程化,提问与中国投资人有相似之处[68] - 美国机构投资中国团队需确认诸多风险,建议中国创业者多在美国社交增加信任[70][72] - 坚信 AI 产品化大有可为,简单朴素的产品化将回归主流,产品化细节可形成壁垒[76][79][80]
以人为本——全职及实习生招聘 | 42章经
42章经· 2025-03-09 12:53
业务模式 - 公司业务核心围绕"找到最优秀的人并与其建立关系"展开,通过媒体、播客、活动、FA及投资等多种形式与优秀人才互动 [3] - 媒体内容不追逐热点,专注于为优秀人才提供发声平台,强调优质人才自然产出优质内容 [3] - 业务驱动逻辑为深度链接行业顶尖人才,包括为其提供融资支持、直接投资及资源整合服务 [3] 人才筛选标准 - 候选人需具备对行业(一级市场或AI领域)的真诚热爱,热爱被视为优秀的基础条件 [3] - 要求候选人具备社交能力(倾向外向型或能为内向需求主动社交),线下互动被视为拓展机会的关键途径 [3] - 强调深度思考能力与持续学习习惯,避免社交表面化,需通过自我提升获得优秀人才认可 [3] - 重视对人性的研究兴趣,需具备快速识别优秀个体及分析行为背后信息的能力 [3] - 需具备运营思维,能够系统性利用资源杠杆提升效率,而非机械执行 [3] - 要求成熟度或早熟特质,明确自身及他人需求 [3] - 语言表达能力被视为高效杠杆,需能清晰面向目标对象传递信息 [4] - 接受多元上进心驱动(如金钱、面子或生活压力) [4] 业务现状与资源 - 公司已建立国内顶级AI播客及AI创始人社群,通过FA和投资服务大量优秀AI领域创始人 [4] - 提供跨业务线机会(媒体/社群/FA/投资),岗位无固定职级但需高度契合公司理念 [4] - 承诺提供高于市场平均水平的薪酬待遇,并可作为进入AI领域的跳板资源 [4] 招聘信息 - 优先考虑北京base候选人,简历投递邮箱为kaiqu@42zhj.com,亦接受通过微信直接联系 [4]
为什么我们对 25 年 AI 极度乐观?| 42章经
42章经· 2025-01-05 21:54
AI市场发展回顾与展望 - 23年AI市场爆发初期,互联网从业者和美元基金迅速涌入,投资焦点集中在大模型公司,OpenAI背景人才备受追捧 [1] - 24年上半年一级市场跌至十年最低谷,大模型公司热度消退,Pre Training模式被质疑,具身智能成为新投资关键词 [2] - 24年9月后市场出现三大变化:融资复苏、多模态模型能力突破(图片/语音/视频生成达GPT-3水平)、AI创二代创始人涌现 [3] 技术演进趋势 - 大模型呈现四大趋势:基础设施化、开源快于闭源、多模型混合方案受青睐、产品价值高于技术 [2] - 多模态进展超预期,视频和3D模型发展速度显著快于语言模型,推理模型o1推动Agent落地 [3] - AI Native产品形态可能通过多模态实现突破,NotebookLM展示跨模态内容组织新范式 [13][14] 投资与创业格局 - 25年市场两极分化加剧:美元基金聚焦出海,人民币基金侧重硬科技/国产替代,初创公司首轮估值达3000-5000万美金 [4][5] - 应用落地成为共识方向,生产力工具类产品主导市场,20-30家应用公司估值超5000万美金,头部ARR达1000万美金 [2][6] - 创始人画像迭代:从互联网转型者变为AI创二代(大厂AI负责人/创业公司联创),认知水平和商业模式显著升级 [3] 商业模式变革 - Prosumer(小B大C)模式验证成功:兼具C端传播属性和B端付费能力,预计25年将出现千万美金ARR公司 [6] - Agent商业模式可能颠覆SaaS:按结果付费替代订阅制,销售体系重构,新创企业比现存SaaS公司更具转型优势 [7][8][9] - Perplexity案例显示搜索平台可能演变为任务完成型Agent,成为AI时代核心入口 [12] 未来重点方向 - Agent领域三大机会:2B场景落地、存量SaaS公司AI化、新商业模式创业公司反攻 [11] - 多模态潜在突破点:视频作为内容输出终局、用户从被动接收转向参与式消费、生产关系变革 [15] - 技术-商业协同效应:AI理解能力+多模态组织将重塑产品形态,如NotebookLM的交互式对话设计 [13][14]
为什么我们对 25 年 AI 极度乐观?| 42章经
42章经· 2025-01-05 13:54
市场趋势与行业动态 - 2023 年 AI 创业投资关键词是大模型,2024 年是具身智能,2025 年将是应用落地[2][4] - 2024 年 9 月后融资市场复苏,各种模态模型能力加强,创始人画像改变,市场进步将延续到 2025 年[4] - 2025 年市场环境将进一步变好,但会更加两极分化,资本方向上美元基金和人民币基金分化,创业融资更倾向背景好的人[4] 投资机会与潜在风险 - 2025 年看好应用落地方向,尤其是生产力工具类产品,预计会出现一批千万美金 ARR 的创业公司[4] - 2025 年看好 Agent 和多模态方向,Agent 主要在 2B 领域落地,新商业模式的 Agent 创业公司将冒头反攻现存 SaaS 企业[4][5] - 多模态可能藏着 AI Native 的答案,未来产品组织形态和使用逻辑可能彻底变化[7] 公司财务表现 - 当下市场约 20 - 30 家应用类公司估值超 5000 万美金,多数应用公司 ARR 年收入为 0,少数找到 PMF 的达 100 万美金 ARR,极少数头部项目达 1000 万美金 ARR[2] 技术发展趋势 - 大模型逐渐成为基础设施,开源进展速度超闭源,实际应用落地偏向多模型混合方案[3] - 推理模型能力提升解锁 Agent 可能性,未来各专业人群、垂直领域都有 Agent 机会[4] 商业模式分析 - Agent 若按结果付费,将对现有 SaaS 公司和模式产生颠覆式变化,销售人员管理和组织模式也会改变[5]