42章经

搜索文档
组织能力才是 AI 公司真正的壁垒|42章经
42章经· 2025-09-26 08:33
我们是怎么做到的呢? 很简单:只让 AI 来做 Review。 AI 不仅能提效,还有一个意想不到的好处,就是减少摩擦。人工 Review 很容易让人觉得是在「挑刺」,但如果是 AI 指出问题,工程师反而会感谢它帮自己排雷。 所以在我们团队里,大家都会相互推荐好用的 AI Review 工具。这种「好用」很难用量化指标衡量,更多取决于工程师的主观体验。 本期播客前半部分是任川的单人分享,后半部分是现场交流,原文约 14500 字,本文经过删减整理后约 5600 字。 任川单人分享 我们公司成立于去年 4 月,一开始就采用了 AI Native 的组织形式,两三个月后,就把 AI 深度嵌入了研发的各个环节,这一年多实践下来,效率和效果都很好。 今天我就会从工作流、人才、组织三个维度,分享我们打造 AI Native 工程团队的经验。 先说第一部分: 如何用 AI 重构研发工作流,把效率提升 10 倍。 所谓「10 倍提效」只是保守说法,实际体感远不止于此。拿 Code Review 举例,这件事即使在效率优化到极致的 Google,平均也要一两天,而我们只需 10 分钟。 在传统工作流里,我们通常会默认所有事都 ...
Mercor 高速增长的秘诀与其中的聪明人|42章经
42章经· 2025-09-14 12:40
公司业务定位 - 核心业务是帮助顶尖AI公司招聘各行业专家 而非传统数据标注公司[4][26] - 通过专家提供系统性反馈来提升AI模型智能 替代传统数据标注平台[6][27] - 交付物为评估标准和基准测试规范 相当于模型的PRD[27][28] 商业模式 - 采用平台化运营模式 客户将资金支付给平台 再由平台结算给专家[8] - 平均时薪超过90美元 不同职业差异显著:英文语音训练21美元 软件工程师100-200美元 皮肤科医生高达400美元[16] - 从100万美元到1亿美元年化营收运行率仅用11个月 增速超过Cursor的12个月纪录[39] 市场竞争优势 - 完全替代传统数据标注平台 模型可直接基于其提供的评估标准进行强化学习[6] - 核心能力在于人才质量评估 能通过科学方法从万份简历中筛选顶尖人才[10][11] - 相比Scale AI被收购后的业务下滑 Mercor抓住模型升级带来的市场空白[20][25] 运营流程 - 获客主要依靠熟人推荐(超50%专家来源) 推荐人可获得推荐费[12] - 采用AI视频面试自动生成问题 20-30分钟面试后生成带转录文本的视频报告[13] - 通过多人交叉验证机制确保标注质量 异常方案会被及时识别并淘汰[15] 市场前景 - 数据标注市场规模约50-100亿美元 随OpenAI等公司持续投入而扩大[36] - 业务模式可复用到所有行业 核心是解决"挑选"环节的痛点[32] - 未来工作形态将向项目制演进 全职岗位减少 AI衡量能力将拓展至更多场景[29][30] 团队特质 - 团队平均年龄22岁 多位成员曾获Thiel Fellowship并有过创业经历[39] - 决策速度极快 依赖创始人直觉而非完全数据驱动 强调快速试错[48][49] - 执行能力突出 团队每日工作时间为7:30至凌晨1:00 依靠增长作为核心激励[53][55] 人才标准 - 注重技术实践能力 要求候选人展示实际构建成果[58] - 强调Agency(主动性) 即克服困难达成结果的能力[59][60] - 通过概念类比测试学习能力 例如用MCP vs API的类比快速理解新概念[63][65]
硅谷 AI 大转弯与二级市场的牛市|42章经
42章经· 2025-08-31 12:35
AI行业发展趋势 - AI进入高速发展阶段 核心衡量指标从Scaling Law转变为Token消耗量 7月Token消耗量较6月增长20%以上[3] - 行业预期发生变化 从追求AGI转向优化现有智能的可用性和易用性[4] - AI已超越应用阶段 进入产业化和工业化新阶段[6] 模型发展特点 - GPT-5代表重要转折点 通过整合分散的模型能力和前端界面提升可用性而非追求更聪明[5] - 模型智能评估重要性降低 OpenAI和DeepMind模型已获得IMO金银牌[18] - 模型进入瓶颈期 智能提升主要来自各环节增量优化 仍有几十个百分点提升空间[22] 基础设施优化 - Infra优化分为四层:模型与GPU间优化 模型与应用间推理加速 Agentic Infra优化 context层Infra优化[25][26][27] - 推理加速技术壁垒不高 部分开源 毛利空间存在争议[25] - 英伟达需求来自训练和推理两部分 Token消耗增长推动推理需求持续上升[29] 公司战略演变 - 模型 应用和Infra公司边界变得模糊 出现端到端打通全链条的趋势[13][14] - OpenAI招募创业公司创始人 Google加快应用端发力 Manus开展技术工作 Cursor开始训练自有模型[13] - 公司分工新共识:模型公司提升Token价值 Infra公司优化使用效率 应用公司换取数据反馈[11] 投资市场表现 - 英伟达股价上涨核心驱动是Token消耗量持续增长[29] - ASIC厂商和AMD股价表现亮眼 反映市场对降低成本方案的追求[30][31] - 美国AI估值存在泡沫 但发展前景依然被看好[48] 应用场景发展 - RL范式推动Coding 数学等可验证效果场景发展[37] - 垂类公司找到PMF Harvey AI在法律领域实现高ARR 医疗金融保险领域出现成功团队[37] - 视频Token消耗增速远高于文字 但真正多模态原生应用尚未出现[88][89] 二级市场差异 - 美国市场受AI发展预期主导 AI对整体景气度影响占三分之二以上[45] - 中国市场受多重因素影响 包括居民存款 投资意愿 风险偏好和制造业周期[46] - 腾讯成为国内AI板块代表性标的 因AI努力程度和战略高度获得市场认可[56] 一级市场特点 - 美国模型公司估值达到上百亿美元 出现全明星团队加持现象[79] - 第一梯队与第二梯队公司估值差距创历史纪录[82] - 国内一级市场两极分化严重 头部公司可能获得十倍资金[84] 新兴公司关注 - Reddit因社区数据质量高被ChatGPT高频使用 类似美国版知乎+小红书+B站[76] - ServiceNow通过Workflow梳理和软件交付获得500强客户 增长速度加快[76] - Figma凭借协作场景优势和中生代公司地位 有望将AI融入协作场景[77]
活动报名:AI 视频的模型、产品与增长实战|42章经
42章经· 2025-08-10 14:04
AI视频模型技术路径与能力展望 - Luma AI模型产品Lead戴高乐分享视频模型与世界模型的技术路径及未来能力展望 [2] - 探讨视觉模型从diffusion到DiT再到autoregressive的技术演进历程 [3] - 分析更智能的视觉模型能力发展前景 [3] Pixverse用户增长与商业化策略 - 爱诗科技联合创始人谢旭璋分享Pixverse两年内实现6000万用户的关键决策 [3] - 外部模型、自研模型与应用产品的选择与迭代策略 [4] - 从模型到特效类产品的转化逻辑及0-6000万用户的增长点与商业化路径 [4] 视频工具产品增长方法论 - 前OpusClip增长产品负责人谢君陶提出视频工具获客需聚焦创作者长期合作模式 [5] - 转化阶段强调灵活精准的定价策略与分阶段价格实验设计 [5] - 留存策略以用户为中心,通过客服团队与运营保持长期连接 [5] - 早期数据基建的取舍与数据驱动决策在增长中的关键作用 [5] 行业交流活动信息 - 活动聚焦AI视频领域模型、产品、增长三大维度实战经验分享 [10] - 线上会议时间为8月16日10:30-12:30,限额100人(非投资行业优先) [7][10]
关于 AI Infra 的一切 | 42章经
42章经· 2025-08-10 14:04
AI Infra的定义与架构 - AI Infra包括硬件和软件两部分 硬件指AI芯片 GPU 交换机等设备 软件层面类比云计算分为三层 [3][4] - 最底层类似IaaS 解决基础计算 通信和存储问题 中间层类似PaaS 包含资源调度 资源管理等平台 MaaS归属这一层 [4][5] - 最上层近似SaaS应用层 但在AI Infra领域更倾向于理解为训练及推理框架的优化层 [5] AI Infra的发展历程 - 第一批AI Infra人如贾扬清 李沐 陈天奇等有算法背景 他们为充分利用GPU而开发AI Infra [6] - 第二批AI Infra人主要推动AI Infra在工业界的规模化应用 [6] - 大模型兴起使AI Infra进入主舞台 类似搜索引擎兴起时的机会窗口 可能十年二十年才出现一次 [7][9][10] AI Infra与传统Infra的差异 - AI Infra绝对核心是GPU 传统Infra核心是CPU [11] - AI Infra需要更极致 更贴合AI特殊需求 太阳底下没有太多新鲜事但要做到更极致 [12] - Infra人才相比算法更强调积累 算法依赖年轻人而Infra需要长期经验 [14] AI Infra的核心指标与价值 - 线上服务侧关注首字延迟 吐字稳定性 整体成本 训练侧关注每张GPU处理数据量和训练效率 [15] - 优化Infra可显著降低成本 例如1万张GPU每月租金1亿 利用率提升10%可节省1000万 [18][19] - 小公司可通过对比云厂商方案决定是否自建Infra 云服务商价值在于帮助小公司节省优化成本 [20][21] AI Infra的商业模式 - 第三方公司短期价值在于提供API集贸市场 让客户自由选择不同API [22] - 长期来看 第三方需与硬件或模型垂直整合才能建立壁垒 避免被云厂商或模型公司取代 [24][25] - MaaS服务商可通过与硬件厂商深度合作获得差异化优势 类似游戏机独占游戏 [26][27][28] AI Infra与模型效果 - Infra水平影响模型效果 优化更好的Infra可在相同算力下多学20%数据 提升模型效果 [36][37] - MFU是常见指标但单一指标难判断优劣 DeepSeek的MFU偏低但Infra并不差 [37][38] - DeepSeek成功关键在于选对优化目标 即给定推理成本训出最好模型 而非传统训练算力优化 [39][40][41] AI Infra的未来趋势 - 当前最重要指标是decoding速度 直接影响线上业务成本和强化学习效率 [44] - 多模态仍有突破可能性 需实现理解和生成的统一 类似GPT-3.5让专用模型退休 [63][64] - 开源模型促进AI Infra发展但也可能阻碍创新 如过度优化Llama影响新范式探索 [69] AI Infra的组织架构 - 理想协作是Infra 算法 数据团队共同决策 大厂中Infra常被视为支持角色缺乏影响力 [46][47][49] - 合理架构应是Infra人设计模型结构 数据人负责刷分 算法人主攻训练范式革新 [54] - 大厂人才结构错配 如DeepSeek Infra工程师多于算法工程师 而多数大厂相反 [81][82] AI Infra的创业机会 - 训练侧商业模式难成立 因训练方不愿泄露核心竞争力 推理侧如加速优化仍有机会 [67][68] - 国产芯片需专门设计模型结构提升性价比 Step 3开源模型支持国产卡商用并达到SOTA [69][73][74] - 多模态成本有望大幅下降 理解已不贵但生成仍贵 视频生成一年后可能降至几分之一 [75][76][77]
我不给人做产品,给 Agent 做 | 42章经
42章经· 2025-06-29 14:48
Agent Infra市场机会 - Agent Infra被视为下一个投资热点 未来Agent数量将达到SaaS的几千倍[1][2] - 现有互联网基础设施不适合AI使用 需要为Agent重构[2] - Agent Infra市场规模巨大 类比AWS级别的机会[17] - 互联网上40%流量来自机器人 但大模型流量仅占0.1% 未来可能有10万倍增长空间[23][56] Agent与人类差异 - 交互方式:Agent通过文本和多模态后端交互 人类依赖前端界面[5] - 学习方式:Agent可同时执行任务和学习 人类无法并行[5] - 工作模式:Agent多线程并行 人类单线程按流程执行[6][7] - 责任界定:人类可负责自身行为 Agent需要安全边界[8][10] - 执行状态:Agent需保持多任务状态 人类天然不需要[8] Agent浏览器特性 - 云端化运行 持续工作不需休息[24] - 无前端界面 直接后端交互[25] - 设计反馈循环 支持自主迭代[26] - 安全机制:本地处理账号密码 不泄露给大模型[28][29] - 支持多线程任务连续性 避免资源浪费[31] Agent Infra技术架构 - 三层架构:Runtime层(浏览器内核) Agentic层(交互控制) Knowledge层(领域knowhow)[32] - Runtime层解决网页拉取和渲染 Agentic层控制AI与网页交互[33] - 必须同时构建Runtime和Agentic层才能实现完整功能[35] - Browserbase估值3亿美元 专注Runtime层[22][34] Agent Infra细分领域 - 主要环境:Coding环境(逻辑执行) Browser环境(网页交互)[37] - 工具类:身份认证 支付能力 通讯工具等可重做[38] - 场景切入:旅游Agent需CRM 搜索 支付等工具[40] - 数学环境:公式执行器 定理检索等工具[42] - 物理环境:传感器 具身智能 空间智能等[38] 市场发展阶段 - 类比22年AI Coding 当前Browser Use处于早期[44] - 全球软件开发市值3-4万亿美元 AI Coding仅100亿 增长空间大[47] - 互联网活动通过AI提升5%效率将创造巨大市场[48] - 差异化关键:深耕细分场景 抢占99.9%未开发市场[56] Agent产品设计核心 - 反馈循环设计比上下文或数据更重要[50] - 人类知识可能非必要 Agent可通过强化学习自主迭代[51][52] - AlphaProof案例:仅用+1/-1奖励机制 不参考人类解法即获奥数银牌[52] - 未来范式:Agent通过环境体验获取真实反馈 自主进化[53]
活动报名:Agent Infra 领域里的下一个大机会 | 42章经
42章经· 2025-06-15 13:53
Agent赛道热度与机会 - Agent赛道热度持续数月 多个方向项目已获融资 行业关注下一波机会 [1] - Agent Infra被视为新兴机会 涉及基础设施层创新 [1] - 硅谷热门项目E2B和Browserbase引发行业讨论 [1] Agent Infra发展路径 - 产品设计从"面向人类"向"面向Agent"演化 需重构交互逻辑 [2] - Agent专属浏览器成为关键基础设施 需解决差异化需求 [2] - 行业探索长期记忆解决方案 技术进展受关注 [2] 行业实践动态 - Grasp创始人提出Agent Infra方法论 强调实践观察 [1][2] - 线下活动聚焦一线创业者经验 覆盖浏览器实践等主题 [2] - 行业交流趋向垂直化 限定非投资领域从业者参与 [2]
抱着“不做就会死”的决心,才能真正做好全球化 | 42章经
42章经· 2025-06-15 13:53
全球化战略与心态 - 全球化必须被视为"不做就会死"的战略而非第二曲线尝试 否则难以真正投入资源与决心 [2][4] - "出海"与"全球化"存在本质差异 前者缺乏明确市场聚焦 后者需从day 1就选定具体地区突破 [6][8] - 美国市场具有最高辐射价值 其成功案例能带动其他地区 而日本/东南亚市场无法反向影响美国 [11][12] - 美国企业软件客户支付意愿强 系统宕机5分钟造成的股价损失远超服务费用 百万美金级测试预算很常见 [13] 市场选择与执行策略 - 日本市场业务极度可预测 但增长节奏不受供应商push影响 客户具有强烈契约精神 [15][17][18] - 必须摒弃"出差心态" 需要团队常驻海外才能建立深度客户关系 临时拜访难以形成长期合作 [19] - 团队组建应岗位差异化 销售/解决方案需本地化 研发初期可从国内派遣但需逐步过渡 [20][22] - 中国团队三大竞争优势:技术工程能力、供应链管理、7×24小时贴身服务响应速度 [24][25][26] 产品与商业化关键 - 安全合规优先级高于产品性能 需提前1-2年准备SOC/HIPAA等认证 否则将错失金融医疗客户 [32][33] - 海内外产品本质不同 国内侧重私有化部署 海外主推云服务 开源内核是最大公约数 [34] - UI/UE设计ROI极高 直接影响客户第一印象 美国市场特别重视Storytelling能力 [35] - 客户选择应聚焦LTV 北美客户实际价值可能是预估值的3-5倍 年贡献100w美金才算大客户 [39][41][42] 组织与资源配置 - 创始人需预留300w美金学费 做好3年零产出准备 PingCAP曾犯过5000w美金级错误 [29] - 早期应招聘本地销售并共同拜访客户 销售背景负责人更易衡量产出 最终各地区一号位多为销售出身 [29] - 全英文办公和使用国际化工具是检验团队国际化水平的重要里程碑 [48] - 国内业务增长反而可能拖累全球化进度 其他地区已盈利情况下中国区仍在亏损 [49] 行业认知与建议 - 无需过度关注竞争对手 美国市场足够大 主要威胁来自传统云厂商而非同规模公司 [27][28] - PLG/SLG选择取决于产品DNA 本质应追求Value-LG LTV长短决定商业模式 [46] - Marketing应后置于客户口碑 早期重点获取能主动传播产品的标杆客户 [47] - 企业服务行业在海外利润率显著高于中国 全球化需要坚决all-in的决策 [49][50]
张津剑:投资中的频率与频谱 | 42章经
42章经· 2025-06-08 08:11
注意力机制与人类信息处理 - Transformer架构首次赋予机器注意力机制 推动AI技术飞跃 并促使人类重新审视自身信息感知方式 [1] - 人类感知-处理-行动系统存在巨大鸿沟:视网膜每秒接收10^9比特信息 大脑处理仅10^6比特 输出带宽仅10^1比特 [6][7] - 注意力机制作为主动过滤器 帮助人类在信息洪流中聚焦关键信号 但当前普遍面临机制崩溃导致独立判断能力丧失 [8][10] 社会分化与注意力失控 - 注意力失控导致世界分化加剧 体现为地缘政治冲突 贫富差距扩大及微观人际关系割裂 [1][3] - "拉尔森效应"普遍存在:信息输入输出端口过近导致信号循环啸叫 引发赛道投资极端化(过热或过冷) [12][13][14] - 创始人案例显示 专注冷门领域7年最终获得全球仅4张的国家牌照 验证注意力博弈价值 [19][20] AI与人类能力对比 - AI通过注意力机制实现能力飞跃 未来将具备全频谱感知能力(包括X光 伽马射线等人类不可感知频段) [34][35] - 人类局限性体现为:感知频谱仅占已知电磁波频谱1/10^9 依赖核磁共振等工具间接获取信息 [33] - 未来AI系统将是"传感器+Agent+具身智能"三位一体 需以AI为中心重构工作流而非简单赋能人类 [35][37][38] 人类在AI时代的核心价值 - 创造需求成为关键价值 需明确自身要解决的问题 而非依赖市场反馈贴标签 [40][42] - 审美作为超越多模态的处理结果 是人类独有的核心能力 能预判技术路径或感知潜在风险 [41][42][43] - 心力取代智力成为核心竞争力 优秀创始人特质体现为逆境坚持与克制 [44] 创业与投资启示 - 冷门领域存在未被充分估值的机会 需通过专注发现根本性变化(如2023年具身智能案例) [15][16][17] - 传感器技术将迎来爆发 创业者应探索人类未利用的数据频段(如α波 伽马射线) [34][35] - 区块链或成为Agent互联网的基础设施 当前多数项目仍错误围绕人类需求设计 [35][36]
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 14:10
Agent定义与核心特征 - Agent是基于环境反馈使用工具的程序 采用Anthropic的定义[2] - 核心三要素包括状态(Context)、行动(Tool Use)、激励信号(RL反馈机制)[32][33] - 与RL强关联 需理解强化学习才能设计优质Agent产品[31] Agent技术演进 - 2023年4月AutoGPT为代表的早期Agent更像玩具 实际应用价值有限[4] - 当前Agent已能在工作生活场景中真正解决问题 实现价值跃迁[5] - 进步源于:1)底层模型能力提升(如RL结合、长思维) 2)工程产品突破(Context构建)[6][7] Context工程创新 - Context是大模型执行任务所需信息总和 不同产品Context构成不同[8] - 相比传统RAG Agent能自动化提炼Context 减少人工干预[10][11] - 优质Context需包含用户历史行为路径 如APP打开瞬间即提供海量意图线索[48][49] Tool Use技术方案 - Function Call/MCP/A2A属于代码驱动派 Computer Use/Browser Use属于视觉模拟派[13] - MCP核心价值在于统一Tool Use标准 降低工具调用门槛[12] - Browser Use存在纯视觉方案(如已倒闭的Adept)和API包装方案 后者更成熟稳定[15] 产品设计方法论 - Chat是最佳交互入口 保障用户自由度优于追求准确度[41] - 需解决双重信任问题:开发者信任模型能力 用户信任执行过程[52][54] - 垂直领域Agent将长期主导 通用Agent面临收敛困难[25][46] 行业竞争格局 - 当前Agent可分为:1)Coding Agent(交付代码) 2)调研Agent(交付报告) 3)表格Agent(定量分析)[61][64] - Sheet0实现100%准确率 核心在于模块化工具复用与AI Coding验证[57][67] - AI Coding与Agent存在协同效应 但直接编码执行任务成本过高[29][30] 发展关键变量 - 模型能力突破与Context工程进步是两大核心驱动因素[69][70] - 需构建完整评估体系(激励信号) 确保系统可收敛[35][71] - 产品需平衡通用性与准确性 不同场景选择不同技术路径[59][60]