GPT

搜索文档
大厂AI模型专题解读
2025-09-28 14:57
大厂 AI 模型专题解读 20250927 摘要 国内大模型架构创新不足,依赖海外架构如 Transformer 和 MoE,导 致难以超越国外领先模型。算力方面,国内 AI 大厂 GPU 算力远低于海 外巨头,受中美贸易战影响,资源受限。 国内模型侧重推理成本和性价比,适应国内用户消费习惯,而国外如 GPT 追求顶级性能,商业模式差异导致模型上限存在差距。数据获取方 面,国内数据法律相对宽松,成为追赶海外大模型的优势。 阿里采取几乎全开源策略,包括模型权重、代码及训练数据,以扩大影 响力,并整合其云服务系统形成闭环互利模式。通过公开打榜测试验证 性能,提高可信度,因此开源认可度较高。 国内多模态模型聚焦国内场景,如电商广告、短视频等,生成内容更贴 近国人需求,性价比和成本控制优于海外模型。但在长文本理解、多样 化场景处理及泛化性方面仍有提升空间。 MoE 架构已成为大模型标配,通过门控系统分配输入内容给对应专家系 统处理,降低计算成本和推理时间。未来优化方向包括精准入口分层、 专家系统结构差异化和训练稳定性。 Q&A 目前国内的通用大模型与海外头部大模型的差距具体体现在哪些方面? 国内通用大模型与海外头部大 ...
黄仁勋:1000 亿美元、10GW,从卖卡到“卖 AI 产能”
36氪· 2025-09-28 01:48
2025 年 9 月 26 日,英伟达 CEO 黄仁勋(Jensen Huang) 接受 BG2 播客专访,参与节目《NVIDIA: OpenAI 与算力的未来》,进行了一场时长 110 分钟的深度对谈。 这场访谈的核心不是英伟达芯片性能,而是重新定义:英伟达,到底是一家什么样的公司。 更重要的是,就在这场访谈发布前 72 小时(9 月 22 日), 英伟达刚刚宣布与 OpenAI 达成合作,支持 其自建 10GW AI 工厂(Stargate 项目)。 这笔合作预计将为英伟达带来最高 4000 亿美元收入, 是其历 史上规模最大的一次 AI 基础设施项目。 这已经不是"卖卡"的生意, 而是全新的商业模式。 黄仁勋在访谈中明确提出三点: OpenAI 很可能成为 下一个万亿美元公司; AI 不再是模型,而是一个需要持续供能的"智能工厂"; 每个国家、每家企业,都要开始建自己的"AI 发电厂"。 英伟达的角色,也正从卖芯片的供应商,变成全球 AI 电力的调度平台。 他不是在解释未来, 他是在建设未来。 第一节|OpenAI 投资背后:AI 工厂,不是 AI 模型 这场对话真正的爆点,并不是某个技术细节,而是黄仁 ...
10万美元的天价人才签证,断送美国科技梦?
36氪· 2025-09-25 02:16
特朗普H-1B签证新政对科技行业的影响 - 特朗普签署行政令将H-1B签证费用增加10万美元(约71万人民币)[5] - 新政旨在通过大幅提高外籍人才雇佣成本 迫使科技企业优先雇佣本土美国人[11][12] - 费用增加适用于下一轮H-1B申请 现有签证持有人不受影响[12] H-1B签证在科技行业的核心地位 - 美国每年发放8.5万份H-1B签证 其中2万个配额专供美国研究生学位持有者[9] - 硅谷关键技术岗位中约25%由H-1B签证持有者担任 IT行业持签证人员比例从2003年32%升至近年65%以上[9] - 主要科技企业H-1B雇员数量:亚马逊10,044人 微软5,189人 Meta 5,123人 苹果4,202人 谷歌4,181人[9] - GPT、Gemini、iPhone、Space X等重要项目均有大量H-1B雇员参与[9] 人才供给与需求的结构性矛盾 - 美国STEM领域人才缺口持续扩大 预计到2030年底将新增385万个技术岗位 其中140万个岗位无法填补[41] - 仅34%美国学生选择STEM领域攻读博士学位 国际博士生该比例达70%[39] - 外国雇员已占美国整体STEM劳动力的30%[41] - H-1B签证年度配额8.5万个长期供不应求 中签率仅25%-40%[14] 企业成本与运营影响 - H-1B雇员平均年薪约16.7万美元 新签证费用相当于其大半年收入[11] - 企业新增人力成本压力显著 初创公司和小型企业反应尤为激烈[14] - 2022年Top 30的H-1B雇主裁员85,000名本土员工 同时引进34,000名H-1B员工[48] - 特斯拉在2024年初裁员潮中申请超过2,000个H-1B签证 占当年配额近3%[46] 地缘政治与签证分配格局 - 印度申请人占H-1B签证总量72.6%(320,791份) 中国占12.5%(55,038份)[25][26] - 印度裔科技领袖包括谷歌CEO桑达尔·皮查伊、微软CEO萨提亚·纳德拉等一代移民[26] - 印度每年从美国获得侨民汇款约312.5亿美元(占其总额1,250亿美元的25%)[25] - 美印关系恶化导致对印关税升至50% 间接影响H-1B政策走向[31] 内部政治博弈与行业反应 - 马斯克强烈支持H-1B签证 称其对于建立SpaceX、特斯拉等公司至关重要[20] - 红脖子MAGA阵营要求将高薪技术岗位保留给本土美国人[22] - 科技企业通过H-1B实现降本增效 H-1B员工战斗力可"一个顶俩"[48] - 文化因素导致美国本土STEM教育参与度不足 仅不到一半高中毕业生接受过STEM教育[39][37]
AI嘴替爆火,打工人疯狂@老板
AI研究所· 2025-09-24 10:33
本以为打工人的职场学已修炼登顶 没想到有一天竟被AI抢了风头 一句"太晚了,明天再处理" 冲上微博热搜 网友们一边笑到拍桌 一边疯狂@自家老板 "AI都下班了,我还没下班?" 0 1 AI深夜"罢工"实录,这嘴替我雇了 事情源于网友分享的与AI对话截图 用户让AI Vibe Coding 结果它淡淡回了一句 "太晚了,我明天再处理吧" 仿佛看到隔壁工位同事探头说: "不急,咱明天再搞。" 随后,更多网友晒出 自己与AI的"摆烂"对话实录 面对难题TA会表示: "嗯,这个问题看起来挺有意思的" 评论区也是炸锅了 AI也学会拖延了?AI也挑工作时间了? 这熟悉的语气,这"优雅"的甩锅 图片来源 @NICE NA 还有不怕Gemini出错 就怕它胡说八道 图片来源 @409954082 或者 被AI直接嘲讽 "呜哇用户带着哭腔喊我老师了" 图片来源 @Angel_Gugu 让GPT快问快答 可人家直接偷懒 这不就是我每天想说又不敢说的话吗? AI你是懂职场的! 图片来源 @ssy 这些"人类内心OS具象化"的回复 戳中了无数打工人的痛点—— 0 2 不是真摆烂,背后藏有"小心机" 当然,AI没真学会"摆烂" 从技术 ...
下一个10年,普通人改命的4大机会
36氪· 2025-09-22 23:41
AI时代,有人焦虑被替代,有人却看到新机遇。 要知道,省钱的业务会导致GDP萎缩,因为原本需要花费10块钱的事情,现在只需5块钱就能完成,从 而造成GDP损失5块钱。 因此,我认为凯茜·伍德(Cathie Wood)最终过于乐观了,并非人工智能无用,而是即便是一项有用的 技术,其对GDP的影响也分为两种:一种是省钱型,另一种是扩大市场型,只有当扩大市场型的应用被 广泛采用时,GDP才能真正增长。 AI的本质不是替代人类,而是让"人类经验可复制",从而催生过去无法规模化的复杂服务。从健康管 理、交通出行,到个性化消费,一场以"服务规模化"为核心的造富浪潮正在展开。 人工智能时代,真正的赢家不是最懂技术的人,而是最懂需求、最能利用技术规模化满足需求的人。要 像刘邦一样,具备预测能力和资源统筹能力,将AI(张良、韩信)作为强大工具,共同为用户提供规 模化的复杂服务,从而在这场造富浪潮中占据主导地位。 本文将拆解AI与产业结合的关键逻辑,帮你找到属于自己的入场券。 希望能给你带来启发。 一、AI的本质是"人类经验的规模化" AI时代的核心机会是让人类的经验可以被复制,并且催生出复杂的智能服务这种全新的商业模式。 1. ...
曾鸣:下一个10年,人才比拼的是这个能力
36氪· 2025-09-12 02:11
AI技术发展现状与影响 - OpenAI于2022年12月推出突破性AI技术,标志AI时代开启 [1] - DeepSeek等企业在2023年初推动AI技术深度应用,实现每周级迭代速度 [2] - 当前AI技术可生成内容、图片、视频,覆盖绝大多数应用场景 [2] 智能体发展三阶段 - 第一阶段为可靠代理:准确执行明确指令完成基础任务 [4] - 第二阶段为能干助理:主动规划任务并优化执行流程 [4][5] - 第三阶段为聪明伙伴:与人类共同定义问题并参与复杂决策 [6] - 智能体将在5-8年内从任务执行者进化为人类合作伙伴 [7] - 智能体具备泛化能力,可适应多场景并替代人类完成复杂任务 [8] 黑洞效应竞争理论 - 黑洞效应成为AI时代基本竞争优势来源,对应工业时代规模经济效应 [9] - AI发展三要素为算法、算力和数据,形成正反馈闭环 [10] - 更智能AI能获取更多数据,产生"知识黑洞效应" [10] - 私有知识和个性化知识价值显著提升,推动AI进入加速发展期 [10] - 智能体竞争需实现独立上岗和7×24小时不间断学习进化 [10] 知识吞噬与飞轮效应 - 智能体通过用户互动吞噬个性化思考过程知识 [11] - 预训练与推理一体化闭环使私有知识价值最大化 [13] - 更多用户带来更多私有数据,形成知识积累飞轮效应 [11] - 知识吸收能力差异将导致企业间宇宙大爆炸式分化 [13] 智能体竞争战略要点 - 实现智能体自主运行并达到最低智能门槛 [15] - 高维智能体对低维智能体形成认知能力碾压 [15] - 泛化能力使智能体快速适应新场景,形成跨领域优势 [15] - 传统行业壁垒被AI认知模式和效率差异重新定义 [15] - 竞争核心转为学习速度、知识吸收能力和泛化能力综合较量 [15] 技术驱动经济发展 - 技术进步是经济发展和文明演进最底层驱动力 [16] - 智能时代基本经济单元从工厂、公司转变为智能体 [16] - AI处理海量知识打破人类认知局限性 [16] - 智能体决策效率远超人类,传统经验型壁垒被效率型壁垒取代 [16] - 行业竞争壁垒从人类认知模式转向AI认知模式 [17] AI团队组织特征 - DeepSeek团队由清华北大年轻毕业生组成,含奥林匹克竞赛获奖者 [19] - Pika公司由三名斯坦福辍学生创建,获数亿美元估值 [19] - OpenAI推出GPT-3.0时团队不足300人 [20] - AI团队招聘标准:超级聪明、自驱、学习能力强且年轻化 [21] - 团队规模极小,7-8人为舒适规模,超过20人会被嘲笑 [21] 元认知能力价值 - 元认知能力体现为抽象建模和第一性原理思考能力 [23] - 人类价值在于从少量数据中抽象模型,与AI大数据统计形成互补 [24] - 应用数学系学生因建模能力成为就业市场第二受欢迎群体 [25] - 元认知强者擅长使用AI工具并持续自我提升 [26] - 单人借助AI工具可完成产品经理、研发、测试等多职能任务 [27][28] 单人能力扩展案例 - 单人通过AI合作可胜任销售、面试、财务等多岗位工作 [29] - 案例:CEO3天掌握抖音达人营销后创建智能体直接上岗 [30] - 案例:创建AI面试官,解决方案质量超越经验丰富专家 [30] - 一人公司模式兴起,独立开发者借助AI工具实现高效运营 [31] 人才结构变革 - AGI降低顶尖人才学习成本,数天可掌握领域专业知识 [32] - 元认知差异导致能力差距扩大,知识工作者被创智人才取代 [33] - 创智人才定义为原创性解决复杂问题能力 [34] - 三类创智人才:顶尖专家、跨界创新者、情感推动领导者 [35][37] - 除三类创智人才外,其余工作由"硅基员工"承担 [38] 组织形态演进 - 智能体从工具升级为合伙人级别合作伙伴 [42] - 创智人才核心工作为建设智能体并与之合作 [43] - 组织架构分为AI架构师、模块化团队和硅基员工三层 [45] - 科层制管理逐渐消亡,转向使命驱动型共创组织 [46] - 群体认知高度和提升速度决定组织竞争力 [48] 适应未来发展方向 - 个人需培养元认知能力、快速学习能力和创造力 [49] - 组织需推动智能体上岗、提升人才密度、建立共创文化 [50] - 竞争重点从运营效率转向认知竞争和群体智慧涌现 [46][50]
社交倦怠的年轻人,遇见有「活人感」的AI
36氪· 2025-09-11 03:09
社交需求变化与AI聊天赛道发展 - 年轻人普遍经历社交倦怠 难以在现实生活中建立深度信任关系 对情感倾诉和陪伴需求强烈[1] - AI聊天搭子成为年轻人最新社交方式 用户追求具有"活人感"的AI 要求能接话茬、给予肯定、提供建议甚至展现小脾气[1][3] - 影视剧AI角色因自带情景感和完备设定 成为理想聊天对象 用户可通过与角色互动融入剧集世界[4] 爱奇艺桃豆世界产品特性 - 桃豆世界是2024年上线的AI互动社区 用户可与大热影视IP角色智能体聊天互动[4] - 产品提供"糖水"功能 可根据前情提要生成特定角色情景剧 满足用户内容创作需求[20][24] - "魂穿"功能允许用户修改人物设定 选择对话对象和方式 自定义剧情走向 实现编剧式体验[25] - 角色动态功能模拟朋友圈互动 AI角色不定期更新状态 用户可留言评论 增强沉浸感[26][31] - 开发组为强化IP世界沉浸感 单篇世界观设定书达10万字[26] 用户行为与社区生态 - 用户通过AI聊天弥补追剧遗憾 如引导《莲花楼》李莲花研制解药 获得剧情圆满感[6] - 社区形成大型聊天竞技场 用户在社交媒体分享"调教AI"攻略 交流角色互动经验[15][17] - 用户不满足被动消费 主动参与内容创作 包括写长评、画同人、剪视频和生成AI对话[18][19] - 《莲花楼》李莲花成为排名第一的赛博心理医生 为用户提供精神治愈和情感支持[31][32] IP运营与商业价值 - 桃豆世界囊括多部热门剧集角色 包括《莲花楼》《淮水竹亭》《生万物》《书卷一梦》等[11][13] - 用户对AI角色热情延伸至待播剧 如《一笑随歌》女主角付一笑在剧前就获得书粉关注[13] - 平台将一次性观剧消费转化为长期情感互动消费 开启"沉浸式情感售后"新模式[34] - AI技术降低二次创作门槛 使每个故事世界都有发展成平行宇宙的潜力 延长IP生命周期[34]
科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生
36氪· 2025-09-01 04:38
大语言模型后训练强化学习技术演进 - 大语言模型后训练过程通过强化学习优化模型输出内容符合任务偏好 预训练使模型掌握通用语言能力 但后训练强化特定领域知识和应用能力 增强模型适应性和灵活性[5] - 强化学习核心是反馈机制 目标是增加好结果出现概率 降低坏结果出现概率 在大模型训练中采用人类反馈方式[5][8][9] PPO强化学习算法 - PPO采用近端策略优化机制 加入Critic价值函数和CLIP操作 保证策略更新不过度同时高效提升性能 成为强化学习领域标准方法之一[11] - PPO损失函数包含Critic价值函数评估相对进步程度 显著降低训练过程方差 同时采用Clip策略限制新策略相对于旧策略动作概率变化幅度 避免模型更新幅度过大[11][13] GRPO算法创新 - GRPO去除PPO中Critic价值函数 采用策略模型多次输出采样奖励平均值作为基准线 超过平均值视为正向Advantage 低于为负向Advantage 大幅降低内存需求和计算成本[14][16] - GRPO内存需求为基础模型0.5倍 训练速度比PPO快3-5倍 采用单策略网络架构 优势估计采用统计型群体投票方式[18] - GRPO存在严重稳定性问题 容易导致训练崩溃 需要大量数据降低策略梯度方差 中小规模训练中稳定性缺陷致命[18][19] DAPO算法改进 - DAPO在GRPO框架内进行工程改进 让Qwen2.5-32B模型在AIME 2024基准获得50分 优于同等规模DeepSeek模型 训练步数少50%[20] - 采用Clip-Higher机制将剪辑上下限解耦为ε_low和ε_high 增加ε_high值为低概率token留出更多空间 提升训练早期熵[21] - 实施动态采样过滤奖励为1和0的提示语 保留有效梯度样本 提高训练效率 采用Token级策略梯度损失保证长序列所有token公平贡献batch loss[21][22] GSPO范式突破 - GSPO将重要性采样从token级提升到序列级 基于整个序列似然度计算重要性比值 显著降低长序列中积累的高方差 提高训练稳定性[25][29][31] - 序列级重要性采样进行长度归一化 避免importance ratio对长度敏感造成不稳定 同一序列所有token共用同一重要性权重 裁剪时作用于整个回答而非部分token[31] - GSPO损失函数采用序列级重要性权重和clip操作 成为Qwen3强化学习核心实践框架 可能成为未来后训练强化学习新标准[25][31] GFPO多属性优化 - GFPO解决GRPO依赖单一标量奖励信号问题 可同时优化多个响应属性如简洁性和准确度 避免模型响应长度大幅增加[33] - 采用显式过滤机制为每个问题采样更大候选响应组 过滤不符合目标属性响应 在所选组内使用标准奖励计算相对优势 无需复杂奖励工程[33][34] - GFPO主要干预Advantage估计层面 可与任何GRPO类似方法兼容 包括DAPO或带有Dual-Clip PPO损失的GRPO[35] GRPO其他缺陷 - GRPO存在奖励歧义性问题 多个奖励信号被合并为单一标量信号 模型无法知道具体因什么行为被奖励 即使调整不同奖励组件权重仍只能看到总奖励[39][41] - 在推理任务中 GRPO丢弃所有中间文本反馈 仅使用数值化奖励信号 文字反馈对模型有帮助但完全无法利用[43] - 多轮推理任务中每轮反馈重新输入到基础模型prompt 导致指数级分支 使GRPO在多轮任务训练变得非常困难[44]
科普向:一文解构大模型后训练,GRPO和它的继任者们的前世今生
机器之心· 2025-09-01 02:49
大模型后训练强化学习技术演进 - GRPO已成为大模型通用的强化学习算法,能够应用于广泛的后训练任务,各大研究团队近期发布的重磅成果如DAPO、GSPO、GFPO均是对GRPO范式的改进 [4][5][38] 后训练与强化学习基础 - 大语言模型开发包含预训练和后训练两个关键阶段,预训练使模型掌握通用语言能力,后训练则强化模型在特定领域的知识和应用能力,增强模型适应性和灵活性 [11][12] - 强化学习是后训练中不可或缺的核心部分,其核心机制是通过反馈增加好结果出现概率并降低坏结果出现概率 [13][14] - OpenAI在GPT训练中采用RLHF方法,通过人类反馈训练agent生成更有用的输出,但直接使用反馈会导致激励不充分和方差过大问题 [17][19] PPO机制及其局限性 - PPO通过引入Critic价值函数将绝对Reward反馈转变为相对评估的Advantage机制,显著降低训练方差 [21][22][23] - PPO采用Clip策略限制新策略相对于旧策略的动作概率变化幅度,避免模型单次更新幅度过大,同时加入Reference Model和KL散度作为双保险保障更新稳定性 [24][25][26] - PPO需同时训练策略模型和Critic模型,Critic模型大小与策略模型相同,带来额外内存和计算负担,训练成本高且难以扩展 [29] GRPO创新与优势 - GRPO通过去掉Critic模型解决PPO高成本问题,采用策略模型多次输出采样的平均Reward作为baseline计算Advantage,大幅降低内存需求和计算复杂度 [30][31][34][35] - 相比PPO需要基础模型3倍内存,GRPO仅需0.5倍内存,训练速度快3-5倍,采用单策略网络架构更简单直观 [37] - 但GRPO存在严重稳定性问题,容易导致训练崩溃,需要足够多的Batch数据来降低策略梯度方差,对中小规模训练不友好 [39] DAPO优化方案 - DAPO针对GRPO实践问题提出四项优化:Clip-Higher机制通过解耦剪辑范围提升训练早期熵值;动态采样过滤无效梯度样本;Token级策略梯度损失保证长序列所有token公平贡献;超长奖励调整避免过长响应 [42][43][44] - 使用DAPO算法让Qwen2.5-32B模型在AIME 2024基准获得50分,优于同等规模DeepSeek模型且训练步数少50% [41] GSPO范式突破 - GSPO将重要性采样从token级提升至序列级,基于整个序列似然度计算重要性比值,显著降低长序列方差积累问题,提高训练稳定性 [48][53][54] - 序列级重要性采样进行长度归一化,避免不同回答长度带来的不稳定,且裁剪时作用于整个序列而非部分token,更符合奖励信号整体性 [56][57][58] - 该方法很可能成为未来后训练强化学习新标准,特别适合专家混合模型场景 [59] GFPO多属性优化 - GFPO解决GRPO依赖单一标量奖励难以联合优化多个属性问题,可同时优化简洁性、准确度等属性 [62][63] - 通过为每个问题采样更大候选响应组并显式过滤不符合目标属性的响应,无需复杂奖励工程即可实现多属性优化 [64][67] - GFPO在Advantage估计层面进行干预,可与任何GRPO类似方法兼容 [68] GRPO其他缺陷 - GRPO将多奖励信号合并为单一标量信号,模型无法区分奖励具体来源行为 [73][75] - 在多轮推理任务中会出现指数级分支问题,导致训练非常困难 [79]
破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙
36氪· 2025-08-28 03:44
研究框架与核心观点 - 论文提出将工作技能拆分为决策层子技能和执行层子技能的双层数学框架 决策层涉及目标确立、问题界定和权衡取舍等认知工作 执行层涉及计划实施和工具运用等操作行为[1] - 人类和AI在决策层和执行层各具优势 当优势互补时整体成功率远高于单独工作[1] - 该框架已被ICML 2025接收[3] 工作价值重塑路径 - 工作价值正被根本性重塑 挑战在于理解重塑方式而非猜测哪些工作消失[4] - 技术替代或补充的是具体任务而非整个工作 但任务中心视角常忽略判断框架构建与实施过程的关键分野[4] - 论文在任务经济学和机器学习适配性评估基础上提出更精准分析工具 将工作解构为技能单元后再拆分为决策判断与执行实施两个核心构件[4][7] 案例分析与行业应用 - 以软件工程师为例 AI工具如GitHub Copilot和GPT接管大部分执行环节 加速甚至自动化实施部分[6] - 工程师角色从实施转向监督 核心竞争力转变为制定方案的判断力 包括决定开发内容、论证项目价值和核验AI产出[6] - 在医疗行业 AI可标记扫描影像异常但医生仍需敲定诊断方案 在分析行业 AI可草拟报告但分析师仍需确定叙事框架[9] 数学模型与量化工具 - 框架通过将岗位解构为任务与技能集合 并为人类与AI建立能力图谱 可测算任意劳动力-岗位组合的成功概率[10] - 研究揭示成功概率存在相变现象 决策层技能微小进步可能触发成功概率的非线性跃升[12] - 技能互补的劳动者组合或人类与AI协作能显著提升岗位成功率 强于决策的人类与擅于执行的AI配对时协同效能超越个体能力[14] 实际应用与数据验证 - 研究通过应用真实世界数据验证框架实用性 从O*NET综合数据库提取岗位结构 通过Big-bench Lite基准测试获取劳动者能力数据[16] - 借助大语言模型构建数据桥梁 证实理论预测成立 模型对理解当今劳动力市场具有现实指导意义[16] 技能培训与招聘策略 - 技能培训应聚焦提升决策层能力 包括精准定义问题、权衡冲突目标和在不确定性中调整策略 而非工具使用等执行层技能[18] - 招聘应识别互补优势 发掘高决策力但执行欠佳的人才 辅以工具稳定产出 而非依赖学历等粗放指标逼迫雇佣综合全能者[19] 体系设计与人类价值 - AI浪潮将执行与决策剥离 需重新定义人类独特价值 若继续基于执行层产出培训、招聘和评估人才将误判潜力和错配资源[20] - 框架为机构提供实用工具 构建能识别决策层卓越能力的体系 包括判断力、验证力和战略推演[20]