Workflow
美团(03690)
icon
搜索文档
攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理
搜狐财经· 2025-09-11 22:23
核心观点 - 美团等机构的研究团队提出可验证的过程奖励机制VSRM 通过抑制无效推理步骤和鼓励有效步骤 显著减少大型语言模型的过度思考问题 在保持模型性能的同时实现高效推理 [6][12][20] 技术方案 - VSRM机制结合可验证奖励与步骤级奖励 为推理过程中的每个中间步骤分配奖励信号 天然契合推理任务分步作答特点 [13][20] - 使用特殊token如"However"、"Therefore"等定位推理步骤 并设计三条规则保证划分后内容的可读性 [14] - 通过评估步骤完成前后的正确率增益来评估步骤有效性 正确率可通过可验证方式获得 [15][18] - 引入前瞻窗口机制将未来正确率变化通过折扣因子传播给当前步 确保奖励信号尽量密集 避免稀疏奖励问题 [19][20] - VSRM机制与强化学习算法解耦 能天然适配支持过程奖励的方法 只需将逐步奖励添加到最终reward tensor [20] 性能表现 - 在AIME24基准上 VSRM-PPO使DS-Distill-1.5B模型输出长度从12605 token减少至7065 token 降幅达44% 同时保持29.2%的pass@1准确率 [6] - 在AIME25基准上 VSRM-R++使DS-Distill-7B模型输出长度从10909 token减少至6953 token 降幅达36% pass@1准确率从36.0%提升至36.4% [6] - 在MATH-500基准上 VSRM-PPO使DS-Distill-1.5B模型输出长度从4960 token减少至2400 token 降幅达52% pass@1准确率保持在82.2% [6] - 在AMC23基准上 VSRM-PPO使DS-Distill-1.5B模型输出长度从8577 token减少至4153 token 降幅达52% pass@1准确率从62.9%提升至64.9% [6] - 在DeepScaleR模型上 VSRM-R++使输出长度从8515 token减少至6668 token 降幅达22% 同时在AMC23基准上pass@1准确率从73.6%提升至74.7% [6] 问题背景 - 大型语言模型通过RLVR范式培养强大CoT推理能力 但伴随冗长输出内容 显著增加推理开销并影响服务吞吐量 这种现象被称为"过度思考"问题 [4] - 过度思考问题本质是模型倾向于给出多种不同解答 特别对简单问题 大量无效中间步骤导致中间过程出错 [10][12] - 案例研究显示模型为解决简单子问题如"[-500,0]中有多少个小于0的整数"进行反复思考 在正确和错误间横跳 最终得出不正确结论 [10] 方法优势 - 与直接施加长度惩罚不同 VSRM直接从源头给予清晰奖励信号 引导模型选择对提升最终正确率有帮助的步骤 [20] - 消融实验显示VSRM中前瞻窗口机制有效 额外显式长度惩罚对VSRM机制无帮助 [22] - 在困难benchmark上 VSRM训练后模型保持与原本模型一致的Pass@k指标提升趋势 说明未因输出长度压缩而失去探索能力 [22]
大众点评迎来对手高德
经济观察网· 2025-09-11 15:44
高德扫街榜产品发布 - 阿里巴巴旗下高德地图于9月10日推出基于用户行为数据的本地生活评价体系"高德扫街榜" 包含美食、景点、酒店等品类的实时动态榜单 并承诺永不商业化 [3] - 该产品由高德地图CEO郭宁直接领导 团队从20多人秘密开发三个月后扩张至上百人 基于近一年5132万人13亿次导航数据和228亿公里行程筛选出118万家店铺 [3][5][6] - 榜单核心数据源为导航行为数据(到达数、专程前往率、回头客频次) 结合支付宝芝麻信用分加权评价 通过轨迹算法和AI大模型过滤虚假行为 [3][4][6] 与大众点评竞争对比 - 高德扫街榜采用实时动态更新机制 而大众点评"必吃榜"为月度迭代和年度调整 两者在数据来源、权重机制及异常处理上存在显著差异 [4] - 大众点评过去一年累计3.63亿条真实评价 日均带图评价浏览量同比上升11% 差评优先查看率达14% 拥有22年积累的UGC内容壁垒 [11] - 高德榜单覆盖118万家店铺 但部分商家评价数量仅百条 远低于大众点评过万条的评价规模 存在数据量级差距 [9] 本地生活市场竞争动态 - 美团在高德发布榜单半小时前宣布重启"品质外卖"服务 覆盖超1400家必吃榜餐厅和近1500家高星酒店 并针对中小商家发放最高5万元助力金 [3][11][13] - 抖音生活服务同日加码对中小商家扶持 此前高德与抖音曾相互接入服务 形成对抗美团的临时联盟 但当前竞争关系加剧 [13] - 阿里巴巴通过高德投入超10亿元补贴启动"烟火好店扶持计划" 直接对标美团和抖音的本地生活业务 [12][13] 高德战略定位与商业化路径 - 高德地图2025财年第三季度首次实现盈利 证明本地生活业务"有利可图" 美团2024年核心本地商业收入2502亿元且经营利润达524亿元 [19] - 高德通过导流抽佣模式盈利 虽宣称榜单不商业化 但已与飞猪、淘宝等平台打通 为合作方提供流量导入和佣金收入 [19][20] - 阿里巴巴将高德定位为独立生态平台 2024年与饿了么、飞猪拆伙后 全面聚焦到店场景 承接集团对抗美团的战略任务 [18][19] 技术实现与数据基础 - 产品基于阿里通义千问大模型和空间智能技术处理用户行为数据 日活1.7亿人次 月活8.9亿人次 每日生活服务搜索达1.2亿次 [5][6] - 采用"红蓝对抗"机制校验数据质量 通过芝麻信用分过滤机器刷量 结合轨迹算法识别异常导航行为(如重复绕路、停留时长异常) [4][6] - 榜单包含年度更新的"状元榜"和每日更新的"烟火小店""轮胎磨损榜""多次前往""本地人爱去"等多维度标签页 [5][8]
2025服贸会|北京、上海入选全球前20名竞争潜力城市 旅游业迈入数智化变革新阶段
北京商报· 2025-09-11 15:15
核心观点 - 数字技术正推动全球旅游业向数智化转型 聚焦入境游高质量发展和文化体验创新 [1][4] - 北京凭借文化遗产与科技融合优势 在全球旅游城市排名中显著提升(竞争潜力第5 综合排名第7) [2][3] - 行业通过多语种服务 AI工具和数字化设施优化入境游客体验 推动消费需求向深度沉浸式转变 [5][6] 旅游城市竞争力 - 北京入选全球旅游目的地竞争潜力城市第5名 上海排名第9名 [2] - 北京综合排名升至全球旅游城市第7位 较去年提升1位 [3] - 竞争力评估维度包括知名度 产业景气 智慧度 安全度 经济贡献和游客满意度 [3] 科技赋能旅游业 - 北京融合文化古迹与现代技术 提供AI导览 微信互动和AR沉浸式体验 [2] - 科大讯飞展出多语种AI透明屏和即时翻译机 马蜂窝推出AI具身智能导览机器人 [3] - 数字技术用于优化旅游管理(如雅典智能监测系统)和活化文化遗产(如土库曼斯坦数字设施) [4] 入境游新趋势 - 入境游客中40%为首乘旅客 更倾向深度体验 小团化及"文旅+体育/美食"融合消费 [5] - 外籍旅客前往三线及以下城市订单量快速增长 如大同 义乌 伊宁的机票预订量增长两倍以上 [6] - 多语种服务需求显著 首都机场设综合服务中心提供外卡取现 旅游预订等服务 [5] 企业数字化举措 - 美团AI旅行助手覆盖90%以上酒店景区预订 提供C端行程规划和B端商户服务 [6] - 去哪儿推出英文版App 支持一键语言切换和全流程预订 [6] - 行业通过AI及多语种技术推动"去中国旅游=去中国生活"的观念形成 [6]
美团旅行联合中饭协起草行业可持续发展标准 洲际集团国内7成门店开启“低碳住”
21世纪经济报道· 2025-09-11 14:28
行业ESG标准与倡议 - 中国饭店协会在服贸会发布《住宿企业ESG管理体系要求》并获得商务部认可 [2] - 协会聚焦降碳、减污、扩绿、增长 通过标准化引领行业高质量转型 [2][4] - 联合酒店集团、国央企及数智化企业共同发起《中国住宿企业可持续发展北京倡议》 推动绿色饭店发展和数智化转型 [7][9] 美团旅行ESG实践 - 作为ESG标准起草单位参与《住宿业企业ESG评价指南》及管理体系要求建设 [2][4] - 2024年6月推出酒店民宿"低碳住"机制 消费者选择"不需要六小件"每订单减少203.2克二氧化碳排放 [7] - 已联合40万家酒店实现257万次"低碳住" 累计减碳460吨 [7] - 洲际酒店集团国内超70%门店及华住集团近9000家门店接入"低碳住" [7] - 为参与用户提供200美团积分并支持碳账户累积 助力乡村儿童操场建设 [7] 行业合作与数字化发展 - 美团旅行与69个五星级酒店在线旗舰店合作 其中32个酒店集团实现会员互通 [9] - 合作涵盖洲际、凯悦、香格里拉、万豪等头部集团 万豪国际于2025年5月28日达成战略合作并发布联合会员 [9] - 互联网企业将开放数字化能力 构建"平台+酒店集团"ESG实践新模式 [4][5][9] - 通过科技驱动和行为引导 形成平台、酒店、用户三位一体的绿色生态 [5]
9月11日南向资金净买入189.89亿港元
证券时报网· 2025-09-11 13:32
市场表现 - 恒生指数9月11日下跌0.43%至26086.32点 [1] - 南向资金通过港股通全天净买入189.89亿港元 [1] 交易规模 - 港股通全天合计成交金额达1722.14亿港元 [1] - 沪市港股通成交金额1037.37亿港元 净买入80.73亿港元 [1] - 深市港股通成交金额684.77亿港元 净买入109.16亿港元 [1] 个股交易活跃度(沪市) - 阿里巴巴-W成交额80.75亿港元居首 净买入29.46亿港元 股价上涨0.35% [1] - 美团-W成交额61.84亿港元 净卖出9.36亿港元 股价下跌5.06% [1] - 中芯国际成交额49.10亿港元 净买入4.17亿港元 股价上涨4.97% [1][2] 个股交易活跃度(深市) - 阿里巴巴-W成交额43.57亿港元居首 净买入7.84亿港元 [2] - 中芯国际成交额31.32亿港元 净买入5.15亿港元 [2] - 信达生物成交额25.38亿港元 净买入8.47亿港元 股价下跌2.51% [2] 重点个股资金流向 - 腾讯控股遭净卖出 沪市净卖出9.23亿港元 深市净卖出2.29亿港元 股价下跌0.63% [1][2] - 百济神州获深市净买入8.27亿港元 股价下跌6.92% [2] - 药明生物获沪市净买入3.39亿港元 股价下跌4.26% [2] - 长飞光纤光缆沪市成交18.94亿港元 股价大涨11.81% [2]
南向资金今日成交活跃股名单(9月11日)
证券时报网· 2025-09-11 13:13
南向资金整体流向 - 9月11日南向资金全天成交总额1722.14亿港元 其中买入成交956.01亿港元 卖出成交766.12亿港元 实现净买入189.89亿港元 [1] - 港股通(深)成交金额684.77亿港元 净买入109.16亿港元 港股通(沪)成交金额1037.37亿港元 净买入80.73亿港元 [1] 个股成交活跃度 - 阿里巴巴-W为当日成交额最高个股 达124.32亿港元 美团-W和中芯国际紧随其后 成交额分别为84.52亿港元和80.43亿港元 [1] - 南向资金净买入个股共10只 阿里巴巴-W获净买入37.30亿港元居首 信达生物和中芯国际分别获净买入9.57亿港元和9.32亿港元 [1] - 腾讯控股遭净卖出11.51亿港元 为当日净卖出金额最高个股 康方生物和美团-W分别遭净卖出3.90亿港元和9658.14万港元 [1] 重点个股资金动向 - 阿里巴巴-W连续15日获净买入 期间累计净买入371.43亿港元 中芯国际连续3日净买入 累计净买入15.76亿港元 [2] - 康方生物 腾讯控股和美团-W遭连续净卖出 累计净卖出金额分别为17.48亿港元 14.61亿港元和10.28亿港元 [2] - 百济神州获净买入8.27亿港元但股价下跌6.92% 石药集团获净买入2.67亿港元但股价下跌7.50% [2] 股价表现与资金流向关联 - 阿里巴巴-W获大额净买入37.30亿港元 股价上涨0.35% 中芯国际获净买入9.32亿港元 股价大幅上涨4.97% [1][2] - 腾讯控股遭净卖出11.51亿港元 股价下跌0.63% 美团-W遭净卖出9658.14万港元 股价下跌5.06% [1][2] - 信达生物获净买入9.57亿港元但股价下跌2.51% 药明生物获净买入3.39亿港元但股价下跌4.26% [2]
美团AI产品进入集中发布期 龙猫、小黄蜂服贸会曝光
21世纪经济报道· 2025-09-11 12:44
公司AI产品发布动态 - 2025年公司AI产品进入集中发布期 包括室内外一体化具身智能配送机器人"美团小黄蜂"、龙猫大模型、AI Coding Agent工具NoCode、AI经营决策助手"袋鼠参谋"、酒店经营垂类AI Agent"美团既白"等产品 [1][2] - 公司第六次参展中国国际服务贸易交易会 携无人机、无人车及美团闪购、美团买药、美团服务零售等业务亮相 突出零售+科技主题 [1] - 最新研发的"美团小黄蜂"首次参展 面向封闭半封闭场景末端即时配送设计 具备多模态感知和定位导航能力 可在商超、公寓、机场等场景提供无人配送服务 [1] 技术应用与商业化进展 - "美团小黄蜂"已在深圳宝安机场、上海互联宝地等地试点 累计配送超1万单 成为国内首个在机场管制区实现外卖直达登机口的机器人 [2] - 龙猫大模型通过架构和训练创新 以更低成本实现更快计算推理和高效智能体应用 已跻身行业第一阵营 [2] - 公司C端AI智能体服务将于一周内发布 目前处于"封楼测试"阶段 [3] 公司AI战略布局 - AI策略聚焦三大方向:AI at work提升员工工作效率和业务运营效率 AI in products打造AI原生产品改造现有2B和2C服务 构建内部大语言模型提升自研基座能力 [2] - 自研AI产品在业务中实际使用率很高 公司持续加大AI领域投资 [1][2]
阿里高德10亿补贴推“扫街榜”,本地生活大战烧向“到店”服务
财经网· 2025-09-11 12:18
高德扫街榜推出背景与战略意义 - 阿里巴巴通过高德地图推出"高德扫街榜" 投入超10亿元补贴启动"烟火好店支持计划" 项目由高德CEO郭宁直接领导且内部保密程度极高 [1] - 阿里在本地生活领域屡败屡战 此次选择高德作为突破口再次冲击到店业务 试图以用户行为数据重构线下服务信用体系 [1][4] - 高德地图覆盖全国超700万个餐厅点位 每天产生1.2亿次生活服务相关搜索 导航前往1300万个生活服务目的地 [3] 扫街榜核心机制与技术创新 - 榜单排名基于导航到店人数、复购率、专程前往、人群宽度四个核心因子 每日动态更新 [1][2] - 引入支付宝芝麻信用体系为可信评价加权 结合AI风控技术识别过滤虚假评价 解决"恶评门槛低""好评成本高"行业痛点 [2] - 推出多维度排行榜单包括轮胎磨损榜(远距离专程前往)、回头客榜(多次前往)、本地人爱去榜等细分品类 [1] 市场竞争格局与对手反应 - 美团在扫街榜发布同日迅速反击 宣布重启"品质外卖"服务 发放2500万张消费券 并强化AI+真实高分体系 [7][8] - 抖音本地生活业务四年做到年成交额5000多亿元 2025年目标9000亿 对美团形成直接竞争压力 [8] - 美团整合到店与到家业务 打通神会员体系 必吃榜商家团购销量平均提升超50% 并通过数据监测下架20余家违规餐厅 [8] 行业生态与差异化挑战 - 阿里生态优势包括支付、电商、地图等综合体系 可为到店业务提供丰富流量入口和用户数据 [4] - 美团在线下商户深度运营方面具有优势 大众点评已形成强大用户心智壁垒 [4][8] - 行业关键方向在于实现差异化服务 各平台通过AI技术、无人配送等技术试图突围 [9] 实施挑战与用户反馈 - 用户习惯改变存在难度 商场内店铺可能面临流量分配问题 用户更倾向导航至综合体而非具体店铺 [5][7] - 存在刷分作弊风险 有用户声称可通过付费方式 manipulation 定位数据 [5][7] - 本地人和回头客的导航需求存疑 可能沦为大众点评榜单的复制品 [7]
美团-关键要点 _ 在扩大的即时零售业务下捍卫外卖领导地位
2025-09-11 12:11
涉及的行业与公司 * 公司为美团 (3690 HK) 在食品配送和快速商务领域的竞争策略、财务表现及增长前景[1] * 行业涉及食品配送、到店酒旅、即时零售(闪购)及快速商务行业[1][5][8] 核心观点与论据 食品配送竞争格局与公司优势 * 6-7月以来竞争加剧导致单位经济效益受显著影响 因补贴水平提升及为维持行业领先履约服务而产生更高配送成本[5] * 公司专注于维持其在餐饮类别交易总额(GTV)的市场份额领导地位 并对其单位经济优势及竞争正常化后的长期单位经济(UE)保持信心 因其拥有广泛的商户覆盖和更优的骑手与用户体验[5] * 预计2025年第三季度/2025财年订单量将增长13%/11% 原因是行业补贴推高了近期需求 但预计食品配送单位经济将因确保市场份额的增量补贴而大幅下降[5] * 预计食品配送竞争将持续至第三季度/第四季度 并在随后几个季度逐渐从食品转向商品[5] * 预计2025年食品配送息税前利润(EBIT)将亏损220亿元人民币 因需用户补贴以捍卫交易总额市场领导地位[5] 到店、酒店及旅游(IHT)业务竞争与利润率轨迹 * 竞争格局保持稳定 近期IHT息税前利润率主要受宏观因素影响 包括更多低客单价交易、低线城市订单组合占比更高、会员计划投资以及食品配送竞争(连锁餐厅广告预算转向食品配送)[8] * 预计2025年第三季度IHT收入同比增长13% IHT利润率因持续投资会员计划及食品配送竞争对到店餐厅的影响而环比下降[8] * 预计2025年IHT收入增长15% 调整后息税前利润增长7%[8] 闪购增长与利润展望 * 公司的按需零售模式涵盖第三方模式(闪购)和第一方模式(象鲜超市) 并注意到自2025年第三季度起因同行补贴驱动的快速商务推进而竞争加剧[5] * 公司重申了之前提出的2030年闪购和象鲜超市交易总额目标[5] * 预计2025年第三季度闪购订单量将加速至33% 但运营亏损扩大至15亿元人民币 因投入增量投资以进一步改善用户心智份额 然而即时购物需求(与食品不同)通常更由紧急需求而非补贴驱动[5] * 预计2025年闪购量增长31% 2025财年息税前利润亏损17亿元人民币[6] 海外扩张与其他新举措进展 * 鉴于国内竞争 公司将优先将资源配置到国内市场 但仍继续执行海外业务发展 并预计香港盈利能力持续改善以及在中东(最近在卡塔尔)的有管理扩张[8] * 美团优选的亏损也将在2026财年显著减少[8] * 随着美团优选战略收缩以及因卡塔尔前期投资导致Keeta亏损增加 预计2025年第三季度/2025财年新举措亏损分别为23亿元人民币/90亿元人民币[8] 整体财务展望与投资评级 * 尽管面临短期利润压力 但对美团在扩大的快速商务总目标市场(TAM)下的整体本地服务领导地位保持信心[7] * 预计2026年食品配送补贴将逐渐正常化(鉴于其交易总额仍处于领先地位 将推动2026-2027年利润恢复) 在仍快速增长的到店本地服务板块格局稳定 按需购物零售高速增长 以及人工智能应用和Keeta的新增长动力 外加强劲的资产负债表[7] * 对美团给予买入评级 12个月目标价为144港元(较当前103港元有39.8%上行空间)[7][11] * 预计2025年集团收入为3597.4亿元人民币 调整后每股收益(EPS)为-2.22元人民币[11] 其他重要内容 关键下行风险 * 竞争差于预期 可能影响增长或利润转好步伐[7] * 劳动力成本通胀/效率问题[7] * 食品安全问题/更严格的监管[7] * Keeta投资超出预期[7] 财务数据预测(高盛观点) * 预计2025年核心本地商业(CLC)收入增长13% 调整后息税前利润下降107%[9] * 预计2025年新举措收入增长9% 调整后息税前利润为-90亿元人民币[9] * 预计2025年食品配送平均日订单量增长12% 但调整后每单息税前利润为-0.91元人民币[9] * 预计2025年闪购交易总额增长32% 平均日订单量增长33%[9] * 预计2025年到店、酒店及旅游业务交易总额增长15% 收入增长15% 调整后息税前利润增长1%[9]
大众点评失去“大众”,高德扫街榜精准“点穴”美团
搜狐财经· 2025-09-11 11:52
高德推出扫街榜挑战美团到店业务 - 高德地图于9月10日推出全球首个基于用户行为产生的榜单"高德扫街榜",聚焦美食、酒店、景区三大类目,构建线下服务信用体系,以支持餐饮及服务消费[1] - 高德扫街榜基于10亿用户真实导航、到店、搜索、收藏等行为数据,结合芝麻信用体系,通过AI模型量化评分,提升信息真实性和防刷能力[19][24][25] - 高德对商家实行免费入驻政策,不收取页面装修费、流量购买费或活动上架费,确保榜单排名仅取决于消费者真实行为[24] 美团紧急重启大众点评防御竞争 - 美团在高德发布扫街榜同日宣布重启大众点评"品质外卖服务",并透露其C端AI智能体处于"封楼测试"阶段,计划一周内发布[1] - 大众点评虽被边缘化但仍是美团核心利润来源,到店及酒旅业务贡献美团近三分之一利润,2022-2024年利润率分别为46%、35%、33%,2025年预计为34%[5][6] - 大众点评在到店餐饮市场占据绝对支配地位,2021年市场份额达83%,预计2025年仍保持70%左右[7] 大众点评面临信用体系危机 - 大众点评评分体系被注水,出现商家通过送菜、返现等方式索要好评,以及第三方组织刷评控评的现象,央视财经7月报道其探店笔记造假[12][13][15] - 平台VIP会员体系(橙V-V8)形成灰色产业链,高权重用户好评/差评可付费操纵,导致连锁店和网红店通过营销手段垄断榜单[15][16] - 消费者信任度下降,出现"反其道而行之"的3.5分宝藏餐厅搜索趋势,商家经营成本达GTV的5%-20%(每100元消费券支付5-20元费用)[12][6] 行业竞争格局与市场影响 - 美团外卖市场份额2024年为65%,较2020年74%有所下降,但仍超过50%的市场支配地位门槛[8] - 高德扫街榜通过"行为+信用"体系直接挑战大众点评评分系统,旨在重构本地生活生态,打破美团到店业务垄断格局[19][25][26] - 抖音、快手等平台曾尝试冲击美团本地生活业务但未撼动其地位,高德成为新破局力量[17][26]