Workflow
36氪
icon
搜索文档
计算成本减半,化学反应发现工具ChemOntology将人类直觉「编码」到系统中,加速反应路径搜索
36氪· 2025-12-24 07:47
文章核心观点 - 日本北海道大学开发的ChemOntology框架,通过将人类化学知识形式化为机器可理解的规则,并与自动化反应路径搜索(AFIR)相结合,实现了从“描述性标注”到“指导性控制”的跨越,在保证化学合理性的同时显著提升了机理解析效率,计算成本降低近一半 [1][2][4][20] 研究方法论与框架设计 - 该框架是一种知识驱动型计算框架,其核心不依赖大规模数据训练,而是通过整合化学反应规则、结构约束与量子化学路径搜索来引导探索 [5][7] - 工作流程包括用户输入解析、化学信息建模、反应路径生成、结构合理性约束、运行控制AFIR及路径分析六个环节 [8] - 框架将反应体系解析为具有明确化学角色的结构单元集合,并利用ERPO对有机金属基元反应过程进行模块化描述,以降低搜索空间的组合复杂度 [10] - 通过引入基于原子杂化变化的过滤机制,自动剔除不合理的几何结构,有效抑制结构爆炸问题,提高计算效率 [12] - 其“知识库”由官能团识别规则、结构单元分类和ERPO文件构成,无需数据集训练,可由用户灵活修改 [12] 实验验证与性能表现 - 研究选取机理复杂的经典Heck反应作为测试案例,该反应涉及氧化加成、烯烃插入等多个关键步骤,对自动化方法构成典型挑战 [6][15] - 对比了三种策略:无引导的AFIR_DEFAULT、部分限定的AFIR_TARGET以及引入化学本体论的AFIR_ChemOntology [16] - AFIR_ChemOntology的搜索结果高度聚焦,能较早勾勒出清晰的主反应通道,显著降低了“坏节点”比例,识别出的关键中间体与经典机理高度一致 [16] - 在探索约一半路径数量时,AFIR_ChemOntology即可获得与AFIR_TARGET完整搜索相当的有效结果,整体计算成本降低近一半 [4][20] - 能量分析显示,只有AFIR_ChemOntology能够完整区分并追踪分别通向主产物与副产物的特异性路径 [18] 行业应用与趋势 - 化学本体论与自动化路径搜索的融合正在连接理论化学与工业应用,推动反应机理研究从“事后解析”向“主动引导”转变 [21] - 学术界案例:冰岛大学团队开发的“最优传输高斯过程”算法,将分子反应路径搜索的平均耗时从28.3分钟缩短至12.6分钟,且成功率显著提升 [21] - 产业界案例:薛定谔公司开发的AutoRW自动化反应工作流,深度融入化学本体论思维,实现了从反应枚举到结果输出的全流程自动化 [22] - 产业界案例:巴斯夫与IBM合作,将化学本体论与量子化学计算、AI结合研发高性能催化剂,显著缩短研发周期并降低实验试错成本 [22] - 全球领先企业的实践形成了从学术突破到技术转化、再到产业应用的良性循环,推动化学工业走向更绿色、高效与智能的未来 [23]
最鲁棒的MLLM,港科大开源「退化感知推理新范式」
36氪· 2025-12-24 07:47
文章核心观点 - 多模态大语言模型在真实世界视觉退化下的性能崩溃是产业落地的致命瓶颈[1] - 由香港科技大学、西北工业大学等团队提出的Robust-R1实现了从“抵抗干扰”到“理解干扰”的范式转变[2] - 该方法将视觉退化问题重构为显式结构化推理任务,在多项权威评测中实现了质量与鲁棒性的双重突破[1] 技术方案与创新 - **核心思想**:为视觉大模型构建一套“退化感知推理系统”,执行三步诊断流程:退化参数感知、语义影响分析、鲁棒结论生成[3][5] - **范式创新**:首次跳出“隐式适应”的思维定式,将退化感知提升为显式的结构化推理能力[2][24] - **技术内核**:通过三阶段构建“退化感知推理引擎”,包括结构化推理链监督微调、退化参数精准对齐奖励、动态推理深度自适应调控[9][10][11] - **可解释性**:模型的每一个判断都伴随完整的推理链条,决策依据透明、可追溯、可验证[3][19] 数据与训练 - **数据引擎**:研究团队构建了业界首个大规模退化感知推理数据集,覆盖真实世界四大退化阶段和16种精细化退化类型[13][16] - **训练流程**:数据集包含11K样本,每个样本不仅包含退化参数,更包含完整的“诊断→分析→推理→结论”链条[13][16] 性能表现 - **真实退化基准测试**:在R-Bench基准上,Robust-R1在低、中、高三种退化强度下全面超越所有基线模型[14] - **综合性能领先**:Robust-R1 (SFT+RL) 在R-Bench上的综合性能得分为0.5017,高于通用MLLM Qwen2.5-VL-3B的0.4845和专用鲁棒模型TeCoA的0.3586[15] - **对抗退化压力测试**:在MMMB、MMStar、RealWorldQA三大通用VQA基准上,对图像施加25%、50%、100%强度的合成退化[15] - **抗衰减能力强**:随着退化强度从25%增加到100%,Robust-R1的性能下降幅度显著小于所有基线模型[18] - **极端场景可用**:在100%强度的极端退化下,Robust-R1在MMMB基准上的性能为75.35,大幅领先专用鲁棒模型TeCoA的51.76和Robust CLIP的53.33[15][17][18] - **全面领先**:Robust-R1 (SFT+RL) 在三大基准的所有退化强度下,均取得了最佳或接近最佳的性能[17] 行业影响与意义 - **开启新篇章**:标志着多模态大模型从追求“在清晰世界中表现完美”向追求“在复杂现实中可靠决策”的重大转变[23] - **可信AI**:提供完整的可解释推理链,极大增强了模型在关键应用中的透明度和可信度[24] - **高效实用**:动态推理机制平衡了性能与效率,更具实用价值[24] - **应用领域**:解决了自动驾驶、医疗影像、安防监控等关键领域落地的瓶颈问题[2]
影石悬赏10万打击黑公关,已固定两千余条谣言证据并立案
36氪· 2025-12-24 07:45
影石创新法务部称,目前公司已完成相关证据固定,向公安机关报案后已获正式立案。 【#影石十万元悬赏黑公关#,已固定两千余条谣言并获正式立案】 据21世纪经济报道,近日,影石创新表示,公司旗下首款全景无人机 "影翎 Antigravity A1" 上市两周 内,网络上集中涌现超过 2500 条恶意不实攻击信息。针对此行为,影石法务部发起全网悬赏,公开征 集相关线索,若线索被公安机关采纳,最高可给予10万元奖励。 据悉,征集启动后,影石收到大量网友举报。12月23日,影石创新法务部在社交平台公开晒出多条"黑 公关"线索证据。一推广众包平台明确标明招募"产品负面评价内容推广",发布一条相关内容的稿费最 高达2000元。 ...
现代数据仓库的崛起:八个时代的二十年历程
36氪· 2025-12-24 06:49
企业如何从手工构建的销售报告发展到拥有数千消费者的PB级多租户平台以及未来十年将如何发展 。 二十年前,"数据仓库"几乎等同于将 数据提取、转换和加载 (ETL) 到 Oracle 或关系型数据库管理系统 (RDBMS) 。存储空间以 GB 为单位 衡 量。报表 按月或按周 交付。大多数企业只有不到十几个仪表盘,分析师往往是 SQL 的把关人 。 Netflix 使用 Apache Iceberg 来管理 每天数十亿次的流媒体事件 。 Uber 使用 Apache Hudi 管理 150+ PB 的数据 。 这不仅仅是技术问题——这是数据如何成为现代商业 核心产品的故事。 第一个时代:2005–2010 年 · 直接表格 → "只需生成报告" "数据是成本中心,而不是资产。" 快进到今天: Google BigQuery可以对EB 级 数据进行查询 应用程序直接写入报告表(sales_report、customer_report、inventory_report)。 报表通常是 硬编码的 SQL 脚本, 通过cron 作业进行定时运 行。 电子表格是手动导出的,并作为"单一事实来源"通过电子邮件发送。应用程序 ...
商超变革:要做减法
36氪· 2025-12-24 06:49
行业现状:冰火两重天 - 行业呈现两极分化格局,头部企业如胖东来、奥乐齐、山姆及新锐品牌鲜风生活、成山农场、农夫刘先生等凭借精准定位与高效运营业绩长虹,异军突起 [1] - 部分传统巨头深陷闭店潮,例如中百集团在2025年上半年已关闭13家仓储大卖场,截至目前累计关闭30家,预计关店损失高达1.8亿元 [1] 核心问题:传统零售沉疴 - 传统零售企业普遍存在三大问题:门店盲目扩张导致部分长期亏损;总部机构臃肿、权责交叉、人浮于事;商品SKU泛滥,充斥大量动销缓慢的“僵尸品” [2] - 在增长见顶、存量博弈的背景下,粗放式扩张模式已失效,企业重振竞争力的关键在于“做减法”,即减掉冗余负担、砍掉低效环节、聚焦核心价值 [2] 减门店:聚焦优质资产 - 核心是砍掉亏损门店,聚焦优质资产,基于数据进行科学决策,避免盲目闭店 [3] - 需建立门店综合评估体系,梳理运营数据,对比盈利能力交叉比率,并参考销售额、毛利率、坪效、人效、租金成本、客流增长率、会员复购率等综合指标,结合商圈潜力、竞争格局等外部因素进行分级分类 [4] - 对交叉比率垫底、持续亏损且无改善潜力的门店坚决关闭;对暂时亏损但有前景的门店纳入重点整改,给予资源支持与整改期限 [4] - 闭店需科学规划流程:提前与物业方沟通协商;通过多种渠道告知顾客,妥善处理会员积分与储值卡余额以保障消费者权益;通过调拨、线上清仓、供应商回购等方式处理库存;优先内部转岗安置员工,无法转岗的依法给予经济补偿 [5] - 将从亏损门店释放的资金、人力、管理资源集中投入到优质门店的升级改造中,优化陈列、服务与核心商品供给,并形成可复制的运营模式以实现“少而精”的高质量发展 [6][7] 减机构:优化流程体系 - 核心是通过流程优化,为臃肿机构“减肥”,优化冗余人员,简化决策流程,实现组织精简高效 [8] - 需梳理现有部门架构,合并职能重叠部门(如市场部与企划部、行政部与后勤部),撤销非必要辅助部门,减少管理层级,形成“总部-区域-门店”的扁平化架构 [9] - 需优化人员结构,将人力资源向一线核心业务倾斜:通过绩效考核淘汰冗余人员;减少总部职能人员占比,增加一线岗位投入;优化薪酬激励体系,薪酬向一线倾斜,与业绩效率挂钩,加大绩效奖金占比,并对核心岗位与关键人才设立专项激励基金 [10] - 需借助工具提升决策效率:梳理业务流程,砍掉不必要审批环节,下放审批权限(如常规促销活动审批下放至区域经理);使用自动补货系统减少时间成本 [11] - 借助数字化工具如钉钉、企微实现信息共享与高效沟通;升级商业管理系统实现销售、库存、客户数据实时同步,为总部决策提供支持 [12] 减商品:优化SKU结构 - 核心是基于科学指标筛选,淘汰低效滞销品,聚焦高效核心商品,优化SKU结构,关键工具是交叉比率(交叉比率=毛利率×周转率) [13] - 需走出商品采购思维误区:摒弃“商品越多越能吸引顾客”和“为填充货架、收取后台费用而增加商品”的错误观念 [13] - 以交叉比率为标尺筛选高效商品,交叉比率越高代表商品综合价值越高,属于A类商品;需淘汰品类中交叉比率靠后的“绿叶品”,将资源向高交叉比率商品倾斜 [14] - 优化资源配置:坚决淘汰交叉比率靠后的C类商品;将资源向A类商品倾斜,优化其陈列位置并加大库存保障;对B类商品通过调整定价、促销等方式提升其周转率或毛利率,力争升级为A类商品 [15] - 精简SKU需遵循“品类完整性”原则,例如醋品类最精简配置可用6支SKU覆盖不同品牌、价格带、规格与口味以满足核心需求,再根据促销节奏增补2-3款促销品,整体控制在10款SKU以内即可满足90%以上消费者需求 [16] 动态优化:保持商品结构活力 - 商品“做减法”非一劳永逸,需根据市场需求与消费习惯变化进行动态调整 [17] - 企业应建立定期品类评审机制,建议每季度开展全面SKU复盘,结合交叉比率数据、销售数据、消费者反馈、市场趋势等因素优化商品结构 [18] - 需持续淘汰交叉比率下滑的滞销品,并积极引入市场潜力新品,通过试销、调研评估其交叉比率与市场接受度,对表现优秀的新品及时扩大陈列与库存 [18] - 需结合季节变化、节日促销等场景灵活调整促销品与应季商品的SKU配置以保持货架新鲜度与吸引力 [18] - 需关注“宽类窄品”逻辑:在保持品类宽度覆盖的同时精简每个品类的SKU数量,但对于交叉比率极低、无法创造价值的品类,即便属于“宽类”也应坚决淘汰 [18] 行业启示:回归效率竞争 - 在增长停滞、存量竞争的时代,零售行业竞争本质已回归效率竞争,企业需放弃“规模越大越好”、“商品越多越好”的粗放式思维 [19] - 企业应以“奥卡姆剃刀原理”(如无必要,勿增实体)为指引,理性审视自身的门店、组织与商品,果断砍掉冗余低效部分以聚焦核心价值 [19] - 当企业摆脱沉重包袱,实现组织精简、商品精准、运营高效后,才能在行业剧烈变革中提高效率并摆脱困境 [19]
直播电商食品安全新规即将落地,平台、主播与服务机构责任被系统压实
36氪· 2025-12-24 06:49
从具体内容看,新规首先明确了直播电商平台经营者的食品安全管理责任。平台需在商家审查登记、直 播营销人员培训、食品安全风险自查与管控、违法行为处置等方面履行管理义务。 其中,直播间运营者主体资质、直播经营的食品情况以及直播行为是否合法合规,被明确纳入食品安全 风险管控清单,作为重点监管内容,并要求平台建立"智能监测、排查调度、快速处置"等工作机制,压 实平台责任,防止风险管控流于形式。 在央视与市场监管总局连续披露私域直播虚假宣传、食品安全违法案例后,针对直播电商食品安全的专 门监管规则即将正式落地。 昨天上午,市场监管总局在食品安全专题新闻发布会上明确,《直播电商经营者落实食品安全主体责任 监督管理规定》相关工作程序已基本完成,将于近期发布实施。 新规将围绕直播电商平台、直播间运营者、直播营销人员及其服务机构,系统明确食品安全责任边界, 并配套相应法律责任。 这一表态,也被视为对近期私域直播食品安全问题集中曝光后的制度性回应。此前,央视及市场监管总 局已多次指出,私域直播本质仍属于电子商务活动,应适用与线上、线下一致的监管标准,食品安全、 虚假宣传等红线不因"私域"而例外。 在责任划分之外,新规不仅细化了不得 ...
进击的2025:阿里京东们的“买楼造楼运动”
36氪· 2025-12-24 06:49
2025年,互联网公司成了房地产的大买家。 2025年,中国互联网大厂活力再现。投身外卖大战的是他们,all in AI大潮的是他们,在低迷的房地产市场豪气出手的还有他们。 尽管房地产市场依然低迷,但互联网公司却很活跃,而且出手阔绰,动不动投资几十亿甚至上百亿,他们不是在买楼,就是在买地造楼。 这些"买楼、造楼"运动,首先是出于满足自身业务发展的需要,但又不只是满足发展需要,它背后承载着太多的诉求与期待。 互联网公司继续买买买 中国互联网公司似乎普遍热衷买房置地,从搜狐、新浪、网易,到BAT再到字节、美团、小米、B站、快手,无一例外均有涉及。 2025年,互联网公司继续在房地产市场买买买。 10月份,阿里巴巴集团与蚂蚁集团共同出资72亿港元(相当于9.25亿美元),在香港下铜锣湾港岛壹号中心共13层商业写字楼。该交易创下2021年以来香 港最大宗写字楼成交。 12月份,京东宣布斥资约34.73亿港元,购入香港中环的中国建设银行大厦部分办公楼层,面积约11202平方米(含公区摊销面积)。 近年香港房地产市场低迷,2024年甲级写字楼大额交易总交易额为410 亿港元。2025年市场有所回暖,甲级写字楼全年大额交易 ...
4张图看懂:为什么2025年是中国出海的「分水岭」?丨36氪年度透视⑤
36氪· 2025-12-24 06:43
文章核心观点 - 2025年是中国企业出海的分水岭,行业从单点卖货转向更系统的能力输出,包括供应链、组织效率、履约体系、文化叙事及商业规则的重塑 [2][10] 拼速度:平台全球化进程加速 - 以Temu、AliExpress为代表的中国电商平台,仅用2-3年时间便进入全球访问量前列,其速度远超亚马逊过去三十多年的全球化布局 [3] - 这种速度差异不仅源于补贴,更在于供应链密度、组织效率和履约体系的整体压缩能力 [3] - 根据全球访问量数据,AliExpress在2025年以6.46的数值位列前列,超过了eBay(6.35)、亚马逊日本站(5.25)、沃尔玛(5.06)等国际平台 [5] 卖情绪:商品价值叙事升级 - 以潮玩品牌Labubu在海外走红为例,中国商品开始突破传统的“性价比”叙事,进入情绪、审美与身份表达层面 [5] - 出海商品的价值主张从回答“好不好用”升级为“值不值得被认同” [5] - 在TikTok上,与Labubu相关的开箱话题StylingMyBagwithLabubu产生了超过110万篇内容,显示出强大的情绪驱动力 [6] - 相应的商业结果显著,2025年第一季度相关消费同比大幅增长475%,中国收益同比增幅达95%至100% [6] 抢入口:影响全球消费流量与路径 - 中国电商平台正从供应链后端走向全球消费流量前台,开始影响用户的注意力分配和购物路径,而不仅仅是完成交易 [7] 改规则:重塑全球商业基础设施与节奏 - 中国企业通过将“双十一”等购物节推向海外,并建设高效的海外履约网络,正在参与重塑全球商业时间表 [10] - 海外仓与本地履约体系极大地抹平了“跨境感”,例如24小时上网率达到45.16%,24小时发货资率达到51.61% [12] - 以京东物流(覆盖23国)和菜鸟(覆盖18国)为代表的企业,正在构建高效的跨境物流网络 [12] - 2024年海外仓市场底盘已达2140亿元人民币,同比增长23% [12]
四大城市群,疯狂建机场!
36氪· 2025-12-24 06:26
国家战略与建设浪潮 - 民航局力争到2050年建成一批世界一流的航空企业和航空枢纽,支撑交通强国建设 [1] - 新一轮机场建设潮已经到来,粤港澳、长三角、京津冀、成渝四大顶级城市群动作频频,朝着世界级超级航空枢纽迈进 [3] 粤港澳城市群建设进展 - 深圳宝安国际机场第三条跑道启用,未来可满足年旅客吞吐量8000万人次的需求 [4] - 香港国际机场二号客运楼首阶段启用,投资约129亿港元进行扩建 [4] - 广州白云国际机场T3航站楼与第五跑道投运,成为中国民航首个拥有5条商用跑道的机场 [4] - 去年阳江机场获批 [4] 长三角城市群建设进展 - 嘉兴南湖机场计划于2025年12月26日正式通航,首批开通5条客运航线 [5] - 随着嘉兴南湖机场即将通航,环苏州机场群已然成形 [5] 京津冀城市群建设进展 - 大兴机场正加快推动卫星厅及配套工程建设,建成后将增加2700万人次旅客吞吐量保障能力,届时机场将满足年旅客吞吐量7200万人次的使用需求 [7] - 根据2017年发布的《推进京津冀民航协同发展实施意见》,明确到2030年基本实现京津冀地区主要机场与轨道交通等有效衔接,打造世界级机场群 [7] - 预计到2035年,京津冀“三地四场”将拥有12条跑道、11座航站楼,旅客保障能力将超过3亿人次 [7] 成渝城市群建设进展 - 重庆第二机场已经获批,重庆江北国际机场T3B航站楼启用,形成“3座航站楼+1座卫星厅+4条跑道”格局,达到年旅客吞吐量8000万人次、货邮吞吐量120万吨的运行保障能力 [8] - 成都天府国际机场二期扩建工程已启动前期准备,计划在“十五五”期间(2026-2030年)开建,旨在将年旅客吞吐量提升至1.15亿人次以上,并新增两条跑道及两座航站楼 [8] - 去年5月,重庆都市圈成员的广安获批建设广安机场 [8] 机场密度与建设需求分析 - 广东21个城市中只有9个拥有民用机场,江苏13个城市拥有9个机场,浙江11个城市拥有7个民用机场 [9] - 在经济强省中,只有广东的机场数量不及城市数量的一半 [10] - 2023年末全国共有259座民用运输机场,广东机场数量与江苏并列第九 [10] - 广东1.27亿人口拥有9个机场,平均每1000万人拥有0.7座机场,密度全国倒数第二 [12] - 京津冀中的天津、河北、北京机场密度分别位居全国倒数第三、倒数第五、倒数第六 [13] - 西藏365万人拥有8座机场,平均每千万人拥有21.9座机场,密度全国第一 [13] - 粤港澳、京津冀最需要大规模建设民用运输机场 [13] - 苏州作为GDP超两万亿、常住人口超千万的城市,目前没有大型民用运输机场 [13] 航空枢纽格局与定位 - 官方定位中,航空第一梯队为北京、上海、广州;第二梯队为成都、深圳、重庆、昆明、西安、乌鲁木齐、哈尔滨;第三梯队包括大连、南京、杭州等城市 [14] - 2024年长三角城市圈航空旅客吞吐量合计2.88亿人次,位居各大城市群首位,其流量规模相当于京津冀与成渝之和 [16] - 粤港澳去年航空旅客吞吐量为2.14亿人次,位居第二 [16] - 单个机场运输能力最强的是上海浦东国际机场,其次是广州白云国际机场、北京首都国际机场、深圳宝安国际机场、成都天府国际机场 [18] - 以城市角度看,航空运输实力最强的三个城市是拥有三个大型民用运输机场的上海、北京、成都,其次是广州、深圳 [21] 双机场城市发展与规划 - 目前国内拥有双大型民用运输机场(4E级别以上)的城市有四个:北京、上海、成都、台北 [25] - 未来即将拥有双大型国际民用运输机场的城市有三个:南京、广州和重庆 [25] - 南京宣布将正式步入“双机场”时代,禄口国际机场将启动三期工程,六合马鞍机场的民用功能将适时启用 [26] - 南京马鞍国际机场为4E级军民两用机场,民用功能启用后,南京将成为第五个拥有双大型民用运输机场的城市 [29] - 广州的第二机场(珠三角枢纽(广州)新机场)已于2022年开工建设,预计2027年投入使用 [29] - 重庆第二机场(重庆璧山机场)预计将在“十五五”初期开工建设,力争2030年建成投用 [29]
下雪了,去沈阳搓澡
36氪· 2025-12-24 06:20
「人体表皮污垢学」,是网友们给这个学科取的新名字。 不会太高深,又带着点学院派的味道。最近两天,沈阳下雪了。 在这个适合搓澡下泥的冬季。东北的澡堂子里,一群行走的白花花肉体,经过一轮全方位下泥洗礼的同时。 澡堂子外,关于沈阳成立专门洗浴学院的事儿,又热闹起来。 新闻虽是三个月前的——为打造沈阳成为"中国沐浴休闲之都",全国首个专注于沐浴休闲与健康管理领域的高技能人才培养平台,正式落地沈阳。 当时就有人展望未来。搓澡届,也能搓出个教授了。 还有人提议,让乔杉做院长。 但调侃至今,说到底,论搓澡仍是「全国洗浴看东北,东北洗浴看沈阳」。沈阳,还是太权威了。 今年冬天的东北澡堂子里,还没有学院派的师傅登场。 我们的同事Sinta拿着号码牌,在期待和忐忑中,开始了人生中的第一搓。管它什么学院不学院的。论下泥的高级手法,还得是姐/姨的那套过硬功夫,一 气呵成。 回来后,她给我们分享了南方小土豆,首次勇闯沈阳澡堂的全过程。其实心得就两个。抱着「重生」的心态,走进去。先拥抱赤裸裸的自己,再亲吻光溜 溜的手臂。便能收获身体与灵魂,在这人世间最轻盈和香滑的一刻。 是的,在这个寒冷刺骨的冬季。去一趟沈阳澡堂子,你会重新爱上老己的。 ...