大模型

搜索文档
港股异动 | 方舟健客(06086)涨超8% 杏石医疗大模型登上Nature新闻版面 公司AI慢病管理模式出圈海外
智通财经网· 2025-09-26 03:17
股价表现 - 方舟健客股价上涨8.23%至4.34港元 成交额达4077.62万港元 [1] 行业动态与公司技术突破 - Nature报道认可中国AI慢病管理模式为全球少数深度融合多种慢性疾病管理的成功案例 [1] - 海外市场缺乏AI与多种慢病管理深度融合的大型企业 中国市场创新力量有望实现弯道超车 [1] - 公司杏石大模型于今年9月正式落地 获得医疗领域关注并首次登上Nature报道 [1] 杏石大模型应用场景 - 大模型驱动AI用药助手、AI健康管家、AI医生助手、AI学术助手和AI搜索五大应用 [2] - AI学术助手支持语音交互与秒级语音播报 提升临床医生诊疗效率与工具黏性 [2] - 应用覆盖用药指导、患者教育、诊断辅助及医学文献查询等临床与患者端场景 [2]
阿里计划追加AI基础设施投入,产业链有望受益
金融界· 2025-09-26 03:00
阿里集团董事兼首席执行官吴泳铭9月24日在2025云栖大会上表示,大模型是下一代操作系统,而AI云 是下一代计算机,也许未来全世界只会有五六个超级云计算平台。 目前阿里正积极推进3800亿元的AI基础设施建设,并计划追加更大的投入。为了迎接ASI时代的到来, 对比2022年这个生成式人工智能的元年,到2032年阿里云全球数据中心的能耗规模将提升10倍。这意味 着阿里云算力投入将指数级提升。 研究机构认为,北美云厂商上调资本性支出预期,业绩增长超市场预期,AI基建投入持续。统计数据 显示,谷歌、微软、Meta和亚马逊四家公司,预计今年将在数据中心等AI基建上投入超3500亿美元, 2026年将超过4000亿美元。国内方面,后续伴随着DeepSeek以及Agent、多模态方面相关进展,AI行业 景气度持续,国产服务器、交换机、液冷等环节值得重视。 免责声明:以上内容为本网站转自其他媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦 不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布,可与本网联 系,本网视情况可立即将其撤除。 素材源:吕怡蕾 编辑:康书源 审核:王怡然 ...
全新梅赛德斯-奔驰纯电CLA开启预售
齐鲁晚报· 2025-09-26 02:19
限时下订,丰富好礼 梅赛德斯-奔驰为豪华纯电客户,提供丰富的预售限时好礼。客户在上市日(含)18:00前下订,支付3000元订金,即可享超4倍超值膨胀,总价值超13000 元,可选好礼涵盖梅赛德斯-奔驰进口精品周末旅行套装、Burmester®️3D环绕立体声音响系统及超值充电权益。此外,客户还可额外再享城区及高速领航辅 助驾驶权益包,可用于智能辅助驾驶产品购买。为庆祝全新纯电CLA预售正式开启,梅赛德斯-奔驰更为预售期间下单的奔驰老客户及指定品牌电车客户额 外赠送专属影音畅享包,让客户能在车内,在超大屏和柏林之声双重加持下,充分感受全新纯电CLA为其呈献的视听盛宴。 齐鲁晚报·齐鲁壹点 陈颖 9月25日,全新梅赛德斯-奔驰纯电CLA开启预售,上市时率先提供纯电CLA 300L超长续航版、纯电CLA 300L超长续航领智版,预售价格分别为人民币 259,000元和299,000元。客户在上市日(含)18:00前下订,还可享受多重好礼,订金膨胀超4倍,总价值超13000元。 全新纯电CLA是安全标杆,在诸多方面严守奔驰标准,满足客户对于一辆奔驰好车的期待;作为史上最智能的梅赛德斯-奔驰,其搭载AI赋能的智能座舱 ...
超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙
量子位· 2025-09-26 02:08
公司数据资源 - 拥有超过10万亿tokens的通用大模型语料数据及覆盖14个关键行业的专业数据集 总存储量达350TB [1] - 数据经过精心标注和优化 包含多模态内容 可直接用于行业应用 [3] - 高质量数据集通过采集 加工等处理流程 能直接用于AI模型开发训练 提升模型性能 [4] 技术平台架构 - 星辰MaaS平台作为核心 构建"数据-模型-服务"完整闭环 包含四大核心组件 [7] - 数据工具链覆盖"采-存-算-管"链路 支持文本 图片 音视频等多类型数据统一接入与处理 [18] - 模型工具链覆盖"标-训-推-评"链路 支持40多种标注任务 通过AI预标注使效率提升5倍以上 [18] - 智能体作为执行中枢 灵活调度资源并自主完成复杂任务 实现决策智能化与行为自动化 [7] 模型体系与能力 - 建立"三全"星辰大模型体系:全模态 全尺寸 全国产 [8] - 成功研发万亿参数大模型 采用全国产万卡集群和国产深度学习框架训练 [9] - 语音大模型精准识别60种方言 语义大模型参数规模庞大 视觉模型鉴伪技术达国际领先水平 [39] - 完成中央网信办"境内深度合成服务算法备案"和"生成式人工智能服务"双备案 [39] 行业应用案例 - 在纺织行业实现AI验布 瑕疵检测准确率从50%提升至95%以上 生产效率提升50% [9] - 服务物流集团 纳管超500P国产化算力卡 构建多个物流行业高质量数据集 [29] - 在医疗领域与北京三甲医院合作构建医疗质量管理数据集 推动医院运行管理智能化升级 [36] - 在农业领域为雄安新区打造"雄小农"应用 帮助当地农民实现超过15%的增收 [37] - 在政务服务领域基于1200万条工单记录建成520万条高质量语料 支撑25个智能应用场景 [38] 生态建设与产业赋能 - 支撑成都 沈阳等多个国家级数据标注基地建设 扮演产业生态规划者 产能运营者和新职业培育者角色 [34] - 在成都联合打造"蓉数公园・新津数据要素服务站" 引入数十家标注企业及教研机构 [34] - 建立培训认证体系 规模化培养数据标注师 AI训练师等数字化人才 [35] - 形成"政府引导+央企主导+生态协同"可复制模式 构建完整生态链 [35] 战略定位与发展愿景 - 基于国家战略 市场需求 运营商优势禀赋和使命责任四个层面重仓投入数据基础设施建设 [14] - 承载成为国家战略科技力量和领先的通用人工智能服务提供商的愿景 [42] - 持续发力技术领先 应用普惠 生态开放和人才培养四大方向 [43] - 日增数据量达1.6PB 基础数据集超10万亿tokens 服务超10亿公众客户和上千万政企客户 [16]
有一定深度学习基础,该如何入门自动驾驶?
自动驾驶之心· 2025-09-25 23:33
欢迎添加小助理咨询活动详情! 平台课程八折优惠券 超级折扣卡!课程享受七折优惠 自动驾驶的技术栈更新实在是太快了!三年前还是BEV,两年前是无图,一年期是端到端,今年是VLA和世界模型,下一步是什么呢?现在入行怎么才 能保证毕业不会被淘汰? 其实没什么捷径,只有持续不断的更新自己的认知,这条最困难但却是最正确的路。 所以我们平台搭建了自动驾驶、具身智能和大模型三个平台,在变化中不断摸索前行的道路并反过来提升自己。别盼着稳定,要在变化里找新机会。 我们也在尽自己最大的力量推动行业的进步,如果你也想和我们一起前行,欢迎关注我们国庆节&中秋节的活动!喜逢国庆和中秋节节日,我们推出了今 年最大的优惠活动给大家,欢迎微信咨询小助理。 这一个月柱哥收到了很多的咨询,最具代表性的是:有一些深度学习的基础,怎么才能高效入门自动驾驶? 星球优惠!新人七折续费五折 星球核心内容一览! 自动驾驶之心 知识星球 技 最前沿的 自驾技术社区 术 f 7 P 7 5 r 6 自动驾驶VLA 世界模型 闭环仿真 扩散模型 BEV感知 --- 近40+学习路线 保持活力,持续学习 交 学术界&工业界 大佬面对面交流 4 r r VLA和WA ...
从现有主流 RL 库来聊聊RL Infra架构演进
自动驾驶之心· 2025-09-25 23:33
强化学习在大模型发展中的核心作用 - 强化学习已从辅助技术跃升为驱动大模型能力跃迁的核心动力 正经历从单轮静态任务向多轮交互式智能体训练的关键范式转移 目标是构建能在复杂动态环境中通过多步观察思考行动与反馈完成任务的智能体 这是通往AGI的关键一步[2] - 强化学习正在重塑大模型能力边界 不仅是弥补数据瓶颈的利器 更是构建下一代通用智能体的核心方法论 背后依赖日益成熟的RL基础设施生态[2] 现代RL基础设施架构范式 - 核心架构围绕Generator和Trainer两大组件 Generator负责让LLM与环境交互生成轨迹并计算奖励 计算开销大 设计灵活性和环境抽象能力至关重要 Trainer负责根据轨迹数据使用PPO和GRPO等算法更新模型参数 性能取决于分布式训练后端如FSDP DeepSpeed Megatron[6] - 生成器-训练器架构配合Ray等分布式协调层构成大模型强化学习系统的黄金标准 RL训练计算成本极高 涉及大规模并行推理和参数更新 优秀RL库需高效稳定可扩展地协调这两个阶段[6] Primary Development框架 - TRL是Hugging Face官方推出的最开箱即用的RL框架 更像训练器集合而非复杂分布式系统 算法支持包括SFT PPO DPO GRPO IPO KTO Online DPO REINFORCE++等 集成transformers库 支持vLLM加速Rollout 训练后端依赖accelerate库 支持DDP DeepSpeed ZeRO FSDP API简洁文档丰富 适合快速原型和中小规模实验 但不支持环境交互 生成与训练耦合紧[9][10][14] - OpenRLHF由OpenLLMAI 字节 网易等联合开发 旨在提供高效可扩展的RLHF和Agentic RL框架 训练后端基于DeepSpeed ZeRO-3和Auto Tensor Parallelism 代码结构清晰 是许多二次开发框架的基础[11][15] - veRL由字节Seed团队开发 是功能最全面算法支持最广泛的框架之一 算法支持包括PPO GRPO GSPO ReMax REINFORCE++ RLOO PRIME DAPO DrGRPO等 架构采用HybridFlow控制器 支持多轮训练和工具调用 目前生成与训练耦合 后续规划异步解耦 集成vLLM和SGLang等推理后端 训练后端支持FSDP/FSDP2和Megatron-LM 奖励支持模型奖励和函数规则奖励如数学代码 追求全能 涵盖所有主流RL算法和应用场景 是前沿算法研究和复杂任务如多模态多智能体实验的理想选择 配置较复杂[16][22] - AReaL由蚂蚁开源 专为大规模高吞吐推理模型RL设计 核心是完全异步架构 算法支持包括PPO GRPO REINFORCE++ RLOO DPO IPO KTO等 架构支持异步Pipeline RLHF和异步Agentic RL模式 后者通过Agent类API支持多轮对话 深度集成vLLM用于高吞吐Rollout 核心创新是完全异步设计 通过可中断Rollout Worker经验回放缓冲区和并行奖励服务将生成与训练彻底解耦 使用SGLang进行Rollout Ray进行集群管理 训练后端主要使用PyTorch FSDP 也支持Megatron 为追求极致训练效率和可扩展性而生 其轻量版AReaL-lite提供更易用API[20][21][28] - NeMo-RL是NVIDIA官方推出的面向生产的RL框架 集成在NeMo生态系统中 与NVIDIA硬件GPU和软件栈CUDA TensorRT深度集成 提供从RM训练到PPO的端到端Pipeline 设计优雅接口定义清晰 性能和扩展性兼顾[24][29] - ROLL是阿里开源专注于大规模LLM RL的框架 强调异步和Agentic能力 算法支持集成了GRPO PPO REINFORCE++ TOPR RAFT++ GSPO等多种先进RL算法 架构采用基于Ray的多角色分布式设计 将策略生成价值评估奖励计算等任务解耦到独立Worker角色中 实现灵活资源调度异步训练和复杂任务编排 深度集成SGLang和vLLM作为高性能推理后端加速策略生成Rollout 训练后端主要基于DeepSpeed ZeRO和Megatron-LM 5D并行 未来支持FSDP2 奖励通过模块化奖励工作者RewardWorker处理奖励计算 支持验证器沙盒LLM-as-judge等多种奖励源 构建灵活奖励路由机制 面向多样化用户 高度可配置接口丰富[30][36] - slime由清华智谱开源 是轻量级专注于将SGLang与Megatron无缝连接的框架 架构强调可扩展性和生产级编排 支持异步Rollout非Colocate放置等 训练后端支持Megatron-Core和DTensor FSDP2 集成支持使用TensorRT-LLM和vLLM进行rollout 通过自定义数据生成接口和服务端引擎实现任意训练数据生成流程 支持异步训练和Agentic工作流 追求极简主义与高性能[34][35][40] Secondary Development框架 - Agentic RL智能体强化学习框架包括verl-agent基于veRL构建 专门为Agentic RL优化 支持异步Rollout和训练 以及agent-lightning实现训练与推理解耦 更容易支持多智能体训练 关键技术包括异步生成经验回放环境接口标准化[46][47][49][50][52] - Multimodal RL多模态强化学习框架包括VLM-R1和EasyR1基于veRL开发 用于训练视觉语言推理模型 以及DanceGRPO专门用于扩散模型如文生图的RL训练 关键技术包括多模态数据加载器跨模态奖励设计如CLIP分数针对扩散模型的特殊采样策略ODE/SDE转换[54][55][57][58] - Multi-Agent RL多智能体强化学习框架包括MARTI由清华C3I提出的首个高性能开源LLM多智能体强化训练与推理框架 通过统一框架整合多智能体推理与强化学习 结合高性能引擎与灵活架构 为复杂协作任务提供高效可扩展解决方案 兼容单智能体RL框架如OpenRLHF veRL 支持vLLM 以及Agent-Lightning其解耦设计便于扩展到多智能体场景 关键技术包括集中训练分散执行CTDE基于自然语言的信用分配如LLaMAC多智能体策略优化如MAGRPO[60][62][63] RL基础设施发展趋势 - 标准化与模块化 RL基础设施正从手工作坊走向标准化流水线 框架设计越来越模块化 将Rollout Reward Train等环节解耦 便于复用和扩展 库不再绑定单一推理后端 支持vLLM SGLang等[65] - 异步化成为大规模RL必备特性 为应对Rollout和Train之间巨大计算不对称性 异步架构如AReaL OpenRLHF slime等已成为关键[65] - 推理引擎至关重要 vLLM和SGLang等高性能推理引擎的出现极大加速了Rollout过程 成为现代RL框架标配[66] - 从RLHF向Agentic RL演进 早期库如TRL主要为单步任务设计 新一代库内置强大环境抽象以支持复杂多步交互[66] - 分布式训练框架选择 Megatron-LM在超大规模模型训练中性能最佳 FSDP/FSDP2因与PyTorch集成好广受欢迎 DeepSpeed在内存优化上表现出色 成熟库通常支持多种方案[66] - 场景驱动的二次开发 通用框架如veRL OpenRLHF为生态奠定基础 针对特定场景如多模态多智能体GUI的二次开发框架解决垂直领域独特挑战[66] - Orchestrator重要性由于RL涉及多个分布式组件如训练框架推理框架环境 使用Ray等进行任务编排资源管理和容错已成为行业共识[66]
大模型下沉的N个可能
北京商报· 2025-09-25 16:53
技术从论文走向现实,不是动动手指那般简单,但有不少想象空间。9月25日,北京商报记者在云栖会 场内外,听到了珊瑚保护从业者与大模型交叉的故事以及助盲眼镜创业者讲述的AI改变生活的实例。 "云RTC(即时通讯)技术能满足实时避障的低延迟需求,我们的AI眼镜可以在300毫秒内识别障 碍。"杭州瞳行科技市场总监陈刚透露,公司的眼镜同时还整合了通义千问VL(视觉语言模型)、OCR (光学字符识别)模型。大模型可以打破学科壁垒,土木工程专业的个人开发者张子豪靠大模型一个人 就能完成具身智能复杂系统开发。 根据国际权威市场调研机构Omdia发布的《中国企业GenAI(生成式AI)采用格局,2025H1》报告,超 七成的《财富》中国500强企业已采用GenAI。当大模型与产业需求碰撞,抽象的算法正变为触手可及 的生产力工具,在田间地头、深海暗礁、城市角落书写技术普惠的新可能。 智能眼镜:300毫秒内识别 过去十年,他和团队走遍南海300多座岛礁,积累了20多T水下影像资料和100万张照片。"这么多照片 靠人分析是不可能的,传统方法分析100个样方,经验丰富的专家要花18.6小时,还容易出现误差。"杨 红强说依靠AI是自己的 ...
云栖观察|大模型下沉的N个可能
北京商报· 2025-09-25 15:10
据国际权威市场调研机构Omdia发布的《中国企业GenAI(生成式AI)采用格局,2025H1》报告,超七成的《财富》中国500强企业已采用GenAI。当大模型 与产业需求碰撞,抽象的算法正变为触手可及的生产力工具,在田间地头、深海暗礁、城市角落书写技术普惠的新可能。 Cast the first CH ADS The I long AGA ACT 2008 an The State of the d 11, 2017 t and the 113 t and the 11:57 C STANDAY the state an el Child the proble the 18 1 t 2 g Ch 0 th 16 the HD CAN /+ 14 12 3 t 20 61 77 20 the state the in 最高 the first The Car the state 20 the state nt th 100 TO BE THE the 2012 3 Bang the state CD 100 the t 2 Bir De r and 112 87 20 re Children t and th ...
共筑产业高地 2025云栖大会人工智能大模型产业投资推介对接会成功举办
全景网· 2025-09-25 14:43
西湖区作为浙江"双核"所在地和杭州城西科创大走廊的创新策源"东首",是全省人工智能产业集群核心区。区内人工智能、大数据等产业的深厚积淀,既 有"算力-算法-数据"的全链条资源支撑,更有将创新成果转化为产业动能的成熟生态,足以在这场产业变革中抢占先机、主动作为。 西湖区作为杭州人工智能产业发展的核心承载区,以省级特色产业集群(人工智能核心区)、省未来产业(人工智能)先导区财政激励为引擎,聚焦AI、云计 算、商业航天等新赛道,在大模型开发训练及推广应用等方面在全省具有领先优势。 西湖区商务局党委副书记、副局长李胜英在致辞中表示,作为数字经济第一区,西湖区入选全省人工智能产业集群核心区,大模型开发应用优势突出。截至 2024年,全区规上人工智能核心企业近100家,占全省五分之一、全市四分之一,形成以云计算、大数据、区块链等为核心的产业集群。在大模型开发训练 及推广应用方面,西湖区走在全省前列,7个大模型通过中央网信办备案,在"AI+制造""AI+医疗""AI+航天"等领域多点开花,构建起繁荣多元的人工智能 产业生态。西湖区诚挚欢迎更多大模型领域的专家、团队和企业来到西湖区,共同打造具有全国影响力的大模型创新高地与产 ...
京东CEO许冉宣布三年投入万亿 这款新品“会发光”
第一财经· 2025-09-25 13:30
京东AI战略与产品发布 - 公司宣布未来三年持续投入带动万亿规模人工智能生态建设 [2] - CEO刘强东亲自担任集团探索研究院院长职务 [2] - 发布全新大模型品牌JoyAI及三大AI产品:京犀、他她它、JoyInside附身智能 [2] 零售场景技术创新 - 推出电商创新AI架构体系Oxygen 融合快慢思考决策模式 [2] - 10月将上线智能搜索推荐功能"爱购" 支持自然语言交互 [2] - 双11期间将实现"无限导购"场景覆盖 通过话题功能聚合内容与商品 [3][4] 技术效能与成本优化 - Oxygen-9N-xLLM大模型推理引擎实现5倍效率提升和90%成本优化 [4] - 数字人平台升级至4.0版本 推出行业首个品牌代言数字人 [4] - 数字人生产成本从数万元降至两位数 较真人模式成本降幅超90% [5] 数字人应用场景拓展 - 数字人成本仅为真人主播十分之一 超80%真人主播带货效果 [4] - 应用于直播/客服/文旅/品牌代言/赛事解说/名人分身等多场景 [4] - 与山西大同文旅合作花木兰数字人 推出明星数字人分身辅助流量变现 [4] 技术开源与生态建设 - 持续将Oxygen体系技术开源 推动行业技术共享 [4] - 大模型显著降低数字人制作门槛 从半小时视频素材缩减至单张照片生成 [5] - 通过智能体与大模型结合实现购物知识快速转化为导购内容 [4]