联邦学习
搜索文档
港理工成立人工智能高等研究院 聚焦去中心化AI与成果转化
21世纪经济报道· 2025-12-10 12:07
(原标题:港理工成立人工智能高等研究院 聚焦去中心化AI与成果转化) 南方财经 21世纪经济报道记者 张伟泽 实习生 金颖 张艺宁 香港报道 12月10日,香港理工大学人工智能高等研究院(PAAI)正式成立。香港理工大学校长滕锦光在成立仪 式上表示,该研究院是理大未来重点布局的五大高等研究院之一,致力于开展跨学科基础研究并推动成 果转化。研究院将充分发挥理大在内地的科研网络优势,着力将前沿科研成果转化为现实的产品、技术 与标准,服务社会发展。 针对人工智能发展中存在的"数据孤岛"与"隐私安全"核心挑战,PAAI创院院长杨强指出,未来AI发展 的方向不应是依赖单一的巨型模型,而是构建连接的"垂直领域专家模型"。"联邦学习"(Federated Learning)应运而生,这是一种安全、去中心化的人工智能开发方式,能够在不交换原始数据的前提下 有效打破医疗与金融领域的数据流通壁垒及破解隐私保护难题。 杨强认为,作为国际金融中心与科创中心,香港背靠粤港澳大湾区丰富的临床网络与产业需求,未来将 着力构建去中心化AI基础设施,推动各类机构在安全可控的前提下运用先进AI技术。 对于AI领域未来的挑战,杨强表示,PAAI ...
微软系 40 大 AI 科学家,为何钟情雷峰网的 GAIR 大会?
雷峰网· 2025-11-27 10:05
GAIR大会与微软系科学家的历史渊源 - 1998年张亚勤与李开复联合创办微软中国研究院,被称为中国人工智能的黄埔军校[5] - 2016年首届GAIR大会在深圳举办,由CCF和雷峰网主办,旨在促进学术界、产业界、投资界融合[7][8] - 七年来GAIR已成为微软系科学家的AI第二故乡,累计有40多名来自微软全球各地的科学家参与[9] 历届GAIR大会的重要里程碑 - 2018年第三届GAIR上微软系马毅、孙剑探讨深度学习的痼疾[9] - 2019年第四届GAIR上张正友、周明分别作为CVPR、ACL大会主席探讨人工智能多学科大一统[9] - 2020年第五届GAIR设立纪念Thomas Huang专场,沈向洋、颜水成、田奇等参与追忆[9] - 2023年第七届GAIR成为国内首个走向海外的AI产学融合顶会,黄学东院士离开微软后首秀[9] - 2025年12月将举办第八届GAIR全球人工智能与机器人大会[10] 微软系顶尖科学家的职业发展轨迹 - 沈向洋从微软全球执行副总裁转任IDEA理事长、香港科技大学校董会主席[14] - 黄学东从微软云与人工智能部首席AI技术官加入Zoom担任CTO[17] - 张宏江从微软亚太研发集团CTO转任北京智源人工智能研究院理事长[20] - 周明从微软亚洲研究院副院长孵化出澜舟科技,推出轻量化模型"孟子"[36] - 马维英从微软亚洲研究院常务副院长加入字节跳动,后转入张亚勤清华AIR团队[40] - 何晓冬从微软雷德蒙德研究院负责人转任京东集团高级副总裁、大模型负责人[46] 科学家在GAIR大会的技术分享重点 - 杨强在2016、2019、2020年分别分享人工智能成功条件、联邦学习发展及应用[22][23] - 孙剑在2017-2019年连续三届分享Face++研发方向、云端芯视觉计算、深度学习变革[50] - 颜水成在2017、2020年探讨深度学习精度极限与用户体验、芯片能与新基建[56] - 梅涛在2017-2021年分享视频内容生命周期、智能供应链机器视觉、感知到认知计算[60] - 郑宇在2019年演讲用大数据和AI打造智能城市[58] 科学家在产业界的技术影响力 - 张正友现任腾讯首席科学家,曾在GAIR分享计算机视觉三生三世[32] - 芮勇现任联想集团CTO,曾在GAIR分享计算机视觉从感知到认知的长征[34] - 赵峰现任清华大学AIR首席科学家,曾在GAIR分享IoT+AI赋能智慧家庭[42] - 华先胜曾任阿里巴巴副总裁,现任特斯联CTO,专注城市大脑视觉智能[54] - 余凯从百度研究院副院长创办地平线,在GAIR分享中国AI真实现状[72]
AAAI 2026 Oral | 悉尼科技大学联合港理工打破「一刀切」,联邦推荐如何实现「千人千面」的图文融合?
机器之心· 2025-11-25 04:09
行业痛点与现有挑战 - 推荐系统利用图像和文本等多模态信息辅助决策已成为标配,但该需求与要求“数据不出本地”的联邦学习范式结合时情况变得复杂[2] - 现有联邦推荐方法面临两难:为保护隐私而放弃繁重多模态处理仅使用ID特征,或采用“一刀切”的粗暴融合策略假设所有用户图文偏好一致[2] - 用户对图文信息的“融合偏好”具有极大异质性,例如购买服装更依赖视觉冲击,挑选数码产品则更关注参数文本,这种差异在联邦环境下极难捕捉[2] - 联邦学习中存在“信息不对称”问题,服务器看不见用户行为数据,无法得知个体用户对图片或文字的偏好程度[5] - 端侧设备算力有限,难以运行庞大的视觉-语言模型(如CLIP),构成计算瓶颈[5] 核心技术框架:FedVLR - FedVLR核心洞见在于重构多模态融合决策流,将重计算的特征预处理留给服务器,而将决定“怎么看”的融合决策权通过轻量级路由机制下放给用户端侧[3] - 该框架创新性地提出双层融合机制,巧妙解耦特征提取与偏好融合[8] - 第一层为服务器端的“多视图预融合”,利用强大预训练模型将物品图像、文本和ID信息通过多种预设融合算子加工成一组“候选融合视图集”,解决算力焦虑[9] - 第二层为客户端的“个性化精炼”,引入极轻量的本地混合专家模块,利用本地私有交互历史动态计算个性化权重,实现千人千面[11] - 融合过程完全在本地发生,确保用户偏好数据从未离开设备,严格遵循隐私保护原则[12] 技术优势与工程价值 - FedVLR被设计为可插拔的通用增强方案,具有极高工程落地价值[15] - 具备模型无关性,可无缝挂载到FedAvg、FedNCF等任何主流基于ID的联邦推荐框架上[16] - 实现零通信增量,通信过程中传输的依然是梯度或小模型参数,未增加额外带宽负担[16] - 隐私无损且低端侧开销,复杂CLIP编码在云端完成,端侧仅需运行轻量级MLP路由网络[16] - 在电商、多媒体等多个领域公开数据集上的测试表明,无论基线模型如何,挂载FedVLR后NDCG和HR等核心推荐指标均实现显著且稳定提升[17][26] 应用前景与行业影响 - FedVLR为联邦基础模型落地提供了极具启发性的范式,展示了“云端大模型编码+端侧微调适配”的高效协同路径[19] - 该方案无需在每个终端部署庞大模型,通过精巧架构设计将云端通用内容理解能力与端侧私有偏好解耦[19] - 极大降低了联邦学习的通信与计算门槛,为未来将更复杂视觉-语言模型甚至生成式AI引入隐私敏感场景铺平道路[19] - 在数据稀疏场景下性能提升尤为显著,证明通过个性化融合策略能更有效利用有限本地数据理解物品内容[26] - 是构建下一代“既懂内容、又懂用户、且严守隐私边界”的智能系统的关键一步[19]
微众银行AI学术研究再添新成果,九项技术创新连续获顶会顶刊发表
华尔街见闻· 2025-10-31 12:00
会议与学术成就 - 自然语言处理领域国际顶级会议EMNLP 2025将于2025年11月4-9日在中国苏州举行 该会议每年吸引全球数万名科研人员与工程师参与[1] - 公司有3篇论文被EMNLP 2025大会录取 研究方向包括联邦大模型框架 大模型压缩和推理知识迁移[1] - 2025年公司共有9篇论文入选EMNLP NeurIPS CVPR KDD TIFS TKDE等顶级会议与期刊 创下历年新高[3] - 公司多年来累计在NeurIPS CVPR EMNLP等国际顶会或顶刊发表论文50余篇[4] 公司战略与技术布局 - 公司是中国首家数字银行 秉持“让金融普惠大众”的使命 致力于通过科技创新为普通民众和小微企业提供优质便捷的金融服务[3] - 公司正加速从“数字原生”向“AI原生”跃迁 具体路径包括夯实AI基础设施 深化AI全场景应用 重塑AI原生型组织以及健全AI治理体系 目标是建成全球领先的AI原生银行[3] - AI研究坚持“问题导向 落地优先”的理念 以解决产业实际痛点为目标[4] - 未来公司将围绕“金融科技 智慧民生”两大领域 持续深耕AI核心技术研究 推动研究成果向产业价值转化[5] 行业贡献与认可 - 由公司牵头编写的国家标准GB/T 46284-2025《人工智能 联邦学习技术规范》已于2025年10月5日正式发布实施[3] - 公司联合同济大学 微软亚洲研究院共同获得2025年度中国计算机学会“CCF科技成果奖”自然科学三等奖 显示行业对其技术创新实力的高度认可[3] - 公司的多项AI技术已应用于金融风控 智能客服 反欺诈等核心业务场景[4]
微众银行AI学术研究再添新成果,九项技术创新连续获发表
中国经济网· 2025-10-31 11:39
公司战略与定位 - 公司是国内数字银行的先行者,秉持“让金融普惠大众”的使命,坚定不移走高水平科技自立自强之路 [2] - 公司正加速从“数字原生”向“AI原生”跃迁,致力于建成全球领先的AI原生银行 [2] - AI研究坚持“问题导向、落地优先”的理念,以“解决产业实际痛点”为目标 [3] 研发投入与技术创新 - 公司持续加大在人工智能、区块链、大数据、云计算等前沿领域的研发投入 [2] - 重点突破联邦大模型压缩、大小模型思维链蒸馏、大模型服务化定制等关键技术 [2] - 2025年公司有9篇论文入选EMNLP、NeurIPS、CVPR、KDD、TIFS、TKDE等顶会顶刊,创历年新高 [2] - 多年来累计在NeurIPS、CVPR、EMNLP等国际顶会顶刊发表论文50余篇 [3] 行业认可与标准建设 - 公司牵头编写的国家标准GB/T 46284-2025《人工智能 联邦学习技术规范》正式发布实施,自2025年10月5日起生效 [2] - 公司联合同济大学、微软亚洲研究院共同斩获2025年度中国计算机学会“CCF科技成果奖”自然科学三等奖 [2] - 公司有3篇论文被自然语言处理领域权威学术盛会EMNLP 2025录取 [1] 技术应用与成果转化 - 多项AI技术已应用于公司金融风控、智能客服、反欺诈等核心业务场景 [3] - 未来公司将围绕“金融科技、智慧民生”两大领域,推动研究成果向产业价值转化 [3] - 公司AI研究团队将在EMNLP 2025与全球AI专家学者交流分享联邦大模型框架、大模型压缩、推理知识迁移方向的研究成果 [1]
助力金融风控:G20AI生态筑牢数字金融安全屏障
江南时报· 2025-10-29 03:21
文章核心观点 - G20 GPU构建的金融AI生态通过整合硬件算力、软件算法和数据协同的一体化模式,解决了传统风控系统在亿级用户和每秒千万级交易时代下面临的算力不足、数据割裂和算法滞后等难题 [1] - 该生态实现了更高效精准的数字金融安全屏障,在保障交易安全的同时提升了支付便捷性 [1] 风控系统性能提升 - 在某大型支付平台实现毫秒级风险识别,系统在0.3秒内完成交易行为分析、设备安全校验、历史风险匹配等18项检测并生成风险评分 [1] - 峰值时段每秒处理超过5万笔交易请求 [1] - 通过整合6家算法厂商的反欺诈模型和3家数据安全厂商的加密技术,形成动态调整的风控体系 [1] 模型优化效率与效果 - 反欺诈模型更新周期从过去的1-2周缩短至24小时,通过生态协同机制实时共享最新风险特征 [2] - 欺诈交易拦截率相比之前提升22%,正常交易误判率下降18% [2] - 生态内模型训练平台自动整合数据并对反欺诈模型进行迭代优化 [2] 数据共享与安全机制 - 针对金融行业数据敏感共享困难的痛点,与多家银行保险机构建立跨机构风险数据共享机制 [2] - 通过联邦学习技术实现数据可用不可见,各机构无需共享原始数据,仅上传本地数据模型参数进行加密计算 [2] - 某银行接入该机制后,对信用卡逾期风险的预测准确率提升15%,不良贷款率下降0.8个百分点 [2] 生态应用规模与成效 - 已服务超过20家金融机构,涵盖支付平台、银行、保险、证券等多个领域 [3] - 累计拦截可疑交易金额超过15亿元,处理风险事件超过30万起 [3] - 为数字金融业务平稳运行提供支撑,为行业风控模式创新提供可借鉴范例 [3]
研判2025!中国联邦学习行业产业链、市场规模及重点企业分析:技术框架持续迭代,隐私保护技术助力协同建模[图]
产业信息网· 2025-10-16 01:20
行业概述与定义 - 联邦学习是一种分布式机器学习方法,核心目标是在保护数据隐私的前提下实现多方协作训练模型,原始数据始终保留在本地,仅加密传输模型参数 [2] - 根据数据分布特征、网络结构及参与方角色,联邦学习可分为横向联邦学习、纵向联邦学习和联邦迁移学习三大类 [2] 市场规模与增长 - 2024年中国联邦学习行业市场规模为2.54亿元,同比增长11.89% [1][8] - 行业在政策支持、技术进步和市场需求推动下呈现稳步发展态势 [1][8] 技术发展与核心框架 - 以微众银行FATE、蚂蚁金服共享智能平台为代表的技术框架持续迭代,支持同态加密、安全多方计算等隐私保护技术 [1][8] - 联邦学习有效解决了数据孤岛与隐私安全的矛盾,在多个应用场景中提升模型精度达20%以上 [1][8] - 微众银行开源的FATE框架是全球首个工业级框架,其社区已吸引超4000开发者、800企业参与 [3] 行业发展历程 - 中国联邦学习行业自2017年概念提出后,经历了探索、应用、生态构建至成熟扩展四个阶段 [3] - 2023年至今,联邦学习已成为技术基础设施,并在多行业深度应用 [3] 产业链结构 - 产业链上游主要包括计算硬件、隐私保护软件库、分布式计算框架及云服务 [5] - 产业链中游为联邦学习平台与解决方案提供商 [5] - 产业链下游主要应用于金融、医疗、物流、数字广告、智能交通、政务等领域 [5] 重点企业分析 - 蚂蚁数科以36.7%的市场占有率连续三年位居中国隐私计算市场份额第一,其摩斯隐私计算平台融合多项技术 [8] - 微众银行在金融领域率先应用联邦学习技术,其FATE框架成为行业技术标杆 [8][3] - 百度集团在联邦学习领域技术领先,其PaddleFL框架支持横向联邦与两方安全学习,应用于金融风控等场景 [9] - 腾讯控股聚焦场景深耕与产品化,其T-Sec联邦学习通过加密中间结果交换提升模型效果15% [10] 主要应用场景 - 在金融风控领域,联邦学习技术通过整合不同金融机构的数据,构建更精准的信用评估模型 [7][8] - 在医疗领域实现跨医院数据融合,支持医疗联合诊断 [3][8] - 其他应用场景包括城市交通优化、智能营销、工业互联网设备故障预测及自动驾驶等 [1][8][12] 行业发展趋势 - 联邦学习将深度融合AI大模型、边缘计算及5G/6G技术,形成“分布式AI协同”新生态 [10] - 应用场景将从金融、医疗向工业互联网、自动驾驶、能源管理等更多垂直行业渗透和深度应用 [12] - 随着IEEE P3652.1标准推进及国内《数据安全法》与《个人信息保护法》等政策的完善,联邦学习将形成更规范的产业生态 [13]
对抗协作+原型学习!深北莫FedPall开源,联邦学习破局特征漂移,准确率登顶SOTA
机器之心· 2025-09-24 09:25
研究背景与问题 - 特征偏移问题是联邦学习数据异构场景下普遍存在的挑战 同一类别的样本在不同客户端上表现出不同特征分布 导致决策边界模糊并严重影响分类性能[2] 研究方法与算法 - 提出FedPall算法 结合原型对比学习和对抗协作学习进行联合训练[2] - 客户端与服务器间引入对抗学习机制 通过客户端间协作将特征表示投影到统一特征空间[3] - 采用分层整合全局原型与局部特征的技术策略 混合原型特征用于训练全局分类器[3] - 通过KL散度增强不同客户端的异构信息 利用CE和全局原型对比损失训练特征编码器[5] - 将全局分类器部署至每个客户端取代本地分类器 以增强泛化能力[6] 实验设计与数据集 - 在三个特征漂移数据集(Digits、Office-10和PACS)上评估性能[8] - 与FedAvg、FedProx、FedBN、MOON等经典及SOTA基线方法进行比较[9] 性能表现 - Office-10数据集平均准确率达67.5% 较第二名ADCOL方法(61.4%)高出约6.1个百分点[9][10] - Digits数据集平均准确率达88.7% 较第二名FedBN方法(87.6%)高出约1.1个百分点[9][10] - PACS数据集平均准确率达60.6% 较FedBN方法(59.5%)高出约1.1个百分点[9][12] - 在MNIST-M客户端上准确率达85.9% 显著优于FedBN的76.3%[9][12] - 在Office-10数据集上以31.5个百分点的优势超越FedBN方法[12] 技术优势 - 对抗学习有效缓解MNIST-M客户端中的异构信息问题[12] - 融合对抗学习与协作学习的特殊设计能良好适应现实数据集的显著特征漂移[12] - 在所有子数据集上都取得第一或第二的准确率[12] 应用与局限 - 目前仅针对分类任务设计并在图像数据集上进行评估[12] - 未来计划验证框架在其他模态数据和更多任务类型的泛化能力[13]
抖音巨量广告:竞价推广代运营公司
搜狐财经· 2025-09-12 06:25
行业现状 - 短视频平台成为品牌推广重要战场 抖音凭借庞大用户基数和精准算法成为流量高地 [1] - 巨量广告作为抖音官方广告投放体系 通过竞价模式帮助广告主实现高效曝光与转化 [1] - 面对复杂规则和专业化运营需求 越来越多企业选择将广告账户托管给代运营公司 [1] 企业痛点 - 中小企业自主操作面临多重困境:缺乏经验导致预算浪费 不熟悉OCPM/CPC等计费模式陷入烧钱无效果循环 [2] - 创意内容生产乏力 非专业团队难以产出高转化率素材 [2] - 数据分析能力薄弱 无法有效解读完播率/互动率/转化率等数据指标 [2] - 某美妆品牌自行投放时单条视频消耗500元仅获3个咨询量 代运营后同等预算咨询量飙升至87条 ROI提升近15倍 [2] 核心竞争力 - 精准用户画像构建能力 结合兴趣标签/行为轨迹/地域分布等建立多维度用户模型 [2] - 数据驱动的动态调优机制 采用智能竞价系统+人工干预双重保障 实时监控CTR/CVR/ECPM等关键指标 [5] - 某电商服饰类客户经过两周数据积累与策略迭代 广告组平均CPA下降42% [5] - 爆款内容工业化生产流程 实行标准化内容生产SOP 专业团队打造的视频广告留存时长比企业自制内容高出60%以上 [6] 行业乱象 - 存在不良现象:工作室收取高额服务费却采用刷量手段 专家顾问仅提供通用型方案无定制化能力 挪用客户预算进行二次投资 [7] - 企业选择时应考察案例真实性 要求提供近三个月完整投放数据报告 辨别异常高点赞/转发比例 [7] - 需确认是否取得巨量引擎官方认证服务商资格 [9] - 合同条款需明确约定KPI考核标准/退款机制及数据所有权归属 [9] 未来趋势 - 行业朝智能化/精细化方向演进 自动化工具逐步接管基础操作岗位 人力聚焦战略决策支持 [10] - 跨平台整合能力成为新竞争壁垒 能统筹管理抖音/快手/微信生态等多渠道资源的服务商更受青睐 [10] - 隐私计算技术突破或催生基于联邦学习的联合建模新模式 在保护用户隐私前提下实现更精准广告定向 [10]
礼来开放其价值超10亿美金AI制药平台!邀中小企业共享“数据金矿”
生物世界· 2025-09-10 09:00
核心观点 - 礼来公司宣布开放其价值超过10亿美元的AI药物研发平台Lilly TuneLab 采用联邦学习技术使生物技术公司无需共享核心数据即可利用其AI模型进行药物发现 旨在解决中小企业数据短缺问题并推动行业创新 [3][4][7] 平台价值与技术 - Lilly TuneLab是一个基于礼来多年研究数据训练的机器学习平台 涵盖药物处置、安全性和临床前数据 数据成本总和超过10亿美元 被列为行业最有价值的数据集之一 [4] - 平台采用联邦学习技术 由第三方托管 合作公司无需直接共享专有数据或获取礼来原始数据 即可使用AI模型 实现数据隐私保护下的模型共同进化 [4] - 平台旨在为中小生物技术公司提供与礼来科学家同等的AI能力 平衡行业资源差距 [5] 合作模式与生态建设 - 合作公司需贡献自身训练数据以推动平台持续改进 最终惠及整个生态系统和患者 [5] - 该平台是礼来Catalyze360计划的一部分 该计划还包括风险投资部门Lilly Ventures和孵化器部门Gateway Labs 旨在全方位支持行业创新 [6] 行业痛点与解决方案 - 中小生物技术公司面临缺乏大规模高质量数据的根本障碍 影响AI模型训练和关键决策 [7] - Lilly TuneLab将礼来数十年的学习成果压缩为即时可用的智能 直接解决数据短缺问题 [7] 未来发展规划 - 礼来计划在未来版本中增加体内小分子预测模型等功能 持续扩展平台能力 [8] - 开放平台是制药巨头利用数据优势重塑行业生态的尝试 为中小公司提供拥抱AI的新机会 [8]