Workflow
联邦学习
icon
搜索文档
对抗协作+原型学习!深北莫FedPall开源,联邦学习破局特征漂移,准确率登顶SOTA
机器之心· 2025-09-24 09:25
研究背景与问题 - 特征偏移问题是联邦学习数据异构场景下普遍存在的挑战 同一类别的样本在不同客户端上表现出不同特征分布 导致决策边界模糊并严重影响分类性能[2] 研究方法与算法 - 提出FedPall算法 结合原型对比学习和对抗协作学习进行联合训练[2] - 客户端与服务器间引入对抗学习机制 通过客户端间协作将特征表示投影到统一特征空间[3] - 采用分层整合全局原型与局部特征的技术策略 混合原型特征用于训练全局分类器[3] - 通过KL散度增强不同客户端的异构信息 利用CE和全局原型对比损失训练特征编码器[5] - 将全局分类器部署至每个客户端取代本地分类器 以增强泛化能力[6] 实验设计与数据集 - 在三个特征漂移数据集(Digits、Office-10和PACS)上评估性能[8] - 与FedAvg、FedProx、FedBN、MOON等经典及SOTA基线方法进行比较[9] 性能表现 - Office-10数据集平均准确率达67.5% 较第二名ADCOL方法(61.4%)高出约6.1个百分点[9][10] - Digits数据集平均准确率达88.7% 较第二名FedBN方法(87.6%)高出约1.1个百分点[9][10] - PACS数据集平均准确率达60.6% 较FedBN方法(59.5%)高出约1.1个百分点[9][12] - 在MNIST-M客户端上准确率达85.9% 显著优于FedBN的76.3%[9][12] - 在Office-10数据集上以31.5个百分点的优势超越FedBN方法[12] 技术优势 - 对抗学习有效缓解MNIST-M客户端中的异构信息问题[12] - 融合对抗学习与协作学习的特殊设计能良好适应现实数据集的显著特征漂移[12] - 在所有子数据集上都取得第一或第二的准确率[12] 应用与局限 - 目前仅针对分类任务设计并在图像数据集上进行评估[12] - 未来计划验证框架在其他模态数据和更多任务类型的泛化能力[13]
抖音巨量广告:竞价推广代运营公司
搜狐财经· 2025-09-12 06:25
行业现状 - 短视频平台成为品牌推广重要战场 抖音凭借庞大用户基数和精准算法成为流量高地 [1] - 巨量广告作为抖音官方广告投放体系 通过竞价模式帮助广告主实现高效曝光与转化 [1] - 面对复杂规则和专业化运营需求 越来越多企业选择将广告账户托管给代运营公司 [1] 企业痛点 - 中小企业自主操作面临多重困境:缺乏经验导致预算浪费 不熟悉OCPM/CPC等计费模式陷入烧钱无效果循环 [2] - 创意内容生产乏力 非专业团队难以产出高转化率素材 [2] - 数据分析能力薄弱 无法有效解读完播率/互动率/转化率等数据指标 [2] - 某美妆品牌自行投放时单条视频消耗500元仅获3个咨询量 代运营后同等预算咨询量飙升至87条 ROI提升近15倍 [2] 核心竞争力 - 精准用户画像构建能力 结合兴趣标签/行为轨迹/地域分布等建立多维度用户模型 [2] - 数据驱动的动态调优机制 采用智能竞价系统+人工干预双重保障 实时监控CTR/CVR/ECPM等关键指标 [5] - 某电商服饰类客户经过两周数据积累与策略迭代 广告组平均CPA下降42% [5] - 爆款内容工业化生产流程 实行标准化内容生产SOP 专业团队打造的视频广告留存时长比企业自制内容高出60%以上 [6] 行业乱象 - 存在不良现象:工作室收取高额服务费却采用刷量手段 专家顾问仅提供通用型方案无定制化能力 挪用客户预算进行二次投资 [7] - 企业选择时应考察案例真实性 要求提供近三个月完整投放数据报告 辨别异常高点赞/转发比例 [7] - 需确认是否取得巨量引擎官方认证服务商资格 [9] - 合同条款需明确约定KPI考核标准/退款机制及数据所有权归属 [9] 未来趋势 - 行业朝智能化/精细化方向演进 自动化工具逐步接管基础操作岗位 人力聚焦战略决策支持 [10] - 跨平台整合能力成为新竞争壁垒 能统筹管理抖音/快手/微信生态等多渠道资源的服务商更受青睐 [10] - 隐私计算技术突破或催生基于联邦学习的联合建模新模式 在保护用户隐私前提下实现更精准广告定向 [10]
礼来开放其价值超10亿美金AI制药平台!邀中小企业共享“数据金矿”
生物世界· 2025-09-10 09:00
核心观点 - 礼来公司宣布开放其价值超过10亿美元的AI药物研发平台Lilly TuneLab 采用联邦学习技术使生物技术公司无需共享核心数据即可利用其AI模型进行药物发现 旨在解决中小企业数据短缺问题并推动行业创新 [3][4][7] 平台价值与技术 - Lilly TuneLab是一个基于礼来多年研究数据训练的机器学习平台 涵盖药物处置、安全性和临床前数据 数据成本总和超过10亿美元 被列为行业最有价值的数据集之一 [4] - 平台采用联邦学习技术 由第三方托管 合作公司无需直接共享专有数据或获取礼来原始数据 即可使用AI模型 实现数据隐私保护下的模型共同进化 [4] - 平台旨在为中小生物技术公司提供与礼来科学家同等的AI能力 平衡行业资源差距 [5] 合作模式与生态建设 - 合作公司需贡献自身训练数据以推动平台持续改进 最终惠及整个生态系统和患者 [5] - 该平台是礼来Catalyze360计划的一部分 该计划还包括风险投资部门Lilly Ventures和孵化器部门Gateway Labs 旨在全方位支持行业创新 [6] 行业痛点与解决方案 - 中小生物技术公司面临缺乏大规模高质量数据的根本障碍 影响AI模型训练和关键决策 [7] - Lilly TuneLab将礼来数十年的学习成果压缩为即时可用的智能 直接解决数据短缺问题 [7] 未来发展规划 - 礼来计划在未来版本中增加体内小分子预测模型等功能 持续扩展平台能力 [8] - 开放平台是制药巨头利用数据优势重塑行业生态的尝试 为中小公司提供拥抱AI的新机会 [8]
医药生物-医药行业行业研究:从数据、算力、模型切入的3类龙头,看全球AI
搜狐财经· 2025-08-31 03:08
行业趋势与核心观点 - AI制药已从概念迈向现实,2024年Hassabis与Jumper因AlphaFold2获诺贝尔化学奖标志行业开启,多组学AI应用将实现医药领域1000倍降本增效,首个AI重磅药临近获批 [1][4] - 行业核心三要素(算力、数据、模型)瓶颈逐步突破:算力云端化且持续升级,数据通过联邦学习及跨界合作突破孤岛限制,生成式AI模型成为竞争关键 [1][4] - AI开发药物I期试验成功率80%-90%,远超传统方法的40%,全球AI药企管线加速进入临床阶段 [1][4][64] 算力进展 - 云端算力供给充裕,亚马逊、谷歌、微软、阿里等科技巨头提供基础设施支持 [1][4] - 英伟达2025年推出Spectrum-XGS以太网技术,可连接分布式数据中心形成“AI超级工厂”,提升算力量级 [1][4][14] - 云计算驱动制药行业数字化转型,实现数据存储、分析及AI模型训练的高效扩展,成本降低达40% [39] 数据突破 - 联邦学习(FL)技术突破数据隐私与孤岛限制,实现跨设备及跨孤岛的知识共享 [4][43] - Apheris等企业及英国“OpenBind”联盟整合跨界数据,英国联盟计划5年生成50万个蛋白质-配体复合物结构数据,填补行业空白 [1][4][53] - 医疗数据量激增,英国生物数据库储存50万名患者信息,数据量是Meta LLaMA 3.1405B模型的27倍 [26][30] 模型与研发效率 - 生成式AI是关键竞争壁垒,英矽智能Pharma.AI平台(含Biology42、Chemistry42等模块)实现端到端研发,模型迭代时间从50天缩短至3天 [1][31] - 全球25家领先AI药企中,部分企业管线进入临床,英矽智能针对TNIK、ENPP1、PHD抑制剂3次复现成功且研发过程在Nature披露 [1][4][32] - AI模型可解释性受欧盟《人工智能法案》推动,依赖黑箱模型的系统可能退出市场 [4][31] 行业参与格局 - 科技巨头加速入局:英伟达推BioNeMo平台并投资13家AI药企,谷歌拆分Isomorphic Labs且临床试验临近 [1][5][15] - 产业链企业积极布局:泓博医药推DiOrion平台,深度智耀赋能IND合规提交,英矽智能10种候选化合物获批IND [1][5] - 默沙东、辉瑞等十大制药巨头投入数百亿美元,近5年全球AIDD相关交易总额超500亿美元,85%头部药企加大AI投资 [1][5][20] 投资策略与方向 - AI新药破局在即,关注管线丰富、兑现力强的企业如英矽智能、晶泰控股 [6] - 制药与跨界企业入局者众,优选壁垒随时间增厚者如石药集团、复星医药等长期布局AI的公司 [6]
促进和规范数据跨境流动,将对智能汽车进出口有何影响?
中国汽车报网· 2025-08-28 06:30
数据跨境流动政策背景 - 商务部提出促进和规范数据跨境流动 加快发展国际数据服务业务 为智能网联汽车进出口带来利好信号 [3] - 《数据安全法》实施四周年 主管部门此时推动数据跨境流动对智能汽车产业具有特殊意义 [3] - 我国构建数据跨境流动政策体系 2021年9月1日施行《数据安全法》确立数据分类分级保护制度 2021年11月1日实施《个人信息保护法》规范个人信息跨境传输 [5] 智能网联汽车数据规模 - 智能网联汽车已成为数据终端 每天产生TB级海量数据 [4] - 数据包含驾乘人员面部表情、动作、目光、声音数据 以及车辆地理位置、车内外环境、车联网使用数据 [4] - 特斯拉等智能汽车进口和中国智能汽车出口增多 使数据跨境流动成为重要现实课题 [5] 监管体系完善进程 - 2024年3月22日网信办发布《促进和规范数据跨境流动规定》 [6] - 2025年6月13日八部门联合发布《汽车数据出境安全指引(2025版)(征求意见稿)》 标志监管走向精细化专业化 [6] - 要求企业完成全面安全评估 区分一般数据/重要数据/核心数据实施差异化管理 建立内部管理制度 [6] 国际政策对比 - 欧盟以GDPR为核心实行严格数据本地化要求 限制数据跨境流动 除非接收方具备充分保护水平 [7] - 我国智能网联汽车企业在欧盟市场面临数据处理与传输挑战 需投入大量资源满足合规要求 [7] 企业合规实践 - 上海自贸区临港新片区2024年5月公布智能网联汽车领域数据跨境场景化一般数据清单 包含11个场景64个数据类别600余个字段 [8] - 特斯拉在中国建立本地化数据中心 将在华销售车辆产生数据全部存储于境内 满足数据本地化存储要求 [9] - 企业采用隐私计算、联邦学习技术实现数据"可用不可见" 使中外研发团队可不转移原始数据协同训练驾驶行为数据 [10] 技术解决方案 - 动态脱敏技术根据使用场景与风险等级实时对敏感数据变形处理 保持匿名状态 [11] - 智能加密技术运用先进算法加密数据 仅授权特定主体可解锁查看 [11] - 行业组织提出"事前评估-事中监控-事后审计"全流程管理体系 形成良好自律氛围 [11] 战略发展建议 - 出口端需构建技术合规+本地化运营双引擎 满足国际法规并精准对接当地需求 [12] - 进口端需打造数据主权保护+功能本土化竞争力 对进口车辆智能驾驶功能深度本土化适配 [12] - 率先建立数据合规体系并平衡安全与发展的企业 将在全球化竞争中赢得优势 [12]
数据“中毒”会让AI“自己学坏”
科技日报· 2025-08-19 00:18
随着AI爬虫的大规模抓取,许多创作者担心作品被未经许可使用。为了保护版权,创作者采取了法律 和技术手段。如《纽约时报》起诉OpenAI,称其新闻报道被模型学习再利用,侵犯了版权。 面对旷日持久的版权拉锯战,一些创作者转向技术"自卫"。美国芝加哥大学团队研发了两款工具。名为 Glaze的工具可在艺术作品中加入微小的像素级干扰,让AI模型误以为一幅水彩画是油画。另一款工具 Nightshade更为激进,它能在看似正常的猫的图片中植入隐蔽特征,从而让模型学到"猫=狗"这样的错 误对应。通过这种方式,艺术家们让自己的作品在训练数据中成为"毒药",保护了原创风格不被复制。 在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有 信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。 然而,一旦有人恶意干扰,比如用一束红色激光模拟列车尾灯,那么摄像头可能会误以为轨道上已有列 车。久而久之,AI学会了把这种假象当作真实信号,并不断发出"轨道占用"的错误提示。最终,不仅列 车调度被打乱,甚至还可能酿成安全事故。 澳大利亚《对话》杂志日前报道称,这是数据" ...
华为诺亚首席研究员,也具身智能创业了
量子位· 2025-08-13 01:01
具身智能创业热潮 - 具身智能成为当前最热门的创业赛道,吸引众多科技大牛投身[1][5] - 华为系科学家和工程师在具身智能领域表现突出,形成"华为系"创业集群[6][37][38] - 行业呈现"水大鱼大"特征,资本关注度高,初创公司快速获得融资[13][14] 诺因知行科技概况 - 公司成立于2025年6月19日,定位家用等身机器人领域[7] - 创始人李银川为前华为诺亚方舟实验室首席研究员,发表70+顶会论文,拥有30+专利[2][24] - 联合创始人疑似来自大疆创新,股东中出现大疆专利申请同名人物王韵杰[19][20] - 成立一个月即完成首轮融资,投资方包括源码资本,估值首轮后翻倍[4][14][15] 家用机器人市场特征 - 家用机器人设计侧重轻型结构、多任务泛化能力和细腻交互,区别于工业机器人的任务导向[10] - 受人口老龄化和独居化趋势推动,市场需求潜力巨大但商业化落地晚于工业机器人[11] - 竞争者包括李泽湘孵化的卧安机器人、鹿明机器人等,2025年多家企业传出融资进展[11] 华为系创业公司代表 智元机器人 - 核心团队包括华为天才少年稚晖君(CTO)和原华为副总裁邓泰华(CEO)[41][42] - 高管团队多来自华为无线产品线和企业业务,如COO邱恒(原华为企业业务COO)[44][45] 它石智航 - 天使轮融资创行业纪录,两轮合计2.42亿美元[47] - 技术团队豪华:CEO陈亦伦为前华为车BU首席科学家,首席科学家丁文超为华为首批天才少年[48] 其他华为背景公司 - 灵初智能联创陈源培为00后华为天才少年[52] - 智澄AI创始人胡鲁辉曾任美国华为研究院CTO[54] - 少年游科技创始人史青帆有华为履历,专注双足人形机器人[56][57] 华为系创业人才特征 - 主要来自两大来源:天才少年计划和智能车BU部门[58] - 自动驾驶领域人才因技术相关性大量转向具身智能[58] - 历史原因使华为系创业不如其他大厂突出,但具身智能领域出现突破[59][61] 创始人李银川背景 - 学术轨迹:北理工博士→哥大联培→Santé Ventures技术顾问→华为诺亚方舟[24][27][31] - 研究方向经历多次转变:雷达成像→金融预测→联邦学习→具身智能[27][31][33] - 最高引用论文为2022年《通过变分贝叶斯推理实现个性化联邦学习》(131次)[32]
ICCV 2025 | 新型后门攻击直指Scaffold联邦学习,NTU联手0G Labs揭示中心化训练安全漏洞
机器之心· 2025-08-09 03:59
联邦学习安全漏洞 - Scaffold联邦学习通过控制变元校正客户端梯度偏移,显著提升非IID数据下的模型收敛性,但引入新的安全攻击面[7][8] - 控制变元机制可能被恶意篡改,引导良性客户端梯度朝中毒方向更新,放大后门攻击效果[8][9] - BadSFL攻击利用GAN生成对抗样本补充非IID数据知识,结合控制变元操控实现高隐蔽性后门植入[11][19] BadSFL攻击技术 - 采用三阶段攻击流程:GAN数据补全→隐蔽触发器设计→控制变元优化,使后门模型更接近全局最优解[21][22] - 创新性使用控制变元预测全局模型收敛方向,通过公式(3)优化后门持久性,攻击效果可持续60轮以上[25][28][30] - 基于特征的后门触发器(如CIFAR-10中绿色汽车)攻击成功率超80%,主要任务准确率保持60%[29][34] 实验验证结果 - 在CIFAR-10/100和MNIST数据集上,BadSFL后门准确率超90%,比基准方法持久性提升3倍[33][37] - 攻击停止后仍能维持5倍于基准的攻击持续时间,标签翻转攻击中后门准确率衰减速度降低10%[37] - GAN数据增强使攻击者本地模型更接近全局最优解,减少因非IID分布导致的性能偏差[21][22] 行业影响 - 揭示Scaffold聚合算法的设计缺陷,控制变元机制可能成为联邦学习系统的新攻击向量[8][12] - 非IID场景下的安全威胁需重新评估,传统IID防御方案对控制变元操控类攻击无效[16][18] - 该研究已入选ICCV 2025,可能推动联邦学习安全防御技术的迭代升级[3][39]
宝信软件(安徽)取得基于联邦学习差分隐私图像分类相关专利
金融界· 2025-08-09 02:49
公司动态 - 宝信软件(安徽)股份有限公司于2025年8月9日获得国家知识产权局授权一项名为"一种基于联邦学习的差分隐私图像分类方法及装置"的专利,授权公告号CN115527061B,申请日期为2022年09月 [1] - 公司成立于2002年,位于马鞍山市,主营业务为研究和试验发展,注册资本达36109.372万人民币 [1] - 公司对外投资5家企业,参与招投标项目3103次,拥有商标信息13条,专利信息152条,行政许可20个 [1] 知识产权 - 公司最新专利涉及联邦学习与差分隐私技术的图像分类领域,显示其在人工智能和数据安全领域的研发投入 [1] - 公司累计专利信息达152条,反映其持续的技术创新能力 [1]
微算法科技(NASDAQ:MLGO)应用区块链联邦学习(BlockFL)架构,实现数据的安全传输
区块链与联邦学习结合的技术创新 - 微算法科技创新性地应用BlockFL架构,将区块链技术与联邦学习相结合,构建安全协作框架,解决数据安全与隐私保护问题 [1] - BlockFL利用区块链作为信任层,验证和记录联邦学习过程中所有参与者的行为,确保训练公正性和数据使用合规性 [1] - 区块链的不可篡改性和透明性保障数据传输安全,联邦学习的本地训练特性避免原始数据离开设备,双重强化隐私保护 [5] BlockFL架构的核心机制 - 系统初始化阶段创建初始模型并广播至所有节点,区块链记录联邦学习活动的元数据 [4] - 本地训练阶段节点在本地数据集上生成更新参数,无需暴露原始数据 [4] - 参数上传后通过智能合约验证有效性和完整性,聚合节点加权平均生成全局模型新版本 [4] - 区块链自动执行激励与惩罚机制,奖励高质量数据贡献,惩罚违规行为 [4] 技术优势与应用场景 - BlockFL通过区块链分布式特性和高并发处理能力实现高效数据交换与同步,确保模型训练一致性和准确性 [2] - 该架构有效解决数据孤岛问题,促进跨机构数据协作,适用于医疗健康、金融风控、智能制造和智慧城市等领域 [5] - 在医疗领域支持医院联合训练诊断模型,金融领域实现机构间欺诈识别协作,工业领域优化工厂设备协作 [5] 行业影响与发展前景 - 微算法科技的BlockFL架构是创新性技术尝试,同时解决安全性、隐私性和效率问题 [6] - 该技术有望成为未来数据传输和机器学习领域的重要支撑,具有广泛的应用拓展空间 [6]