联邦学习
搜索文档
医药生物-医药行业行业研究:从数据、算力、模型切入的3类龙头,看全球AI
搜狐财经· 2025-08-31 03:08
行业趋势与核心观点 - AI制药已从概念迈向现实,2024年Hassabis与Jumper因AlphaFold2获诺贝尔化学奖标志行业开启,多组学AI应用将实现医药领域1000倍降本增效,首个AI重磅药临近获批 [1][4] - 行业核心三要素(算力、数据、模型)瓶颈逐步突破:算力云端化且持续升级,数据通过联邦学习及跨界合作突破孤岛限制,生成式AI模型成为竞争关键 [1][4] - AI开发药物I期试验成功率80%-90%,远超传统方法的40%,全球AI药企管线加速进入临床阶段 [1][4][64] 算力进展 - 云端算力供给充裕,亚马逊、谷歌、微软、阿里等科技巨头提供基础设施支持 [1][4] - 英伟达2025年推出Spectrum-XGS以太网技术,可连接分布式数据中心形成“AI超级工厂”,提升算力量级 [1][4][14] - 云计算驱动制药行业数字化转型,实现数据存储、分析及AI模型训练的高效扩展,成本降低达40% [39] 数据突破 - 联邦学习(FL)技术突破数据隐私与孤岛限制,实现跨设备及跨孤岛的知识共享 [4][43] - Apheris等企业及英国“OpenBind”联盟整合跨界数据,英国联盟计划5年生成50万个蛋白质-配体复合物结构数据,填补行业空白 [1][4][53] - 医疗数据量激增,英国生物数据库储存50万名患者信息,数据量是Meta LLaMA 3.1405B模型的27倍 [26][30] 模型与研发效率 - 生成式AI是关键竞争壁垒,英矽智能Pharma.AI平台(含Biology42、Chemistry42等模块)实现端到端研发,模型迭代时间从50天缩短至3天 [1][31] - 全球25家领先AI药企中,部分企业管线进入临床,英矽智能针对TNIK、ENPP1、PHD抑制剂3次复现成功且研发过程在Nature披露 [1][4][32] - AI模型可解释性受欧盟《人工智能法案》推动,依赖黑箱模型的系统可能退出市场 [4][31] 行业参与格局 - 科技巨头加速入局:英伟达推BioNeMo平台并投资13家AI药企,谷歌拆分Isomorphic Labs且临床试验临近 [1][5][15] - 产业链企业积极布局:泓博医药推DiOrion平台,深度智耀赋能IND合规提交,英矽智能10种候选化合物获批IND [1][5] - 默沙东、辉瑞等十大制药巨头投入数百亿美元,近5年全球AIDD相关交易总额超500亿美元,85%头部药企加大AI投资 [1][5][20] 投资策略与方向 - AI新药破局在即,关注管线丰富、兑现力强的企业如英矽智能、晶泰控股 [6] - 制药与跨界企业入局者众,优选壁垒随时间增厚者如石药集团、复星医药等长期布局AI的公司 [6]
促进和规范数据跨境流动,将对智能汽车进出口有何影响?
中国汽车报网· 2025-08-28 06:30
数据跨境流动政策背景 - 商务部提出促进和规范数据跨境流动 加快发展国际数据服务业务 为智能网联汽车进出口带来利好信号 [3] - 《数据安全法》实施四周年 主管部门此时推动数据跨境流动对智能汽车产业具有特殊意义 [3] - 我国构建数据跨境流动政策体系 2021年9月1日施行《数据安全法》确立数据分类分级保护制度 2021年11月1日实施《个人信息保护法》规范个人信息跨境传输 [5] 智能网联汽车数据规模 - 智能网联汽车已成为数据终端 每天产生TB级海量数据 [4] - 数据包含驾乘人员面部表情、动作、目光、声音数据 以及车辆地理位置、车内外环境、车联网使用数据 [4] - 特斯拉等智能汽车进口和中国智能汽车出口增多 使数据跨境流动成为重要现实课题 [5] 监管体系完善进程 - 2024年3月22日网信办发布《促进和规范数据跨境流动规定》 [6] - 2025年6月13日八部门联合发布《汽车数据出境安全指引(2025版)(征求意见稿)》 标志监管走向精细化专业化 [6] - 要求企业完成全面安全评估 区分一般数据/重要数据/核心数据实施差异化管理 建立内部管理制度 [6] 国际政策对比 - 欧盟以GDPR为核心实行严格数据本地化要求 限制数据跨境流动 除非接收方具备充分保护水平 [7] - 我国智能网联汽车企业在欧盟市场面临数据处理与传输挑战 需投入大量资源满足合规要求 [7] 企业合规实践 - 上海自贸区临港新片区2024年5月公布智能网联汽车领域数据跨境场景化一般数据清单 包含11个场景64个数据类别600余个字段 [8] - 特斯拉在中国建立本地化数据中心 将在华销售车辆产生数据全部存储于境内 满足数据本地化存储要求 [9] - 企业采用隐私计算、联邦学习技术实现数据"可用不可见" 使中外研发团队可不转移原始数据协同训练驾驶行为数据 [10] 技术解决方案 - 动态脱敏技术根据使用场景与风险等级实时对敏感数据变形处理 保持匿名状态 [11] - 智能加密技术运用先进算法加密数据 仅授权特定主体可解锁查看 [11] - 行业组织提出"事前评估-事中监控-事后审计"全流程管理体系 形成良好自律氛围 [11] 战略发展建议 - 出口端需构建技术合规+本地化运营双引擎 满足国际法规并精准对接当地需求 [12] - 进口端需打造数据主权保护+功能本土化竞争力 对进口车辆智能驾驶功能深度本土化适配 [12] - 率先建立数据合规体系并平衡安全与发展的企业 将在全球化竞争中赢得优势 [12]
数据“中毒”会让AI“自己学坏”
科技日报· 2025-08-19 00:18
AI数据中毒威胁 - AI系统在学习过程中输入错误或误导性数据会形成错误认知并作出偏离预期的判断[1] - 数据中毒攻击通过连续欺骗系统可逐渐腐蚀系统为后门植入和数据窃取埋下隐患例如攻击者用红色激光欺骗火车站摄像头30天[2] - 线上系统尤其是依赖社交媒体和网页内容训练的大语言模型中数据投毒已是重大隐患[2] AI爬虫数据采集风险 - 2024年AI爬虫流量首次超过人类用户其中OpenAI的ChatGPT-User占全球网页访问量6% Anthropic的ClaudeBot占13%流量[2] - AI模型大规模采集网页内容可能将故意投放的有毒数据如篡改版权材料和伪造新闻信息带入模型[3] - 有毒数据可能导致版权侵权虚假信息扩散和在关键领域引发安全风险[3] 版权保护技术反击 - 创作者采取技术手段保护版权例如芝加哥大学团队开发Glaze工具可加入像素级干扰使AI误判作品类型[4] - Nightshade工具能在图片植入隐蔽特征使AI学习错误对应关系该工具发布一年下载量超1000万次[4] - Cloudflare公司推出AI迷宫通过制造海量虚假网页消耗AI爬虫算力和时间[4] 去中心化防御技术 - 联邦学习技术允许模型在分布式设备本地学习只汇总参数降低单点中毒风险[5][6] - 区块链技术凭借时间戳和不可篡改特性使模型更新过程可追溯便于定位投毒源头[6] - 多个区块链网络可互相通报可疑模式当识别威胁时立即警示其他系统[6]
华为诺亚首席研究员,也具身智能创业了
量子位· 2025-08-13 01:01
具身智能创业热潮 - 具身智能成为当前最热门的创业赛道,吸引众多科技大牛投身[1][5] - 华为系科学家和工程师在具身智能领域表现突出,形成"华为系"创业集群[6][37][38] - 行业呈现"水大鱼大"特征,资本关注度高,初创公司快速获得融资[13][14] 诺因知行科技概况 - 公司成立于2025年6月19日,定位家用等身机器人领域[7] - 创始人李银川为前华为诺亚方舟实验室首席研究员,发表70+顶会论文,拥有30+专利[2][24] - 联合创始人疑似来自大疆创新,股东中出现大疆专利申请同名人物王韵杰[19][20] - 成立一个月即完成首轮融资,投资方包括源码资本,估值首轮后翻倍[4][14][15] 家用机器人市场特征 - 家用机器人设计侧重轻型结构、多任务泛化能力和细腻交互,区别于工业机器人的任务导向[10] - 受人口老龄化和独居化趋势推动,市场需求潜力巨大但商业化落地晚于工业机器人[11] - 竞争者包括李泽湘孵化的卧安机器人、鹿明机器人等,2025年多家企业传出融资进展[11] 华为系创业公司代表 智元机器人 - 核心团队包括华为天才少年稚晖君(CTO)和原华为副总裁邓泰华(CEO)[41][42] - 高管团队多来自华为无线产品线和企业业务,如COO邱恒(原华为企业业务COO)[44][45] 它石智航 - 天使轮融资创行业纪录,两轮合计2.42亿美元[47] - 技术团队豪华:CEO陈亦伦为前华为车BU首席科学家,首席科学家丁文超为华为首批天才少年[48] 其他华为背景公司 - 灵初智能联创陈源培为00后华为天才少年[52] - 智澄AI创始人胡鲁辉曾任美国华为研究院CTO[54] - 少年游科技创始人史青帆有华为履历,专注双足人形机器人[56][57] 华为系创业人才特征 - 主要来自两大来源:天才少年计划和智能车BU部门[58] - 自动驾驶领域人才因技术相关性大量转向具身智能[58] - 历史原因使华为系创业不如其他大厂突出,但具身智能领域出现突破[59][61] 创始人李银川背景 - 学术轨迹:北理工博士→哥大联培→Santé Ventures技术顾问→华为诺亚方舟[24][27][31] - 研究方向经历多次转变:雷达成像→金融预测→联邦学习→具身智能[27][31][33] - 最高引用论文为2022年《通过变分贝叶斯推理实现个性化联邦学习》(131次)[32]
ICCV 2025 | 新型后门攻击直指Scaffold联邦学习,NTU联手0G Labs揭示中心化训练安全漏洞
机器之心· 2025-08-09 03:59
联邦学习安全漏洞 - Scaffold联邦学习通过控制变元校正客户端梯度偏移,显著提升非IID数据下的模型收敛性,但引入新的安全攻击面[7][8] - 控制变元机制可能被恶意篡改,引导良性客户端梯度朝中毒方向更新,放大后门攻击效果[8][9] - BadSFL攻击利用GAN生成对抗样本补充非IID数据知识,结合控制变元操控实现高隐蔽性后门植入[11][19] BadSFL攻击技术 - 采用三阶段攻击流程:GAN数据补全→隐蔽触发器设计→控制变元优化,使后门模型更接近全局最优解[21][22] - 创新性使用控制变元预测全局模型收敛方向,通过公式(3)优化后门持久性,攻击效果可持续60轮以上[25][28][30] - 基于特征的后门触发器(如CIFAR-10中绿色汽车)攻击成功率超80%,主要任务准确率保持60%[29][34] 实验验证结果 - 在CIFAR-10/100和MNIST数据集上,BadSFL后门准确率超90%,比基准方法持久性提升3倍[33][37] - 攻击停止后仍能维持5倍于基准的攻击持续时间,标签翻转攻击中后门准确率衰减速度降低10%[37] - GAN数据增强使攻击者本地模型更接近全局最优解,减少因非IID分布导致的性能偏差[21][22] 行业影响 - 揭示Scaffold聚合算法的设计缺陷,控制变元机制可能成为联邦学习系统的新攻击向量[8][12] - 非IID场景下的安全威胁需重新评估,传统IID防御方案对控制变元操控类攻击无效[16][18] - 该研究已入选ICCV 2025,可能推动联邦学习安全防御技术的迭代升级[3][39]
宝信软件(安徽)取得基于联邦学习差分隐私图像分类相关专利
金融界· 2025-08-09 02:49
公司动态 - 宝信软件(安徽)股份有限公司于2025年8月9日获得国家知识产权局授权一项名为"一种基于联邦学习的差分隐私图像分类方法及装置"的专利,授权公告号CN115527061B,申请日期为2022年09月 [1] - 公司成立于2002年,位于马鞍山市,主营业务为研究和试验发展,注册资本达36109.372万人民币 [1] - 公司对外投资5家企业,参与招投标项目3103次,拥有商标信息13条,专利信息152条,行政许可20个 [1] 知识产权 - 公司最新专利涉及联邦学习与差分隐私技术的图像分类领域,显示其在人工智能和数据安全领域的研发投入 [1] - 公司累计专利信息达152条,反映其持续的技术创新能力 [1]
微算法科技(NASDAQ:MLGO)应用区块链联邦学习(BlockFL)架构,实现数据的安全传输
中国产业经济信息网· 2025-07-31 02:53
区块链与联邦学习结合的技术创新 - 微算法科技创新性地应用BlockFL架构,将区块链技术与联邦学习相结合,构建安全协作框架,解决数据安全与隐私保护问题 [1] - BlockFL利用区块链作为信任层,验证和记录联邦学习过程中所有参与者的行为,确保训练公正性和数据使用合规性 [1] - 区块链的不可篡改性和透明性保障数据传输安全,联邦学习的本地训练特性避免原始数据离开设备,双重强化隐私保护 [5] BlockFL架构的核心机制 - 系统初始化阶段创建初始模型并广播至所有节点,区块链记录联邦学习活动的元数据 [4] - 本地训练阶段节点在本地数据集上生成更新参数,无需暴露原始数据 [4] - 参数上传后通过智能合约验证有效性和完整性,聚合节点加权平均生成全局模型新版本 [4] - 区块链自动执行激励与惩罚机制,奖励高质量数据贡献,惩罚违规行为 [4] 技术优势与应用场景 - BlockFL通过区块链分布式特性和高并发处理能力实现高效数据交换与同步,确保模型训练一致性和准确性 [2] - 该架构有效解决数据孤岛问题,促进跨机构数据协作,适用于医疗健康、金融风控、智能制造和智慧城市等领域 [5] - 在医疗领域支持医院联合训练诊断模型,金融领域实现机构间欺诈识别协作,工业领域优化工厂设备协作 [5] 行业影响与发展前景 - 微算法科技的BlockFL架构是创新性技术尝试,同时解决安全性、隐私性和效率问题 [6] - 该技术有望成为未来数据传输和机器学习领域的重要支撑,具有广泛的应用拓展空间 [6]
大模型如何链接政务办公?联通元景重磅发布
环球网· 2025-07-24 04:56
技术基座 - 联通元景大模型通过"蒸馏"政务数据和注入专业知识,构建政务实体关系的知识网络,形成专业知识图谱 [3] - 采用监督微调、蒸馏等技术手段,炼出语言、语音、视觉、多模态四大技能包 [4] - 通过"政务沙盒"机制和联邦学习框架保障数据隐私,实现模型迭代 [4] 产品矩阵 - 构建"1+5+X"模块化架构,"1"是核心引擎,"5"是5个核心政务场景,"X"是任意组合的场景化应用 [6] - 提供云模式、一体机模式、本地化集群模式三种灵活部署方式 [6][7] - 包含智能对话、文案创作、知识问答、语音纪要等通用功能组件 [7] 应用场景 - 自动生成标准公文框架,对标《党政机关公文格式》国标 [4] - 智能解析政策,形成"政策逻辑树",关联实施细则和负责部门 [4][7] - 会议场景中实现语音实时转文字并标记重点 [7] - 社保查询、证件办理等场景提前梳理材料流程,减少群众跑腿次数 [8] 落地成效 - 已在多省市政府及部委落地应用,赋能经济运行调度日常工作 [9] - 会议筹备时间减半,公文排版效率提升 [7] - 推动"数据多跑路、群众少跑腿、基层减负担"从口号变为现实 [7][8] 行业影响 - 重新定义政务智能化边界,提升公共服务效率和社会治理精准度 [1] - 技术+场景双轮驱动模式持续拓展应用边界 [5] - 推动政务服务向更高效率和更具温度的方向发展 [9]
ICML spotlight | 一种会「进化」的合成数据!无需上传隐私,也能生成高质量垂域数据
机器之心· 2025-07-11 09:22
数据短缺问题 - 公共数据产生速度预计到2028年将赶不上大模型训练的消耗速度而被耗尽[1] - 医疗、工业制造等特殊领域可用数据原本就少,数据短缺问题更严重[1] 现有解决方案的局限性 - 垂直领域中小企业倾向于使用现成大模型API,但无法直接合成垂域数据[4][5] - 大模型生成的数据与垂域实际数据存在巨大差距,无法满足垂域特性需求[7][8] - 垂域数据因隐私、知识产权等原因不能上传,增加了prompt工程难度[9] PCEvolve框架核心创新 - 只需少量标注样本即可在保护隐私同时进化出整个数据集[2] - 采用类似达尔文进化论的迭代进化框架:生成候选数据→选择淘汰→下一轮进化[11] - 设计基于指数机制的新型隐私保护方法,适配垂域少样本场景[11] 技术实现细节 - 利用开源Encoder基座模型将数据映射到特征空间计算距离[16] - 通过寻找聚类中心代表标签所有私有数据来降低计算成本[16] - 提出相似度度量h(d_s^c,D_p)来优化合成数据与垂域数据的绝对距离[18] 实验验证结果 - 在COVIDx数据集上精度达64.04%,相比初始49.34%提升显著[23] - 在Came17数据集上精度达69.10%,相比初始50.47%提升显著[23] - 在KVASIR-f和MVAD-l数据集上也分别达到50.95%和59.26%的精度[23]
博世加码人工智能投入自动驾驶是关键应用领域
新浪财经· 2025-06-30 12:26
投资计划与销售预测 - 公司计划2027年前在人工智能领域投资超过25亿欧元 [1] - 预计到2035年软件、传感器技术、高性能计算单元、车载通讯类零部件销售额将翻倍,超过100亿欧元 [1][3] 人工智能技术应用 - 公司将辅助驾驶与自动驾驶作为人工智能优势的关键应用领域 [1] - 早期在摄像头和雷达上部署人工智能用于物体识别和环境感知 [1] - 未来重点是将所有传感器数据输入大模型,融合环境信息并提升预判能力 [1] - 生成式人工智能模型可模拟不同驾驶场景(如雨天、夜间) [2] 数据与技术优势 - 公司累计超过200PB(2亿GB)全球交通场景数据用于训练人工智能模型 [2] - 采用"联邦学习"技术实现全球数据训练而不共享原始数据 [2][3] - 通过联邦学习解决全球数据跨境传输的复杂要求 [3] 市场合作与全球化 - 公司与奇瑞合作成功,为中国市场建立人工智能计算集群 [3] - 中国团队具备完整产品开发能力,使用本土云服务器和数据 [3] - 辅助驾驶技术在中国市场对吸引消费者至关重要 [3] - 预计自动驾驶技术将在2035年实现长期商业成功 [3]