Workflow
深度学习
icon
搜索文档
深度学习与转债定价:转债量化定价2.0
财通证券· 2025-08-20 01:47
报告行业投资评级 未提及 报告的核心观点 - 深度学习或能对转债定价,基于万能近似定理,若转债定价存在解析解,神经网络模型可拟合结果 [2][5] - 设计多层感知机模型(MLP),通过多层非线性变换学习定价模型,添加 11 种因子非线性拟合定价特征 [2][5] - 模型收敛性好且外推泛化能力出色,对样本外数据有强解释能力 [2][8] - 结合 MC 模型和传统 BS 模型,三个模型可在多场景辅助投资活动 [2][13] - 神经网络模型显示当前市场定价有高估,但仍有上行空间 [2][13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好 [2][16] - 模型在下修定价方面有较好效果 [2][19] 根据相关目录分别进行总结 深度学习定价模型的思路与设计 - 参考 BS 公式,中国可转债是复杂期权,可能存在复杂定价公式,基于万能近似定理,神经网络模型可拟合定价结果 [5] - 设计 MLP 模型,建立有限隐藏层,通过多层非线性变换学习定价模型,添加 11 种因子拟合定价特征 [5] - 模型收敛性好且外推泛化能力出色,选择 2022 - 2023 年因子数据训练和测试,剔除异常数据,第 100 轮迭代误差收敛,对 2024 - 1Q2025 数据解释能力强 [8] - 与 BS 公式和 MC 模型相比,MLP 模型定价效果更强,拟合市场整体转债价格平均值和所有转债价格时误差更小、稳定性更强 [10] - MLP 模型批量计算定价结果速度快,考虑转债特性和市场环境,定价更贴近实际,但存在不可解释性和需大量历史数据训练的问题 [11] 转债量化定价 2.0——模型有哪些应用? - 结合 MC 模型和传统 BS 模型,三个模型可在新券定价、市场解释、条款定价等场景辅助投资 [13] - 神经网络模型显示当前市场定价有高估,但截至 2025 年 8 月 15 日,市场价格中位数估值高估幅度不大,转债估值虽在高位但仍有上行空间 [13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好,超 50% 转债上市价格在 MC - MLP 框定区间,2024 年 11 月后超 80% 被捕捉 [16] - 模型在下修定价方面有较好效果,2025 年一季度多数转债提议下修第二个交易日价格能被 MLP 预测价格区间框定或接近上下沿 [19]
每经热评丨人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-19 15:07
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知融合 [1] - 运动会在真实竞技环境中检验传感器识别 运动控制 路径规划等综合能力 暴露技术缺陷并提供改进方向 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工 宇树科技 加速进化等头部整机企业 [2] - 赛事考验算法数据质量 硬件供应链稳定性到运维响应速度的整个生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人产品获得超过2000台订单 [2] 社会影响层面 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解机器人能力 [3] - 赛事荣誉体系和竞争氛围为青年人才提供展示舞台 激励投身机器人科研领域 [3] - 竞技活动推动技术融合与突破 促进前沿技术从实验室走向大众市场 [3]
图灵奖得主杨立昆沉寂数月后发声:AI安全是工程问题,不必恐慌“失控”
36氪· 2025-08-19 02:50
划重点: 2025年7月1日,Meta正式宣布成立 Meta超级智能实验室(Meta Superintelligence Labs),以加速通用人工智能(AGI)的研发进程。在 这一重组过程中,马克·扎克伯格展现出对AI顶尖人才的强烈渴求,他主导的一系列高调挖角行动迅速震动了整个科技行业。然而,在此 过程中,长期担任Meta基础AI研究实验室(FAIR)首席科学家的杨立昆(Yann LeCun)却逐渐被"边缘化",淡出了公众视野。 自2023年夏季以来,Llama模型家族已被下载约8亿次,这个数字令人震惊。 让AI的行为与人类价值观保持一致,更像是一个工程与设计问题,就像当年通过工程手段让喷气式飞机安全飞行一 样。 杨立昆提出"目标驱动架构",核心思路是为系统设定清晰的目标和必要的安全边界,使其在既定范围内执行任务。 AI可能像15世纪的印刷术一样,引发一场新的文艺复兴,放大人类智慧。 年轻人不要被负面的、耸人听闻的故事吓倒;要认识到自己的力量,主动塑造自己想要的未来。 沉寂数月后,这位被誉为"人工智能教父"之一的科学家,在法国巴黎接受一位人工智能专家(也是硅谷一家初创公司的联合创始人、首 席技术官)——芭芭 ...
几何计算联袂深度学习 提升疾病诊断准确率
科技日报· 2025-08-19 01:22
科技日报讯 (记者金凤)记者8月17日从东南大学获悉,该校教授顾忠泽团队联合中国科学院外籍 院士丘成桐团队等研发出基于几何表面参数化的多组学预测技术。该技术能提升对结直肠肿瘤等实体瘤 的组织分型与分子标志物的预测准确率,有望支撑人工智能在病理图像分析领域的应用。相关成果近日 刊发于中国工程院院刊《工程学》。 "人工智能已经在病理诊断中有不少应用,但现有算法多用于自然图像领域,其处理不规则病理图 像的能力有限。"论文第一作者、东南大学生物科学与医学工程学院博士生黄锴介绍,当碰到病理组织 分布不均匀等情况时,人工智能对疾病的预测准确度就会大打折扣。 "病理切片中的组织形状很不规则,造成图像中有许多空白区域,这些空白对于疾病的诊断没有意 义,我们将包含少量空白的不规则组织的图像提取出来,再将这些图像转换为正方形。"论文共同通讯 作者李铁香介绍,团队通过几何映射技术,保留了病理图像关键特征,同时引入多尺度和各向异性信 息,提升病理切片图像中有关肿瘤区域的信息量。经过这番处理,既减少了对无用信息的储存、处理, 又能增强卷积神经网络对肿瘤特征的学习能力。 黄锴介绍,团队使用该方法在573名结直肠癌患者的1802张切片上进 ...
每经热评︱人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-18 07:40
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知的融合 [1] - 运动会使技术缺陷在传感器识别运动控制路径规划等环节暴露 推动机械结构人工智能光学传感材料等多学科技术进步 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工宇树科技加速进化等头部整机企业 [2] - 赛事考验算法数据质量硬件供应链稳定性运维响应速度等全生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人获得超过2000台订单 [2] 社会影响 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解人形机器人应用场景 [3] - 赛事荣誉体系和竞争氛围激励青年人才投身机器人科研领域 加速行业人才培养 [3] - 竞技活动推动技术从实验室走向大众市场 实现产业革新 [3]
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
量子位· 2025-08-17 03:43
百度AICA项目概况 - 百度举办第九期首席AI架构师培养计划(AICA),吸引茅台、奔驰、麦当劳、国网、中石化、中石油等头部企业技术高管参与[2][3] - 项目依托百度自研飞桨深度学习平台和文心大模型,培养兼具技术开发与项目落地能力的复合型AI架构师[5] - 本期96名学员从500多名报名者中筛选,61%来自国央企/上市公司/T1服务商,80%具备"管理+专业+技术"复合背景,覆盖能源、重工业、医疗等18个领域[42][44] 大模型技术发展趋势 - 大模型相关课题占比达51%,首次涉及多智能体协同等前沿技术应用[6][7] - AI技术进入软件3.0时代:1.0为传统编码,2.0为深度学习模型,3.0通过大模型提示词实现多功能任务[35] - 百度内部AI代码生成占比从2022年5%提升至50%,采纳率从15%增至80%,可处理复杂编程任务[28] - 大模型参数规模达十亿级,核心进步在于Transformer架构、注意力机制及专家MoE结构的优化[36][37][38] 产业落地关键方向 - AI竞争重点转向制造、医疗、金融等场景落地,需解决产品同质化、与核心业务挂钩等挑战[13][20] - 企业应用AI的三大价值:工作效率提升(OpenAI研究)、服务模式重构(赛迪研究院补充)、资源均衡分配[16][17] - 国内AI发展呈现技术比拼(智能水平替代参数规模)、商业应用(场景实践替代概念验证)、产业格局(头部企业主导)三大趋势[18] AI架构师能力要求 - 需掌握提示词工程(任务拆解/指令优化)、模型调优(微调/对齐)、全栈系统设计(开发至部署)、场景洞察四大核心能力[32][33] - 重点提升大模型输出质量与效率,包括结果优化、速度提升及Agent工作流整合[30][33] - 百度通过AICA提供文心大模型实战案例,已培养489名架构师覆盖工业、能源、金融等数十行业[47] 行业应用案例 - 麦当劳团队申报《麦麦巡警数字员工》课题,探索大模型优化与Agent工程化设计[45] - 百度文心大模型4.5 Turbo应用于罗永浩数字人直播,展现深度分析与持续输出能力[26]
Cell重磅:AI破局抗生素耐药危机,从头设计全新抗生素,精准杀灭耐药菌
生物世界· 2025-08-15 04:21
抗生素耐药性危机与公共卫生威胁 - 2021年全球471万例死亡与细菌抗生素耐药性相关,其中114万例直接归因于抗生素耐药性[2] - 美国疾控中心将淋病奈瑟菌和金黄色葡萄球菌列为"紧急"和"严重"威胁,因对现有抗生素产生广泛耐药性且缺乏新治疗手段[5] - 1980年至2003年间全球前15大制药公司仅开发出5种抗菌药物,凸显新结构化合物需求紧迫性[5] 生成式人工智能在抗生素开发中的突破 - 研究团队开发生成式AI平台,通过基于片段的CReM方法和无约束的VAE方法设计新型抗生素分子[8] - 平台生成超过3600万种未记录抗菌活性化合物,从中合成24种化合物,7种显示选择性抗菌活性[8] - 两种先导化合物NG1和DN1对多重耐药菌株具杀菌效力,作用机制各异,在小鼠模型中杀菌速度超过万古霉素[8] 技术方法与创新应用 - 深度学习中的图神经网络(GNN)将化学结构表示为数学图,通过消息传递操作预测分子抗菌活性概率[6] - 生成式AI突破已知化学空间限制,理论化学空间包含约10^60种化合物,而最大计算机模拟库仅含10^11种[7] - 遗传算法与变分自编码器实现基于片段设计和从头设计,为探索化学空间未知领域提供平台[10][11] 研究成果与实验验证 - 先导化合物显著降低淋病奈瑟菌感染和耐甲氧西林金黄色葡萄球菌皮肤感染小鼠模型的细菌负荷量[8] - 化合物对人类细胞显示安全性,且对耐药菌株表现出独特作用模式[3][10] - 研究方法增强在化学空间中寻找候选抗生素的能力,为应对抗生素耐药性危机提供新武器[7][11]
NVIDIA英伟达进入自动驾驶领域二三事
自动驾驶之心· 2025-08-13 23:33
自动驾驶行业格局与Orin平台应用 - 英伟达Orin平台目前被众多明星车企采用,包括上汽R/智己、理想L9、蔚来ET7、小鹏新一代P7、威马M7、比亚迪、沃尔沃XC90等乘用车品牌,以及智加科技等自动驾驶卡车公司和Cruise/Zoox/滴滴/小马智行/AutoX等Robotaxi企业[2] - 软件公司Momonta等也基于Orin平台进行开发[2] 特斯拉与Mobileye的合作与分歧 - 2013年9月特斯拉宣布自研自动驾驶技术,但初期因缺乏芯片支持被迫与Mobileye合作[5] - 特斯拉在Mobileye方案基础上创新性增加Fleet Learning功能,实现Autopilot自我学习能力,这成为后来"影子模式"的雏形[9] - 2015年特斯拉成立Tesla Vision团队并挖角微软计算机视觉专家David Nister,引发Mobileye强烈反对[11][12] - Mobileye要求特斯拉停止自研算法否则断供技术支持,导致2015年双方矛盾激化[13] 英伟达切入自动驾驶领域 - 2012年黄仁勋认定电动汽车自动驾驶是英伟达在端侧最佳方向[15] - 2013年英伟达财报会议提出汽车业务应向自动化发展,强调GPGPU将赋能计算机视觉和驾驶辅助功能[17] - 2015年1月发布DRIVE品牌及PX平台,基于Tegra X1芯片和Maxwell GPU,算力超1 TOPS[18] - 2016年1月黄仁勋亲自向马斯克展示DRIVE PX平台[18] 特斯拉转向英伟达合作 - 2016年Mobileye因Autopilot事故终止与特斯拉合作[19] - 2016年10月特斯拉HW2.0采用英伟达DRIVE PX 2定制版,算力提升40多倍,支持8摄像头+12超声波雷达+1前向雷达的传感器方案[20] - 英伟达2016年初发布的DRIVE PX 2被黄仁勋称为"首款自动驾驶超级计算机"[21] 英伟达技术迭代与生态拓展 - 2017年底特斯拉公开自研芯片计划[25] - 同期英伟达加速产品迭代并拓展225家合作伙伴,涵盖车企/供应商/互联网公司/创业公司等[26] - 2018年CES发布DRIVE Xavier SoC平台,性能提升同时功耗显著降低[28] 特斯拉自研芯片进展 - 2018年马斯克承认英伟达硬件优秀但强调特斯拉需要独特定制方案[28] - 2019年4月发布自研HW3(FSD Computer),宣称图像处理能力达英伟达方案10倍[30] - 至此英伟达与特斯拉在智驾平台合作正式结束[32] 自动驾驶技术社区生态 - 行业已形成包含大模型/VLA/端到端/BEV/Occupancy/多模态融合等30+技术方向的学习路线[35] - 技术交流覆盖感知/仿真/C++开发/传感器融合等全链条环节[35]
OpenAI联合创始人Greg Brockman:对话黄仁勋、预言GPT-6、我们正处在一个算法瓶颈回归的时代
AI科技大本营· 2025-08-13 09:53
行业演进与公司发展 - 计算机行业正经历从个人魔法到工业革命的演进,OpenAI驾驭十万GPU集群标志着AI基础设施的成熟[3] - Stripe早期通过第一性原理突破传统限制,24小时完成银行需9个月的技术对接,体现硅谷创新精神[15][16] - OpenAI构建了研究-工程双引擎文化,工程能力与研究洞见同等重要,共同推动AGI发展[27][28][29] 技术突破与创新 - 深度学习从AlexNet开始颠覆传统规则,神经网络在多个领域超越人类设计的系统[24][25] - 强化学习(RL)和混合专家模型(MoE)成为解决算法瓶颈的关键方向,推动AGI研究进入新阶段[49][48] - Codex已贡献OpenAI内部10%代码合并请求,外部GitHub日处理24000个PR,重塑软件开发流程[42] 基础设施与硬件需求 - AI基础设施需兼顾高计算量任务与低延迟响应,催生专用加速器需求[45][47] - 模型规模扩大带来系统复杂性挑战,检查点机制和可靠性设计成为训练长周期智能体的关键[43][44] - 黄仁勋提出未来数据中心需支持多样化工作负载,包括多模态AI和实时交互系统[45][46] 产品化与生态发展 - AI产品化面临模型与产品的鸿沟,需结合领域专业知识构建垂直智能体生态[52][53] - GPT-4o图像功能5天获1亿用户,反映AI应用病毒式传播特性与规模化挑战[35][36] - 经济将因AI驱动产生10倍增长,医疗、教育等领域需定制化解决方案[54][55] 研发趋势与瓶颈 - 基础研究回归成为核心,算法瓶颈重新成为制约AGI进展的关键因素[49][50] - 当前研发受计算资源、数据、算法、电力等多维度限制,需动态平衡[49] - GPT-4暴露可靠性问题,显示AI需突破"隔玻璃观察"的学习模式[50][51]
超低标注需求,实现医学图像分割,UCSD提出三阶段框架GenSeg
36氪· 2025-08-12 03:24
医学图像分割技术 - GenSeg是一种用于训练语义分割模型的三阶段框架,通过数据增强模型与语义分割模型的紧密耦合,显著提升分割模型性能 [2] - 该技术可应用于不同分割模型如UNet和DeepLab,提升其在同数据集和跨数据集场景下的表现 [4] - 框架采用端到端训练方式,包含语义分割模型和掩膜到图像的生成模型两个核心组件 [9] 技术优势 - 在足部溃疡分割任务中,GenSeg-UNet仅需50张图像即可达到Dice分数0.6,相比传统UNet需要的600张减少12倍数据量 [13] - 在皮肤病变分割任务中,GenSeg-DeepLab使用40张ISIC图像即在DermIS测试集上达到Jaccard指数0.67,标准DeepLab使用200张图像仍未达到该水平 [13] - 胎盘血管分割任务中,GenSeg-DeepLab实现0.52 Dice分数,显著优于分离式策略的0.42 [15] 技术原理 - 采用三层优化框架:首阶段训练生成模型参数,次阶段生成合成图像-掩膜对训练分割模型,末阶段根据验证损失反向更新生成模型结构 [9] - 通过多层级优化过程直接以分割性能为目标生成高保真图像-掩膜对,确保合成数据质量与训练效果 [10] - 实验证明端到端优化机制优于分离式策略,且不依赖特定生成模型类型 [17] 应用效果 - 在11个医学图像分割任务和19个数据集上展现强泛化能力,涵盖多种疾病、器官与成像模态 [20] - 同域与跨域设定下均可带来10-20%绝对性能提升,训练数据量仅需现有方法的1/8到1/20 [20] - 支持3D数据分割任务扩展应用 [5] 行业影响 - 突破医学图像分割中标注数据稀缺的关键瓶颈,显著降低医生手工标注负担 [1] - 解决医疗领域数据隐私限制导致的超低数据困境,提升深度学习在数据匮乏场景的可行性 [1][10] - 研究成果发表于Nature Communications期刊,由加州大学圣地亚哥分校团队开发 [8]