深度学习
搜索文档
2025航空行业报告:360亿方智能航空AI白皮书
搜狐财经· 2025-11-22 05:11
深度学习与大语言模型专利格局 - 深度学习技术自2011年成型以来,已累计产生超过31万个专利族,其专利申请增速从早期的近50%放缓至2019-2023年的复合年增长率16% [2] - 2023年中国贡献了全球80%的深度学习专利申请,但在国际专利族指标上,中国占比40%,美国占比35%,显示出美国更强的全球布局意识 [2] - 大语言模型专利自2020-2021年起快速涌现,目前已积累约6,000个专利族,2022年ChatGPT的发布推动专利活动进入指数增长阶段 [4] 主要国家与企业竞争态势 - 百度以6,751个深度学习专利族位居全球第一,腾讯、平安科技、国家电网等中国企业位列前十,而美国企业如谷歌、微软、IBM、英伟达在国际专利族数量上优势明显 [3] - 大语言模型领域的创新主要由产业界推动,学术机构占比仅为21%,谷歌、百度、腾讯、微软、阿里巴巴五家企业几乎主导了整个领域的专利布局 [4] - 美国呈现多元化且去中心化的创新格局,而中国形成由百度主导、顶尖高校支持的集中式生态系统 [17] 技术应用与商业化趋势 - 大语言模型十大应用领域中,内容生成、聊天机器人、医疗健康、法律应用与情感分析位居前列,医疗领域在疾病诊断、药物研发与个性化医疗方面展现出突破潜力 [5] - 谷歌、百度、微软、腾讯和阿里巴巴在绝大多数应用类别中均处于专利申请领先地位,展现出全面的技术生态战略 [5][18] - 深度学习技术从“幻灭低谷期”跃升至“生产力成熟期”,大语言模型驱动的生成式人工智能从“创新触发阶段”发展到“期望膨胀期”的后期阶段 [20][22] 未来发展与战略影响 - 专利布局已成为企业构建技术壁垒、抢占市场先机的核心手段,中美两国在基础研究、产业应用与国际扩展方面的差异化策略将持续影响全球AI创新格局 [6] - 随着计算效率提升与数据质量优化,大语言模型正迅速适应市场需求,并在金融、教育、网络安全等多个行业中发挥变革性作用 [18] - 大语言模型通过包含数十亿甚至数万亿参数的庞大数据集训练,正在重新定义数据处理的边界 [23]
图灵奖得主竟「忘了提及」中国学者成果?马库斯重锤Yann LeCun
36氪· 2025-11-19 11:19
核心观点 - 文章围绕Yann LeCun可能离开Meta以及其与Gary Marcus的学术争议展开,核心是AI领域关于技术路线(LLM vs 世界模型)和学术贡献(CNN发明权)的激烈辩论 [1][5][6][8] Yann LeCun的观点与立场 - Yann LeCun是图灵奖得主,Meta首席AI科学家,但公开反对大语言模型,认为LLM是死胡同,未来3到5年会被淘汰,其智商不如猫 [1][29][31] - 主张发展“世界模型”,该模型通过观察视觉信息来理解世界,类似于人类婴儿的学习方式 [31][32] - 在Meta内部被边缘化,其领导的FAIR实验室面临裁员和资源缩减,28岁的Alexandr Wang被提拔为其上司 [40][41][43][45] - 计划离开Meta并创立新公司,专注于开发“世界模型” [26][31][47] Gary Marcus的批评与指控 - Gary Marcus是认知科学家,深度学习的长期批判者,认为LLM存在幻觉问题,无法真正理解,且难以通向AGI [6][8] - 指控Yann LeCun的学术成就存在包装和剽窃,并非CNN的发明者 [5][9][10] - 指出CNN的基础工作由日本学者福岛邦彦在1979年完成,中国学者张伟等人在1988年早于LeCun将反向传播应用于CNN训练 [11][21][22][23] - 批评LeCun在LLM问题上的立场转变,指其在ChatGPT成功前曾赞扬LLM,之后才转变为反对者,是见风使舵 [23][24] - 认为“世界模型”概念并非创新,早在1950年代由赫伯特·西蒙等人提出,LeCun是旧概念新包装 [26][27] 学术争议背景 - Jürgen Schmidhuber是另一位长期指控深度学习巨头抄袭成果的研究者,并专门撰文质疑2018年图灵奖的颁发 [14][16][19] - Schmidhuber指出张伟等人于1988年以日文发表、1989年4月提交期刊的CNN研究,早于LeCun1989年7月发表的英文论文 [21][22][23] - 争议焦点在于LeCun通过英文论文在知名平台发表,但未充分引用前辈工作,被指责系统性抹杀同行贡献 [23][28]
字节将中国电商、生活服务、中国广告工程技术团队整合为“中国交易与广告”部门
每日经济新闻· 2025-11-18 08:23
公司组织架构调整 - 字节跳动于11月17日将中国电商、生活服务和中国广告的工程技术团队整合,成立“产品研发与工程架构-中国交易与广告”部门 [1] - 此次调整仅涉及工程技术团队,旨在加强广告与交易业务的研发建设,提升研发效率 [1] - 新成立的中国交易与广告部门由抖音生服技术负责人王奉坤负责 [1] 业务与技术整合 - 中国交易与广告部门将基于个性化推荐、深度学习和大模型技术,依托抖音、今日头条、西瓜视频、番茄小说等多元产品 [1] - 该部门的核心任务是构建抖音电商、生活服务、广告营销等核心营收业务的算法策略和工程架构 [1]
Nature全新子刊上线首篇论文,来自华人团队,AI加持的可穿戴传感器,突破手势识别最后难关
生物世界· 2025-11-18 04:05
技术突破概述 - 加州大学圣地亚哥分校团队开发出基于深度学习的抗运动干扰人机交互界面 即使在剧烈运动环境下也能实现精准手势识别和机械臂控制[3] - 该研究发表于Nature新子刊Nature Sensors 是该期刊首篇论文[3] 运动干扰挑战 - 传统可穿戴惯性测量单元(IMU)在真实世界应用中受到运动伪影严重干扰 可能来自行走、跑步或交通工具振动[7] - 运动干扰可能与手势信号频率相似或幅度更大 从而淹没手势信号 且在不同个体间存在差异[7] 传感器系统设计 - 传感器系统集成六通道IMU、肌电信号(EMG)模块、蓝牙微控制器单元和可拉伸电池 尺寸仅为1.8×4.5 cm² 厚度2毫米 拉伸性超过20%[9] - 采用四层设计:第一层电池经过60次充放电循环后仍保持约25mAh容量 库仑效率接近100% 第二层包含EMG信号采集模块 使用三层电极结构[9] - 第三层集成IMU和蓝牙单元 蓝牙信号在20米距离内保持稳定 连续运行30分钟最高温度仅27.7°C 佩戴1小时皮肤温度稳定在34.5°C[9] 深度学习算法性能 - 基于LeNet-5的卷积神经网络(CNN)在复合数据集测试中表现最佳 召回率大于0.92 精确度大于0.93 F1分数大于0.94 特异性大于0.99[12] - CNN架构包含三个卷积层、三个最大池化层和三个全连接层 训练准确度收敛至接近1 损失接近0 确认无过拟合问题[12] 个性化迁移学习 - 应用基于参数的迁移学习增强模型泛化能力 仅需每个手势2个样本(坐姿和躺姿各一个)即可将19种手势最小识别准确度从51%提升至92%以上[14] - 数据收集时间从约2分钟大幅减少到约6秒 学习率从0.01调整至0.001进行微调[14] 实时控制性能 - 采用滑动窗口机制(窗口长度1秒 滑动步长0.25秒)实现连续手势识别 蓝牙传输延迟约1毫秒 CNN模型预测时间约1毫秒[16] - 机械臂在接收到三个连续相同预测(约3毫秒)后275毫秒内响应执行动作 在跑步机运动场景下仍能精确控制[16][18] 水下应用拓展 - 系统经Scripps海洋-大气研究模拟器训练后 在叠加海浪干扰的IMU信号测试中召回率、精确度、特异性和F1分数均接近1[20] - 海水环境可降低电极-皮肤阻抗 增强EMG信号质量 已成功应用于潜水员控制水下机器人进行目标跟踪、海洋数据收集等任务[20]
文本转语音技术行业研究报告(附行业政策、产业链全景分析、竞争格局及发展趋势预测)
搜狐财经· 2025-11-18 03:37
行业定义与核心价值 - 文本转语音技术是一种将文字内容转换为自然流畅语音信号的技术,其核心价值在于打破信息传递的媒介限制,实现人机交互 [10] - 技术工作原理涵盖文本预处理、波形培育等关键环节 [11] 市场规模与发展现状 - 2024年中国文本转语音技术行业市场规模达到187.6亿元,同比增长22.77% [4][7][12] - 技术已从早期机械模拟演进为能生成接近人类水平自然度的智能系统,在语音助手、有声读物、无障碍辅助等传统领域及虚拟主播、个性化语音定制等新兴场景中应用广泛 [4][7][12] 产业链结构 - 产业链上游为核心硬件、算法框架与基础设施支持 [6][10] - 产业链中游为技术核心环节 [6][10] - 产业链下游应用领域包括教育、金融、医疗、媒体等 [6][10] 下游应用深化 - 网络视听行业是重要下游应用领域,2024年中国网络视听用户规模达10.91亿人,同比增长1.58% [6] - 网络视听内容创作者利用文本转语音技术生成语音解说,与视频结合制作高质量多媒体内容 [6] 企业竞争格局 - 行业呈现“国际技术引领,国内场景深耕”格局,国际企业如Google、微软凭借技术领先性占据高端市场 [7] - 国内主要企业包括科大讯飞、百度、云知声、腾讯、网易有道等,在中文场景和垂直应用中具备优势 [7][15] - 未来竞争将围绕边缘计算部署、多模态交互及伦理安全技术展开 [7] 未来技术趋势 - 大模型与深度学习深度融合将推动技术从“能发声”向“会表达”跨越,聚焦拟人化质感与长场景适配能力升级 [8] - 多模态融合成为核心发展路径,与文本、图像、视频生成等技术协同构建全链路内容生产生态 [8] - 政策监管与行业自律将持续加强,推动市场向规范化、标准化发展 [8]
从印度二本到Meta副总裁,被世界拒绝15次的他,撑起AI时代地基
36氪· 2025-11-17 04:20
PyTorch发展历程 - 2017年正式开源,其前身Torch7曾因无人使用且看不到收益而多次面临被管理层砍掉的危机[8][9] - 开源一年内被全球顶尖实验室采用,成为深度学习研究主流工具,论文数量爆炸式增长[10] - 到2021年,PyTorch在谷歌上的搜索量反超TensorFlow,达到其1.8倍[17] - 2018年Facebook宣布推出PyTorch 1.0,标志其从研究工具升级为可支撑生产级别部署的工业级框架[19] 行业影响与市场地位 - 在NeurIPS、ICML、CVPR等顶级学术会议上,超过70%的论文选择PyTorch作为实现框架[19] - Hugging Face平台显示PyTorch已成为AI研究者最常用框架,TensorFlow市场份额快速缩小[21] - OpenAI的GPT系列、Stability的生成模型、Anthropic的Claude等顶级AI模型均依赖PyTorch生态[26] - 社区从几十人扩展到全球数十万开发者,渗透至课堂、课程和科研机构[21] 产品技术优势 - 采用更灵活架构和更友好接口,让研究者能够边写边改并实时调整实验模型[17] - 相比TensorFlow更注重灵活性和直觉性,使机器学习过程更具创作自由[17] - 开源特性使其成为"所有人都能用、所有人都能改"的框架[28] 团队与领导背景 - 创始人Soumith Chintala出身印度普通家庭,曾被美国12所大学拒绝,DeepMind拒绝其三次[1][4] - 以J-1签证赴美后从亚马逊测试工程师起步,后加入Facebook AI Research担任L4级工程师[4][5] - 在FAIR工作期间通过解决ImageNet任务中的数值与超参数错误展现技术能力[5] - 最终晋升为Meta副总裁,成为AI社区最受尊敬的工程师之一[10][23]
我国研发的微观世界“超级相机”成功验收;三星宣布未来五年内将在韩国进行450万亿韩元投资丨智能制造日报
创业邦· 2025-11-17 03:06
半导体产业投资与布局 - 三星集团宣布未来五年内在韩国进行总额450万亿韩元的投资,重点涵盖研发及半导体领域[2] - 三星电子计划在平泽园区启动第五座工厂(P5)的结构施工,该工厂预计自2028年起全面投产,以提前布局产线应对全球存储半导体的中长期需求增长[2] - 三星集团维持在未来五年内创造6万个新工作岗位的目标[2] 半导体材料与技术进展 - 芯联集成发布全新碳化硅G2.0技术平台,通过优化器件结构与工艺制程,实现高效率、高功率密度、高可靠的核心目标[2] - 该技术平台全面覆盖电驱与电源两大应用场景,可应用于新能源汽车主驱、车载电源及AI数据中心电源等市场[2] 前沿计算技术突破 - 芬兰阿尔托大学领导的研究团队开发出新方法,可利用单次光传播完成复杂张量运算,实现以光速完成深度学习中的关键计算步骤[2] - 该技术被视为向通用人工智能硬件研制迈出的重要一步,为突破现有计算平台性能瓶颈提供了新路径[2] 高端科研仪器进展 - 我国首台高能直接几何非弹性中子散射飞行时间谱仪成功验收,该设备致力于观测物质微观世界的结构与动力学性质[2] - 该谱仪填补了我国在百毫电子伏以上非弹性中子散射领域的空白[2]
内行被外行指导、时刻担心被裁,Meta 人现在迷茫又内卷
AI前线· 2025-11-16 05:33
核心事件概述 - Meta首席人工智能科学家Yann LeCun计划在未来几个月内离职并创办AI初创企业[2] - 新公司方向将聚焦于世界模型的研究与落地[7] - LeCun在Meta的纽约大学兼职教授职位将保持不变[2] Meta AI战略转向 - 公司AI战略重心从LeCun领导的FAIR实验室的长期基础研究转向快速推出模型和AI产品[2][4] - 核心AI研究部门FAIR经历裁员其影响力被专注产品落地的GenAI团队/TBD Lab取代[4] - 组织调整导致LeCun被要求向TBD Lab负责人Alexandr Wang汇报[4] LeCun与Meta的分歧 - LeCun对Meta新出台的内部研究发表规定不满认为其限制了学术自由[4] - 在AI技术路线上存在分歧LeCun认为大模型无法实现人类级智能而致力于世界模型研究[4][5][10] - LeCun公开撇清与Llama 2/3/4项目的关系称自2023年初以来均由GenAI团队开发[5] - 政治立场分歧可能加剧紧张关系LeCun批评美国政府而公司政策向特朗普阵营靠拢[5] Meta内部管理问题 - AI部门存在恐惧文化绩效评估制度与滚动裁员机制导致员工为害怕被炒而工作[18] - 生成式AI战略缺乏方向部门职责不断叠加导致内部冲突和模糊目标[18][19] - 项目管理采用倒排工期方式为赶工期而牺牲产品质量基于技术判断的叫停难以实现[15] - 高层管理者多为基础设施或传统计算机视觉背景对大语言模型缺乏深入理解形成外行指导内行局面[14] 行业竞争与影响 - Meta的Llama 4模型表现不佳落后于GoogleOpenAI和Anthropic的最新产品[4] - 公司AI聊天机器人未能在消费者中获得认可[4] - 扎克伯格暗示明年AI投入可能突破1000亿美元后公司股价暴跌12.6%市值蒸发近2400亿美元[13] - 大模型时代算力成为决定性因素资源博弈导致公司整体氛围不如以前轻松愉快[13]
沪深300增强超额收益领先市场
财通证券· 2025-11-15 08:34
核心观点 - 报告基于深度学习框架构建了AI体系下的低频指数增强策略,该策略通过组合优化勾连深度学习alpha信号与风险信号,构建了针对沪深300、中证500和中证1000的指数增强组合 [3][16] 本周市场指数表现 - 截至2025年11月14日当周,主要市场指数普遍下跌:上证指数下跌0.18%,深证成指下跌1.40%,沪深300指数下跌1.08% [5][8] - 创业板指和科创50指数跌幅较大,分别为3.01%和3.85%;中证2000指数和万得微盘股指数逆势上涨,涨幅分别为0.89%和4.11% [9] - 行业表现分化显著:综合、纺织服饰、商贸零售行业表现较好,周收益率分别为6.99%、4.41%、4.06%;通信、电子、计算机行业表现较差,周收益率分别为-4.77%、-4.77%、-3.03% [9] - 万得微盘股指数今年以来累计上涨80.18%,表现突出 [9] 指数增强基金绩效 - 截至2025年11月14日当周,不同宽基指数增强基金的超额收益中位数分别为:沪深300指数增强基金0.24%,中证500指数增强基金0.32%,中证1000指数增强基金0.03% [5][12] - 今年以来,中证1000指数增强基金的超额收益中位数最高,达7.53%,显著高于沪深300的1.85%和中证500的2.83% [13] - 中证1000指数增强基金今年以来的超额收益最大值达到19.24% [13] 跟踪组合表现(AI低频指数增强策略) - 策略核心方法:利用深度学习框架构建alpha和风险模型,alpha维度通过多源特征集合和堆叠多模型策略生成信号,风险维度利用神经网络寻找长期IC均值为0且高R方的风险信号,组合周度调仓,约束周单边换手率10% [16] - **沪深300指数增强组合**:截至2025年11月14日,今年以来组合上涨28.5%,超越基准指数17.6%的涨幅,超额收益为10.9%;当周组合上涨0.1%,而基准指数下跌1.1%,超额收益为1.2% [5][20];全样本历史年化超额收益为13.8%,月度胜率达78.0% [21] - **中证500指数增强组合**:截至2025年11月14日,今年以来组合上涨35.0%,超越基准指数26.4%的涨幅,超额收益为8.6%;当周组合下跌0.2%,而基准指数下跌1.3%,超额收益为1.1% [5][25];全样本历史年化超额收益为16.9%,月度胜率达79.3% [26] - **中证1000指数增强组合**:截至2025年11月14日,今年以来组合上涨41.7%,超越基准指数25.9%的涨幅,超额收益为15.8%;当周组合上涨0.5%,而基准指数下跌0.5%,超额收益为1.0% [5][31];全样本历史年化超额收益为24.1%,月度胜率达86.6%,表现最为优异 [32]
易思维科创板IPO:打破国际垄断,国产机器视觉“驶”入新赛道
证券时报网· 2025-11-14 13:31
公司上市进展 - 易思维科创板上市申请将于2025年11月21日接受上交所上市审核委员会审议 [1] 市场地位与份额 - 公司是中国汽车制造机器视觉赛道龙头企业,市场份额稳居第一 [2] - 2024年在中国汽车制造与整车制造领域的市场份额分别达到13.7%和22.5%,超越伊斯拉、伯赛等国际企业 [2] 研发与技术实力 - 研发团队共251人,占员工总数45.89%,本科及以上学历员工近九成 [3] - 累计研发投入超过3亿元,形成22项核心技术模块 [3] - 共获得119项软件著作权、387项国内外专利技术,其中200项为发明专利 [3] - “高质量汽车制造视觉检测成套技术及应用”项目经鉴定整体达国际先进水平,部分核心技术达国际领先 [3] 产品应用与客户覆盖 - 产品已系统化应用于冲压、焊装、涂装、总装、电池、压铸六大汽车工艺环节 [4] - 客户包括一汽-大众、广汽丰田、比亚迪、蔚来、小米、小鹏等主流品牌 [4] - 产品出口至沃尔沃、Rivian等海外车企全球工厂,并进入比亚迪、奇瑞等国产龙头的海外生产基地 [5] 新业务拓展 - 拓展轨道交通市场,研发列车轮对检测、受电弓检测等系统,已在多地地铁和铁路局成功交付 [5] - 截至今年6月底,轨交运维产品在手订单额达2923.35万元 [5] - 在航空领域实现产品落地,为成长注入新动能 [5] 财务业绩表现 - 近三年营业收入分别为2.23亿元、3.55亿元、3.92亿元,年均复合增长率32.59% [6] - 近三年净利润分别为538.69万元、5774.67万元和8433.17万元,年均复合增长率达295.66% [6] 行业前景与政策环境 - 机器视觉作为智能制造核心支撑迎来政策红利,如“科技十六条”、“科创板八条”等 [7] - 行业处于技术升级和市场扩容的历史交汇点,人工智能和深度学习持续赋能 [7] - 下游应用场景不断拓展,在工业、轨道、航空等多元领域应用前景广阔 [7]