Workflow
Deepseek R1
icon
搜索文档
AIoT行业专题
2025-09-28 14:57
AIoT 行业专题 20250926 摘要 端侧 AI 在推理成本大幅下降、模型性能持续提升以及模型竞争加剧的背 景下,其应用基础日益稳固。英伟达通过硬件升级和架构优化,显著降 低 AI 推理成本和功耗,并推出 Robin CPX GPU 以提升特定工作负载效 率。 Deepseek 通过架构创新,如稀疏 MOE 架构和注意力机制 MLA,有效 降低模型训练和推理成本。Deepseek R1 运用蒸馏技术,在保持性能 的同时,显著降低计算复杂度和存储需求,加速端侧 AI 落地。 端侧 AI 率先在 AR 玩具领域实现落地,因其对硬件设备和模型性能要求 相对较低。Yuran 创新推出的 AR 玩具 Bubble Popper 和 Coco Mate,市场反响良好,推动了端侧 AI 技术的应用。 IoT 行业整体景气度向上,云平台如涂鸦智能持续保持较高增长速度, 小米 IoT 业务也实现历史新高。中游及下游的良好表现预示着 ALT 行业 具有广阔的发展前景,而 ALT 是端侧 AI 的关键路径。 乐鑫科技作为全球领先的 WiFi MCU 供应商,营收持续超预期增长,传 统智能家居业务保持稳定增长,同时 AR 玩具 ...
Alibaba shares rise after it reveals new AI model, Qwen-3
Youtube· 2025-09-11 20:27
阿里巴巴AI模型进展 - 推出下一代AI模型Quen 3 宣称更高效率且降低计算成本 [1] - Quen 3为开源模型 类似深度求索的R1模型 [2] 中国AI芯片自主化趋势 - 阿里巴巴和BU开始采用自研芯片训练模型 减少对英伟达依赖 [2] - 中国AI自给自足能力持续提升 反映技术自主化趋势 [3] - 企业转向内部技术开发 规避美国芯片出口限制不确定性 [5] 中国科技板块表现 - Kweb ETF当日上涨2% 年初至今累计涨幅达40% [3] - 中国低成本高效能芯片开发预期升温 类似历史模式重现 [4] 行业竞争格局变化 - 中国AI模型构成对OpenAI和Anthropic等硅谷企业的竞争威胁 [2] - 除Quen 3外 竞品模型Kimmy K2同样值得关注 [5] - 中国AI领域竞争意识强化 打破美国主导预期 [4]
2025Agent元年,AI行业从L2向L3发展
2025-08-28 15:15
涉及的行业或公司 * AI行业 特别是人工智能代理(Agent)领域[1][5][17] * 涉及公司包括OpenAI、谷歌、Deepseek、Cursor、Devin、Metas、Salesforce、苹果、Manas、Genspark、Minimax等[1][4][16][18][19][21] 核心观点和论据 **技术发展推动Agent爆发** * 底层模型突破是Agent发展的关键 如Deepseek R1推理模型使Agent能执行复杂任务[1][6] * 模型在预训练、强化学习、推理能力、编程能力、多模态能力等多个维度有明显提升[3] * MCP(Multi-Context Processing)技术推出显著提升Agent能力 简化大模型与工具交互过程[3][9][11] * 底层模型成功率对任务执行至关重要 多步骤任务需高成功率保证最终结果[10] **市场需求驱动发展** * 从2022年底ChatGPT推出到2023年模型竞赛 市场一直在等待能带来生产力提升和降本增效的工具[1][3][7] * 早期AI应用如Chatbot未能达到预期效果 被视为"玩具"[7][8] * 2025年市场需要看到AI带来的实际降本增效、营收增长及客户满意度提升等明确效果[1][14] **产品类型与能力定义** * 主流Agent产品分为三类:编程类(Cursor、Devin)、研究型(谷歌、OpenAI的Deep Research)、综合性应用(Metas)[4] * 真正意义上的Agent产品需具备五项核心能力:对话能力、推理能力、长记忆能力、调用工具能力以及规划能力[15] * 目前多数Agent仍处于半自动状态(human in the loop) 完全自动化产品失败率较高[15] **发展阶段与重要性** * Agent处于L3阶段 具备聊天、推理及动手能力 是从L2到L4的重要过渡环节[1][5] * Agent不仅是效率提升工具 更是通往AGI的关键环节 会影响未来互联网流量入口格局[5][18] 其他重要内容 **开源生态影响** * 开源生态通过MCP等技术降低开发门槛 促进技术共享与创新 加速行业发展[1][9] **竞争格局差异** * 垂直型Agent因聚焦单一领域而落地更快 工作流明确且高频重复 已签约大客户并带来收入增长[20][25] * 通用型Agent目前成功率较低且缺乏明确商业场景 但代表未来竞争方向 是用户流量入口[20] * 科技巨头将在通用型Agent领域展开激烈竞争 初创公司可能面临闭源模型API服务停止的风险[24] **资源消耗与成本** * Agent普及将大幅增加tokens消耗 完成一个任务通常需要多个步骤 每个步骤都需消耗大量tokens[19] * 一些人工智能服务如Manas、Genspark、Minimax等 完成一个任务约需10元人民币[19] * 智能体目前消耗大量tokens成本 而订阅费用与成本之间存在错配问题[24] **投资建议与市场展望** * 未来几年AI智能体将围绕工具调用、规划、记忆及可靠性迭代 垂直领域智能体先行落地[2][26] * 长期配置平台巨头 关注足够垂直且壁垒深厚的玩家[2][26] * 行业估值可能回归理性 有利于长期健康发展[27]
MiniMax闫俊杰:AI领域会多玩家共存,成本也会更可控
21世纪经济报道· 2025-07-26 15:44
行业竞争格局 - 年初Deepseek R1开源模型引发行业震动,几乎成为所有下游AI应用厂商的选择,部分资本市场人士认为大模型战争已结束 [1] - MiniMax CEO闫俊杰认为AI领域将维持多玩家并存格局,不同模型因对齐目标差异而具备独特优势(如程序员能力、情商对话、想象力等)[2] - 开源模型影响力持续扩大,最佳开源模型性能已逼近闭源模型,例如月之暗面Kimi K2在代码和Agent任务能力上接近OpenAI/Anthropic水平 [3] 技术演进趋势 - MiniMax推出全球首个开源大规模混合架构推理模型MiniMax-M1,在长文本处理任务中计算量仅为DeepSeek R1的25% [4] - 模型优化带来显著成本优势:8万Token深度推理时算力需求为竞品30%,10万Token生成时仅需25%算力 [4] - 行业算力增长未导致模型规模同比扩张(如Kimi K2总参数1T,激活参数32B),因公司需平衡参数量与计算速度 [4] 成本与需求动态 - 未来1-2年顶级模型的推理成本可能再降一个数量级,单模型训练成本不会显著增加 [5] - 算力消耗呈指数级增长:单个对话Token消耗从几千增至几百万,因AI解决更复杂问题且用户基数扩大 [5] - 混合架构技术(如闪电注意力机制)推动效率提升,使模型在保持性能同时降低资源需求 [4]
各方关于H20的观点
傅里叶的猫· 2025-07-16 15:04
H20芯片库存与生产情况 - 大摩预计H20芯片库存可达100万片 其中成品芯片库存约70万个 需采购1万片CoWoS-S晶圆进行封装 KYEC可能额外提供20-30万个芯片 [1][2] - JP Morgan预测H20初期季度需求高达100万个 主要受中国AI推理需求驱动且无替代产品 库存可能在一个季度内消耗完毕 [3][4] - 瑞银估算H20销售额将达130亿美元 按每台1.2万美元均价计算对应销量略超100万台 销量恢复比例或达15%-20% [5][6] - Jefferies推测现有H20库存约55-60万个 基于150亿美元收入损失推算 后续将推出采用GDDR6内存的降级版本 [7] 市场需求与行业动态 - JP Morgan指出H20需求旺盛源于中国AI推理市场及客户提前下单行为 与2025年Q2 Deepseek R1的60万需求形成对比 [3] - 瑞银提到中国市场占英伟达数据中心销售额百分之十几 H20出口放宽将支撑下半年业绩 GB200产能提升及GB300量产将推动增长 [5] - Jefferies透露美国可能重新引入数据传输速度限制 HBM3内存的H20将停产 转向GDDR6版本 [7] 行业信息与资源 - 英伟达B系列服务器已在国内开放样品订单 接受行业客户咨询 [8] - 行业研究平台持续更新投行数据及关键信息 提供网盘资源整合服务 [10]
中信建投|下半年展望,寻找确定性与预期差
2025-06-19 09:46
纪要涉及的行业和公司 行业:A股市场、内需消费、有色金属、医药生物、金融、公用事业、煤炭、人工智能、人形机器人、创新药、新消费 纪要提到的核心观点和论据 - **弱美元周期显现及影响**:美元走势脱离利差框架且美国财政赤字扩大,预计2026年赤字率恶化至7%,2023 - 2024年或恶化至7.8%,弱美元成重要宏观背景;过去三段弱美元时期A股宽基指数上涨,消费风格最佳,内需消费、有色金属、医药生物和金融行业表现不错[1][2][4] - **资本市场新政策周期利好**:2024年9月以来出台多项利好政策,央行互换工具操作规模达1050亿,回购操作贷款上限总额达1374亿,合计约2400亿,为市场提供底部修复流动性支持[1][5] - **全球流动性宽松影响A股**:全球三大央行M2同比增长与A股走势相关,2019 - 2021年宽松推动A股牛市,2022年转负致熊市,2024年8月M2转正、9月美联储降息,开启新一轮牛市[1][6] - **全球货币政策处于宽松周期**:美联储短期暂停降息但周期未结束,2025年可能继续降息两次;欧洲央行多次降息,中国央行明确降准降息方向[1][7] - **外资态度转变**:外资从看空中国转向加仓,源于对中国财政和货币政策的信心、科技硬资产崛起、美国形象受损及中国软实力提升[3][8][9] - **下半年市场预期差**:外需可能不疲弱,通胀削减法案或提振美国需求;中美贸易战可能停战或修复;增量财政政策加码发力,结构性政策有望年中落地[3][11] - **下半年市场走势**:预计先震荡后向上,震荡中枢逐步上移,当前因基本面制约震荡,未来受弱美元、政策支持和流动性改善推动[12] - **市场向上突破因素**:全球基本面超预期改善、国内增量政策落地、新兴产业突破性发展,如人工智能、人形机器人、创新药、新消费等[13][16] - **A股中长期展望**:使用择时指标预测全A未来三年年化回报为8.64%,权益资产性价比高,建议维持60%中长期仓位配置,大趋势震荡上行[14] 其他重要但是可能被忽略的内容 - 2025年全年A股业绩增速预测年底仅零增长左右,全A剔除金融、石油、石化后的业绩增速可能负增长[12] - 市场存在对出口订单需求减弱、经济通缩、财政和货币政策乘数效应不足等悲观预期[10][11]
自主可控加码,AI硬件加速落地 | 投研报告
中国能源网· 2025-06-09 01:30
东吴证券近日发布电子行业中期策略:Fab厂资本开支增速放缓,建议关注国产测试线 表现及国产HBM扩产。两存扩产接近顶峰,SMIC25年资本开支持平,今年一线fab厂资本开 支增速明显下滑。在资本开支绝对值预期内背景下,半导体设备的国产化率提升重要性提 升,先进制程的国产测试线表现尤为重要。此外,国产HBM的扩产也落在预期外,值得期 待。 以下为研究报告摘要: 投资要点 H1业绩改善显著,H2旺季加速复苏。25Q1电子行业A股上市公司营收合计为8595亿 元,同比+18%;归母净利润为366亿元,同比+30%。25Q1营收淡季环比24Q4旺季仍有增 长,复苏态势明确。我们认为随着下半年旺季叠加库存去化结束,电子行业有望持续复苏。 从细分板块来看,25Q1功率、模拟半导体持续复苏,我们认为主因下游经过两年的库存, 库存水平已到达较低水平。同时价格亦在底部企稳。而数字IC由于AI需求,营收利润增长 强劲,同环比均有20%左右增速。下半年传统旺季来临,其余板块亦有望再添复苏动力。同 时,工业、汽车领域或将迎来复苏。从库存端看,25Q1,电子板块的存货合计为6787亿 元,环比+9%,整体存货略有提升。从盈利端看,考虑 ...
四月游戏收入同比增长超20%,游戏ETF(516010)涨超3%
每日经济新闻· 2025-06-03 03:01
中国游戏市场规模 - 2025年4月中国游戏市场规模达273.51亿元,同比增长21.93% [1] - 移动游戏同比增长28.41%,出海收入同比增长9.62% [1] Deepseek R1技术进展 - R1在AIME2024和LiveCodeBench测试中超越o3和Gemini 2.5 Pro,较旧版提升15% [1] - 推理能力蒸馏至Qwen3-8B小模型,数学测试结果较蒸馏前高10% [1] - 文字理解和创作能力提升:改写润色、总结摘要、阅读理解的幻觉率降低45%-50%,长篇写作和角色扮演能力增长明显 [1] 人工智能与游戏行业结合 - 人工智能持续发展有望提振游戏板块,游戏是成熟的人工智能应用领域 [1] - 大语言模型可能催生新玩法,例如剧本编写:通过提纲生成剧本并优化调优 [1] - 未来或通过大语言模型赋予游戏人物独立人格,使其在虚拟世界中自主行动 [1]
国泰海通|电子:Deepseek R1更新,商业场景拓展加速
Deepseek R1模型性能升级 - 深度思考能力对标国际顶尖模型OpenAI-o3和Gemini-2-5-Pro-0506 在数学、编程与通用逻辑等多个基准测评中整体表现接近[3] - 蒸馏训练性能显著提升 基于Deepseek-R1-0528思维链训练的Qwen3-8B Base模型在AIME2024数学测试中性能仅次于原模型 与Qwen3-235B相当[3] - 幻觉率降低45-50% 在改写润色、阅读理解等场景表现优化 同时支持议论文、小说等文体的长篇内容生成及工具调用[3] 商业化应用前景 - 性能迭代有望提升用户渗透率和使用频次 带动国产算力产业链需求增长[4] - 蒸馏模型在端侧设备表现优异 加速大模型在手机、PC、眼镜等终端设备的落地应用[4] 行业影响 - 模型更新被视为行业催化剂 推动国产大模型技术持续迭代[5] - 技术突破可能重塑AI赋能终端设备的竞争格局[4]
Openai重回非营利性 商业路之殇
小熊跑的快· 2025-05-06 10:37
OpenAI组织架构调整 - OpenAI宣布将保持慈善组织身份,并将营利性子公司转型为公益公司(PBC),非营利组织作为大股东控制PBC [1] - 此次调整强调公司的非营利性定位,与2023年人事动荡中关于商业化与安全性的争议有关 [1] - 前首席科学家Ilya Sutskever因反对过度商业化离职,其新项目SSI估值达200亿美元,而OpenAI当前估值3000亿美元 [1] 开源与闭源之争 - 行业质疑OpenAI闭源商用模式的可持续性,原预计2026年面临挑战,但开源模型的快速追赶使压力提前 [1] - Llama4、Deepseek R1等开源模型性能已接近GPT-4初代水平,代际差距缩短至14个月以内 [1][2] - Claude 3.5/3.7凭借开放态度和API调用便利性在亚洲市场占据优势 [2] 商业化与竞争格局 - OpenAI的API定价比竞争对手(R1、豆包)高一倍多,而最新季度行业API调用量环比增长4-5倍 [3] - 云计算厂商大力推广其他基础模型,性价比优势对OpenAI形成冲击 [3] - 苹果未投资OpenAI,反映市场对基础模型商业化前景的谨慎态度 [2] 行业技术发展 - 开源模型通过社区生态加速迭代,投资者更倾向支持可延展开发的平台 [2] - 模型代际追赶速度超预期,开源阵营已接近2024年初GPT-4水平 [1][2]