Workflow
DeepSeek系列大模型
icon
搜索文档
杭州的野心不止于成为“下一个硅谷”
AI研究所· 2025-11-27 09:04
杭州作为AI开源生态枢纽的核心观点 - 英伟达创始人黄仁勋评价杭州为“中国硅谷”,全球科技界关注该城市[1] - 魔搭社区开发者中心在杭州启用,该社区是国内最大AI开源社区,汇聚12万个开源模型,服务全球2000万开发者[3] - 杭州通过“政策赋能+场景牵引+生态协同”的独特路径,在全球AI开源领域走出与硅谷不同的差异化道路[17][24] 政策支持优势 - 杭州发布《加快建设人工智能创新高地实施方案》,提供4年10亿元算力券大礼包,企业购买算力、模型服务最多可获六成补贴[7] - 配套“AI开源政策包”提供市级、区级联动政策,包括一次性项目奖励、算力补贴、安家费及办公房租装修补贴[7] - 企业、高校或科研机构建设AI开源服务平台,实际投入超500万元且促进产业发展,可按软硬件投入30%获得补助,最高500万元[10] - 政府要求国企优先采用基于开源大模型的解决方案,通过“杭州AI+”场景开放工程发布机会清单和能力清单[11] 产业生态优势 - 杭州形成“高校研发+企业转化+社区协同”完整链条:浙江大学、西湖大学、之江实验室提供研发支持;阿里、DeepSeek等企业负责技术转化;魔搭社区聚集人才[13] - DeepSeek系列大模型选择在魔搭社区首发,并登上全球最大开源社区Hugging Face[13] - 魔搭开发者中心配备数据服务、硬件开发等公共平台,解决初创企业“缺数据、缺算力”问题[14] - 魔搭社区坚持开放中立运营模式,模型由创作者自主上传,平台不干预,已汇聚超12万个开源模型、5500+MCP服务和调试工具[15] 城市基因与发展成果 - 杭州自2002年取消西湖景区门票,将“用开放换生态”思路应用于AI开源领域[15] - 魔搭社区创空间模块有近2.3万个AI应用,覆盖超20个行业,其中约95%由个人开发者创建[15] - 截至2025年底,杭州目标实现人工智能核心产业营业收入超3900亿元,规模以上核心产业企业超700家,智能算力服务规模超50EFLOPS[17] - 通过“杭州AI+”场景开放工程,将城市治理、工业生产、医疗服务、景区服务等领域需求梳理清楚,如西湖景区已应用AI文旅推荐智能体[19] 与硅谷的差异化比较 - 技术路线:硅谷走“闭源垄断”道路,头部企业封闭核心技术;杭州选择“开源普惠”模式,魔搭社区公开源代码供开发者自由使用修改[24] - 应用逻辑:硅谷AI专注于底层技术突破和高端市场;杭州AI开源更接地气,专注于解决实际问题[24] - 生态构建:硅谷资源围绕头部企业集中;杭州以开发者为核心,政府、企业、高校共同服务开发者,魔搭社区95%应用由个人开发者创建[25]
能源局推进,14家央企加入,“AI+光伏”大有可为!
搜狐财经· 2025-10-08 03:26
政策导向与行业趋势 - 国家发展改革委、国家能源局下发实施意见,推进人工智能与能源高质量发展,特别提出人工智能+新能源典型应用场景[1] - 政策要求加快在高精度功率预测、电力市场、场站智慧运营等方向的人工智能应用,推动新能源关键材料及产品迭代创新[1] - 目标在于打造“气象预测+功率预测+智慧交易+智能运维”一体化新能源智能生产模式,支撑新能源稳定供给[1] - 以DeepSeek系列为首的人工智能大模型正以惊人速度渗透到能源等核心产业领域[2] 能源央企AI平台部署进展 - 国家电网、南方电网、国家能源集团等十余家能源电力央企已完成旗下AI平台与DeepSeek大模型的接入[2] - 国家电投集团中央研究院完成DeepSeek模型本地化部署,研发科技情报助手并上线试运行,为30多名科研人员提供服务[3][7] - 中国华能完成DeepSeek系列模型本地化部署,推出“睿智小能”AI助手并与移动门户集成,部署版本包括671B千亿参数级模型[3][9] - 南方电网人工智能创新平台完成DeepSeek本地部署,升级“大瓦特”模型,提升各业务领域人工智能应用效果[4][15] 具体应用场景与能力提升 - 龙源电力在新能源数字化平台部署DeepSeek-R1系列大模型,构建专属知识库,打造智能应用助手+生产运营智囊[3][5] - 中国大唐完成DeepSeek-R1本地化部署,显著提升供应商商情分析报告质量,全面剖析供应商经营实力和技术能力[4][13] - 国家电网MSC平台接入DeepSeek后,已完成2245个产品原型、4926个数据模型设计及300多个创新产品研发[14] - 中国电建问知平台接入DeepSeek后形成10大特色能力体系,包括知识问答、论文综述、科研写作等核心能力[16] 技术实施与数据安全 - 多家企业采用私有化部署方式,在确保数据安全前提下保证模型稳定运行,如中国华能基于全国产化算力底座完成部署[9] - 龙源电力结合Ollama等工具实现统一管理,构建安全可控的AI基础设施,在内网环境下提供AI服务[5] - 中广核基于国产算力底座实现DeepSeek模型稳定运行,提升模型计算能力与数据处理速度,已成功上线13个典型应用[19][20] - 中国能建通过优化模型部署和应用调度策略,提升DeepSeek服务的易用性,为员工带来智能高效的办公体验[18]
A股全线收跌,信息安全概念崛起,AI产业链股活跃
证券时报· 2025-07-31 08:43
市场整体表现 - A股主要指数普遍下跌,沪指跌1.18%报3573.21点,深证成指跌1.73%报11009.77点,创业板指跌1.66%报2328.31点 [1] - 沪深北三市合计成交额达19621亿元,较前一日增加超过900亿元 [1] - 市场整体疲弱,近4300只个股下跌,煤炭、钢铁、石油、有色等资源股及券商、保险、酿酒、银行等板块均走低 [2] 信息安全概念板块 - 信息安全概念股逆市强势拉升,*ST广道涨停29.94%,数字认证涨停20.00%,南兴股份涨停10.00% [4] - 用友网络、亚信安全、永信至诚涨幅约8%,深信服涨近7% [4] - 板块表现强劲源于国家互联网信息办公室就英伟达H20算力芯片潜在安全漏洞问题约谈英伟达公司 [5] AI产业链板块 - AI产业链股活跃,液冷服务器、CPO概念股集体拉升,方盛股份涨超15%,鼎通科技涨超10% [7] - 英维克、淳中科技、冰轮环境等个股涨停,工业富联涨超6%且盘中一度触及涨停 [7] - 行业观点指出国产大模型性能已可比肩海外产品且成本更低,在金融、办公等应用领域表现可圈可点 [8] - 国产AI芯片厂商如海光信息、华为、寒武纪等在产品领域取得积极突破,AI算力芯片自主可控取得长足进步 [8] - 券商观点认为国产AI产业链从算力、算法到应用场景正逐步完善,智能驾驶万亿级市场加速下沉 [9] 辅助生殖概念板块 - 辅助生殖概念股走势活跃,安科生物、共同药业、利德曼均涨停20.00%,广生堂涨超18%,汉商集团涨停10.00% [11] - 消息面上,中共中央办公厅、国务院办公厅印发《育儿补贴制度实施方案》,中央财政今年初步安排育儿补贴补助资金预算约900亿元 [12] - 中央财政对地方发放国家基础标准补贴所需资金总体承担约90%的比例 [12] - 券商分析指出育儿补贴发放短期将刺激母婴相关消费,长期有助于提振生育意愿并带动母婴产业链发展 [13]
突发!全线下跌!
证券时报· 2025-07-31 08:31
市场整体表现 - A股主要指数全线收跌,沪指跌1.18%报3573.21点,失守3600点,深证成指跌1.73%报11009.77点,创业板指跌1.66%报2328.31点 [1] - 沪深北三市合计成交额达19621亿元,较前一日增加超过900亿元 [1] - 市场整体疲弱,近4300只个股下跌,煤炭、钢铁、石油、有色等资源股及券商、保险、酿酒、银行等板块均走低 [2] 信息安全概念 - 信息安全概念股逆市强势拉升,*ST广道涨停30%,数字认证、南兴股份涨停20%,用友网络、亚信安全、永信至诚涨幅约8% [4] - 国家互联网信息办公室约谈英伟达公司,要求其就H20算力芯片的漏洞后门安全风险问题进行说明并提交证明材料 [6] AI产业链 - AI产业链股活跃,液冷服务器、CPO概念股集体拉升,方盛股份涨超15%,鼎通科技涨超10%,英维克、淳中科技、冰轮环境涨停,工业富联涨超6% [8] - 国产大模型性能已可比肩海外领军模型且成本更低,在金融、办公等领域应用可圈可点,AI Agent已在企业管理场景落地 [10] - 国产AI芯片厂商如海光信息、华为、寒武纪等在产品领域取得积极突破,AI算力芯片自主可控取得长足进步 [10] 辅助生殖概念 - 辅助生殖概念股走势活跃,安科生物、共同药业、利德曼涨停20%,广生堂涨超18%,汉商集团涨停 [12] - 中共中央办公厅、国务院办公厅印发《育儿补贴制度实施方案》,2022年1月1日后出生的符合条件的婴幼儿可领取补贴,中央财政今年安排预算约900亿元 [14] - 育儿补贴发放有望直接刺激母婴相关消费,长期看有助于提振生育意愿并带动新生儿数量增长,利好辅助生殖、基因检测等产业链 [15] 个股表现 - 新上市公司鼎佳精密在北交所首日大涨479%,收报64.63元/股 [2] - 人脑工程概念股创新医疗、爱朋医疗涨超7%,AI应用概念股易点天下涨停20%,慧博云通涨超13% [2]
突发!全线下跌
证券时报· 2025-07-31 08:27
市场整体表现 - A股主要指数全线收跌,沪指下跌1.18%至3573.21点,失守3600点关口 [1] - 深证成指下跌1.73%,创业板指下跌1.66%,沪深北三市合计成交额达19621亿元,较前一日增加逾900亿元 [1] - 市场整体疲弱,近4300只个股下跌,煤炭、钢铁、石油、有色等资源股集体回调 [2] 信息安全概念板块 - 信息安全概念股逆市强势拉升,*ST广道涨停29.94%,数字认证和南兴股份涨停20% [3][4] - 用友网络、亚信安全、永信至诚涨幅约8%,深信服上涨近7% [3][4] - 板块走强背景为国家网信办就英伟达H20算力芯片安全漏洞问题约谈英伟达公司 [5] AI产业链板块 - AI产业链股活跃,液冷服务器、CPO概念集体拉升,方盛股份涨超15%,鼎通科技涨超10% [6][7] - 英维克、淳中科技、冰轮环境涨停10%,工业富联涨超6%且盘中一度触及涨停 [6][7] - 国产AI产业取得长足进步,DeepSeek系列大模型性能可比肩海外产品,海光信息、华为、寒武纪等芯片厂商取得积极突破 [8] 辅助生殖概念板块 - 辅助生殖概念股走势活跃,安科生物、共同药业、利德曼均涨停20% [9][10] - 广生堂涨超18%,汉商集团涨停10% [9][10] - 消息面刺激为《育儿补贴制度实施方案》印发,中央财政今年安排育儿补贴预算约900亿元,中央总体承担约90%的补贴资金 [11][12]
突发!全线下跌!
证券时报· 2025-07-31 08:26
市场整体表现 - A股大幅跳水,沪指跌1.18%报3573.21点,深证成指跌1.73%报11009.77点,创业板指跌1.66%报2328.31点,沪深北三市合计成交19621亿元,较前一日增加逾900亿元 [1] - 市场整体疲弱,近4300股下跌,煤炭、钢铁、石油、有色等资源股集体回调,券商、保险、酿酒、银行等板块走低 [2] - 港股同步下挫,恒生指数跌超1% [1] 信息安全概念 - 信息安全概念逆市拉升,*ST广道30%涨停,数字认证20%涨停,南兴股份涨停,用友网络、永信至诚涨超8%,深信服涨近7% [4][5] - 国家网信办约谈英伟达,要求其就H20算力芯片漏洞后门安全风险问题进行说明,依据《网络安全法》《数据安全法》《个人信息保护法》相关规定 [6] AI产业链 - AI产业链股活跃,液冷服务器、CPO概念集体拉升,方盛股份涨超15%,鼎通科技涨超10%,英维克、淳中科技、冰轮环境涨停,工业富联涨超6% [8][9] - 国产大模型性能可比肩海外领军产品且成本更低,应用端在金融、办公等领域表现突出,AI Agent已在企业管理场景落地 [10] - 国产AI芯片厂商海光信息、华为、寒武纪等取得突破,燧原、沐熙、天数、壁仞等公司快速发展,算力芯片自主可控进展显著 [10] 辅助生殖概念 - 辅助生殖概念崛起,安科生物、共同药业、利德曼20%涨停,广生堂涨超18%,汉商集团涨停 [11][12] - 政策面推动生育支持,中央财政设立900亿元育儿补贴补助资金,8月下旬各地将开放申领,中央财政承担约90%补贴资金 [13] - 育儿补贴短期刺激母婴消费(婴童护理、乳制品等),长期或提振生育意愿,利好辅助生殖、基因检测等产业链 [13] 个股异动 - 北交所新股鼎佳精密首日大涨479%收报64.63元/股 [2] - 人脑工程概念股创新医疗、爱朋医疗涨超7%,AI应用概念股易点天下20%涨停,慧博云通涨超13% [2]
R2还没来,但DeepSeek的秘密武器已经“剧透”了
虎嗅· 2025-07-31 07:58
行业技术突破 - DeepSeek与北京大学联合研发的"原生稀疏注意力(NSA)"技术获ACL最佳论文奖 该会议被公认为自然语言处理领域顶级风向标 [2][3][4] - NSA技术首次实现稀疏注意力在完整训练流程的应用 突破仅能用于推理阶段的限制 在27B模型上实现训练前向计算加速9倍 反向传播加速6倍 [5][23][44] - 该技术显著提升长文本处理效率 在64k上下文长度下推理速度提升11.6倍 同时保持模型性能不降反升 [5][16][45][46] 技术原理创新 - NSA采用三重机制模拟人类阅读行为:Token Compression压缩早期文本为摘要块 Token Selection精准选择相关原文细节 Sliding Window保留最近上下文精细注意力 [26][27][28] - 通过门控机制动态平衡三种阅读策略 实现硬件对齐优化 兼容GQA架构和FlashAttention-2内核 基于Triton重写关键kernel [30][31][52] - 原生可训练特性使稀疏模式与模型协同优化 在MMLU、GSM8K等9项基准测试中7项超越全注意力模型 DROP测试推理能力提升显著 [32][33][35][37] 性能表现数据 - 在64k长度(约8万字)"大海捞针"测试中实现100%信息检索准确率 LongBench评测平均分0.469超越全注意力基线的0.437 [38][40][41] - 上下文长度与加速比呈正相关:8192长度加速4倍 16384长度加速6.4倍 32768长度加速9.1倍 65536长度加速11.6倍 [46] - 传统注意力机制在64k上下文长度下占据70%-80%推理延迟 NSA通过稀疏化计算有效降低延迟 [18][43] 行业应用前景 - 技术已通过27B及MoE架构完整预训练验证 具备商业化落地条件 将应用于下一代DeepSeek大模型 [51][52][53] - 突破性提升长文本处理能力 支持整本书籍、多份财报、完整代码库的直接分析 无需人工拆分 [49][54] - 计算效率提升将传导至API成本降低 加速AI应用生态发展 [55][58][59]
平安证券:国产大模型能力提升 我国AI产业未来前景广阔
智通财经网· 2025-07-04 11:44
国产大模型发展 - 以DeepSeek系列为代表的国产大模型性能已可比肩海外领军模型且成本更低 实现从"可用"到"好用"的跨越 [1][3] - 国产大模型开源、低成本和高性能特性将加速B端和C端应用场景落地 重点关注金融、办公、AI Agent三大方向 [3][6] - AI Agent已在企业管理场景落地 未来发展空间大 [1][6] AI算力芯片进展 - 2022年全球AI芯片市场规模422亿美元 预计2025年达920亿美元 CAGR为27.7% [4] - 美国制裁倒逼国产替代 海光信息、华为、寒武纪等厂商取得突破 燧原、沐熙等公司快速发展 [1][4] - 英伟达GPU多次减配后性能优势削弱 国产芯片已占据一定市场份额 [4] 智能驾驶产业趋势 - 中国智能驾驶市场规模达万亿级 L2辅助驾驶向10-20万元大众市场下沉 城市NOA从试点迈向全国推广 [5][7] - 车路云一体化建设加速 2025/2030年产业增量预计达7295亿元/25825亿元 [5] - Robotaxi综合成本当前4.4万美元 2030年将降至3.5万美元 商业化拐点临近 [5] 计算机行业表现 - 2025Q1行业基本面拐点显现 计算机设备营收表现优于软件开发和IT服务 [3] - 行业指数涨幅跑赢沪深300 在申万一级行业中排名第6 基金持仓连续两季度提升 [3] 重点推荐标的 - AI算力:推荐海光信息(688041)、浪潮信息(000977) 关注寒武纪(688256) [2][7] - AI应用:强烈推荐恒生电子(600570) 推荐科大讯飞(002230)、金山办公等 [2][7] - 智能驾驶:强烈推荐中科创达(300496) 推荐德赛西威(002920)、地平线机器人-W(09660) [2][7]
中移齐鲁创新院发布“迅测”工具:助力国产芯片选型效率跃升
齐鲁晚报· 2025-06-06 08:15
行业趋势 - 大模型推理成本持续下降和国产芯片快速发展推动政务、金融、医疗等数据敏感行业加速推进推理模型国产化本地部署 [1] - 国产智算芯片型号众多、性能差异显著,高效准确压测模型推理性能成为筛选高性能低成本芯片的关键挑战 [1] 技术创新 - 中移齐鲁创新院自主研发"迅测"芯片推理性能自动压测工具,创新构建"配置即测试"压测模式并集成数据自动解析能力 [1] - "迅测"工具单轮测试人工值守时长从平均8小时降至0.5小时,数据整理耗时减少70%,整体芯片选型效率提升3倍 [1] - 工具核心技术亮点包括基于vLLM的智能自动压测和压测数据自动汇总及可视化分析 [3] 技术细节 - 通过智能调度vLLM引擎实现一键化操作,用户仅需设定并发请求量即可自动执行多轮压力测试 [3] - 支持本地和宿主机远程两种压测模式,适配不同芯片的单节点或多节点部署需求 [3] - 采用标准化数据存储机制自动计算生成错误率、单路输出速度等核心性能指标,确保跨平台测试结果可比性 [3] - 内嵌数据可视化引擎直观呈现芯片性能差异,自动化日志解析技术解决海量日志人工汇总痛点 [3] 应用成果 - 已完成DeepSeek系列大模型在天数智芯、华为昇腾、壁仞科技、瀚博半导体等主流国产计算平台上的推理性能测试 [3] - 生成精细化对比报告包含多项关键参数对比矩阵,为国产大模型推理芯片选型提供重要参考依据 [3]
一轮00后的创业小高峰来了
虎嗅APP· 2025-05-05 09:36
核心观点 - 90后和00后成为AI与机器人领域创业主力军,团队平均年龄普遍低于30岁,展现出技术直觉和适应力优势 [1][6] - AI技术迭代速度以"月"为单位,大幅降低创业门槛,推动轻资产+敏捷开发模式成为主流 [6][10] - 新一代创业者具备全球视野,从创业首日即瞄准全球市场与技术前沿,参与国际竞争 [12][13] - 当前AI创业呈现务实导向,小团队聚焦垂直场景与现金流,与早期烧钱模式形成对比 [9][10][11] 行业特征 创业者画像 - 2025年AI领域高潜力公司中90后创始人占67%,00后创业者同比增长120% [6] - 代表性团队:DeepSeek团队平均年龄不足30岁,xAI核心成员平均年龄22岁,最小19岁 [1] - 典型案例:宇树科技(王兴兴90年)、智元机器人(彭志辉93年)、月之暗面(杨植麟93年)等 [1] 技术驱动因素 - DeepSeek系列大模型将开发成本压缩至传统方案1/5,API调用成本同比下降40% [6][10] - 低代码平台(如Coze、Dify)使单人开发者可三天上线产品 [10] - 技术迭代速度导致产品生命周期缩短,如DeepSeek V3发布使数十家AI写作工具过时 [16] 商业模式演变 - 5人以下团队占比从2020年32%升至2025年68%,聚焦工具型产品快速变现 [10] - 2025年具身智能赛道70%融资投向有稳定现金流项目 [11] - 典型案例:Aha Lab用AI Agent取代达人营销人工环节,获朱啸虎投资 [5] 市场格局 区域差异 - 国内AI创业集中于C端工具型/场景类落地,硅谷以B端为主且收购路径成熟 [15] - 人形机器人优先渗透工业(汽车装配/焊接)和服务场景(商场导览/养老陪护) [15] 融资环境 - 2024年AI领域融资事件同比下降16%,2025年Q1机构融资笔数降25% [16] - 美元基金规模收缩,人民币基金偏好成熟期企业,早期项目依赖个人天使 [16] 竞争策略 - 成功AI应用三大特征:垂直场景、数据闭环、成本可控 [17] - 团队需保持"半月迭代"节奏,速度与场景理解成为关键壁垒 [16][17] - 典型案例:蓝天团队砍掉酷炫功能专注孕妈刚需,获一线奶粉品牌收购邀约 [10]