Workflow
开源大模型
icon
搜索文档
我在WAIC看见的十大趋势
量子位· 2025-07-30 02:29
核心观点 - AI行业热度空前,WAIC展会呈现十大核心趋势,展现中国AI产业的快速发展和创新活力 [2][3][5] 十大核心趋势 趋势一:中国AI因DeepSeek而不同 - DeepSeek带来观念改变,AGI在中国被真正相信,中国人可能率先实现AGI [6] - DeepSeek-R1让普通人不再认为AI是"智障",唤醒中国AI创始人直接瞄准AGI [7] - 前谷歌CEO施密特等国际专家认可中国AI实力 [6] 趋势二:基础大模型综合实力比拼 - 基础大模型竞逐重点从SOTA转向推理、多模态和低成本 [8][9] - 阶跃星辰Step-3模型总参数321B,具备多模态推理能力,联合千里科技和吉利汽车落地智能座舱 [12] - 商汤日日新V6.5在多模态推理能力上表现优异,部分指标超过Gemini 2.5 Pro和Claude 4-Sonnet [14][15] - 讯飞深度推理X1升级版在幻觉治理、综合能力等方面有提升 [15] 趋势三:开源大模型进入中国时间 - 开源成为中国大模型领域的标配,通义千问是开源旗手 [17][18][21] - 阿里通义千问系列模型和通义万相2.2全部开源 [18][20] - 中国开源模型方阵蔚为壮观,包括基础大模型和垂直模型 [23][24][26] - 开源共识形成,中国可能成为AI时代的"安卓" [28][31] 趋势四:国产化AI生态闭环 - 国产芯片与国产大模型协同构建生态 [32][33] - 摩尔线程实现100token/s跑满血DeepSeek,推动AI训练向万卡级规模演进 [37] - 后摩智能发布能效比最高的存算一体AI芯片M50,功耗仅10W [39] - 中昊芯英发布中国首枚TPU架构高性能AI芯片"刹那®"和计算集群"泰则®" [41] - 联想、燧原科技等推出国产算力+国产模型的大模型一体机 [44][46] 趋势五:AI基建与垂直行业应用 - 华为展示昇腾384超节点真机,支持万张算力卡的数据中心 [51] - 中国电信展出五大技术体系,包括智传网、算网一体服务等 [53] - PPIO发布国内首个Agentic AI基础设施服务平台 [56] - 国家电网和南方电网展示电力行业大模型"大瓦特",机器人代人率达80% [60] - 蚂蚁数科推出金融大模型Agentar-Fin-R1,在金融基准测试中表现优异 [62] - 百度展示数字人技术NOVA,曾支撑罗永浩数字人直播间创5500万GMV [64] 趋势六:ToC创新与AI Agent - C端产品创新开始,AI Agent成为新风口 [66][67] - WPS发布原生Office办公智能体,通过自然语言完成文档创作等 [76] - 钛动发布全球营销AI Agent,赋能营销全链路 [77] - 深势科技发布通用科学智能体SciMaster,提供专家级科研助手 [79] - Agent被视为AI时代的软件形态产品,将革新各领域应用 [82][83] 趋势七:商业化AI终端 - 汽车、耳机和眼镜成为第一批商业化AI终端 [86][87] - 特斯拉、吉利等车企展示AI能力,座舱领域创新打开新增长空间 [88][90][94] - 讯飞AI耳机iFLYBUDS Pro 3和Air 2主打商务办公场景 [99][100] - AI眼镜备受关注,Rokid预定量达25万台,Halliday中国首秀 [104][105][107] - 夸克发布AI眼镜,集成阿里和支付宝生态 [109][110] 趋势八:具身智能机器人 - 具身智能机器人赛道白热化,今年实现大飞跃 [112][113] - 智元、银河通用、北京人形机器人创新中心等展示能走能动的机器人 [117][119][121] - 宇树科技通过"机器人打拳击"展示灵活运动能力 [129] - 戴盟聚焦触觉感知技术,展示精细化操作能力 [135][137][139] - 行业开始向人形收敛,VLA和世界模型成为共识 [133] 趋势九:非Transformer架构 - 非Transformer架构从学术研究进入产业应用 [144][145] - RockAI展示自研非Transformer架构驱动的机器狗和灵巧手 [146] - RWKV元我智能公开RWKV-7s架构,KV cache仅为MLA的1/9大小 [146] 趋势十:中国与硅谷AI差距 - 中国与硅谷AI差距缩短至6个月,集中在大模型先进技术层面 [154] - 发展目标转向AGI实现,而非追赶硅谷 [155] - 中国拥有发展AI的宝贵资源——人才和用户基础 [157][158]
中国平安再现外脑空降!王晓航任CTO,曾系蚂蚁集团副总裁
南方都市报· 2025-07-29 06:57
人事任命 - 公司聘任王晓航出任集团首席技术官兼平安科技总经理 [1] - 王晓航曾任职于谷歌、彭博、百度、蚂蚁集团等国际知名企业,在百度期间推动打造百度钱包和金融业务,在蚂蚁集团负责数字金融和AI创新,推出AI金融管家等生成式AI产品 [1] 战略方向 - 公司表示王晓航的加入有助于全面提升AI技术研发与应用水平,推动自研大模型与大数据开源平台深度融合发展 [2] - 公司将加快建设数字化经营、数字化运营、数字化管理、数字化营销、数字化服务五大体系 [2] - 公司深化"综合金融+医疗养老"双轮并行、科技驱动战略,加速推进全面数字化转型 [2] 技术布局 - 公司董事长马明哲强调人工智能已在主业各个环节全面铺开,2024年AI坐席服务量约18.4亿次,覆盖80%客服总量 [3] - 公司认为人工智能时代的关键因素包括数据、算法、算力、场景,并拥有深圳和上海两个大机房支持算力需求 [3] - 公司2024年底拥有超2.1万名科技开发人员、超3,000名科学家,累计获得人工智能竞赛冠军45项,专利申请数达55,435项 [3] 财务投入 - 公司一年利润超千亿,可大量投入科技领域 [3]
WAIC 2025|海外企业组团参展 AI朋友圈再扩容
新华财经· 2025-07-29 01:39
新华财经上海7月29日电(葛佳明) 作为全球人工智能领域的"全球交流盛会", 2025世界人工智能大会 暨人工智能全球治理高级别会议(WAIC)已是第八年在上海举办。与往年相比,本次大会吸引包括新 加坡、马来西亚、英国等多国企业参展,AI朋友圈持续扩大。 伦敦发展促进署大中华区首席代表赵冰冰在接受新华财经记者采访时表示,WAIC可以被视为全球企业 合作和交流的桥梁,一方面,今年有6家来自伦敦的科技公司首次"组团"参展,WAIC可以推动英国企业 进一步了解中国AI生态,找到本地合作方;另一方面,有出海意愿的中国企业则可以通过这一平台找 到合适的出海切入点,共同构筑起生态合作圈。 欧洲企业:来WAIC"交个朋友" 在超过7万平方米的展馆内,出现了越来越多的国外企业的身影,不少国家企业"组团"来WAIC"交个朋 友"。作为中国人工智能对外交流最活跃的舞台,WAIC正构筑起链接全球智慧的桥梁,在此次参展的超 800家企业中,上海市外及国际企业占比超50%。 以英国为例,赵冰冰直言,中国企业和英国企业在AI领域有巨大的合作潜力,主要体现在人才与研发 合作,金融与资本合作以及应用场景与技术结合这三方面,中国因其庞大的市场 ...
传媒行业周观察(20250721-20250725):关注暑期档优质内容供给,WAIC展会再掀AI热潮,持续看好AI应用产业机会
华创证券· 2025-07-28 04:45
报告行业投资评级 维持对传媒行业的投资评级为推荐,持续看好AI推荐应用产业机会 [1] 报告的核心观点 - 当下传媒板块明线为AI应用起势,暗线为内容输出带来的文化自信,需锐度和配置并重;看好今年成为中国开源大模型的爆发及应用格局重塑之年,分三步发展 [6] - 港股方面,随着关税博弈节奏或趋缓,叠加港股市场流动性较好,科技主线有望对产业催化更敏感,恒生科技值得配置 [6] - 游戏再次提示关注回调后的布局机会,产业端投流费用抵税问题预计对游戏上市公司实际经营影响有限,Q3 AI产业较多催化,有望受益于配资资金 [6] - 互联网继续看好基本面有支撑、AI叙事有长逻辑的配置型互联网资产 [6] - 电影受重点单片驱动景气度向上,后续仍有大单片待映,看好大盘持续性,此外ai短剧等进展较快 [6] - 教育龙头公司即将进入财报季,行业景气度持续,此外ai教育进展较快 [6] - 分众传媒是优质配置标的,主业稳健+近期互联网加投带来eps提升,6月起大力推广碰一碰,有望带来增量广告投放+潜在新变现方式,此外仍有新潮整合预期,当前低估值+高分红 [6] 各目录总结 上周市场表现回顾:传媒行业上涨2.15% - 上周传媒(申万)指数整体上涨2.15%,同期沪深300指数整体上涨1.69%,板块跑输沪深300指数0.46%,位列所有板块第18位;幸福蓝海、新华传媒等领涨,世纪天鸿、新迅达等领跌 [9][12] - 港股互联网科技板块华虹半导体、东方甄选等领涨,哔哩哔哩-W、理想汽车-W等领跌 [13][15] - 游戏市场腾讯系产品优势地位显著,网易系产品排名位居中上位置,其他厂商产品表现分化 [16] - 电影市场2025年票房大盘已恢复约88%,观影人次已恢复约77%;7月21日-7月25日整体票房5.08亿元;《长安的荔枝》等五部影片为上周票房前五;后续待上映重点影片包括《寒冰白血》等 [19][20][24][26] 行业重要新闻与重点公司公告 - 行业重要新闻包括国泰海通发布新一代全AI智能APP灵犀、OpenAI年底部署百万GPU与马斯克xAI掀算力军备竞赛、可灵AI全球用户超4500万、阿里巴巴首款自研AI眼镜亮相世界人工智能大会、电影暑期档票房突破49亿元等 [28][29] - 公司公告包括万达电影、世纪华通等发布2025年半年度业绩预告,光线传媒发布董事离任公告,荣信文化发布首次回购公司股份公告 [30][32][34][35]
中国信通院:超一半金融企业积极规划内部开源的协作机制
中国青年报· 2025-07-24 10:04
开源技术在金融业的应用 - 金融行业超过58%的企业正在规划内部开源协作机制以促进技术团队间的深度协作与共享并加速智能化和平台化转型 [1] - 中国信通院已推动中国农业银行、中国工商银行、中国建设银行等数十家金融企业完成开源治理评估认证形成可复制的跨领域标准化实践 [1] - 金融开源社区已有50多家金融企业共同搭建技术协同创新与成果转化平台 [1] 开源大模型在金融业的普及 - DeepSeek系列开源大模型在金融企业应用占比达100% [1] - 通义千问系列开源大模型在金融企业应用占比超过70% [1] - 开源大模型成为推动金融行业智能化转型和技术创新的重要动力 [1] 金融行业开源体系建设进展 - 中国平安人寿、中国农业银行、中国信通院、中国建设银行、中国工商银行代表共同发布金融行业开源体系建设路线图研究报告 [2] - 金融开源创新发展能力评估试点同步启动 [2]
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
量子位· 2025-07-22 04:35
开源大模型竞争格局 - 开源大模型竞争进入中国时间,Qwen3新模型发布后迅速获得行业关注[1][24] - Qwen3-235B总参数量为235B,仅为Kimi K2 1T参数规模的25%[2] - 新模型在基准测试性能上超越Kimi K2和DeepSeek-V3等竞争对手[3][13] - 行业竞争格局快速变化,DeepSeek、Kimi和Qwen相继占据领先位置[25] Qwen3-235B-A22B-2507技术升级 - 采用MoE架构,总参数量235B(非嵌入参数234B),推理时激活参数22B[8] - 包含94层网络结构,采用分组查询注意力机制(64个查询头+4个键值头)[8] - 设置128个专家,每次推理激活8个专家[8] - 原生支持262144(256K)长上下文处理能力[9] - 放弃混合思维模式,改为分别训练Instruct和Thinking模型[4] - 当前版本仅支持非思考模式,网页版已上线但通义APP未更新[5] 性能提升表现 - 数学推理能力显著提升:AIME25准确率从24.7%跃升至70.3%[13] - 知识测试表现:MMLU-Pro得分从75.2提升至83.0,MMLU-Redux从89.2升至93.1[11] - 编程能力提升:LiveCodeBench得分从32.9提高到51.8[11] - 多语言能力增强:MultilF得分从70.2提升至77.5[13] - 文本生成质量改善:Creative Writing v3得分从80.4升至87.5[13] 行业动态 - NVIDIA同期发布OpenReasoning-Nemotron系列模型(1.5B/7B/14B/32B)[17][18] - NVIDIA新模型实际基于Qwen-2.5微调,非全新架构[21] - Qwen官方预告将有更大规模升级即将发布[6][23] - Llama转向闭源背景下,中国开源模型正成为行业焦点[24]
游戏ETF(516010)涨超1.1%,版号放量叠加新游表现提振行业信心
每日经济新闻· 2025-07-21 02:17
大模型发展趋势 - 2023年是闭源通用大模型的爆发之年 [1] - 2025年预计成为中国开源大模型爆发及应用格局重塑之年 [1] 游戏板块投资机会 - 游戏板块建议关注回调后的布局机会 [1] - 核心产品高频数据持续向好 [1] - 游戏ETF(516010)跟踪动漫游戏指数(930901),聚焦动画、漫画、游戏等新兴领域 [1] - 动漫游戏指数由中证指数有限公司编制,反映行业相关上市公司整体表现 [1] AI应用商业化进展 - Agent落地范式逐步成熟 [1] - 垂类2B应用加速降本增效,2C应用优化体验 [1] - AI陪伴、AI教育等场景商业化进程加快,符合个性化需求且付费意愿高 [1] IP衍生赛道发展 - IP衍生赛道景气度提升 [1] - 授权业务进展加速 [1] 基金产品信息 - 无股票账户投资者可关注国泰中证动漫游戏ETF联接A(012728)和C(012729) [1]
长青游戏营收压舱、新游表现决定增量,聚焦游戏板块布局窗口
每日经济新闻· 2025-07-21 02:12
7月21日早盘,游戏板块表现略微震荡,游戏ETF(159869)现涨幅有所收窄,涨近1%。游戏ETF(159869)已连续5个交易日获资金净流入,累 计"吸金"达15.18亿元,备受资金青睐。 华创证券指出,2023年是闭源通用大模型的爆发之年,看好2025年成为中国开源大模型爆发及应用格局重塑之年。游戏板块建议关注回调后的 布局机会,核心产品高频数据持续向好。AI应用方面,Agent落地范式逐步成熟,垂类2B降本增效及2C体验优化加速;AI陪伴、AI教育等场景 商业化进程加快,符合个性化需求且付费意愿高。IP衍生赛道景气度提升,授权业务进展加速。 据统计,2025年上半年共有812款网络游戏获得版号,涉及618家运营单位,其中国产网络游戏757款,进口网络游戏55款。从数量来看,今年 上半年游戏版号数量为近5年之最,全年有望突破1500款,接近2019年水平。从审批情况来看,今年上半年游戏版号月均过审135款,超去年同 期的115款,整体发放稳中有增。中信建投(601066)数据显示1-5月国内手游市场规模同比增长20%——在版号充足、需求大增但买量成本同 样高涨的背景下,行业呈现出长青游戏营收压舱、新游表 ...
黄仁勋评价DeepSeek和通义千问:都是世界顶尖开源大模型
中国证券报· 2025-07-17 21:03
人工智能技术发展 - 人工智能技术从2012年到2017年在计算机视觉、语音识别、语言理解能力方面快速进步并超越人类能力,如今从感知型升级为生成式人工智能 [1] - 人工智能技术未来发展趋势是向物理世界渗透,当前处于推理型人工智能浪潮,下一个浪潮将是物理型人工智能,应用于机器人等物理机械中 [1] - 人工智能技术会为科学发展带来重大影响,帮助理解蛋白质、化学物质、细胞乃至生命的意义,进而研发新药物并延长人类寿命 [2] 中国人工智能生态 - 中国研究者发表的人工智能论文数量世界第一,在开源方面表现突出,DeepSeek和通义千问是世界顶尖的开源大模型 [1][2] - 开源大模型助力形成中国人工智能生态并推动全球其他地区生态构建,医疗公司、金融机构、机器人公司等可利用这些模型并根据需求调整 [1][2] - 中国有数百个项目运用英伟达Omniverse平台模拟数字孪生,用于设计和优化工厂和仓储系统,许多机器人在该平台虚拟世界训练以便与人类安全协作 [3] 芯片技术发展 - 未来硅基技术将在晶体管结构、封装技术、硅光技术三方面迭代,晶体管向三维发展,下一代将是"全环绕栅极"晶体管 [2] - 芯片领域从单芯片发展到堆叠芯片、多芯片,封装技术越来越先进,硅光子技术将有较大创新空间 [2] - 英伟达技术路线图已覆盖接近10年未来规划,公司预计至少需忙碌20年 [2][3] 中国市场重要性 - 中国市场对英伟达非常重要,是世界上最大市场之一,具有活力和独特性 [1][3] - 英伟达恢复H20芯片在中国销售并推出面向中国市场的新GPU,产品应用于供应链数字化管理、具身智能大模型训练等领域 [3] - 英伟达不将自身视为芯片公司而是"AI基础设施"或"计算平台"供应商,机器人技术将为公司带来万亿美元级别增长机会 [3]
K2开源大模型,会是Kimi的DeepSeek时刻吗?
虎嗅· 2025-07-14 03:20
中国AI开源模型发展 - MoonShot最新开源大模型K2总参数规模达到万亿级别(1T),是目前开源模型中最大的,激活参数320亿 [2] - K2在基准测试SWE Bench Verified(编程)、Tau2(智能体)中仅次于Claude 4 Opus,在AceBench(工具调用)中仅次于GPT-4.1 [2] - K2官方API服务与DeepSeek的R1相当,但最大支持上下文长度(128K)高于R1(64K) [2] - K2发布后成为HuggingFace上热度第一的开源模型,新兴云厂商NovitaAI与Parasail已将其托管上线 [4] - Perplexity首席执行官Aravind Srinivas在内部测试后决定尽快对K2展开后训练 [4] 中国AI公司竞争格局 - 中国本土AI公司竞争激烈,MiniMax与MoonShot相互竞争,先后发布多款开源模型 [5] - MoonShot已披露融资总额约15亿美元,远低于硅谷同行 [6] - MoonShot比DeepSeek更早推动"执行"以更低成本落地,冲击AI应用的消费市场和企业市场 [7] - K2兼容OpenAI和Anthropic的API格式,凭借更高性价比可能赢得硅谷AI应用开发者市场 [7] MoonShot技术创新 - K2架构采用更少注意力头、更多专家,提高长上下文效率和每个token处理效率 [8] - MoonShot自研MuonClip优化器计算效率是AdamW优化器的2倍 [8] - MoonShot在MuonClip优化器中融入自研QK-Clip技术解决MaxLogit爆炸问题 [10][11] - MoonShot重视底层创新,曾提出MoBA(混合块注意力)架构 [11] MoonShot产品布局 - MoonShot拥有形式推理模式Kimina-Prover-72B、编程模型Kimi-Dev-72B、深度研究智能体Kimi-Researcher等多款产品 [12] - K2的智能体能力得益于大量Agentic合成数据和通用强化学习手段 [12] - MoonShot团队具有文艺特质,公司名来源于平克·弗洛伊德的专辑 [13]