大模型

搜索文档
国证国际港股晨报-20250910
国证国际· 2025-09-10 08:38
港股市场表现 - 港股三大指数集体收涨 恒生指数涨1.19% 国企指数涨1.32% 恒生科技指数涨1.3% 大市成交上升至2940.329亿港元[2] - 南向资金持续流入 港股通净流入金额102.31亿港元 北水净买入最多的是阿里巴巴 中芯国际 巨子生物 净卖出最多的是小米集团 美团 康方生物[3] - 主板总卖空金额为468.15亿港元 占可卖空股票总成交额比率上升至17.611%[2] 行业板块表现 - 网络销售药品规范带动互联网医疗板块上涨 阿里健康大涨10.02% 叮当健康涨9.76% 京东健康涨6.42% 平安好医生涨3.11%[4] - 国际黄金价格创新高推动黄金股上涨 赤峰黄金涨11.55% 山东黄金涨7.2% 中国黄金国际涨6.83% 灵宝黄金涨6.18% 紫金矿业涨4.04%[4] - 一线城市限购政策优化刺激房地产股延续涨势 世茂集团涨27.87% 碧桂园涨27.45% 雅居乐集团涨10.64% 融信中国涨7.29% 旭辉控股集团涨6.06%[4] - 苹果概念股普遍承压 富智康集团跌5.5% 高伟电子跌4.59% 蓝思科技跌3.49% 鸿腾精密跌2.51%[5] 大模型与AI行业观察 - 大模型调用量显著增长 截至9月8日大模型AI周度token调用量达4.95万亿 环比增8% 最近2周调用量较前4周均值增41%[9] - 中国模型与海外差距缩小 DeepSeek最近14天日均调用量750亿 达Alphabet的55% 阿里巴巴日均调用量4300万 达Alphabet的32% OpenAI的70%[9] - 阿里巴巴发布万亿参数大模型Qwen3-Max-Preview 基准测试多项指标超越DeepSeek-V3 1等模型[10] - 阿里巴巴AI相关产品收入连续8个季度超100%增长 AI相关收入占外部收入20% 公司计划未来3年投入3800亿元于AI和云基础设施[10] 国际科技公司动态 - Alphabet图像生成模型Nano Banana技术能力排名第一 编辑突破超2亿次 为Gemini App带来超1000万新用户[11] - Gemini 2 5系列成为大模型调用量领先产品 基于TPUv5p芯片训练 在推理效果及成本优化方面表现突出[11] - 美股三大指数集体收涨 纳斯达克涨0.37% 标普500涨0.27% 道琼斯涨0.43% 美国8月小企业信心指数升至100.8[5] 投资建议与财务展望 - 大模型需求增长确定性较高 布局云业务 芯片 大模型的公司具备最优生态站位[12] - 预计阿里巴巴智能云FY2026E收入同比增长25% 现价对应18 1倍FY2026E市盈率和13 8倍FY2027E市盈率[12] - 美国就业数据下修 截至3月的12个月内新增就业职位较初值少91 1万个 下修幅度超市场预期[6]
英伟达下一代GPU登场,Rubin CPX一次推理数百万Token,网友:这是头野兽
机器之心· 2025-09-10 08:14
机器之心报道 机器之心编辑部 在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为 Rubin CPX(Rubin Context GPUs) 的新 GPU,专为超过 100 万 token 的长上下文推理而设计。 对用户而言,这意味着他们在软件开发、视频生成等长上下文任务中能够获得更好的性能。 例如,在软件开发中,AI 系统必须能够对整个代码库进行推理、理解仓库级代码结构,才能更好的帮助开发者。同样地,长视频和研究类应用也要求在数百万 token 范围内保持持续的连贯性和记忆。 现在,随着 Rubin CPX 发布,这些问题都能迎刃而解。 这款新型 GPU(Rubin CPX) 将与 NVIDIA Vera CPU 和 Rubin GPU 搭配使用,共同组成全新的 NVIDIA Vera Rubin NVL144 CPX 平台。这一集成式 NVIDIA MGX 系统在单机架内可提供 8 exaflops AI 算力,其 AI 性能是 NVIDIA GB300 NVL72 系统的 7.5 倍,并配备 100TB 高速内存和 1.7 PB/s(petabytes)内存带宽。 同时,NVIDIA 还将为已有 V ...
8月份全国企业销售收入保持较快增长
中国证券报· 2025-09-09 20:21
全国企业销售收入增长 - 8月份全国企业销售收入增速较7月份加快0.9个百分点 [1] 制造业发展 - 制造业销售收入增速较全国企业总体增速快1.5个百分点 [1] - 制造业占全国企业销售收入比重为30.7% [1] - 装备制造业销售收入同比增长7.4% [1] - 数字产品制造业销售收入同比增长9.6% [1] 高技术产业增长 - 全国高技术产业销售收入同比增长14.5% [1] - 工业机器人制造业销售收入同比增长12.6% [1] - 特殊作业机器人制造业销售收入同比增长52.9% [1] - 服务消费机器人制造业销售收入同比增长64.2% [1] 服务消费表现 - 服务消费延续7月份以来良好增长态势 [1] - 暑期出行旅游和休闲运动带动服务消费热力不减 [1]
美团自研560B大模型并开源,性能赶超DeepSeek
观察者网· 2025-09-08 02:46
模型发布与性能表现 - 美团正式推出龙猫大模型LongCat-Flash-Chat并在GitHub和Hugging Face平台开源 该模型为5600亿参数的混合专家模型(MoE) [1] - 模型在30天内完成20万亿token训练 实现单卡100+token/s的推理速度 每百万token成本仅0.7美元 [1][4] - 模型性能与DeepSeek V3.1、Qwen3、GPT 4.1等顶尖模型相当 部分领域实现超越 支持128k长文本上下文 [1][4] 架构创新与资源优化 - 采用零计算专家机制动态分配计算资源 将低信息token直接返回输出 极大节省算力 [2] - 虽然总参数量达5600亿 但处理任务时仅动态激活186亿至313亿参数 平均约270亿 实现成本与效率平衡 [2] - 引入快捷连接混合专家(ScMoE)机制 扩大计算和通信重叠窗口 实现计算与通信并行 显著提升训推吞吐量 [3] 功能特性与应用能力 - 完成面向智能体能力的多阶段训练 包括基座模型训练、增强推理与编码能力的中期训练及专注对话与工具使用的后训练 [3] - 具备强大Agent能力 可专业编写爬虫脚本 提示技术法律风险 推荐学习资源 并实现图文并茂的数据分析 [4] - 在开源社区中与DeepSeek V3.1、Qwen3、Kimi-K2、GPT 4.1等模型进行详细性能对比 多方面追平行业翘楚 [4]
阿里上线首个超万亿参数模型!阿里巴巴高开高走,一度涨超4.5%
每日经济新闻· 2025-09-08 02:29
港股市场表现 - 9月8日早盘港股三大指数集体上涨 科网股涨跌不一 内房股集体拉升 光伏太阳能板块走高 [1] - 恒生科技指数ETF(513180)跟随指数震荡 持仓股中地平线机器人、阿里巴巴、百度集团、腾讯控股等领涨 阿里巴巴一度涨超4.5% [1] 阿里巴巴AI技术突破 - 9月6日阿里上线最大模型Qwen3-Max-Preview(Instruct)参数量超1万亿 在多项主流权威基准测试中展现全球领先性能 [1] - Qwen3-Max-Preview正式上线阿里云百炼平台 可通过API直接调用 Qwen Chat同步上线新模型支持免费使用 [1] - 长江证券认为该模型展现出国产大模型向世界领先水平演进 有望加速国产AI应用落地并推动算力需求爆发 [1] 港股科技板块投资价值 - 恒生科技板块处于历史相对低估区间 南向资金持续流入叠加美国降息周期启动 港股9月或迎内外资共振 [2] - 反内卷政策推进叠加阿里巴巴财报超预期和AI大模型迭代 港股科技板块有望从"外卖内卷"回归AI叙事 [2] - 恒生科技指数ETF(513180)标的指数囊括30家港股科技龙头 成分股深度聚焦AI产业链上中下游 [2]
中国平安集团首席科学家:AI真的能当理财顾问吗?丨国是访问
中国新闻网· 2025-09-08 01:29
人工智能+行动政策推动 - 国务院印发《关于深入实施"人工智能+"行动的意见》推动人工智能与各行业广泛深度融合 [1] - 金融行业是拥抱人工智能最为积极的领域之一 [1] - 中国平安明确表示将"All in AI"并推行智能化营销、服务、运营、管理、经营战略 [1] 人工智能技术发展三阶段 - 人工智能发展经历小模型阶段解决单一问题 大模型阶段具备跨领域泛化能力 "强思考"阶段能举一反三 [2] - 人工智能技术加速迭代 几乎每天都有新突破 [2] - AI将极大改变金融、医疗、养老等行业 可能用机器人取代医生助手 [2] 平安AI应用成效 - 搭建通用模型、垂域模型、应用模型三层大模型体系 [2] - 单个车险保单成本每年以10%速度下降 车险保费规模持续增长 [3] - AI辅助诊疗系统覆盖超2000种疾病 导诊准确度超99% 辅助诊断准确率超95% [3] 大模型应用挑战 - 大模型在金融医疗等严肃场景存在AI幻觉挑战 [3] - 需要依赖专业数据和案例训练减少错误 [3] - 已布局大小模型矩阵实现灵活按需组合应用 [3] AI理财应用现状 - AI无法直接作为个人理财顾问 但可开发工具帮助理财顾问提高效率 [4] - AI在研究分析、信息检索、研报解读方面发挥重要作用 [4] - 个人投资者依靠AI直接选择股票和资产组合并不保险 [4] 机构投资者AI应用 - 机构投资者能通过AI释放更多潜能 [5] - 平安理财自主开发的新一代投资组合管理平台支持数千只理财产品运作 [5] - 数字员工"Copilot"助手实现领域知识迁移和全天候自动化运营作业 [5] 科技叙事条件 - 传统金融企业的科技叙事注重科技为业务带来的实际增量 [6] - 产生增量价值需要数字化基础、产业规模大、利润水平高三个条件 [6] - 金融业具备规模庞大、数字化基础扎实、利润水平高等特点 [6] 中国市场优势 - 中国市场在数据、人才、政策环境、创新包容度等方面形成优势 [6] - 国内大模型训练数据中超过一半甚至七成来自中文语料 [6] - 集中力量办大事的制度优势助力传统行业科技叙事机会增多 [6]
大模型接入智能客服,实现7×24小时不间断响应 | 创新场景
钛媒体APP· 2025-09-08 01:13
3. 大模型升级的热在线一体化人工坐席平台:通义晓蜜云联络中心不仅提供在线/热线一体化人工坐 席,完成了坐席和管理者 Copilot 升级发布,提供智能化的工具和套件,如面向坐席的回复内容纠错/扩 写/优化、对话信息小结、自定义工单生成,以及面向管理者的数据看板、热词分析等。 4. 智能对话分析能力:推出Contact Center AI对话分析all-in-one agent,适用于通话录音、文本消息、图 片、工单等各类信息的抽取、摘要、总结、分析、质检等广泛场景。 场景描述 随着数字化服务的普及,用户期望客服响应更快速、更智能、更个性化。传统基于规则或小模型的智能 客服在理解复杂语义、多轮对话和情感识别方面存在局限,难以满足用户日益增长的需求。大模型的引 入可以实现更拟人化、更精准的企业完成客户服务。此外,企业面临客服人力成本高、培训周期长、服 务一致性差等问题。通过大模型升级智能客服,可以处理更多重复性、高频问题,减少人工介入,提升 服务效率,实现7×24小时不间断响应。 解决方案 1. 全渠道在线人机对话接入方案:通义晓蜜提供智能对话机器人产品方案,产品全方位Agent化升级, 整合CoT、MCP、多 ...
阿里发布万亿参数大模型,多领域迎重大突破
选股宝· 2025-09-07 14:50
阿里巴巴大模型发布 - 阿里巴巴发布万亿参数大模型Qwen3-Max-Preview 参数规模超1万亿 支持262K上下文长度 性能全面超越前代及国际竞品 [1] - 大模型在多模态分析 代码生成 复杂任务分步执行等场景展现极高准确率 进一步推动算力需求持续爆发 [1] - Qwen3-Max-Preview是迄今首款万亿参数闭源大模型 标志着国产大模型在参数规模 性能及商业化布局上的重大突破 [1] 行业竞争格局 - 中国大模型技术在全球竞争格局中跻身第一梯队 [1] - 中文及多语言能力 垂类行业解决方案深度整合能力 更具性价比的商业化路径增强中国AI企业全球竞争力 [1] 产业链相关公司 - 神州数码与云服务商Azure AWS GCP 华为云 阿里云 字节跳动合作 为全球客户提供创新和多样化的云服务解决方案 [1] - 海光信息深度受益阿里资本支出扩张 产品兼容CUDA生态 [1]
李飞飞的答案:大模型之后,Agent向何处去?
虎嗅APP· 2025-09-07 02:51
Agent AI核心框架 - 提出由环境与感知、认知、行动、学习、记忆五大模块构成的智能体认知闭环架构 这代表对未来通用人工智能发展路径的前瞻性思考[10][12][17] - 感知模块具备多模态信息接收能力和任务规划与技能观察功能 使智能体能主动从物理或虚拟世界获取信息[12] - 认知模块作为处理中枢 由大语言模型和视觉语言模型提供世界知识、逻辑推理和上下文理解能力[14] - 行动模块通过控制器生成物理世界交互指令或虚拟世界API调用[15] - 学习模块支持预训练、零样本/少样本学习、强化学习和模仿学习等机制 实现持续自我进化[16] - 记忆模块采用持久化结构化系统存储知识、逻辑和推理结果 支持长期经验积累[17] 大模型驱动机制 - 大型基础模型特别是LLM和VLM的成熟是Agent AI框架的根本驱动力 为智能体提供零样本规划能力[20] - 大模型存在的"幻觉"问题可通过环境交互机制解决 环境反馈能迫使模型内部知识与外部现实对齐[21] - 基础模型存在社会偏见风险 需通过多元化数据训练和偏见检测机制确保包容性[22] - 个人数据隐私保护需建立明确法规框架 通过提示工程和人类监督层确保安全可控[22] 游戏领域应用 - 彻底改变传统NPC由固定脚本驱动的模式 实现基于记忆、目标和情感的动态行为调整[25] - 支持玩家用自然语言与游戏世界互动 为开放世界游戏带来前所未有的沉浸感和自由度[25] - 可作为创作者副驾驶 根据指令自动生成游戏关卡、道具和完整3D场景 大幅提升开发效率[25] 机器人领域应用 - 用户可用日常语言下达指令 机器人自主规划执行复杂物理操作 如GPT-4V可将人类演示视频转化为可执行任务序列[27] - 通过领域随机化技术在模拟训练中引入变化 增强对真实世界差异的鲁棒性[27] - 融合视觉、语言、触觉等多模态信息理解环境 实现更精准的物理交互[27] 医疗健康应用 - 作为医疗聊天机器人进行初步问诊和病史收集 基于医学知识库提供诊断建议 提升初级诊疗覆盖率[29] - 连接实时更新的医学数据库 在生成诊断时同步进行事实核查和来源引用 抑制模型幻觉[29] - 处理分流患者信息并监控慢性病患者生命体征 实现高效个性化健康管理[31] 发展挑战与方向 - 需解决视觉、语言、听觉、动作等多模态深度融合问题 而非浅层拼接[32] - 需训练能跨游戏、机器人和医疗等不同领域工作的通用智能体 而非定制化模型[32] - 建立科学评测体系至关重要 研究团队已提出CuisineWorld多智能体协作基准和VideoAnalytica视频理解基准[32]
贵州做优做强数字经济
经济日报· 2025-09-07 01:15
数字经济发展概况 - 2024年数字产业规模达2549.4亿元 同比增长18.3% [1] - 实体经济和数字经济深度融合水平较"十三五"末提升17.3% [3] 算力基础设施 - 在建和投运重点数据中心达49个 算力规模达92.6EFLOPS [1] - 智算占比近97% 超1.4万架机架中实际加电运行占比超70% [1] - 出省带宽超6万Gbps 建成全球首条400G全光网算力通道 [2] - 与国内42个主要城市实现网络直联 构建3ms/10ms/20ms三层超低时延圈 [2] 算力服务能力 - 为全球50多个国家和地区、20多万用户提供云渲染算力服务 [2] - 60多家客户数据入驻中国电信云计算贵州信息园 [1] - 从"数据存储仓库"向"算力输出引擎"转型 [2] 产业数字化转型 - 实施"万企融合"行动 带动超3万家企业"上云用云" [3] - 雅光电子自动化生产线使产能提升40% 综合制造成本降低20% [2] - 聚焦24个重点行业领域打造近百个大模型应用场景 [3] - 已有22个大模型项目上线运行包括39AI全科医生等 [3] 未来发展方向 - 重点发展智算产业、高质量数据集产业、行业大模型人工智能产业 [3] - 推进数智化特色电子信息产业发展 [3]