Workflow
大语言模型
icon
搜索文档
GLM-4.5大模型杀出重围 “领跑者”智谱走上台前
北京商报· 2025-07-31 14:55
核心观点 - 智谱华章发布新一代旗舰大模型GLM-4.5,综合得分位列全球第三、国产第一,专为智能体应用打造,实现复杂推理、代码生成及智能体交互等能力融合与技术突破 [1][3] - GLM-4.5采用混合专家(MoE)架构,总参数量3550亿,激活参数320亿,在开源社区Hugging-Face榜单全球第二,创增速纪录 [3] - GLM-4.5在真实场景Agentic Coding测试中展现出竞争优势,API调用成本较低,输入0.8元/百万tokens、输出2元/百万tokens,被评价为"成本更低、性能更优" [4] - 公司已启动IPO上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的"大模型六小虎",并获多地国资战略投资 [1][7] 技术能力 - GLM-4.5是首款原生融合模型,首次在单个模型中实现推理、编码和智能体能力原生融合,能够一键生成复杂应用、游戏、交互网页 [5] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,国产第一 [3] - 在真实代码智能体的人工对比评测中,GLM-4.5达到开源SOTA(当前最佳技术),实测国内最佳 [3] 市场表现与竞争 - GLM-4.5发布仅2小时就被X平台推荐上首页,12小时后位列Hugging-Face榜单全球第二,创增速纪录 [3] - OpenAI将智谱定义为全球竞争对手,GLM-4.5的发布早于OpenAI多次推迟的GPT-5 [1][6] - 在真实场景Agentic Coding测试中,GLM-4.5相比其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出 [4] 商业模式与资本动向 - 公司已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,8月将进入正式辅导期第二阶段 [1] - 公司获多地国资战略投资,股东背景多元,可同时获得应用场景、政务资源、国际市场等支持 [7] - 与具身智能相比,智谱专注通用大模型与智能体,商业模式相对成熟,直接竞争较少 [8] 行业趋势 - 大模型的下一个范式是将各种能力整合到一起,成为一个"全优生",GLM-4.5正是朝着这一目标努力 [5][7] - OpenAICEO山姆·奥特曼提到GPT-5将整合大量技术,包括o3,但发布时间多次推迟 [6] - 智谱与OpenAI相似之处在于双方都在各自国家较早地开始训练大模型,并探索不同方向的能力边界 [7]
AI令一些人失业,但也让一些人工资大涨
财富FORTUNE· 2025-07-31 13:05
AI对劳动力市场的重塑 - AI正在加速科技行业裁员 受影响员工数量高达8万人 仅微软就裁减1 5万个岗位 同时承诺向新AI项目投入800亿美元 [1] - 非技术岗位对AI技能需求激增 相关职位薪资平均增长28%(约1 8万美元/年) 传统技术岗位占比从2019年61%降至2024年49% [2] - 2024年超半数AI技能需求来自非科技行业 营销 人力资源 金融 教育 制造业等领域AI工具整合加速 [3] 非技术领域AI应用爆发 - 要求GenAI技能的非技术岗位数量暴增8倍 营销 设计 教育 人力资源成为增长最快领域 [3] - 2024年明确要求GenAI技能的职位达6 6万个 较前一年增长近4倍 大语言模型 ChatGPT 提示词工程为热门技能 [6][7] - 客户支持 销售 制造等行业AI人才薪酬涨幅最大 复合型AI技能可使薪资比招聘广告再高43% [5][8] AI技能的价值分化 - 艺术类岗位受AI冲击最大 但沟通 管理 创新等人类独有能力在AI时代价值凸显 [4][10] - 技术岗位更需高级机器学习专家 非技术岗位仅需基础AI应用能力即可获得升职加薪机会 [8][10] - 头部企业正将AI融入全业务链 提升营销 HR 财务等部门的AI技能以构建未来竞争力 [10] 劳动力市场结构性变化 - AI技能普及带来28%薪资增长 但可能伴随高薪技术岗淘汰与低薪岗小幅提薪的结构性压缩 [11] - 掌握两项以上AI技能者薪资溢价显著 人类判断力与AI技能结合的人才极度稀缺 [8][9] - 企业招聘AI岗位时十大核心能力包含技术基础与软技能 复合型人才最受青睐 [9]
新一代青年与新一代人工智能 | 两说
第一财经资讯· 2025-07-31 10:01
人工智能技术发展现状 - 以ChatGPT、DeepSeek为代表的大语言模型展现出革命性突破,具备惊人的理解、推理和创造能力,正在重塑人类社会的知识生产方式和价值创造模式 [1] - 人工智能技术已进入全新节点,大模型评测高考成绩理科达985水平,文科可冲击顶尖高校 [4] - 开源AI模型如DeepSeek通过开放技术大幅降低应用门槛,推动青年多元化成长 [15] 人工智能在教育领域的应用与挑战 - 全国高校纷纷开设AI通识课,但需警惕学生过度依赖AI完成作业而丧失独立思考能力 [4] - 人工智能使用可分为三个层次:先"用"以积累经验,然后"不用"以重建信心,最终达到"用与不用"的有无之境 [4] - 文科和理科的差异正在拉平,文科生利用AI可完成工科领域任务,如搭建LSTM时序分析模型和多模态微表情识别项目 [13] 人工智能的创造性与幻觉问题 - 大模型的幻觉现象是其将语料知识根据概率统计生成新内容的结果,完全消灭幻觉会同时消灭其创造性 [8] - 幻觉不能单纯视为技术问题,需要在试错过程中由个人辨别,而非在实验室完全解决 [6] 人工智能对行业结构的影响 - 人工智能打破了传统知识生产和学习的金字塔结构,如围棋领域从师承传递转变为普惠知识获取 [17] - 围棋行业在AI冲击后并未消亡,反而更加繁荣,表现为更多儿童学习围棋、围棋班增加和比赛竞争加剧 [17] - 开源精神体现为"功成不必在我,但成功一定有我"的理念,为青年创新创造多元土壤 [15] 青年与人工智能的未来发展 - "80后"、"90后"在AI技术创新中发挥重要作用,但青年需适应从封闭知识体系向开放结构的转变 [10] - 当科技创新进入"无人区"时,人类的主动性和创造性将变得至关重要 [10] - 在新知识结构下,教育体系需重新定义学习内容和知识结构,突破传统文理科划分 [12]
R2还没来,但DeepSeek的秘密武器已经“剧透”了
虎嗅· 2025-07-31 07:58
行业技术突破 - DeepSeek与北京大学联合研发的"原生稀疏注意力(NSA)"技术获ACL最佳论文奖 该会议被公认为自然语言处理领域顶级风向标 [2][3][4] - NSA技术首次实现稀疏注意力在完整训练流程的应用 突破仅能用于推理阶段的限制 在27B模型上实现训练前向计算加速9倍 反向传播加速6倍 [5][23][44] - 该技术显著提升长文本处理效率 在64k上下文长度下推理速度提升11.6倍 同时保持模型性能不降反升 [5][16][45][46] 技术原理创新 - NSA采用三重机制模拟人类阅读行为:Token Compression压缩早期文本为摘要块 Token Selection精准选择相关原文细节 Sliding Window保留最近上下文精细注意力 [26][27][28] - 通过门控机制动态平衡三种阅读策略 实现硬件对齐优化 兼容GQA架构和FlashAttention-2内核 基于Triton重写关键kernel [30][31][52] - 原生可训练特性使稀疏模式与模型协同优化 在MMLU、GSM8K等9项基准测试中7项超越全注意力模型 DROP测试推理能力提升显著 [32][33][35][37] 性能表现数据 - 在64k长度(约8万字)"大海捞针"测试中实现100%信息检索准确率 LongBench评测平均分0.469超越全注意力基线的0.437 [38][40][41] - 上下文长度与加速比呈正相关:8192长度加速4倍 16384长度加速6.4倍 32768长度加速9.1倍 65536长度加速11.6倍 [46] - 传统注意力机制在64k上下文长度下占据70%-80%推理延迟 NSA通过稀疏化计算有效降低延迟 [18][43] 行业应用前景 - 技术已通过27B及MoE架构完整预训练验证 具备商业化落地条件 将应用于下一代DeepSeek大模型 [51][52][53] - 突破性提升长文本处理能力 支持整本书籍、多份财报、完整代码库的直接分析 无需人工拆分 [49][54] - 计算效率提升将传导至API成本降低 加速AI应用生态发展 [55][58][59]
英美情报界如何使用AI模型?
观察者网· 2025-07-31 05:52
【文/经济学人】 7月23日,美国总统特朗普在参加"赢得AI竞赛"峰会期间展示关于人工智能行动计划的行政命令 7月14日,五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI(该公司的聊天机器人在最 近一次更新后一度自视为希特勒)等企业分别授予了最高达2亿美元的合同。这些公司将测试"代理 型"(agentic)AI模型。此类模型能够代替用户执行任务,并将复杂任务拆分为若干步骤,还可以操控 其他设备,比如汽车或计算机。 这些前沿实验室不仅活跃在军事领域,也正深度介入欧美的情报界。早期的大多数应用都集中在利用大 语言模型分析机密数据这方面。今年1月,微软公司表示,其26款云计算产品已获准用于美国情报机 构。6月,Anthropic宣布推出Claude Gov,并称该模型"已部署在拥有最高国家安全保密级别的情报机构 中"。目前,美国所有的情报机构都在广泛使用AI模型,其中不乏来自多个实验室的竞品。 AI公司通常会根据情报机构的需求对模型进行"微调"。例如,出于安全考虑,Anthropic面向公众开放的 Claude模型可能会拒绝处理带有"机密"标识的文件;而Claude Gov版本则会被调校 ...
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”|WAIC观察
财经网· 2025-07-31 03:53
WAIC展会核心观察 - 展会吸引约35万线下观众,800多家展商展示从大模型到机器人零部件的全产业链技术进展 [1] - 大模型应用从ChatBot转向Agent成为行业焦点,Agent市场规模已达50亿美元且年增长率40% [3][4] - 人形机器人实现从"被吊着"到实际场景复刻的跨越,展示娱乐表演/工厂作业/家庭服务三大类应用 [2][10] 大厂Agent布局 - 阿里推出无影AgentBay并展示三款开源大模型,夸克AI眼镜集成Qwen大模型支持导航/支付/比价功能 [3] - 百度GenFlow 2.0 Agent平台支持多智能体协作和主动干预,8月将全量上线 [3] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1,联合金融机构推出超百个金融智能体解决方案 [6] 大模型"六小虎"动态 - 百川智能和零一万物未参展,后者战略转向ToB推出万智企业大模型平台2.0 [7] - 阶跃星辰发布Step3大模型并组建"模芯生态联盟",全年营收目标10亿元 [8] - 智谱AI展示AutoGLM模型可自主完成电商操作,月之暗面重点展示K2模型 [8] 人形机器人进展 - 宇树/智元/星动纪元等厂商展示舞蹈/搬运/服务等场景,核心零部件六维力传感器出货量年增2000+台 [10][12] - 蓝点触控六维力传感器占国内70%市场份额,订单排至9月并完成近亿元B轮融资 [12][14] - 非夕科技展示自适应机器人完成蛋雕/按摩等精细操作,结合具身智能大模型实现复杂任务 [11] 基础设施与算力 - 超云展示AI大模型一体机SuperCube R7000,强调高性价比和专业服务 [9] - 大模型一体机市场快速膨胀,超云通过联合生态伙伴打通应用落地"最后一公里" [10] 行业趋势 - 技术展示转向场景演练,AI应用从"技术炫技"进入产品化能力比拼阶段 [14] - 具身智能技术路线尚未收敛,软硬协同和生态组建成为竞争关键变量 [14]
刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
机器之心· 2025-07-30 16:25
ACL 2025大会概况 - 本届ACL大会投稿数创历史新高,达8000多篇,较去年4407篇增长81% [3] - 主会论文接收率20.3%,Findings接收率16.7% [3] - 中国作者占比首次过半达51.3%,远超美国14.0% [4] - 共颁发4篇最佳论文、2篇最佳社会影响力论文、3篇最佳资源论文等多项奖项 [6] 最佳论文研究成果 - DeepSeek团队与北大杨耀东团队包揽4篇最佳论文中的2篇 [10] - 杨耀东团队论文揭示大模型存在"弹性机制",导致对齐困难且需与预训练相当的资源 [24][25] - DeepSeek提出NSA注意力机制,在27B参数模型上实现长上下文高效训练与推理 [33][40] - NSA通过分层token建模实现260B token预训练,性能媲美Full Attention但计算效率更高 [37][41] 技术创新方向 - 大模型安全领域突破:发现模型参数存在抵抗对齐的结构性惯性 [24] - 高效训练技术:NSA实现硬件对齐的稀疏注意力,解码速度随序列长度增加而提升 [36][41] - 数据质量评估:Meta-rater提出四维度数据选择方法提升预训练效率 [55] - 评估效率优化:SubLIME方法可将LLM评估成本降低80%-99% [56] 行业影响与趋势 - 华人团队学术影响力显著提升,包揽最佳论文半数奖项 [10] - 大模型基础架构创新持续涌现,注意力机制优化成为关键突破点 [33][37] - 模型安全与对齐挑战凸显,需重新评估现有技术路线 [24][25] - 高效训练与推理技术获重点关注,推动商业化应用落地 [40][41]
预见2025:《2025年中国人工智能代理行业全景图谱》(附市场现状、竞争格局和发展趋势等)
前瞻网· 2025-07-30 14:39
行业定义与演进 - 人工智能代理是由大语言模型驱动,整合MCP代理等插件,具备感知环境、自主决策、目标导向和学习能力的软件系统 [1] - 行业从Chatbot(2016-2020年)演进至Copilot(2021-2023年),再发展到当前具备自治决策和环境交互能力的Agent阶段(2023年至今) [8][10] - 技术演进路径为:从预定义规则机器人→具备基础推理的效率工具→拥有百万tokens记忆能力的多模态数字雇员 [10] 产业链结构 - 产业链形成基础层(云计算/AI芯片/算法框架)、技术层(大模型/多模态技术/知识图谱)和应用层(B/C/G端及硬件载体)的三层体系 [2][5] - 基础层由硬件与算力提供方支持大模型运行环境,技术层由模型提供方输出成熟大模型,应用层通过平台中台整合模型并对外提供服务 [2] - 行业在数据规模和应用创新上有优势,但面临高端芯片依赖和数据合规性挑战 [5] 政策环境 - 2015年《促进大数据发展行动纲要》首次推动大数据与AI结合,支持智能分析和自动化决策技术 [11] - 2017年《新一代人工智能发展规划》明确发展智能机器人、自然语言处理等技术,支持金融、医疗等领域代理应用 [11] - 2021年出台《数据安全法》和《个人信息保护法》,规范AI代理数据收集使用边界,要求获得用户授权 [11] - 2022年《"十四五"数字经济发展规划》提出发展智能客服、智能合约等代理技术,推动自动化服务 [11] 市场规模与增长 - 2023年中国AI Agent市场规模达554亿元,预计2028年增长至8520亿元,年均复合增长率72.7% [12] - 智能客服市场规模2023年超70亿元,预计2027年达181.3亿元,年均复合增长率超27% [13] - 智慧安防市场规模2023年达1226亿元,预计2028年达5598亿元,年均复合增长率35.5% [13] - 智能车载市场规模2023年达119亿元,预计2028年达640亿元,年均复合增长率40% [13] 应用场景与渗透率 - AI Agent使个人博主内容制作时间从20-30分钟缩短至5分钟,服务2000万-3000万网红博主群体 [13] - 2023年企业渗透率不足5%,预计2028年大型企业渗透率达25%,中小企业达15% [15] - 工业与医疗领域增长潜力显著,智能投顾市场预计2030年达1.5万亿元,年复合增长率超40% [27] 竞争格局 - 行业呈现"头部集中、生态分化、场景深耕"特征,阿里巴巴、腾讯、百度等头部企业主导大模型层 [21] - 百度构建AI基础设施,腾讯聚焦生态协同,阿里驱动业务重构,形成三种差异化战略路径 [21] - 科大讯飞2024年营收233.43亿元,医疗Agent覆盖4000家医院,教育Agent客单价2980元且毛利率85% [22][24] - 特斯联2024年营收18.43亿元,AI业务同比增长162.9%;智谱AI商业化收入增长超100%,C端产品年化收入破千万 [22] 技术创新与突破 - 多模态技术(GPT-4v、Gemini 2.0)实现文本、图像、语音及实时视频流融合 [30] - 强化学习微调和推理模型使医疗诊断误差率降至2.3%,金融尽调周期缩短80% [30] - 国产模型DeepSeek-R1通过架构优化降低推理成本,推动技术普惠化 [30] 企业动态与融资 - 初创企业Manus在GAIA测试性能超越OpenAI,支持92%准确率的简历筛选和17种数据源整合,获7500万美元融资后估值达5亿美元 [25] - 开源平台Dify成为GitHub最受欢迎国产智能体项目;Cluely成立2个月获a16z 1500万美元融资,估值1.2亿美元 [25] - 华为与科大讯飞联合开发"星火Agent云"获国家算力中心10000P优先调度权 [23] 未来发展趋势 - AI PC预计2025年全球出货量突破1亿台,占比40%,直接推动AI Agent装机量增长 [27] - 2026年82%的组织计划整合AI Agent,50%中国500强数据团队将应用相关技术 [28] - 行业竞争从技术竞赛转向"场景理解+生态协同"阶段,垂直领域市场规模潜力达传统SaaS十倍 [27][30]
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”
财经网· 2025-07-30 14:13
展会规模与参与情况 - 2025年WAIC线下观众达35万人次 [1] - 超过800家展商参展 覆盖大模型、具身智能、AI基础设施及机器人核心零部件等领域 [1][2] 大模型厂商动态 - 百度、阿里、蚂蚁、腾讯等大厂重点展示AI应用 Agent成为竞争焦点 [1][3][6] - 大模型"六小虎"出现分化:百川智能和零一万物未参展 月之暗面与智谱展台规模缩减 阶跃星辰联合芯片厂商组建生态联盟并设10亿元年营收目标 [1][7][8] - 阿里发布三款开源大模型及Agent平台"无影AgentBay" 百度推出GenFlow 2.0 Agent平台支持多智能体协作 [3][6] - 零一万物战略转向to B 推出万智企业大模型平台2.0版本 [7] 智能体(Agent)技术进展 - 全球AI Agents市场规模突破50亿美元 年增长率达40% [4] - 蜜度推出"校对通"多模态智能体 可处理混合文件包并生成勘误报告 [4] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1 联合金融机构推出超百个金融智能体解决方案 [6] - 智谱AutoGLM模型实现自主抢红包、淘宝下单等操作 [8] 人形机器人场景落地 - 机器人应用场景分为娱乐表演、工厂作业和家庭服务三大类 实现敲锣打鼓、搬箱子、叠衣服等实际任务 [2][10][11] - 宇树机器人设擂台表演 智元机器人展示跳舞送水等技能 数字华夏机器人表演《夜上海》 [10] - 非夕科技自适应机器人完成蛋雕、按摩、穿关东煮等精细操作 千寻智能机器人Moz1实现递送饮料及走珠任务 [11][12] - 星动纪元、擎朗科技、傅利叶等公司分别展示街舞、食品制作及互动功能 [11] 核心零部件与供应链 - 蓝点触控六维力传感器占国内人形机器人市场70%份额 订单排至9月 2024年工业机器人出货量超4万台 [12] - 传感器研发周期从2-3个月压缩至2-4周 公司完成近亿元B轮融资 计划2028年具备IPO条件 [12][13][14] 算力与基础设施 - 超云展示AI大模型一体机SuperCube R7000等产品 强调高性价比和专业服务 [8][9][10] - 大模型一体机市场快速膨胀 超云通过联合生态伙伴打造解决方案 [10] 技术趋势转变 - 行业从"技术炫技"转向"场景演练" ChatBot隐身 Agent成为主战场 [14] - 多模态、推理能力和低成本成为用户核心需求 [1]
综合性能领先 智谱GLM-4.5登顶HuggingFace Trending榜单
证券日报网· 2025-07-30 12:50
本报讯 (记者梁傲男)7月30日,记者从北京智谱华章科技股份有限公司(以下简称"智谱")获悉,智谱发布的新一代旗 舰模型GLM-4.5登顶HuggingFace Trending榜单。 智谱/供图 据记者了解,GLM-4.5参数量为DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多项标准基准测试中表现得更好,得 益于模型更高的参数效率。在性能优化之外,GLM-4.5系列也在成本和效率上实现突破:API调用价格低至输入价格为0.8元/百 万tokens,输出价格2元/百万tokens,大幅低于目前主流的模型定价。 在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测 试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。 智谱方面表示,大语言模型的目标是在广泛领域达到人类认知水平,而非针对特定任务而设计专家模型。一个优秀的大语 言模型必须具备通用问题解决、泛化能力、常识推理和自我改进等核心能力。过去五年里,OpenAI的GPT-3学会了常识知识, 而o1模型则通过强化学习实现了"先思考后回答",在编程、数据分析和复杂数学 ...