大语言模型

搜索文档
人形机器人商业化进程加速!订单密集公布,下个突破点在哪?
中国证券报· 2025-08-03 22:54
人形机器人量产元年 - 松延动力7月量产交付105台人形机器人,环比增长176%,创公司最高月交付纪录 [2] - 松延动力一个月内收获意向订单超2000台,合同额超1亿元,教育教具和商业演出需求占比超60% [2] - 松延动力计划明年交付量达万台,目前在北京、常州、东莞布局生产基地提升产能 [2] - 银河通用商超值守机器人获100家门店订单,计划年底前全国投用 [2] - 智平方AlphaBot系列机器人今年订单近500台,已应用于东风柳汽、晶能微电子等工厂,即将入驻上海虹桥机场 [2] - 星动纪元Q5机器人已获几十台订单,单台售价40-50万元,预计今年交付100台 [3] - 优必选天工行者机器人订单达百台,预计教育科研领域交付超300台 [3] - 智元机器人预计今年出货量达数千台,目前线下量产已超2000台 [3] 企业融资与上市动态 - 智元机器人完成新一轮战略融资,由LG电子和未来资产集团联合投资,此前已获腾讯、京东等10轮融资 [5] - 宇树科技启动上市辅导,中信证券将于10-12月评估其上市条件,已完成10轮融资 [6] - 7月星动纪元、云深处完成近5亿元融资,银河通用6月完成11亿元融资,宁德时代领投 [6] - 优必选过去一年五次配售获净额超43亿港元,多家企业如斯坦德、埃斯顿递表港交所 [6] 技术突破与商业化路径 - 智元机器人提出具身智能需实现"不损失成功率的泛化能力",当前工业场景优先落地,家庭场景需解决复杂性等问题 [7] - 腾讯发布具身智能开放平台Tairos,提供大模型和开发工具 [8] - 上海人工智能实验室推出具身全栈引擎Intern-Robotics,智元机器人开源操作系统"智元灵渠OS" [8] 行业新品与市场预期 - 智元机器人将发布精灵G2,升级运动精度和场景适配性 [4] - 帕西尼将推出轻量化通用人形机器人,具备模块化设计和强越障能力 [4] - 摩根士丹利预测中国2025年下半年将出现人形机器人应用推广潮 [4]
人形机器人商业化进程加速!订单密集公布,行业下一个突破点在哪?
中国证券报· 2025-08-03 14:38
人形机器人行业动态 - 行业预计今年将迎来人形机器人量产元年 [1] - 松延动力7月量产交付105台人形机器人,环比增长176%,创公司最高纪录 [3] - 松延动力一个月内收获意向订单超2000台,合同额超1亿元,教育教具和商业演出需求占比超60% [3] - 松延动力计划明年交付量达到万台 [3] - 银河通用商超值守机器人已获100家门店订单,计划年底前全国投用 [3] - 智平方今年收到近500个通用智能机器人订单,应用于工业、公共服务场景 [3] - 星动纪元星动Q5机器人已获几十台订单,单台售价40万至50万元,预计今年交付100台 [4] - 优必选天工行者人形机器人在手订单达百台,预计教育科研领域交付量超300台 [4] - 智元机器人预计今年出货量达数千台,目前线下量产已超2000台 [4] 企业融资与上市进展 - 智元机器人完成新一轮战略融资,由LG电子和未来资产集团联合投资 [7] - 智元机器人已完成10轮融资,此前获腾讯、京东、比亚迪等产业资本投资 [7] - 宇树科技已开启上市辅导,中信证券将在10月至12月评估其上市条件 [8] - 宇树科技已完成10轮融资 [8] - 星动纪元、云深处7月完成近5亿元融资 [8] - 银河通用6月完成11亿元人民币新一轮融资,由宁德时代及溥泉资本领投 [8] - 魔法原子5月完成数亿元新一轮战略融资,为半年内第二轮超亿元融资 [8] - 优必选过去一年内五次配售,获款项净额超43亿港元 [8] 技术发展与商业化前景 - 智元机器人首席科学家罗剑岚认为人形机器人下一阶段突破点在于"不损失成功率的泛化能力" [10] - 人形机器人需在复杂任务中达到近100%的成功率,依赖具身智能大模型优化升级 [10] - 短期内机器人将在工业智造等受限结构化场景先落地 [10] - 长期来看家庭场景是更大市场,但需解决复杂性、数据隐私等问题 [10] - 腾讯发布具身智能开放平台Tairos,提供大模型、开发工具和数据服务 [10] - 上海人工智能实验室发布具身全栈引擎Intern-Robotics,赋能行业 [11] - 智元机器人发布开源具身智能操作系统"智元灵渠OS" [11] - 摩根士丹利预计中国2025年下半年可能出现人形机器人应用推广潮 [5]
OpenAI杀入通用AI Agent的背后:四大技术流派与下一个万亿流量之战
36氪· 2025-08-03 09:57
OpenAI发布ChatGPT Agent进军通用AI Agent赛道 - 7月17日OpenAI正式发布ChatGPT Agent 融合Deep Research(搜索)和Operator(执行)两大工具 实现"搜索与执行"一体化能力 [1][4] - 技术路线基于浏览器控制 通过视觉模型模拟人类网页操作 通用性强但速度慢 任务耗时可达几十分钟 [7][9][12] - 发布当日ChatGPT日指令量达25亿条 年化9125亿次 相当于谷歌年搜索量的18% [48] 通用AI Agent四大技术流派对比 浏览器为主派(OpenAI) - 优势:全网访问 通用性极强 视觉模型和浏览器点击能力领先行业 [9][13] - 劣势:需加载完整HTML和脚本 Token消耗高 速度慢成为主要痛点 [10][12] 虚拟机+浏览器派(Manus) - 沙盒虚拟机提供隔离计算环境 可本地执行复杂操作 结合浏览器增强功能 [14][16] - 4月融资7500万美元 估值5亿美元 但受限于浏览器能力 页面导航等精细操作困难 [20][22] 大模型+虚拟机派(GensPark) - 限制性沙盒环境搭配预置工具 通过API直接调用服务 牺牲通用性换取速度 [24][26] - A轮融资1亿美元 估值5.3亿美元 集成80多个预构建工具 标准化工作流提升可靠性 [28][31] 工作流+工具集成派(Pokee/UiPath) - 预设节点调用第三方应用 速度达行业4-10倍 工具调用成本降低50%-60% [32][34] - 强化学习自动规划流程 但局限于特定场景 通用性不足 [33] 未来流量入口与商业模式变革 - Agent交互将产生"幽灵光标"现象 取代人类成为互联网访问主力 门户网站流量面临断崖式下跌 [39][41][42] - Google推出Agent2Agent协议争夺入口标准 内容付费模式可能取代广告分成 [42][46] - 创作者可通过API直接收费 广告嵌入Agent工作流环节 商业生态面临重构 [46]
AI大潮下的具身和人形,中国在跟跑还是并跑?
观察者网· 2025-08-03 05:35
具身智能与人形机器人发展现状 - 具身智能被视为通往AGI的必经之路 特斯拉Optimus和波士顿动力Atlas的进展引发全球关注 [1] - 中国在具身智能领域已从"跟跑"转向与美国"并跑"甚至寻求"弯道超车" [1] - 行业讨论焦点集中在电机供应链 强化学习算法 落地场景与资本路径 [1] 美的集团机器人战略布局 - 2016年起通过收购库卡等企业布局To B业务 形成四大板块:楼宇科技 工业技术 机器人与自动化 新兴AI业务 [3][4] - 人形机器人业务2023年启动规划 2024年加速发展 依托电机 减速机等核心零部件技术积累 [4] - 库卡机器人主要服务汽车制造(60%) 3C(20%) 船舶/航空(15%)等工业领域 [4] 格灵深瞳技术路线 - 中国首家科创板AI上市公司 深耕计算机视觉12年 覆盖金融安防 智慧体育等场景 [5] - 推出视觉基础大模型MVT 1.5版本 实现图像到视觉token的转换 [5][32] - 探索视频模型技术 提升机器人对动态场景的理解能力 [36] 人形机器人技术演进 - 关节数量从传统200+缩减至现代40个(全身30个) 强化学习使复杂控制成为可能 [8][9] - 技术路线从液压传动(波士顿动力)转向电动传动(中国供应链优势) [12] - 控制方式从rule-base转向learning-base 提升任务泛化能力 [11][12] 形态路线争议 - 双足形态:适合动态复杂场景(工厂阶梯 火星移民) 具备动力学平衡优势 [16][18] - 轮式形态:平坦场景效率更高(家庭 标准工厂) 安全性更优 [13][15] - 混合形态:智元推出可折叠轮足机器人 尝试平衡效率与适应性 [20] 灵巧手发展路径 - 五指灵巧手:符合人机交互直觉 数据采集便利 但成本高达数万元 [22][25] - 两指夹爪:满足70%基础任务 成本优势明显 成为当前主流方案 [25][26] - 美的认为通用人形机器人必须配备五指手 工业场景则倾向专用末端 [22][23] 技术概念解析 - 具身智能:实现感知-决策-执行的完整闭环 需与物理世界持续交互 [30][33] - World Model:物理世界的数字重建 面临数据采集成本高难题 [40] - 强化学习:具身智能必备组件 但reward函数设计仍是关键挑战 [42][46] 中美产业对比 - 中国优势:机电产业链成熟(占全球人形机器人专利40%) 人才储备充足 政策支持力度大 [63][64] - 美国优势:AI基础研究领先 人力成本推动场景落地更快 [63][66] - 硬件创新中国占优(蔚小理等) 软件创新美国领先 全球市场成为共同目标 [66] 商业化落地展望 - 工业场景优先:上汽计划引入500台人形机器人 分阶段实现自动化 [9][60] - 家庭场景需突破:安全标准 隐私保护 个性化交互等核心问题 [61] - 数据采集瓶颈:需建立类似特斯拉FSD的规模化数据获取机制 [57]
GPT-5呼之欲出 引发五大技术猜想 阿尔特曼为何“感到恐惧”
每日经济新闻· 2025-08-02 06:09
GPT-5发布时间与信号 - GPT-5预计将于2024年8月上旬正式亮相,OpenAI已完成核心架构与能力开发[2][3] - OpenAI CEO萨姆·阿尔特曼在7月19日X平台发文确认即将发布GPT-5,并在7月24日播客中称其表现"令人震惊"[3] - 开发者社区发现Cursor团队已开始内部测试GPT-5-Alpha,MacOS ChatGPT应用中出现了GPT-5-Auto和GPT-5-Reasoning模型[4][5] GPT-5技术特征 - GPT-5将整合GPT系列基础模型、o系列推理模型及GPT-4o全模态模型能力,实现"简化、统一、多模态"的技术路线[7] - 新一代模型单次推理算力消耗不会大幅增加,API价格或较GPT-4o仅小幅增长,推理性价比预计提升一倍以上[8] - 将具备自主规划和执行任务的AI智能体能力,可委派任务、与API交互并自主编排工作流程[8] - 上下文窗口扩展至256K(Horizon Alpha模型已展示该能力),在长时间对话和文档处理中表现更稳定[7][9] - 模型规模将进一步扩大,OpenAI计划在2025年末前部署超过100万张GPU[10] 产业链影响 上游算力需求 - GPT-5将推动"能源-芯片-算力"链条进入新一轮资本投入期,训练和部署阶段对高性能GPU需求激增[10] - 英伟达等GPU厂商持续受益,微软(Maia)、谷歌(TPU)、亚马逊(Trainium)加速自研AI芯片[11] - 全球数据中心计算容量需求到2030年预计增长约3倍,其中70%来自AI负载[11] 中游企业软件 - GPT-5将快速嵌入微软Copilot、Notion、Slack、Salesforce等头部企业服务产品[12] - 微软计划第一时间将GPT-5接入Office 365 Copilot,巩固AI生产力优势[12] - 企业服务或成AI Agent最先落地场景,办公、OA、ERP和营销SaaS厂商有望受益[12] 下游应用领域 - 多模态功能将重塑呼叫中心、医疗诊断和教育等垂直领域[13] - AI+教育、AI+营销、AI+法律、AI+金融、AI+政府等付费意愿高的场景更容易变现[13] - 图片生成和编辑等能力提升将为专业人士提供更高效工具[13]
Kimi K2高速版发布;OpenAI将“星际之门”项目引入欧洲丨AIGC日报
创业邦· 2025-08-02 01:09
OpenAI欧洲AI数据中心项目 - OpenAI宣布启动"星际之门"挪威项目 这是其在欧洲的首个AI数据中心项目 合作伙伴包括Nscale和Aker 站点由Nscale负责设计和建设 预计由Nscale与Aker成立的50/50合资企业共同拥有 [2] 阿里通义千问编程模型 - 阿里通义千问推出编程模型Qwen3-Coder-Flash 该模型在代理式编程 浏览器使用 工具调用等领域超越当前顶级开源模型 仅略逊于顶配版Qwen3-Coder-480B-A35B-Instruct Claude Sonnet-4 GPT4 1等领先闭源模型 [2] Deepseek大语言模型部署专利 - Deepseek关联公司杭州深度求索人工智能基础技术研究有限公司公布"一种大语言模型的部署方法及系统"专利 该专利涉及人工智能领域 通过将预填充阶段和解码阶段分别部署在不同性能的机器上 实现负载均衡 提高硬件利用率 减少闲置算力 降低延迟 提高吞吐量 增强系统扩展性和容错性 [3] Kimi K2高速版发布 - Kimi K2高速版kimi-k2-turbo-preview发布 模型参数与kimi-k2一致 但输出速度从每秒10 Tokens提升至每秒40 Tokens [4] 行业数据服务 - 提供人形机器人 商业航天 AGI等热门赛道的行业图谱和报告 包含2万+LP数据 10万+基金数据 1万+专精特新小巨人企业等 [4][5]
龙虎榜复盘 | 医药小盘股集体大涨,光伏板块迎来局部反弹
选股宝· 2025-08-01 10:07
另外,控股子公司中国电子云深度应用大语言模型技术,结合多年政企数据治理实践经验,构建数据盘点智能体,以智能化、自动化之力,开启政企数据盘 点新模式。 龙虎榜知名游资 一、光伏 龙虎榜机构热股 今天机构龙虎榜上榜33只个股,净买入17只,净卖出16只。当日机构买入最多的个股前三位是:天府文旅(3日2.09亿)、昂利康(3日2.04亿)、深桑达A (1.04亿)。 | 上榜热股 | 实时涨跌幅 | 买/卖家数 | 机构 | | --- | --- | --- | --- | | 天府文旅 000558.SZ | +10.00% | 3/1 | +2 | | 3日 | | | | | 昂利康 002940.SZ | +10.00% | 4/2 | +2 | | 3日 | | | | 深桑达A 龙虎榜显示4家机构净买入1.04亿。 公司大力发展数据要素业务,推出云数一体可信数据空间产品,参与国家数据基础设施试点项目,并与智谱AI等头部企业合作推进AI平台落地。 7月31日,公司发布业绩预告,预计2025年1月1日至2025年6月30日归属于上市公司股东的净利润为17亿元–19.6亿元,比上年同期增长38.65%–59 ...
从OpenAI杀入通用AI Agent,看懂下一个万亿流量之战与四大技术流派
虎嗅· 2025-08-01 07:42
OpenAI突然杀入通用AI Agent战场,推出ChatGPT Agent,意图抢占未来的"流量入口",然而在我们的 采访嘉宾看来,这更像是仓促应战的"占位"之举,其产品效果不尽人意。而此前已有Manus和Genspark 踏入Agent赛道,本次OpenAI的Agent在技术上又有什么不同呢?这期视频我们将剖析当前通用AI Agent 领域的四大技术流派,从浏览器、虚拟机、大语言模型到工作流集成,各流派的工作原理与优缺点是什 么?在"通用性"与"稳定性"中大家做了哪些取舍?更令人深思的是,当AI Agent成为互联网交互的主 体,"幽灵光标"替代真人点击 ,传统的网页流量将迅速下滑,未来巨头们的格局会如何变动?广告生 态将如何被颠覆? 而谁又能在这场万亿级别的流量入口上成为最后的赢家呢? ...
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
量子位· 2025-08-01 04:23
模型性能与技术优势 - 字节Seed最新发布的扩散语言模型Seed Diffusion Preview在代码生成领域表现出色,采用离散状态扩散技术,推理速度显著提升[1] - 在H20硬件上推理速度达2146 tokens/s,比同类Mercury和Gemini Diffusion更快,比同等规模自回归模型快5.4倍[3] - 专注于结构化代码生成,验证离散扩散技术作为下一代语言模型基础框架的可行性[5] 核心技术架构 - 采用两阶段训练策略:第一阶段基于掩码的扩散训练(占训练步骤80%)学习上下文补全,第二阶段基于编辑的扩散训练增强全局逻辑理解[9][10][11][13] - 引入约束顺序扩散技术,通过代码结构化先验解决逻辑混乱问题,确保变量声明等因果关系正确[17][18][19] - 采用同策略学习范式(on-policy)实现训练数据与模型能力动态匹配,减少策略偏差并加速采样优化[21] - 块级并行扩散采样方案将序列分块并行处理,平衡计算资源与生成延迟[23] 实验成果与行业对比 - 代码修复基准CanItEdit的pass@1达54.3%,较自回归模型提升4.8%(54.3 vs 50.5)[14] - 在BigCode Bench(53.2)、MBPP(79.4)、HumanEval(82.8)等多项基准测试中与DeepSeek-Coder-33B(46.2)、Qwen2.5-Coder-14B(52.9)等竞品性能相当[26] - 系统级优化实现推理速度突破,2146 tokens/s显著高于Mercury(1109 tokens/s)和Gemini Diffusion(1489 tokens/s)[26] 应用场景与项目进展 - 特别适合代码编辑任务,在保持生成质量的同时实现高速推理[25] - 项目组开放研究型实习生招募,提供技术报告和体验链接[27]
赛道Hyper | 智谱GLM-4.5:技术突破成因与行业价值
华尔街见闻· 2025-08-01 00:41
核心观点 - 智谱AI发布旗舰模型GLM-4 5并开源 该模型专为智能体应用研发 在性能 成本控制与多能力融合等方面表现突出 [1] - GLM-4 5的突破是技术积累 路径选择与生态协同的综合结果 标志大模型竞争从单点参数规模转向系统效率与生态活力 [10] 技术迭代与架构优化 - GLM系列从GLM-1到GLM-4 5经历四年多迭代 早期GLM模型探索Transformer架构优化 GLM-130B采用DeepNorm和RoPE等技术 [2][3] - GLM-3采用多阶段增强预训练方法 推理速度提升2-3倍 成本降低1倍 为后续参数效率提升奠定基础 [4] - GLM-4 5坚持"高效参数"路线 总参数3550亿中激活参数占比9% 通过优化专家模块协同机制提升效率 [4][5] - GLM-4 5-Air总参数1060亿 激活参数占比11% 部分团队因担心架构复杂度仍选择密集型架构 [6] 性能与成本优势 - GLM-4 5激活参数占比较高 实现参数效率翻倍 API价格仅为Claude的1/10 速度超100tokens/秒 [7] - 训练数据采用"通用+垂直"双层结构 通用文本15万亿token 垂直领域数据8万亿token 按任务单独标注 [7] 多能力融合与生态协同 - GLM-4 5首次实现推理 代码 Agent等多能力原生融合 采用统一底层架构规划参数共享机制 [8] - 智谱AI是国内首批推进大模型开源的企业 GLM-2开源后积累庞大开发者社区 社区贡献轻量化部署方案 [8] - 公司经历11轮融资 资金压力较小 有耐心进行多能力协同专项优化 [9] 团队背景 - 核心团队主要来自清华大学KEG实验室 包括董事长刘德兵 CEO张鹏 总裁王绍兰 首席科学家唐杰曾任清华教授 [1]