大语言模型

搜索文档
GPT-5落地,Kimi掉队,大模型“腰部危机”或将提前
犀牛财经· 2025-08-19 08:34
OpenAI GPT-5发布与资本市场反应 - OpenAI推出GPT-5 大语言模型与推理模型深度耦合 事实错误率较GPT-4o下降47% 多轮复杂任务一次性通过率刷新SOTA [2] - 资本市场迅速反应 英伟达股价当日上涨6.4% 微软股价上涨3.1% A股算力租赁板块整体高开 [2] 月之暗面Kimi模型市场表现 - Kimi K2开源模型上线不足一月热度迅速退潮 与DeepSeek并称大模型双雄的竞争地位明显弱化 [2] - 2024年7月MAU滑落至1408万 国内排名第九 较2024年12月高点蒸发近三分之一 [3] - 2024年春节营销投入超1亿元 单用户获客成本30元 但MAU增长仅为短期现象 [4] Kimi模型面临的多重挑战 - 长文本技术优势被快速抹平 豆包/通义/元宝等厂商将长文本上限卷至百万tokens标配 [4] - 垂直场景工具通过专业数据库绑定切走高价值客群 金融学术等领域遭受降维打击 [4] - 数据生态受限 依赖公开语料与有限合作方 难以启动数据飞轮效应 [4] - 算力成本高企 美国GPU禁售导致国产替代性能折损30%-50% 外采云资源训练成本较自建云大厂高20%以上 [4] - 资本支持不足 2023年8月后未获新融资 2024年底股权纠纷导致潜在出资方观望 [4] 国内大模型市场竞争格局 - 2024年国内大模型公开订单金额超400亿元 科大讯飞/百度/阿里/腾讯占据80%以上份额 [5] - 腰部厂商市场机会锐减 在头部厂商垄断格局下基本颗粒无收 [5]
“数”看期货:大模型解读近一周卖方策略一致观点-20250819
国金证券· 2025-08-19 07:33
股指期货市场表现 - 上周四大期指主力合约全面上涨,中证1000期指涨幅最大达5.21%,上证50期指涨幅最小为2.19% [3][11] - IC、IM处于贴水状态且贴水收窄,IF、IH转为升水状态 [3][11] - 四大期指合约成交量均上升,IH上升幅度最大为65.56%,IM上升幅度最小为30.52% [3][11] - 四大期指持仓量均上升,IH上升幅度最大为11.50%,IF上升幅度最小为3.16% [3][11] - 当季合约年化基差率分别为:IF-1.00%、IC-7.95%、IM-8.22%、IH1.71% [3][11] 跨期价差与套利机会 - IF、IC、IM和IH当月与下月合约跨期价差率分别处于2019年以来18.10%、32.40%、14.20%和9.00%分位数 [4][12] - 以年化收益5%计算,IF正反套当月合约基差率需分别达到0.84%和-1.57% [4][12] - 以年化收益5%计算,IF正反套下月合约基差率需分别达到1.20%和-2.34% [4][12] - 目前IF主力合约不存在正反套机会 [4][12] 分红影响与市场预期 - 沪深300、中证500、上证50和中证1000指数分红对9月主力合约点位影响分别为3.62、1.40、1.39和0.89 [5][12] - IH、IF主力合约转为升水格局,IC、IM主力合约贴水收窄,显示市场情绪持续火热 [5][13] - 中美关税暂停延期带来良好宏观预期,半导体、光伏板块上行预期增强 [5][13] - 四大合约跨期价差处于历史分布偏左位置,IH持续远高近低格局显示市场看好A股未来 [5][13] 卖方策略观点汇总 - 10家券商认为增量资金持续入市,外资和险资活跃度上升,居民存款搬家处于早期阶段 [6][37] - 8家券商认为市场情绪高涨,交投活跃,赚钱效应扩散 [6][37] - 行业方面对科技成长、红利、上游资源品板块有一致性看好 [6][37] - 12家券商认为A股市场呈现牛市特征,有望延续震荡上行或慢牛趋势 [37] - 6家券商对债市持乐观态度,5家持中性态度 [37]
端到端VLA的起点:聊聊大语言模型和CLIP~
自动驾驶之心· 2025-08-19 07:20
大语言模型技术发展 - 大语言模型近五年发展迅速,Transformer架构是核心技术基础 [3][5][7] - Transformer核心模块包括注意力机制和多头注意力,通过8个head增强编解码能力 [11][12] - 位置编码采用正弦/余弦函数实现顺序表征,公式为PE(pos,2i)=sin(pos/10000^(2i/d_model)) [9][13] - BPE分词算法通过合并高频字符逐步构建词表,流程包括统计频次、迭代合并等步骤 [8][13] 视觉与语言模型对齐技术 - CLIP是视觉与大模型对齐的典型代表,实现跨模态特征匹配 [18] - 多模态技术栈涵盖BEV感知、扩散模型、强化学习等方向 [48] - VLA(Vision-Language-Action)成为自动驾驶前沿方向,整合VLM、BEV和强化学习技术 [50] 端到端自动驾驶课程体系 课程结构 - 第一章概述端到端发展史,对比模块化与端到端范式差异 [40] - 第二章重点讲解大语言模型、BEV感知、扩散模型等关键技术 [41][48] - 第三章分析二段式端到端方案,涵盖PLUTO、CarPlanner等经典算法 [42] - 第四章深入一段式端到端,包括UniAD、DiffusionDrive等前沿工作 [43][47] - 第五章设置RLHF微调实战,强化VLA技术迁移能力 [52] 技术亮点 - 覆盖CVPR'25最新成果CarPlanner和AAAI'25世界模型Drive-OccWorld [42][45] - 实战项目包括Diffusion Planner和ORION开源框架复现 [47][50] - 课程目标使学员达到1年经验算法工程师水平,掌握40-70K岗位核心技术 [31][57] 行业应用与人才需求 - VLA算法专家岗位薪资达40-70K-15薪,需求集中在3-5年经验硕士 [31] - 技术栈要求涵盖多模态大模型、BEV感知、模型量化部署等方向 [34][48] - 主机厂加速布局端到端量产方案,推动世界模型、扩散模型等技术落地 [26][50]
限时价23.59万元起 奥迪 E5 Sportback开启预售
北京商报· 2025-08-18 14:27
产品发布 - 奥迪E5 Sportback开启预售 全系共推出4款配置车型 限时售价23 59万元起 [1] 产品设计 - 采用封闭式格栅设计 集成灯光模组 电子外后视镜和贯穿式扰流板等设计 降低风阻系数 [3] - 内饰采用门板嵌入进口原木饰板 配备奥迪设计师甄选30色隐藏式渐变氛围灯 [3] 动力性能 - 搭载前后永磁同步电机 最高转速达21000rpm 0-100km/h加速3 4秒 [3] - 搭载宁德时代CTP无模组电池 最高续航达773km [3] - 采用800伏高压平台架构 可实现10分钟快速补能370km [3] 智能系统 - 搭载全新AUDI OS操作系统 融合高通骁龙8295数字座舱芯片 构建超感互动数智座舱 [3] - 配备奥迪助手 依托深度定制的火山引擎大语言模型"豆包" 具备强大的语义理解 多轮对话及车控交互能力 [3] 智能驾驶 - 联手Momenta打造基于Momenta飞轮大模型的辅助驾驶方案 [4] - 集成27个感知硬件 包括激光雷达 3个长距毫米波雷达 12个超声波雷达 11个摄像头 [4] - 采用英伟达Orin-X芯片提供强大算力支持 可应对城市道路 高速高架及泊车等多种场景 [4]
鸿海攻机器人大脑 英伟达助阵 人形产品将会思考、判断、解决问题
经济日报· 2025-08-17 23:13
鸿海与英伟达合作开发人形机器人 - 鸿海将在11月科技日推出与英伟达合作的最新一代人形机器人,技术层次提升至大语言模型(LLM)平台,具备思考、判断和解决问题能力 [1] - 人形机器人核心AI大脑基于鸿海3月推出的FoxBrain繁体中文AI模型,由英伟达完成训练,在数学与逻辑推理测试中表现优于Meta同等级模型 [1] - 鸿海美国德州工厂将在2024年第一季度导入人形机器人用于GB300 AI服务器生产,目前正训练机器人完成拿取物体、插入缆线等组装工作 [1] 机器人技术进展 - 鸿海开发的FoxBot工业机器人品牌由鸿准负责制造与组装,已向全球四大机器人厂送样并预计2023年开始出货 [2] - 鸿准2011年已具备年产超1万台FoxBot机械手臂能力,将投资10亿美元进军美国制造 [2] - 广宇计划第4季度并购比利时机器人公司,专注机器人关节(如髋关节、大腿)生产以提升承重和扭力性能 [2] 产业链布局 - 鸿海集团形成鸿准(制造组装)和广宇(关键组件)的双箭头布局 [2] - 鸿准持续强化机器人机构设计、精密加工与规模化量产能力 [2] - 广宇通过并购整合欧洲技术资源,完善机器人关键零部件供应链 [2]
“智汇丝路·融通四海”,第六届“一带一路”出版合作经验交流会举办
北京日报客户端· 2025-08-17 05:58
行业动态 - 第六届"一带一路"出版合作经验交流会在广州举办 主题为"智汇丝路·融通四海:创新驱动'一带一路'出版协同发展" 吸引全国近300位出版发行界 科技企业代表及海外出版人参与[1] - 交流会同步公布第六届"一带一路"出版合作典型案例征集与国际化人才遴选活动结果[1] 国际合作成果 - 自2013年以来 中国出版界翻译3000余种中国经典著作 与50多个国家出版社共建选题库 推出1200余种合作图书 促成1 8万项版权贸易[3] - 埃及希克迈特文化产业集团翻译出版超700本中阿互译图书 推广几十位中国作家作品 与100余家中国机构建立合作关系[10] 企业创新实践 - 中国出版集团推动《习近平扶贫故事》对外译介 深化亚洲经典著作互译计划 开发"荀子""思瓜""格物"等大语言模型项目以延伸出版产业链[5] - 广东省出版集团实施"南粤互译计划" 组建"海丝书香同盟" 运用生成式AI和区块链技术建立可信知识服务平台 开发沉浸式阅读产品[7][8] 技术发展趋势 - 全球AI论文发表量从2004年3 6万篇增至2024年48 6万篇 中国在AI论文数量 生成式AI专利影响力方面领先全球[12] - 专家建议利用AI翻译 多媒体电子书等工具拓展数字渠道 构建跨境版权保护协同网络应对盗版挑战[15] 国际合作建议 - 提议共建中阿联合数字出版平台 设立翻译与数字化支持基金 创立"一带一路出版与文化学院"[10] - 强调中外学者合编导读 培养复合型人才 实现从语言转换到文化共鸣的跃升[14][15]
机器人,还当不了打工人
创业邦· 2025-08-16 03:15
人形机器人行业现状 - 人形机器人在2025世界机器人大会(WRC)上成为焦点,展示出灵巧双手、逼真皮肤和表情能力,能完成表演、家务和简单交流任务 [6] - 当前人形机器人存在动作单一、效率低下和价格高昂等问题,高端灵巧手价格达10万-20万元,整机成本可达百万级别 [6][9][23] - 行业分为To B(文娱表演/工业制造/文旅服务/医疗康养)和To C(家庭场景)两大方向,文娱表演是目前最成熟的应用场景 [13][14] 技术发展现状 - 硬件方面运动性能日趋成熟,但软件智能化严重不足,停留在Demo水平,缺乏真实物理环境交互数据 [16][18] - 控制方式主要采用遥操/同构臂/语音控制三种,但离AI自主控制仍有差距 [12][13] - 部分企业如星尘智能通过绳驱传动设计和VLA模型实现技能迁移,银河通用通过GroceryVLA模型实现零售场景自主决策 [19][22] - 英伟达向银河通用提供Jetson Thor芯片,推动具身智能发展 [23] 商业化与资本市场 - 2023年上半年中国机器人产业营收同比增长27.8%,工业/服务机器人产量分别增长35.6%/25.5% [25] - 前7个月新增机器人相关企业15.28万家(同比+43.81%),现存相关企业95.8万家 [25] - 全球超20家人形机器人公司启动IPO,中国占16家,包括宇树科技/智元机器人/傅利叶智能等 [25] - 头部企业估值分层:第一梯队(智元/宇树/银河通用)估值超70亿,第二梯队20-50亿 [27] 企业竞争格局 - 宇树科技核心硬件自研率达95%,G1基础版售价9.9万元,商业化落地能力突出 [25] - 智元机器人全链条布局,构建产业生态 [26] - 傅利叶智能聚焦医疗康复领域,推出Care-bot GR-3陪伴机器人 [26] - 行业分为"人工智能派"(侧重大脑)和"机器人派"(侧重身体)两大技术路线 [26]
视觉强化学习最新综述:全领域梳理(新加坡国立&浙大&港中文)
自动驾驶之心· 2025-08-16 00:03
研究背景与综述定位 - 视觉强化学习(Visual RL)的爆发源于强化学习在大语言模型(LLM)中的成功迁移,特别是RLHF(人类反馈强化学习)显著提升了LLM的人类偏好对齐与复杂推理能力[7] - 当前领域面临三大核心挑战:复杂奖励信号下的策略优化稳定性、高维视觉输入的高效处理、长周期决策场景的可扩展奖励函数设计[7] - 综述核心目标包括形式化视觉RL问题、分类200+研究为四大支柱(多模态LLM/视觉生成/统一模型/VLA模型)、分析算法设计与评估体系[8] 视觉强化学习的理论基础 - 问题建模采用马尔可夫决策过程(MDP),将文本/图像/视频生成统一为episodic MDP框架,状态包含用户prompt和已生成动作序列[15] - 三大对齐范式:RLHF(三阶段流程:SFT→奖励模型→PPO优化)、DPO(直接优化偏好数据)、RLVR(可验证奖励替代主观偏好)[18][19][20] - 策略优化算法PPO(带价值网络与KL惩罚)和GRPO(组相对优势+移除价值网络)分别适用于通用场景和内存密集型任务[26][27] 四大核心应用领域 多模态大语言模型(MLLM) - 常规RL驱动型MLLM使用可验证奖励(如精确匹配/IoU)优化VLM骨干,代表模型包括RePIC、GoalLadder、GRPO-CARE[32] - 空间感知方向分为2D(Omni-R1双系统GRPO优化情感识别)和3D(MetaSpatial用渲染深度奖励优化AR场景生成)[34] - 图像推理分为"基于图像思考"(SVQA-R1用视图一致性奖励)和"用图像思考"(GRIT优化答案正确性+框精度)[35] 视觉生成 - 图像生成三大奖励范式:人类中心偏好优化(ImageReward)、多模态推理对齐(UnifiedReward)、Metric驱动优化(DDPO最小化FID)[37][40] - 视频生成通过偏好模型优化(InstructVideo)、组相对优化(DanceGRPO)、领域特定奖励(Phys-AR惩罚物理定律违反)提升时序一致性[41] - 3D生成采用RL优化文本-网格生成(DreamCS融合轮廓IoU与CLIP对齐)、交互式编辑(Nabla-R2D3用实时渲染验证奖励)[41] 视觉-语言-动作模型(VLA) - GUI自动化分桌面(GUI-R1映射点击成功为稠密奖励)和移动场景(AgentCPM-GUI压缩动作空间适配设备)[42] - 视觉导航采用端到端RL(VLN-R1时间衰减奖励处理轨迹)和仿真微调(Flare实现家居场景泛化)[45] - 机器人操纵通过任务接地奖励(TGRPO)、课程式RL(RLVLA提升重排成功率)优化长周期规划[45] 评估指标与未来方向 - 分层评估框架包含集合级(FID/FVD)、样本级(人类偏好分数)、状态级(KL散度监控策略漂移)[46][48][49] - 开放挑战包括有效推理平衡(自适应周期策略)、VLA长周期RL(分层子目标发现)、视觉思考RL(混合动作空间设计)[50][51][52] - 奖励模型设计需融合低阶信号(几何一致性)与高阶偏好,并实现跨模态泛化与动态更新[53][56]
港股午评:恒指跌1.19%、科指跌1.08%, 医药股强势,科技股低迷
金融界· 2025-08-15 04:21
港股市场表现 - 恒生指数跌1.19%报25215.1点,恒生科技指数跌1.08%报5515.77点,国企指数跌1.26%报9013.58点,红筹指数跌0.15%报4395.34点 [1] - 大型科技股普跌,阿里巴巴跌2.63%,腾讯控股涨0.76%,京东集团跌3.84%,小米集团跌1.69%,网易跌1.44%,美团跌3.14%,快手跌1.6%,哔哩哔哩-W涨1.01% [1] - 互联网医疗股大涨,叮当健康涨超26%;中资券商股走强,中州证券涨超13%;生物技术股多股大涨,银诺医药上市首日一度涨近300%;电力设备股涨幅居前,上海电气涨超8%;稳定币概念走弱,耀才证券金融跌超11% [1] 公司动态 - 阿里巴巴集团旗下智能信息事业群启动大规模AI人才招聘计划,社招与校招总规模近千人,聚焦大语言模型、多模态识别与理解、多模态训练工程以及智能体应用、AI硬件等前沿技术领域 [2] - 中国电信上半年收入2715亿元同比增加1.3%,净利润230亿元同比增加5.5% [3] - 长和上半年收入2406.63亿港元同比增长3.45%,净利润8.52亿港元同比减少91.65% [4] - 京东集团二季度收入3567亿元同比增加22.4%,净利润62亿元同比下滑约50.8% [4] - 网易上半年收入567.2亿元同比增长8.37%,净利润189.02亿元同比增长31.33% [5] 机构观点 - 中泰国际指出港股估值短期已大幅修复,恒指预测PE回归2018-2019年中枢,风险溢价处历史低位与AH溢价创近六年新低,8月进入港股季节性淡季 [6] - 国泰海通认为全年南向净流入规模有望超过1.2万亿元,或为港股资金蓄水池提供源源活水 [6] - 平安证券(香港)指出中国7月出口数据意外强劲,降息预期支撑下港股延续上涨势头,港股具备较低估值以及交易渐趋活跃等优势 [6] - 光大证券表示港股整体盈利能力相对较强,互联网、新消费、创新药等资产相对稀缺,结合当前估值仍偏低,长期配置性价比仍较高 [6]
别盯着GPT-5了!Google这款Genie 3世界模型,才是未来的AI核心战场
老徐抓AI趋势· 2025-08-15 04:00
AI行业焦点转移 - 当前AI行业关注点正从GPT-5转向Google DeepMind发布的Genie 3世界模型,后者被视为更具颠覆性潜力 [5] - 大语言模型(LLM)基于Transformer架构的发展已接近天花板,升级幅度递减且仅能生成语言描述而非可交互环境 [5] - 世界模型处于"人无我有"阶段,掌握该技术的公司极少,突破后将重塑AI产业格局 [5] 世界模型核心技术特征 - 世界模型能生成逻辑一致、可自由探索的虚拟环境,与被动播放的视频有本质区别 [6] - 环境细节动态生成并保持物理常识一致性,例如刷漆后的墙面颜色持久保留 [6][9] - 可实现事件与环境的自然融合,如龙降入水面时产生符合物理规律的水花效果 [11] 行业应用场景 - 游戏/影视行业:单次文本输入即可生成3A级开放世界,成本从数十亿级别大幅降低 [14] - 自动驾驶:通过自然语言描述生成训练场景,覆盖极端工况并支持参数化调整(天气/光线/路况) [15][17] - 元宇宙基建:解决传统3D建模成本过高问题,推动虚拟世界规模化落地 [20] 技术竞争格局 - 世界模型将成为自动驾驶、机器人、沉浸式体验等领域的关键基础设施 [22] - 谷歌/Meta等科技巨头已布局镜像世界(Mirror World)技术,与智能眼镜等硬件形成生态协同 [20] - 该技术可能催生新一代互联网形态,实现现实与虚拟的深度融合 [20] 产业变革影响 - 将顶级3D内容生产能力从专业工作室向大众市场普及 [14] - 彻底改写自动驾驶训练成本结构,解决真实数据采集瓶颈 [15][19] - 为具身智能(Embodied AI)提供物理规则完备的训练环境 [20]