Workflow
Grok4
icon
搜索文档
马斯克Grok5挑战人类电竞高手 约战《英雄联盟》顶尖战队
搜狐财经· 2025-11-26 02:41
事件核心 - 埃隆・马斯克宣布旗下xAI公司研发的AI大模型Grok5将于2026年挑战《英雄联盟》顶级人类战队,以验证其通用能力 [1] - 挑战将在模拟人类生理与操作限制的条件下进行,包括仅通过摄像头观察显示器(可视范围不超过视力正常人类)以及响应延迟与点击率不得超过人类水平 [1] - 行业专家提议增加《星际争霸》作为比赛项目,马斯克与Grok官方账号均表示接受,显示出行业互动与对通用人工智能边界探索的共同兴趣 [1] Grok5模型技术规格与进展 - Grok5的发布计划已调整至2026年,较原计划延后约一个季度 [1] - 模型参数规模达6万亿个,是当前Grok3、Grok4的两倍,也是主流顶尖模型的30倍左右 [1] - 采用多模态MoE(混合专家)架构,原生支持视频理解功能,可解析长视频并回答时序问题 [1] - xAI正扩建孟菲斯超算节点,计划将GPU数量增至150万颗,以支撑模型训练需求 [1] 挑战的战略意义与行业背景 - 马斯克曾公开表达对Grok5的信心,称其“将在各项指标上遥遥领先其它人工智能,成为世界上最智能的人工智能” [2] - 选择《英雄联盟》作为挑战项目,与该游戏对策略规划、实时决策及多角色协同的高要求相关,这类复杂场景被视为检验通用人工智能(AGI)的重要标尺 [2] - 行业分析指出,此次挑战更侧重在模拟人类限制下验证模型的类人认知与决策能力,而非依赖过往AI在竞技游戏中常见的算法与硬件优势 [2] 当前信息状态与后续计划 - 目前xAI尚未披露挑战的具体时间、对阵战队及赛事规则细节 [2] - 相关信息预计将随2026年Grok5模型的发布而逐步公布 [2]
中兴发了一篇论文,洞察AI更前沿的探索方向
机器之心· 2025-11-26 01:36
文章核心观点 - 当前基于Transformer架构的大模型面临算力消耗大、效率低、与物理世界脱节等核心瓶颈,通用人工智能的实现路径亟待突破 [2] - 行业正从“规模竞赛”转向“效率革命”,探索超越自回归Transformer的新计算范式,特别是物理第一性原理模型与新型硬件的融合 [2][38] - 中兴通讯的论文为下一代AI大模型计算范式提供了重要参考,其自身在微架构创新和新型算法硬件探索方面的实践抢占了技术高地 [2][36][38] LLM现状及瓶颈 - 大模型性能遵循规模扩展定律,依赖计算量、参数量和训练数据量的堆叠,但训练沉没成本极高,例如Grok4模型在20万卡集群耗时半年才完成预训练 [4][5] - Transformer架构计算效率低,算术强度仅为2,远低于卷积神经网络的数百,导致模型算力利用率低,并高度依赖先进工艺和高带宽存储器 [6] - 随着模型参数和上下文长度增加,Transformer架构瓶颈与摩尔定律放缓的矛盾将更突出,面临“功耗墙”和“内存墙”挑战 [7] - 现有LLM存在幻觉、可解释性差等问题,其“Next Token Prediction”核心被部分学者认为难以真正理解物理世界,智能进步严重依赖“暴力缩放” [9] LLM自回归模式的工程改进和优化 - 算法层面通过优化注意力机制(如GQA、MLA、Flash-Attention)和采用低精度量化(如4-bit)来提升效率,但量化会引入误差 [13][14] - 循环递归参数复用架构(如Universal Transformer)通过参数共享提升算术强度,但其大规模扩展后的能力尚不明确 [15] - 集群系统采用张量、数据、流水线和专家并行等范式,混合专家模型可将计算量缩减为原来的1/32,预填充和解码阶段分离部署可提升硬件利用率 [16] - 端云AI协同搭建“快慢思考”系统,端侧处理实时推理,云端处理复杂任务 [17] 硬件工程创新 - 微架构领域专用化,引入异步数据搬移和混合精度训练;通过Scale Up和Scale Out域划分进行互联优化,Scale Up域采用Nvlink提供200纳秒超低延迟 [18] - 光电混合集群和“存算一体”等新型计算范式是构建万卡以上集群、突破“内存墙”的关键技术 [18][19] - 基于光IO技术重构计算体系结构和基于3D DRAM构建新型内存体系是两大前瞻性硬件工程技术 [21] - 万卡以上集群部署需通过算网存仿真平台进行优化 [20] 下一代AI大模型计算范式演进和展望 - AGI的实现需根本性变革,产业界正探索不以Next-Token Prediction为核心的新范式,基于能量、动力学等第一性原理的模型成为重要方向 [23][24] - 新模型发展分为两类:一是改进的Transformer架构,如Diffusion LLM可将推理吞吐量提升10倍以上,能耗减少至1/10;二是基于物理第一性原理的架构,如液态神经模型和基于能量的模型 [26][27][28] - 未来AI计算更受能耗限制,催生三大新型计算范式:物理原理启发(光计算、量子计算、电磁计算)、基于材料特性(概率计算、吸引子网络、热力学计算)和生物启发(类脑计算、DNA计算)的架构 [29][30][31][32][33][34] 中兴通讯的探索与实践 - 公司在微架构层面进行创新,如利用8T SRAM数字存内计算技术实现高能效AI加速器,其XPU-PIM异构架构在能效和吞吐量上相比常规GPU有数量级提升 [36] - 公司探索从物理第一性原理出发的新路线,如循环式Transformer架构可在减少超50%参数量的同时保持模型表达能力,基于FPGA的稀疏玻尔兹曼机将训练时间从超过10小时缩短至5分钟,加速超2个数量级 [36][37] - 公司在光连接、新型内存等支撑性工程技术以及大规模仿真平台等架构技术方面展开前瞻性研究 [37]
The latest circular AI deal stars Anthropic, Nvidia, and Microsoft
Business Insider· 2025-11-18 16:05
合作核心内容 - Anthropic计划在微软Azure云平台上投入300亿美元用于计算资源以扩展其Claude AI模型该计算资源将由英伟达提供[1] - 作为交易的一部分英伟达承诺向Anthropic投资高达100亿美元微软将投资高达50亿美元[1] - Anthropic承诺额外承包高达十亿瓦特的算力容量这些算力将由英伟达的Grace Blackwell和Vera Rubin系统构成[3] 战略意义与市场定位 - Anthropic模型将成为微软Azure上的一个选择并且是首个在三大主要云平台上都可用的模型[2] - 微软作为OpenAI的早期投资者近期完成了与这家前沿模型制造商的财务重组并与埃隆·马斯克的xAI合作在其Azure AI Foundry上托管Grok4[2] 行业背景与市场反应 - 该公告发布之际华尔街对人工智能泡沫的担忧持续存在估值和支出承诺不断膨胀[4] - 英伟达将于周三公布财报其业绩被视为市场对AI前景的晴雨表受到密切关注[4] - 作为全球首家市值达到4万亿美元的公司英伟达股价在过去五天内下跌了约7%[4]
资源不到万亿 OpenAI 的 1% ,Kimi 新模型超越 GPT-5
Founder Park· 2025-11-07 12:00
产品发布与核心能力 - 公司推出开源模型K2 Thinking,是其迄今为止最强的开源思考模型[2] - 模型采用1T参数、MoE架构、32B激活参数、原生INT4量化,并支持256k上下文长度,更好支持国产GPU[3] - 在“人类最后的考试”基准测试中取得44.9%的SOTA成绩,表现超过同类型闭源模型[10] - 模型无需人工干预,可自主实现高达300轮的工具调用和多轮思考能力,解决更复杂问题[6] 技术路径与架构演进 - 从K2到K2 Thinking,技术路径从“模型即Agent”演进到“模型即Thinking Agent”[6] - 模型支持多步工具调用,需将思考内容返回模型进行多次推理以保持连贯性,此能力与Claude的“扩展思考”类似,但OpenAI的GPT系列和Google的Gemini模型尚未支持[21][22][23] - 公司选择先做“交互”再做“反思”的技术范式,重点是多轮工具使用和测试时扩展[16][17][18] - 此技术进展被视为实现AI L3级别的重要突破[20] 行业竞争与资源对比 - 公司估值约为33亿美元,而OpenAI估值为5000亿美元,Anthropic估值为1830亿美元,Grok估值为2000亿美元[28][26] - 公司员工约200人,训练成本约460万美元,而xAI拥有20万块H100 GPU集群,员工超1200人,Grok 4训练成本可能达4900万美元[28][29] - 中国基础模型公司面临资源稀缺挑战,但公司用不到1%的资源实现了对国际巨头的技术超越[29] - 在HLE测试集上,旗舰模型成绩从最初不到20%提升至目前超过40%,显示模型能力持续进步[13]
全球首个AI投资大赛落幕:中国模型全部盈利,美国模型全部亏损
新京报· 2025-11-04 05:47
比赛概况 - 首个AI大模型实时投资比赛“Alpha Arena”于11月4日结束,历时17天,初始资金为一万美元 [1] - 参赛模型包括来自中国的DeepSeek v3.1、Qwen3-Max以及来自美国的GPT-5、Gemini2.5Pro、Claude Sonnet4.5、Grok4,共六个顶尖大模型 [1] - 比赛在真实市场进行,模型无人工干预自主决策交易,根据盈亏决出冠军 [1] 比赛进程与策略 - 比赛前半段DeepSeek v3.1处于领先位置,Grok4通过激进策略一度将差距缩短至1美元 [1] - 10月21日至22日成为转折点,Grok4和Claude Sonnet4.5收益大幅下滑由盈转亏,当日所有六个模型收益率一度全部告负 [1] - DeepSeek v3.1和Qwen3-Max在关键时刻自动改写投资策略,在其他模型持续亏损时脱颖而出 [2] 最终排名与业绩 - Qwen3-Max以12200美元资产和超过20%的收益率夺得冠军,DeepSeek v3.1以10490美元资产获得第二名 [2] - 两家中国模型成为唯二盈利的模型,四大美国顶尖模型全部亏损 [2] - 参赛模型形成三大阵营:两家中国模型位列第一梯队多次互换第一;Claude Sonnet4.5和Grok4维持第二阵营略有盈利但整体亏损;GPT-5和Gemini2.5Pro长期亏损垫底,其中GPT-5亏损超60% [2]
Qwen 3 Max领跑“AI投资实战赛”:阿里通义千问在Alpha Arena跑赢GPT-5与Gemini
经济观察网· 2025-10-23 07:27
竞赛概况 - 由美国研究实验室nof1ai发起名为Alpha Arena的AI投资实战竞赛旨在观察AI自主交易能力[1] - 竞赛吸引六大主流AI模型参赛包括DeepSeek GPT5 Gemini25Pro Claude Sonnet45 Grok4与阿里的Qwen3Max[1] - 每个模型以1万美元初始资金在去中心化交易所Hyperliquid上进行永续合约交易收益率是唯一评判标准且所有交易全程公开[1] 参赛模型表现 - 阿里旗下Qwen3Max暂列收益榜首账户价值为11957美元总收益为1957美元收益率为1957%[3] - DeepSeek Chat V31排名第二账户价值为11392美元收益率为1392%[3] - Grok 4与Claude Sonnet 45分别排名第三和第四收益率分别为08%和-1529%[3] - Gemini 25 Pro与GPT 5表现不佳收益率分别为-5755%和-6538%亏损均超过50%[2][3] Qwen3Max领先策略分析 - Qwen3Max注重机会捕捉与风险平衡在市场波动期快速介入并严格止损保持较低风险敞口[2] - 该模型共完成8次交易频率高于平均水平平均持仓时间约7小时显示出较强的短期响应能力[2] - 其收益率从早期的843%提升至1341%实现稳定增长并显著跑赢同期仅录得145%收益的比特币持有策略[2] 不同模型策略分化 - Qwen3Max通过实时强化学习调整策略使收益曲线呈现稳定上行趋势基于反馈信号的自适应机制是其优势[1][4] - Gemini25Pro与GPT5策略相对激进杠杆倍数较高因入场时机偏差导致大幅亏损[2] - DeepSeek V31Chat与Grok4走势接近初期亏损后迅速回升而GPT5与Gemini25Pro则先涨后跌最终在盈亏平衡区间震荡[2] 技术路径与行业影响 - 与传统依赖历史数据的量化策略不同本次竞赛展现出强化学习与实时决策能力的优势模型通过市场反馈持续优化参数[4] - Qwen系列模型加快多模态能力建设涵盖语言视觉语音编程安全等技术体系从单一任务模型向协同学习架构演进[4] - 分析认为强化学习与实时数据处理能力的提升正持续拓宽AI在投研交易决策及风险管理等环节的应用边界[7]
1万美元AI大模型炒币竞技,领先的果然是它
搜狐财经· 2025-10-21 10:21
实验概述 - 国外金融市场人工智能实验室nof1发起名为“Alpha竞技场”的实验,使用6个人工智能模型进行自主交易[2] - 每个模型的初始交易额为1万美元,在真实市场中进行真金白银的操作,并设有真实基准[2] - 第一季测试将于11月3日结束[11] 模型表现排名 - 截至北京时间10月21日上午11点20分,DeepSeek以余额12000+美元排名第一,Claude以11800美元排名第二,Grok4以11500美元左右排名第三[2] - GPT5余额为6600美元,Qwen3 Max余额为9200多美元,Gemini2 5 Pro余额为6170多美元[2] 关键交易表现与策略 - DeepSeek在上周末实现36%的大幅增长,可能源于对国际形势的精准预判[4] - DeepSeek的收益可能很大程度上来自于做空比特币,而Grok4是最大化做多比特币,Qwen只做多比特币,因此在比特币下跌后亏损不少[8] - 在10月11日的测试实验中,Grok4曾遥遥领先,当时起始金额为200美元,随后才开始起始1万美元的真实竞赛[8] 模型能力评估 - 从创始人角度认为,DeepSeek和Grok似乎对市场的微观结构有更好的背景认知[6] - 创始人在10月19日分享了几大模型交易的逻辑[5]
1万美元AI大模型炒币竞技,领先的果然是它
首席商业评论· 2025-10-21 04:31
实验概况 - 国外人工智能实验室nof1发起名为“Alpha竞技场”的真实交易实验 [2] - 6个人工智能模型参与 每个模型获得1万美元初始资金进行完全自主的交易 [2] - 实验在真实市场环境中进行 使用真实基准进行衡量 [2] - 第一季测试将于11月3日结束 [11] 当前排名与表现 - 截至北京时间10月21日上午11点20分 DeepSeek以余额12000+美元排名第一 [2] - Claude以11800美元位列第二 Grok4以11500美元左右排名第三 [2] - GPT5余额为6600美元 Qwen3Max余额为9200多美元 Gemini2 5 Pro余额约为6170多美元 [2] - 在10月11日的测试实验中 Grok4曾以200美元起始金额遥遥领先 [8] 模型交易策略分析 - DeepSeek操盘的大幅增长来源于上周末 涨幅达36% 可能源于对国际形势的精准预判 [4] - DeepSeek周末的收益可能很大程度上来自于做空比特币 [8] - Grok4是最大化最多 Qwen只做多比特币 因此在比特币下跌后出现亏损 [8] - 从创始人角度看 DeepSeek和Grok似乎对市场的微观结构有更好的背景认知 [6] - 实验创始人于10月19日分享了几大模型交易的逻辑 [5]
分析NVIDIA的近百笔AI投资:什么是AI行业的现在和未来?
创业邦· 2025-10-18 10:15
文章核心观点 - NVIDIA通过战略性投资近100家AI领域创业公司,系统性地构建和巩固其AI生态系统[5] - 投资布局聚焦于两大方向:当前AI模型与云平台以锁定现有市场,以及未来的Physical AI以把握下一波浪潮[5][23][28] - 投资行为具有强烈战略协同性,被投企业普遍是NVIDIA GPU的大客户,形成良性循环[5][29] 投资AI模型和云平台 - NVIDIA投资几乎所有前沿AI模型公司,包括OpenAI、xAI、Mistral AI等,以锁定客户并洞察算力需求走势[5][8] - 参与OpenAI高达66亿美元融资并投入1亿美元,并计划共同部署10吉瓦AI算力系统,承诺投资高达1000亿美元[9] - 参与xAI总额200亿美元融资轮次,投资金额达20亿美元,并与xAI有长期H100 GPU供应合作[10] - 投资欧洲模型公司Mistral AI,参与其C轮17亿欧元融资,并计划在法国部署18000个Blackwell GPU[11] - 投资AI云平台CoreWeave,持有约7%股份,CoreWeave上市后市值达700亿美元,拥有25万个NVIDIA GPU[15] - 参投Together AI的3.05亿美元B轮融资,该公司估值33亿美元,拥有FlashAttention-3等核心技术[16] - 投资数据中心建设商Nscale,参与其11亿美元B轮融资(NVIDIA投资6.83亿美元),支持千亿参数模型训练[17] 投资创新类芯片公司 - 投资网络芯片公司Ayar Labs和Enfabrica,以扩展算力集群的网络吞吐能力[18] - Ayar Labs的光互连方案支持单芯片8.192Tbps双向带宽,延迟低于25纳秒[19] - 青睐Enfabrica,先后参投其B轮、C轮融资,并于2025年以9亿美元收购其核心团队及技术授权[20][21] 投资Physical AI(物理AI) - NVIDIA将Physical AI视为继生成式AI之后的下一波浪潮,认为其能让AI与现实物理世界互动[23][28] - 投资Figure AI,参与其10亿美元C轮融资,该公司是拥有机器人模型和制造能力的全栈具身智能公司[24][25] - 投资自动驾驶公司Wayve,参与其10.5亿美元C轮融资,并可能追加5亿美元战略投资[24][26] - 投资智能工厂方案提供商Bright Machines,参与其1.26亿美元C轮融资[24][27] - 公司自身也布局Physical AI,拥有Cosmos世界模型、Omniverse操作系统及DRIVE Thor芯片等[23]
分析NVIDIA的近百笔AI投资:什么是AI行业的现在和未来?
36氪· 2025-10-17 00:47
文章核心观点 - NVIDIA通过战略性投资近100家AI领域创业公司,系统性地构建和巩固其AI生态系统 [1] - 投资布局覆盖AI模型与云平台、创新网络芯片、Physical AI等关键赛道,旨在锁定当前客户并洞见下一代计算趋势 [1] - 投资行为具有强烈战略协同性,被投企业普遍是NVIDIA GPU的大客户,形成良性循环以巩固行业领导地位 [19] AI模型与云平台投资 - 投资逻辑是通过支持前沿模型公司来稳固AI应用生态基石,模型数量越多、性能越强,NVIDIA的生态系统越稳固 [7] - 投资OpenAI:2024年10月参与其66亿美元融资,投入1亿美元;2025年9月计划共同部署10吉瓦AI算力系统,NVIDIA承诺投资高达1000亿美元 [4] - 投资xAI:2025年9月参与其200亿美元融资轮次,投资金额达20亿美元,并与xAI有长期合作关系,提供H100 GPU用于其超级计算机Colossus [5] - 投资Mistral AI:参与其B轮和C轮融资,C轮融资后估值达117亿欧元;2025年6月合作在法国部署18000个Blackwell GPU [6] - 投资Runway:2025年4月参与其3.08亿美元D轮融资,投后估值超30亿美元 [7] - 投资AI云平台CoreWeave:持有约7%股份,CoreWeave上市后市值约700亿美元,拥有25万个NVIDIA GPU,2025年预计营收50.08亿美元 [9] - 投资Together AI:2025年参投其3.05亿美元B轮融资,估值33亿美元,该公司拥有FlashAttention-3等核心技术 [10] - 投资数据中心Nscale:2025年9月参投其11亿美元B轮融资,NVIDIA投资6.83亿美元,其客户包括OpenAI和微软 [11] 创新网络芯片投资 - 投资目的在于强化智算中心布局,通过高速、大带宽通信网络芯片扩展算力集群的网络吞吐能力 [12] - 投资Ayar Labs:技术核心为光互连解决方案,单芯片支持8.192Tbps双向带宽,参投其2023年C轮和2024年D轮融资 [13] - 投资Enfabrica:2025年以9亿美元收购其核心团队及技术授权,其ACF-S超级网卡芯片支持10万级GPU互联 [14] Physical AI(物理AI)投资 - NVIDIA视Physical AI为继生成式AI之后的下一波浪潮,因其能让AI与现实物理世界互动 [15] - 投资Figure AI:参投其10亿美元C轮融资,该公司为全栈具身智能公司,拥有人形机器人本体Figure 03 [17] - 投资Wayve:2024年参投其10.5亿美元C轮融资,2025年可能追加5亿美元战略投资,其核心为端到端神经网络自动驾驶系统 [17] - 投资Bright Machines:2024年6月参投其1.26亿美元C轮融资,为制造业提供全栈自动化解决方案 [18] - 公司自身布局包括Cosmos世界基础模型、Omniverse物理AI操作系统、DRIVE Thor芯片和Jetson边缘计算平台 [15]