Workflow
量子位
icon
搜索文档
诺贝尔物理学成果48年后终获数学证明!中科大少年班尹骏又出现了
量子位· 2025-08-24 04:38
研究突破概述 - 两位华人学者历经16年攻克Anderson模型的数学证明难题 这一成果是自1958年模型提出以来最重大的进展[1][2][32] - 突破性证明涉及一维带矩阵中电子离域化的严格数学验证 并已扩展至二维和三维场景[31][33] Anderson模型核心机制 - 模型解释半导体材料导电性突变现象:当掺杂原子使材料混乱度超过临界点时 电子从自由移动(离域)转变为被困(局域)[11][16] - 电子运动类比迷宫游戏:有序原子排列形成清晰通道(导电) 无序排列导致死胡同(绝缘)[13][15] - 该现象是半导体成为芯片材料的关键特性 既能导电又可绝缘 且状态可控[7] 数学证明突破细节 - 采用带矩阵特征函数分析:特征值分布范围(带宽)决定电子活动范围 带宽越宽电子越活跃[20][23] - 关键证明方法:通过随机矩阵理论调整矩阵 在保持特征函数不变的前提下简化计算[27][28] - 突破性结论:证明当带宽略宽于预测阈值时 特征函数值较小 电子处于离域状态[31] - 研究耗时16年 期间绘制超200张图表理清复杂方程 最终将循环方程拆解为线性链条求解[31][34] 研究者背景 - 姚鸿泽:哈佛大学数学教授 研究方向为数学解释物理现象 职业生涯长期聚焦Anderson模型[36][44][45] - 尹骏:中科大少年班98级校友 普林斯顿大学物理博士 现UCLA教授 曾获冯·诺依曼研究奖及斯隆奖[3][47][50] 理论跨领域影响 - Anderson模型提出者菲利普·安德森在1972年提出"涌现"概念 认为物理系统在不同复杂度会产生全新性质[52][53] - 该理论成为凝聚态物理学独立宣言 并对当前大模型领域的"涌现"现象研究具有奠基意义[54][55]
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
量子位· 2025-08-24 01:13
开源发布 - xAI正式开源Grok 2模型 包含42个文件 总大小约500GB [1][5][6] - 模型需通过HuggingFace下载 官方建议使用SGLang推理引擎运行 要求8个GPU且每个显存超过40GB [5][6][14] - 模型参数未明确公开 网友推测为2690亿参数的MoE架构 [9][10] 技术性能 - Grok 2在多项基准测试中表现竞争力:GPQA达56.0% MMLU达87.5% MMLU-Pro达75.5% MATH达76.1% [8][12] - 在LMSYS排行榜总体Elo分数曾超越Claude和GPT-4 [6] - 模型采用非商业开源协议 与MIT/Apache 2.0等主流协议存在差异 [11][13] 产品动态 - Grok APP更新v1.1.58版本 新增AI视频生成功能 [16][17][19] - 马斯克宣称xAI将很快超越谷歌 并认为中国公司是主要竞争对手 [20] 发展路线 - Grok 3预计将在半年后开源 [1] - 公司曾延迟原定开源时间节点 但最终完成发布 [2][3][4]
让AI作画自己纠错!随机丢模块就能提升生成质量,告别塑料感废片
量子位· 2025-08-23 05:06
技术突破 - 清华大学、阿里巴巴AMAP(高德地图)、中国科学院自动化研究所联合推出S²-Guidance方法 通过随机丢弃网络模块动态构建弱子网络实现生成过程自我修正 避免繁琐参数调整并实现即插即用效果 [1][3] - 该方法在文生图和文生视频任务中显著提升生成质量与连贯性 具体表现为动态感增强、细节更精致、伪影减少、艺术表达丰富及物体协调性改善 [4][6][19] 技术原理 - S²-Guidance通过随机模块丢弃策略在前向传播时临时跳过部分网络模块 动态构建轻量化内生子网络 利用模型冗余特性暴露完整模型在高不确定性区域的错误倾向 [10] - 采用负向引导修正机制 通过引导公式"最终引导方向=标准CFG引导方向-子网络预测的高不确定性方向"实现自我纠错 精准规避低质量生成区域 [11][12] 性能优势 - 在SD3模型T2I-CompBench基准测试中 S²-Guidance在颜色(59.63%)、形状(58.71%)、纹理(56.77%)维度得分均超越CFG-Zero(52.70%/52.84%/53.37%)和CFG(53.61%/51.20%/52.45%) [27] - 在VBench视频评测中 Wan1.3B模型总分80.93分超越CFG-Zero(80.71) Wan14B模型总分82.84分超越CFG(82.65) 且在语义一致性(74.65)和对象类别(89.08)指标表现突出 [28] 应用效果 - 视频生成解决CFG两大痛点:物理真实性方面消除卡车横向漂移等失真现象 复杂指令遵循方面完整还原"金线环绕人脸+发光粒子"等复杂描述细节 [24][25] - 计算效率几乎无损耗 实验证明单次随机丢弃(N=1)效果与多次平均相当 通过多步迭代自然平均随机抖动实现高质量输出 [36][37]
OpenAI首个蛋白质模型披露更多细节,改进诺奖研究成果,表达量提升50倍
量子位· 2025-08-23 05:06
模型技术特点 - 专为蛋白质工程设计GPT-4o微型版本 具备广泛生物学知识基础和技能 注重可控性和灵活性以支持高级应用场景 [7][8] - 基于GPT-4o精简版初始化 在蛋白质序列 生物文本和标记化3D结构数据集训练 添加文本描述 同源序列和蛋白质相互作用等额外上下文信息 [9] - 处理具有内在无序区域蛋白质与处理结构化蛋白质同样有效 对不稳定蛋白质如山中伸弥因子特别有用 [11] - 输入长达64000个token超长提示时 模型可控性和输出质量持续提升 上下文长度在蛋白质序列模型中前所未有 [14][15] - 在更大数据集训练模型遵循scaling laws 困惑度和下游蛋白质基准测试表现提升 [15] 蛋白质设计突破 - 重新设计山中伸弥因子变体 干细胞重编程标记物表达量提升50倍以上 增强DNA损伤修复能力 [2][17] - 超过30%模型生成序列与野生型SOX2平均存在超过100个氨基酸差异 但表达关键多能性标志物表现更优 传统方法命中率低于10% [27][28] - 模型生成14种KLF4变体表现优于最佳组合方案 命中率接近50% [32] - 最优RetroSOX与RetroKLF变体组合使用时 晚期多能性标志物出现时间比野生型OSKM组合提前几天 [34] - 在mRNA递送方法和间充质干细胞测试中 仅7天内超过30%细胞表达关键多能性标志物 第12天出现大量iPSCs形态细胞团簇 [38] - 超过85%细胞激活关键干细胞标志物内源性表达 衍生iPSCs成功分化为所有三个原始胚层 [39][40] - 单克隆iPSC系经数代培养后确认健康核型和基因组稳定性 持续超越标准因子生成iPSC系基准 [41][42] 应用与验证 - 发现已在多个供体 细胞类型和递送方法中验证 确认衍生iPSC系全多能性和基因组稳定性 [4][18] - RetroSOX/KLF组合处理细胞γ-H2AX强度显著低于标准OSKM 在减少DNA损伤方面比原始山中伸弥因子更有效 [46][47] - 工程化变体改善细胞衰老核心标志 为改进细胞再生和未来疗法提供潜在途径 [49] - 山中伸弥因子用于治疗失明药物 逆转糖尿病 治疗不孕不育和解决器官短缺问题 [19] 行业影响 - 直接优化蛋白质序列非常困难 SOX2包含317个氨基酸 KLF4有513个氨基酸 可能变体数量达10^1000量级 [22] - 传统定向进化筛选方法每次只能突变少数残基 仅探索极小设计空间 15年研究仅产生与天然SOX相差5个残基变体 [22] - AI指导蛋白质设计显著加速干细胞重编程研究进程 综合高命中率 深度序列编辑和标志物提前表达等证据 [43] - 模型在所有候选蛋白中产生最佳变体 提出更多多样化序列同时保持比人类科学家基准更高命中率 [50]
马斯克收购OpenAI新计划实锤了:找小扎筹千亿美元,果然敌人的敌人就是朋友…
量子位· 2025-08-23 05:06
马斯克收购OpenAI计划 - 马斯克计划以974亿美元价格收购OpenAI 旨在使其回归开源模式[6][9][11] - 马斯克主动邀请扎克伯格加入收购财团 试图联合对抗OpenAI[4][9][12] - 该计划源于法庭文件披露 但最终被OpenAI拒绝并指责为宣传噱头[8][19] Meta的AI战略调整 - Meta在6个月内进行第4次AI组织架构重组 新成立"Meta超级智能实验室"并拆分为四个团队[23][24] - 团队包括TBD实验室(基础大模型)、产品与应用研究(产品转化)、MSL基础设施(AI基础设施)和FAIR(基础研究)[24][38] - 公司冻结"亿元俱乐部"招聘并禁止跨团队调动 重组后解散了AGI Foundations团队[22][25] 人才竞争动态 - Meta从苹果挖角AI云基础设施负责人Frank Chu 其曾向苹果AI主管John Giannandrea汇报[26][28][29] - 扎克伯格通过上亿美元offer从OpenAI挖走首席研究官Mark Chen 导致OpenAI人才流失[22][34][35] - OpenAI首席人事官Julia Villagra在任职1年半后离职 与人才流失压力相关[33][34][36] 企业竞争格局 - 马斯克与扎克伯格曾因Threads与推特竞争公开矛盾 甚至约战"笼斗"[13][15][17] - Meta的Llama 4项目失败后加速AI战略调整 专注于基础设施和人才建设[21][22][24] - OpenAI与Meta形成直接竞争关系 双方在人才争夺和技术路线上的对抗持续升级[4][19][35]
“智元机器人收购A股上市公司是创新需要…现金流能撑三年”
量子位· 2025-08-22 09:03
公司战略与融资 - 公司已完成对A股科创板公司上纬新材63.62%的控股[1] - 融资能力强劲 可随时启动融资 计划年底启动C轮融资并引入国际产业方[8] - 当前无营收 但现金流可支撑三年运营[8] - 未来三年计划投入数十亿资金孵化50个早期项目 已投15个早期项目 年化收益达8倍[8] - 启动"智元A计划" 目标三年内打造千亿级产业生态[8] 产品与商业化 - 2024年计划出货几千台机器人 2025年出货数万台 未来目标每年出货几十万台[8] - 商业化路径优先ToB场景 后续拓展ToC市场[8] - 落地场景从简单环境+简单任务逐步过渡到复杂环境[8] - 当前销售以直销为主 但计划2024年渠道占比提升至30% 2026年达到70%以上[8] - 重点布局展厅讲解接待和文娱表演场景 已与马来西亚i-city等国际伙伴签约[56][57] 技术研发与突破 - 团队规模超1000人 平均年龄31岁 其中75%为研发人员[8] - 研发投入中2/3聚焦AI算法 1/3专注机器人本体技术[8] - 实现24小时连续自主行走 突破极端环境适应性(地表温度61℃)[20][21] - 实验室测试已达连续行走3000小时 批量测试完成360小时无异常 正进行720小时测试[22] - 开发视觉SLAM与激光雷达融合方案 强化感知精度与安全性[36][38][39] - 发布动作驱动世界模型开源平台Genie Envisioner 采用3000多小时真实机器人数据训练[25][26] 数据战略与行业合作 - 行业处于数据早期阶段 公司通过杭州湾具身智能创新中心推动数据标准化与产业化[28][29] - 计划1-2年内积累大规模真实数据 目标达到大语言模型数据规模[29] - 采用"数据金字塔"策略 结合互联网数据与真机数据优化模型性能[35] - 与上市公司深度合作 借助其行业资源与资金加速落地[49] - 平台化开发生态 包括开源AMRT框架和AimIO嵌入式系统[45] 国际化进展 - 出海双路径并行:科研教育(北美合作)与商业化(东南亚、日韩、中东)[55][56] - 与英伟达、Skill AI达成数据驱动领域合作[55] - 东南亚市场进展最快 已落地马来西亚主题乐园机器人项目[56] 成本与效率优化 - 工业场景ROI回收周期因地区而异:绵阳约3年 上海约2年 海外可缩短至1年[59] - 通过客户协同优化作业效率 例如料箱转运时间从160秒压缩至40秒[60] - 与富临精工合作降低关节成本 推动整机成本下降[61]
只有5%AI项目在挣钱!MIT最新报告印证奥特曼警告
量子位· 2025-08-22 09:03
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 95% 的AI项目,回报都挂零?!! MIT最新报告显示,原来只有5%的AI项目才能创造百万美元价值,其余的都仍在亏损。 全球加速进入AI投资狂热期,亚马逊站队Anthropic投资27.5亿美元,微软则押注OpenAI投资130亿美元,5000亿美元要造AI基础设施"星际 之门",AI概念股持续飘红…… 但其实这更像是一场豪赌,all所有或一无所有, 奥特曼 甚至还跳出来火上浇油: 我们现在处于投资者整体对AI过度兴奋的阶段,而某些人将亏得很惨。 结合最近小扎突然刹车"亿元俱乐部"招聘,莫非奥特曼暗戳戳内涵的是…… (doge) 95%的AI项目零回报 刚刚 MIT 联合 英伟达 发布了一份AI商业分析报告,给火热市场浇了个透心凉。 要知道仅今年上半年全球在生成式AI上的投入就高达300–400亿美元,超过了2024年全年总和,高盛分析估计,AI总投资还将飙升至 2000 亿美元 。 其余7个主要行业 (能源与材料、高端制造业、金融服务、消费与零售、医疗与制药、专业服务) 均停留在试点阶段观望,高关注却是低转 化。 另外,MIT调研发现企业完全自研工具成 ...
阿里全新AI IDE现在免费用:超强上下文理解,覆盖整个代码库
量子位· 2025-08-22 05:51
产品定位与核心功能 - 专为真实软件开发设计的代理式编码平台 通过智能代理无缝融合增强的上下文工程技术 系统化解决软件开发任务 [3] - 能够深度分析用户代码库 自动生成清晰易懂的文档 类似项目维基百科 使团队成员快速理解项目全貌 [7][8] - 支持同时理解和修改多个互相关联文件 在修改前清晰展示所有更改 支持用户实时审查 [13][14] 技术能力与创新 - 集成全球顶尖编程模型 具备最强上下文工程能力 可一次检索10万个代码文件 [1][27] - 通过规则/记忆/代码图谱/索引四大技术支柱实现深度代码库解析 使AI达到真正"理解"而非仅"看到"代码 [24][26] - 集成长短期记忆系统 基于会话历史总结项目经验和个人偏好 存储为"笔记"实现自我学习和进化 [29] - 智能自动选择最合适LLM 在任务难度与响应速度/成本间自动取得最佳平衡 无需手动切换模型 [31][33] 用户体验与差异化 - 支持自然语言指令分解为可执行开发步骤 像人类搭档一样协同工作 [11] - 学习记忆用户编码风格/架构模式/技术栈偏好 保持舒适编程手感 [16][17] - Quest任务模式支持自然语言功能规格描述 自动理解规划并生成详细报告 实现高度自动化功能交付 [19][21][22] 市场推广与用户反馈 - 当前处于预览阶段 完全免费使用 支持英语和简体中文 [4] - 发布后获得广泛关注 用户试用评价较高 [34][35] - 提供论坛支持用户交流和错误报告 已有部分问题反馈 [39]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 05:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
量子位· 2025-08-22 05:51
核心观点 - 谷歌通过硬核数据反驳大模型高能耗舆论,强调Gemini单次查询能耗极低,仅0.24wh,碳排放0.03g CO₂e,耗水量约5滴,显著低于公众预期 [2][3][4] - 谷歌通过全栈优化(硬件、模型架构、服务系统)实现能效提升,一年内Gemini能耗降至1/33,碳排放降至1/44 [5][6][20] - 公司提出全面能源计算框架,涵盖实际芯片利用率、空闲资源、基础设施等要素,纠正理论计算偏差 [8][13][19] 能耗计算框架 - 现有理论计算方法仅考虑芯片运行能耗(如TPU/GPU耗电0.10wh),忽略实际部署中的关键因素 [8][9][10] - 谷歌提出综合计算指标,包括: - 实际芯片利用率(生产系统利用率低于理论最大值) [9][14] - 空闲计算机(为高可用性预留的容量消耗能源) [15] - 主机CPU和内存功耗(服务必需组件) [16] - 数据中心基础设施开销(冷却、配电等,PUE指标衡量) [17] - 用水量(冷却系统耗水,随能效提升减少) [18] - 综合计算后单次查询能耗为0.24wh(中位数) [19] 能效优化策略 - 模型架构:Transformer框架效率比传统语言模型高10-100倍,采用MoE、混合推理减少计算量 [22] - 训练优化:通过精准量化训练(AQT)降低能耗且保持质量 [23] - 推理服务:推测解码技术(小模型预测+大模型验证)、蒸馏技术(大模型生成轻量服务模型)提升响应效率 [25][26] - 定制硬件:自研TPU芯片(如Ironwood能效比首代高30倍),软硬件协同设计最大化每瓦性能 [27][28] - 资源调度:动态分配TPU资源减少空闲时间,高级编译系统(XML、Pallas、Pathways)提升运行效率 [31][32] - 数据中心:平均PUE达1.09(业界领先),增加清洁能源使用,优化冷却系统与水资源管理 [33] 环境指标对比 - Gemini单次查询全面能耗数据: - 能耗0.24wh(相当于微波炉运行1秒) [3] - 碳排放0.03g CO₂e(低于人类一次排放) [3] - 耗水量约5滴(若仅算TPU/GPU则为0.12ml) [3][9] - 能效提升成果:一年内能耗降为原1/33,碳排放降为1/44 [6]