Workflow
量子位
icon
搜索文档
国产手机卖到1万6!华为新旗舰,搭载麒麟9030
量子位· 2025-11-25 09:32
产品发布与核心硬件 - 华为发布年度旗舰Mate 80系列和折叠屏旗舰Mate X7,搭载全新麒麟9030系列芯片 [1] - Mate 80 Pro 12GB内存版搭载麒麟9030芯片,Mate 80 Pro 16GB内存版、Mate Pro Max及Mate X7搭载麒麟9030 Pro芯片 [3] - 麒麟9030芯片采用1+4+4的9核心设计,包括1颗2.75GHz大核、4颗2.27GHz中核和4颗1.72GHz小核,GPU为Maleoon 935 [83] 软件系统与AI功能 - Mate 80系列和Mate X7首发搭载鸿蒙6操作系统,AI功能全新升级 [6] - 小艺语音助手进化为小艺智能体,能够自主学习APP操作并并行处理多任务 [16] - 通过A2A智能体协作整合第三方应用生态,如东方财富智能体提供股市分析、深航飞飞智能体协助订票、叮咚买菜智能体推荐食材等 [23][25] - 小艺慧记支持实时转写录音、智能标注截图、关键信息提醒及视频摘要总结 [29] - 鸿蒙星河互联支持手机与电脑一碰即传,甚至可与苹果设备免流量极速互传文件 [35][37] 影像系统升级 - Mate 80系列首发第二代红枫影像系统,基于第二代红枫和第九代ISP,配备17.5EV超高动态主摄和潜望式双长焦 [8] - 色彩准确度较Mate70系列提升43%,动态范围提升300%,进光量提升96%,光谱感知能力提升25% [51][53][54][56] - Mate 80 Pro Max搭载17.5EV超高动态主摄,配备5000万像素1/1.28英寸大底传感器,支持十档物理可变光圈 [59] - Mate X7主摄采用超光变镜头模组,通过四切片镜片与0.4mm超薄玻璃组合实现更薄更轻设计 [74] 产品配置与价格 - Mate X7起售价12999元,高配版15999元 [10] - Mate 80系列起售价4699元 [12] - Mate 80 Pro Max为5G时代后首款全金属机身旗舰机 [5] - 推出AI电子宠物智能憨憨,售价399元,扩展AI硬件生态 [86][88]
学生3年投稿6次被拒,于是吴恩达亲手搓了个评审Agent
量子位· 2025-11-25 05:31
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 科研人不容易。 3年投稿6次全被拒,每次等反馈要半年?? 机器学习大佬吴恩达听说这位学生的"水逆"遭遇后,亲手搓了个 免费 的AI论文评审智能体出来。 通过在ICLR 2025审稿数据上训练系统,并在测试集中对比发现,该AI审稿系统与人类审稿的 相关系数达0.42 ,和人与人审稿间的0.41相近 甚至还高一点。 也就是说,AI评审的判断已经和人类之间相互评审的一致性相当了。 对此,有网友表示:与其等6个月被拒,还不如几分钟内就被拒! 毕竟早拒早改早提交(doge)。 AI评分和人类评分趋于一致 而且传统评审每轮反馈要等上数月,可收到的评论大都聚焦在"评判论文值不值得发表"上,却很少给出如何修改的具体建议。 而吴恩达的这款AI论文评审智能体,恰恰精准戳中这个痛点! 首先说一下它的"审稿"流程。 当你提交论文时,可以选你投的是哪个期刊/会议,系统就会根据那个会议的评审风格来判断。 | ✓ Select a conference/journal 选择会议 / 期刊 | | --- | | ICLR - International Conference on Le ...
马斯克开始用Grok替代员工了!最惨部门裁员90%
量子位· 2025-11-25 05:31
X公司裁员与AI替代 - 马斯克解雇了X公司负责打击垃圾邮件、影响力行动、非法内容等信任与安全问题的工程团队的一半成员[2] - 该团队在裁员前已缩减至不足20人,相比2022年收购推特时超过100人的规模大幅减少[3] - 团队规模从超过100人缩减至不足10人,裁员程度非常深[4] Grok AI接管X平台算法 - 马斯克宣布在未来几周内彻底移除X启发式推荐算法,由Grok通过阅读和观看全部内容来全自动匹配用户兴趣[6] - 此举意味着算法工程师及相关支持人员面临失业[7] - 马斯克希望让X的算法完全AI化,用户可通过询问Grok聊天机器人调整信息流显示内容[23] xAI关键人员配置 - 马斯克将Grok改造X的任务交给了xAI的两位双胞胎工程师Dima和Ievgin Soboliev[11] - 这对双胞胎兄弟在OpenAI挖走xAI工程师负责人后成为xAI顶级工程师,直接向马斯克汇报[11] - 两兄弟在X内部推行马斯克模式,要求工程师在办公室长时间工作包括周末,根除低效率现象,迅速裁撤不必要职位[20] Macrohard AI软件计划 - 马斯克今年8月成立巨硬(Macrohard),号称要用AI把微软产品重做一遍[8] - Macrohard是一家纯粹的AI软件公司,计划完全用AI模拟微软等软件公司[26] - 该公司业务范围包括用于生成人工智能语音和文本的可下载软件、用于编写代码、设计和运行视频游戏的人工智能工具、图像、视频和语言理解系统[30] AI替代战略的风险与影响 - 负责平台安全的团队与生成内容的AI系统之间存在权责不对等,安全团队负责清理违规内容但对Grok生成内容无控制权[34] - X和xAI合并后团队独立运作,导致安全团队清理有害内容时xAI团队可能正在训练Grok变得更具创造性,内部目标不一致[35] - 裁员影响到X Money支付服务项目,团队频繁人员流动导致未能争取到关键州监管机构支持[36][37] xAI团队结构调整 - 今年9月xAI血裁了帮忙训练Grok模型的数据标注团队,超过500名员工被裁约占数据标注团队的1/3[40][41][42] - 裁员后xAI团队合影显示几乎全是东亚面孔,社交媒体上有自称Grok项目唯一白人参与者的员工声称被解雇[44][46]
荣耀500系列2699元起:人物能实况、路人能消除、照片还能自己“跳出来”
量子位· 2025-11-25 03:20
产品概述与定价 - 公司发布荣耀500系列新机,推出超级标准版和超级Pro版两个版本 [1] - 超级标准款起售价为2699元,超级Pro款起售价为3599元 [8] 性能与续航 - 标准款搭载骁龙8s Gen4芯片,Pro版搭载骁龙8至尊版芯片,标准款芯片性能接近Pro档位 [9] - 全系搭载8000mAh青海湖大电池,刷新同价位手机电量纪录,成为档位唯一的"双八"规格产品 [6][15] - 官方现场体验数据显示,追剧、刷短视频、打手游的续航表现均超过iPhone 17 [16] - 标准版支持80W有线快充,Pro版额外支持50W无线快充,全系支持27W有线反充 [16][17] - 叠加荣耀自家通信芯片C+1,整机响应速度更快,在抢高铁票、抢演唱会票等需要瞬时网络稳定性的场景表现更佳 [9] 影像系统 - 全系主摄配备2亿像素AI超清人像及1/1.4英寸大底传感器,搭载1200万超广角镜头 [25] - Pro版额外加入5000万双防抖长焦,防抖等级达到CIPA 5.0 [26] - 行业首发前后置Live人像功能,支持6种胶片风格 [2][30] - 新增Live路人消除功能,可在动态环境中处理无关路人,使主体更突出 [32] - 支持4K视频转Live动图功能,视频部分支持4K转Live [35] - 新增"破框而出"Live特效,可自动识别照片主体并制作成立体跳出的裸眼3D效果 [4][36] 设计与网络优化 - 机身厚度压至7.75mm,黑边收窄至1.05mm,摄像模组沿用"水晶岛"风格并优化握持感 [23] - 提供海蓝宝、星光粉、月光银、曜石黑四种配色 [21] - 针对学生群体进行网络优化,可提前判断宿舍断电断网并自动切换网络,支持校园网免认证登录 [19][20] 高负载性能与游戏体验 - 官方数据显示在《王者荣耀》《原神》等高负载游戏场景下可满帧运行、不易掉帧 [11] 配件产品 - 同步发布荣耀手表X5,主打轻薄大屏,机身重29g、厚度9.9mm,首销价449元 [38] - 发布荣耀Earbuds S耳机,支持49dB深度降噪,最长续航达42.5小时,首销价299元 [40] - 发布荣耀耳夹耳机2 Pro,采用舒适钛拱桥2.0结构,音频单元升级使响度和低频动力提升约200%,国补到手价466.65元 [42] 上市信息 - 荣耀500系列将于11月27日正式开售 [44]
Nano Banana新玩法无限套娃!“GPT-5都不会处理这种级别的递归”
量子位· 2025-11-25 03:20
Nano Banana Pro技术能力 - 能够生成复杂的递归图像,例如描绘艺术家将电脑屏幕上的递归图像复制到画布上的场景[4] - 对提示词中规定的背景和拍摄视角理解非常到位,生成图像包含老式显示器光晕、画布颜料飞溅、相机时间戳等细节[5][13] - 图像生成过程并非拼接现有素材,而是通过分别随机噪声生成看起来相同的元素[24][25] - 尽管存在细节错误,但在低分辨率老照片风格下提供了模糊空间,降低了错误明显度[23] 行业专家评价 - 早期提示工程师Riley Goodside对Nano Banana生成的递归图像表示惊叹,并对比指出GPT-5无法处理同级别递归[5][6][8] - Riley Goodside已加入Google DeepMind从事大模型提示工程工作[7] 用户反馈与市场反应 - 用户在Reddit上使用"Gemini is CRAZY"表达对Nano Banana的强烈兴趣[27] - Gemini 3发布后市场份额从23%快速提升至30%,增长7个百分点[28][29] - 对比ChatGPT用户忠诚度82%,Gemini用户忠诚度为49%[33] - Salesforce CEO Marc Benioff表示在体验Gemini 3两小时后完全转向使用,称赞其推理能力、速度、图像视频处理的飞跃[37] - 有用户形成AI使用组合:Claude用于编程写作,Gemini用于深度研究、搜索、学习、设计及图像视频处理[38]
Claude Opus 4.5发布!2小时工程测试超人类,前代Sonnet搞不定的活它轻松拿捏
量子位· 2025-11-25 01:17
产品发布与核心能力 - Claude Opus 4.5正式发布,主打编码、智能体和计算机使用能力 [1] - 在SWE-bench Verified基准测试中得分80.9%,高于Sonnet 4.5的77.2%和GPT-5.1的77.9% [2][19] - 在Aider Polyglot基准测试中,面对高难度编码难题得分较Sonnet 4.5大幅提升10.6% [22] 性能表现与基准测试 - 在两小时高强度工程任务测试中,模型得分超过所有人类候选人 [16] - 在长时任务续航测试中,任务完成收益较Sonnet 4.5高出29% [26] - 在研究生级推理GPQA Diamond测试中得分87.0%,多语言问答MMMLU测试中得分90.8% [2][19] 计算机使用与工具能力 - 在计算机使用OSWorld测试中得分66.3%,显著高于前代Opus 4.1的44.4% [2][19] - 在Agentic tool use τ2-bench电信场景测试中得分98.2%,零售场景得分88.9% [2][19] - 能够自主处理财务对比分析,完成模板读取、数据收集与Excel输出 [7] 产品升级与定价 - 定价为每百万tokens输入5美元,输出25美元 [12] - 新增“努力度参数”,在中等设置下输出tokens用量减少76%,最高设置下性能提升4.3个百分点且tokens用量减少48% [32] - 取消Opus专用限额,Max与Team Premium用户整体使用额度上调 [43] 平台与功能扩展 - Claude Code推出计划模式,能生成更精准的执行计划并生成可编辑的plan.md文件 [41] - Claude app支持自动总结长对话内容,实现无限续航聊天模式 [42] - Chrome浏览器扩展程序向所有Max订阅用户开放,Claude for Excel扩展测试权限 [42]
奥特曼谈OpenAI首款AI硬件:我想拿起它咬一口
量子位· 2025-11-25 01:17
文章核心观点 - OpenAI联合创始人Sam Altman与前苹果设计总监Jony Ive合作,计划在未来两年内推出一款革命性的AI硬件产品,其设计理念旨在创造一种简洁、直观且能引发用户本能喜爱(如“想咬一口”)的体验 [1][2][7][27] 合作背景与公司成立 - Sam Altman与Jony Ive因对设计、智能及技术作用的共同理念而于两年前开始合作 [9][10] - 双方共同创立了IO公司,目标是以前所未有的方式融合硬件、软件与智能 [11] - Jony Ive视此项目为其一生所学的集大成之作,而Altman则认为这是其一生中最大的技术革命之一 [13] 产品设计理念与开发过程 - 团队在项目初期拒绝预设具体产品形态,而是优先探索如“改变人类与自然关系”、“智能本质”等抽象主题 [16] - 设计哲学强调永不满足的好奇心,认为过度关注预定目标会限制创造性,享受不可预知的创作过程 [17] - 设计团队通过制作大量涵盖形状历史、相机设计等内容的精美书籍来研究设计线索,引导新产品形态的融合 [18] - 最终产品原型被描述为质量“令人震惊”,其出现将显得“不可避免和显而易见” [20][21] 产品特性与用户体验 - 产品设计追求极致的简洁与平和,被比喻为“坐在湖边山间的漂亮小屋里”,以区别于现代设备的喧嚣复杂 [22] - 产品将由一个值得信赖的AI驱动,能够长期为用户过滤信息、感知语境,并在适当时机提供信息或请求输入 [23] - 用户体验将位于复杂与简单之间,目标是让用户几乎不经思考即可即时使用,无压迫感 [24] - 产品整体特点是“看起来简单,但实际用起来却并不简单” [25] 产品形态与发布计划 - 产品预计在未来两年内发布,尽管此前有消息称面临计算资源匮乏的困境 [7][27] - 产品形态可能与早期小道消息(如类似iPod Shuffle)的描述不同,Altman用“用户会想要咬它”来形容其吸引力 [2][4] - OpenAI已与富士康正式达成合作,将共同生产AI硬件,表明产品量产已进入实质阶段 [27]
波士顿动力前CTO加盟DeepMind,Gemini要做机器人界的安卓
量子位· 2025-11-24 09:30
公司战略动向 - 公司在Gemini 3取得市场成功后迅速进行关键人事任命,聘请前波士顿动力首席技术官Aaron Saunders担任DeepMind硬件工程副总裁 [2][3][12] - 此次人事布局旨在强化硬件协同能力,为公司构建通用机器人操作系统的战略目标提供支持 [10][12] - 公司明确将Gemini定位为机器人领域的“安卓系统”,致力于开发可适配任何身体配置的通用AI基础 [6][9][30] 技术愿景与产品规划 - 公司计划构建即插即用的Gemini基础系统,该系统将兼容人形与非人形机器人等多种硬件配置 [6][7] - 技术路径聚焦于开发结合视觉、语言与动作(VLA)的通用机器人基座模型,并通过具身推理实现“先思考,再行动”的智能化 [28] - 产品迭代显示明确技术路线:3月推出基于Gemini 2.0的多模态机器人系统,6月发布优化本地部署的Gemini Robotics On-Device,9月升级至Gemini Robotics 1.5系列 [23][25][27] 行业资源整合 - 新任硬件副总裁Aaron Saunders拥有21年机器人研发经验,曾主导波士顿动力Atlas人形机器人的动力学与控制系统开发 [13][16][20] - 其技术背景涵盖腿式机器人高难度动作控制(如后空翻、跳舞)及Spot机器狗等多元机器人产品线,具备跨形态机器人技术整合能力 [15][18][20] - 此次人才引进结合Gemini 3的技术势能,标志着公司从单一AI模型向机器人全栈生态的战略扩展 [5][31]
1米3宇树G1完美上篮!港科大解锁全球首个真实篮球机器人Demo
量子位· 2025-11-24 09:30
机器人篮球技能突破 - 全球首个能在真实场景中完成篮球动作的机器人demo由香港科技大学团队研发,基于宇树G1机器人实现三步上篮等丝滑动作[1][3][4] - 机器人通过SkillMimic-V2技术解锁"现实世界打篮球"技能,虽未达NBA水平但已接近"村BA"首发标准[3][7] SkillMimic-V2技术核心 - 技术旨在解决交互演示强化学习中演示轨迹稀疏、含噪、覆盖不足的难题,通过拼接轨迹图、状态转移场、自适应轨迹采样提升鲁棒性[9][11] - 拼接轨迹图在不同演示轨迹间寻找相似状态并建立连接,状态转移场从参考轨迹邻域采样以学习恢复能力,自适应轨迹采样动态调整难学片段的采样概率[21][22] - 实验显示困难技能(如Layup)成功率从0%提升至91.5%,技能转换成功率从2.1%飙升至94.9%[25][26] SkillMimic前作技术 - SkillMimic入选CVPR 2025 Highlight,通过统一HOI模仿奖励与接触图技术,在单一奖励配置下训练出精准接触控制能力[27][29] - 采用分层学习架构,低层学习运球、上篮等基础技能,高层复用技能完成复杂任务,成功率显著高于DeepMimic和AMP[31][33] 技术演进与数据集 - PhysHOI为2023年基础框架,通过物理仿真模仿动态人-物交互,引入接触图防止运动学奖励陷入局部最优[34][36][39] - 研究构建BallPlay数据集(含35分钟篮球交互数据),支撑技能学习并在不同篮球尺寸上展现鲁棒性[32][40][42] 研发背景与进展 - 核心研究人员王荫槐(港科大博士)连续主导PhysHOI、SkillMimic系列工作,被称"篮球科研第一人"[43][45] - 从2023年仿真环境测试到真实环境应用,技术迭代速度显著,体现机器人本体发展与算法协同进步[46]
陶哲轩亲测:我用Gemini十分钟搞定了困扰学界多年的难题
量子位· 2025-11-24 07:30
文章核心观点 - 著名数学家陶哲轩借助Gemini 2.5 Deep Think模型,仅用十分钟便成功补全并验证了一个前人未完成的数学难题的证明[1][2][3] - 该事件是AI辅助解决数学问题的典型案例,并非孤例,近期已有6个困扰数学界多年的Erdős难题通过AI辅助得以解决[6] - AI在数学研究中的应用正变得日益普遍和系统化,许多研究者使用AI工具进行文献查询和解题思路探索[7] - AI被视为数学家的重要辅助工具而非替代者,其角色是充当证明的“中介”并帮助发现新的研究路径[35][37] AI模型性能表现 - Gemini 2.5 Deep Think模型在十分钟内完成了从论证分析到结论确认的全过程[3][20] - 该模型由IMO金牌得主参与开发,在最新的FrontierMath测试中,其数学能力远超GPT-5(high)等模型[10] - 在后续的文献查询任务中,Gemini DeepResearch和ChatGPT DeepResearch均能识别出问题所属范畴,但在细节上仍存在混淆[27] 具体问题与解决过程 - 解决的数学问题是由Paul Erdős提出的367号问题,涉及连续整数结构的乘法数论[12] - 数学家Wouter van Doorn基于一个未验证的同余恒等式提出了反证,陶哲轩将此交给Gemini进行完整证明[16][19] - 在Gemini完成p-adic代数数论证明后,陶哲轩手动花费半小时将其转换为更基础的论证方式[21] - Boris Alexeev使用Harmonic的Aristotle工具,花费两到三小时完成了该证明的Lean形式化验证[24] AI在数学领域的应用趋势 - 陶哲轩自三年前ChatGPT发布起就开始系统性探索AI在数学证明中的应用[29][30] - AI的进步使得数学研究未来将拥有更多的实验性方法,而不仅仅是理论推演[30] - 对于缺乏专业知识但怀有热忱的学习者,AI将帮助他们达到难以想象的学习深度[32] - 需要警惕AI可能产生的“幻觉错误”,数学家的细心纠正仍是不可或缺的环节[34]