Workflow
量子位
icon
搜索文档
周志华,院士!
量子位· 2025-11-21 02:23
2025年两院院士增选总体情况 - 2025年中国科学院和中国工程院共增选144位院士,其中中国科学院院士73人,中国工程院院士71人[1] - 两院同时新增外籍院士51人,包括中国科学院外籍院士27人,中国工程院外籍院士24人[2] - 增选后中国科学院院士总数达到908人,外籍院士173人;中国工程院院士总数增至1002人,外籍院士148人[55] 人工智能领域院士亮点 - 南京大学周志华教授因其在人工智能、机器学习和数据挖掘领域的贡献当选中国科学院院士[3][7] - 周志华教授论文被引数量超过11万次,h-index为133,i10指数为497[21][23] - 其著作《机器学习》(西瓜书)被译为英、日、韩文出版,被全球500多所院校用作教材[24][25] - 周志华教授是少数获得人工智能相关重要会议Fellow“大满贯”的学者,并于2023年当选国际人工智能联合会议(IJCAI)理事会主席,是54年来首位担任此职的大陆学者[17][18] 信息技术科学领域院士分布 - 中国科学院信息技术科学部新当选院士11人,研究方向涵盖星载合成孔径雷达、卫星通信、脑认知模式识别、机器学习等[36][37] - 中国工程院信息与电子工程学部新当选院士9人,来自北京邮电大学、中国科学院大学、中国移动、中国科学技术大学等单位[43][44] - 南京大学在信息技术科学部有两位教授当选,包括周志华(机器学习)和施毅(微电子学与固体电子学)[37] 企业界院士代表 - 宁德时代新能源科技股份有限公司吴凯当选中国工程院院士,属于能源与矿业工程学部[46] - 比亚迪股份有限公司廉玉波当选中国工程院院士,属于机械与运载工程学部[42] - 金发科技股份有限公司黄险波当选中国工程院院士,属于化工、冶金与材料工程学部[47] - 中国移动通信集团有限公司王晓云当选中国工程院院士,属于信息与电子工程学部[44]
Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会
量子位· 2025-11-20 16:01
产品核心升级 - 模型整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑[4] - 图像生成质量提升,最多支持14张输入图片进行混合,并能保持角色和场景的一致性[7] - 强化文本渲染能力,可将图片中的英文文字翻译成中文、韩文等语言,同时保持原有设计风格[9][13] 技术功能与性能 - 支持2K、4K高清分辨率及多种宽高比,从社交媒体方形图片到电影级2.76:1超宽画幅均可应对[32] - 支持自由调整图像的光线、镜头、对焦、色彩调校等物理属性和构图[33] - 与Google Search深度集成,可基于庞大知识库和实时信息生成准确的图表、地图和信息图[19][20] 应用场景与工作流 - 可实现从创意到生产的完整工作流,营销团队可快速设计生成营销素材,实现创意快速迭代[12][16] - 在Gemini 3高级推理加持下,能生成针对性强、专业的信息图,帮助用户快速将复杂知识可视化,如生成胰岛素-葡萄糖反馈回路解释图或生态系统营养级信息图[25][27][28][30] - 可指定角色生成主题定制化图片,并与Veo 3视频生成模型整合,可将生成的图像作为关键帧继续生成视频[37][39][40] 市场发布与集成策略 - 发布策略覆盖从开发者到普通用户,普通用户可通过Gemini应用使用,免费用户有配额限制,订阅用户享有更高配额[42] - 开发者可通过Gemini API在Google AI Studio和Vertex AI使用,企业用户可享受预配置吞吐量、按需付费及高级安全过滤器[42] - 模型将集成至第三方设计工具如Adobe Photoshop和Figma,并在新的AI开发平台Google Antigravity中集成[43][44] 定价与可用性 - Gemini 3 Pro Image预览版定价为每张图像0.139美元(1K/2K分辨率)和0.24美元(4K分辨率)[43] - Gemini 2.5 Flash Image通用版定价为每张图像0.039美元(1024x1024像素)[43] 内容安全与验证 - 在Gemini app中推出AI图像验证功能,依托SynthID数字水印技术,用户可查询图像是否由谷歌AI生成或编辑[46] - 在Gemini app、Vertex AI、Google Ads、Flow等平台生成的图像中将嵌入C2PA元数据,提供可追溯来源和创作信息的数字档案[48][49]
14万,家务机器人带回家!斯坦福华人博士具身创业首款产品亮相
量子位· 2025-11-20 16:01
产品概览 - 产品名称为Memo,是一款全尺寸人形机器人,主打家务场景,具备收拾桌面、叠袜子、冲咖啡、叠衣服等功能[8][9][10] - 机器人身高1米7,体重170磅(约77.1公斤),水平臂展0.8米,升降柱垂直可达2.1米[43][45] - 采用轮式驱动,平均移动速度为每秒1米,续航时间为4小时,充电需1小时,后续将推出自动充电功能[55][56] 技术核心 - 搭载ACT-1基础模型,是首个融合长时序操控与基于地图导航的端到端模型,仅输入像素或观测值即可直接输出全身动作指令[20][21] - 模型在零机器人数据上训练,完全依赖人类数据,在任务中实现自主导航近40米,与21种不同物体进行33类共68次灵巧交互[22][23] - 通过技能捕捉手套采集数据,手套成本仅400美元,已向开发者寄送超2000副,数据转换成功率近90%[31][36][39] 功能特点 - 具备强抗干扰能力,即使衣物扔到头上也能继续叠衣任务,弯腰捡垃圾等动作流畅[10][12][13] - 采用力感应技术,可精确控制抓握玻璃杯与旋转咖啡机等不同力矩的任务[17][18] - 支持在新环境中导航,模型以3D地图为条件输入,能在6个未见过家庭环境中完成精细操作[24][25][28] 设计细节 - 外观采用白橙配色,头顶棒球帽,机身无外露螺丝孔,面板完美对齐,外壳为柔软硅胶材质,可用家用清洁产品擦拭[3][47][54] - 机体采用刚性与弹性聚合物混合材料,提升结构稳健性与安全性,软壳部件提供多颜色可选[51] - 手臂具7个自由度,手部4个自由度,腕部1个自由度,下半身4个自由度,碰撞后可自动复位,断电时保持稳定[45][57] 公司背景 - Sunday公司由斯坦福华人博士赵子豪与迟宬联合创办,专注于具身智能与全栈机器人研发[60][62] - 赵子豪曾任职于DeepMind、Tesla与GoogleX,是ALOHA、ACT等项目的核心作者;迟宬是UMI和扩散策略等工作的第一作者[62]
抢先报名!第二波嘉宾亮相,百度京东高通亚马逊都来了|MEET2026
量子位· 2025-11-20 09:01
大会基本信息 - 活动名称为MEET2026智能未来大会,定位为年度AI科技盛会 [1] - 大会将于2025年12月10日在北京金茂万丽酒店举办 [17][51] - 大会旨在链接学术与产业、技术与商业,回顾年度热点并探讨未来趋势 [2][3] - 预计将吸引上千名科技从业者现场参与,百万观众线上围观,并有近百家合作媒体联合曝光 [53] 核心议题与前沿方向 - 话题覆盖范围广泛,从最基础的AI基础设施到AI Agent、Robotaxi、具身智能等前沿方向 [1] - 大会将聚焦智能科技产业聚变,共论行业破局之道 [16][53] - 将发布2025人工智能年度榜单,从公司、产品、人物三大维度评选五类奖项 [50] - 将发布2025年度AI十大趋势报告,结合技术成熟度与落地现状,提名并分析具有巨大潜力的趋势 [51] 参会嘉宾阵容 - 第二波确认出席嘉宾来自百度、京东、高通、亚马逊等知名公司 [6] - 百度集团副总裁王颖负责文库、网盘等重点业务,持续引领产品创新和落地 [10][11] - 京东集团高级副总裁何晓冬博士从事多模态智能研究,带领团队打造JoyAI大模型并应用于零售、物流、金融、健康等行业 [14] - 文远知行创始人兼CEO韩旭带领公司在全球11国超30城开展自动驾驶研发测试运营,并完成纳斯达克和香港双重上市 [19][20] - 商汤科技联合创始人杨帆负责人工智能基础设施建设与服务体系建设,推动多个核心业务规模化商业落地 [24][25] - 高通公司AI产品技术中国区负责人万卫星负责终端侧人工智能引擎软硬件的规划及生态系统建设 [28][29] - 亚马逊云科技大中华区产品部总经理陈晓建负责云服务在大中华区的落地、产品管理及业务拓展 [33][34] - 其他嘉宾包括自变量机器人创始人王潜、小宿科技联合创始人杜知恒、蚂蚁集团资深技术专家徐达峰等 [39][43][47] - 第三波重磅嘉宾正在陆续确认中 [48]
14万一台家务机器人!斯坦福华人博士具身创业首款产品亮相,用户还能买回去自己教
量子位· 2025-11-20 09:01
产品概览 - 名为Memo的家务机器人正式亮相,主打家务场景,能完成收拾桌面、叠袜子、冲咖啡、叠衣服等任务[8][9][10] - 产品采用卡通小脸蛋、头顶棒球帽的白橙配色设计,轮式驱动,具有可伸缩腰部[3] - 演示视频为无剪辑、无后期、无遥操的真实操作,展示了其稳定执行任务的能力[4] 技术核心:ACT-1模型 - ACT-1是首个融合长时序操控与基于地图导航的端到端基础模型,可直接通过像素输入输出全身动作指令[20] - 模型在零机器人数据上训练,完全依赖人类数据,支持在陌生家庭环境中完成导航和精细操作任务[21][22][24] - 在测试中,机器人自主导航近40米,与21种不同物体进行了68次灵巧交互[23] - 模型以环境的3D地图为条件输入,能解释并适应未见过的新房屋布局,而非记忆具体房屋[25][26][27][28] 数据采集与技能学习 - 训练数据通过独特的技能捕捉手套采集,手套与Memo手部拥有相同几何结构和传感器,成本仅400美元[29][31][32][36] - 通过技能转换技术,人类数据能以近90%的成功率转换为机器人可用数据,消除人体差异影响[37][38][39] - 公司已向开发者寄送超2000副手套,用户可亲手教机器人新技能,促进模型持续学习[36][40][41][42] 硬件规格与性能 - Memo为全尺寸人形机器人,身高1.7米,体重77.1公斤,水平臂展0.8米,垂直可达2.1米[43] - 每条手臂7个自由度,手部4个自由度,腕部1个自由度,下半身4个自由度[45] - 采用刚性与弹性聚合物混合材料,硅胶软壳提供多色可选,无外露螺丝孔,面板对齐精致[47][51][54] - 运动速度每秒1米,续航4小时,充电1小时,具备碰撞自动复位和断电稳定功能[55][56][57] 公司背景与产品规划 - Sunday公司由斯坦福华人博士赵子豪和迟宬联合创办,专注具身智能与全栈机器人研发[60][62] - 创始人拥有DeepMind、Tesla、GoogleX等顶尖企业背景,主导过ALOHA、ACT、UMI等明星项目[62] - Memo目前处于测试阶段,预计2026年正式推出,目标为打造友好、安全、实用且价格实惠的自主机器人[59][63]
狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max
量子位· 2025-11-20 07:01
文章核心观点 - OpenAI发布GPT-5.1-Codex-Max新模型,在AI编程领域实现多项技术突破,包括突破上下文窗口限制、提升任务处理效率和延长连续工作时间,以应对来自Gemini 3等竞争对手的压力 [1][2][9][34] 模型性能提升 - 新模型在METR指标上达到新SOTA,有50%的概率能完成一项原本需要人类2小时42分钟完成的软件工程任务,比GPT-5对标的时间多出25分钟 [11][12] - 在SWE-bench Verified测试中,相同medium推理力度下,新模型性能优于GPT-5.1-Codex,且思考token使用量减少30% [18] - 针对非延迟敏感任务推出xhigh推理力度选项,通过更长的思考时间以获得更优答案 [20] 超长上下文处理能力 - 模型原生支持压缩功能,在接近上下文窗口限制时可自动压缩对话以获得新窗口,从而突破限制实现跨窗口连贯工作 [22][23] - 在内部评估中,模型能一次独立运行超过24小时,连贯处理数百万token的任务 [25] - 该能力使其能直接处理书籍、长文档分析等超长篇幅任务,避免信息割裂,并支撑高负载、长周期的持续工作 [26][27][28] 实际应用与部署 - 新模型在PR创建、代码审查等实际软件工程任务中训练,推理更快更有效,并且是OpenAI首个支持Windows环境的模型 [16] - 目前已在Codex中支持与CLI、IDE扩展、云端和代码审查工具结合使用,API接口即将上线 [30] 行业竞争格局 - 行业内在AI编程赛道竞争激烈,Claude Code在速度上具有优势,但Claude与Codex的组合可能更具竞争力 [31][32][33] - 同期多家公司发布新模型,包括Gemini 3和Grok 4.1 Fast,显示出行业快速迭代的趋势 [34] 其他产品发布 - OpenAI同时低调发布GPT-5.1 Pro版本,第三方测评显示其在指令遵循方面有更好表现 [36][37][38]
Meta「分割一切」进入3D时代!图像分割结果直出3D,有遮挡也能复原
量子位· 2025-11-20 07:01
文章核心观点 - Meta AI发布SAM 3D模型,能够从单张2D图像直接生成精细的3D模型,代表了3D建模领域的新范式[1][4][7] - 同时发布的SAM 3模型在图像分割基础上增强了语义理解能力,支持通过文本或示例提示进行开放词汇的概念分割[5][6][23] - 两个模型系列在各自领域的多项基准测试中均取得了显著优于现有方法的性能,达到SOTA水平[13][17][36] SAM 3D模型技术特点与性能 - SAM 3D包含两个专用模型:SAM 3D Objects用于物体和场景重建,SAM 3D Body专注于人体建模[8] - SAM 3D Objects能够处理小物体、间接视角和遮挡等复杂情况,从单张自然图像实现3D重建和物体姿态估计[10][11] - 在人类用户对比测试中,SAM 3D Objects的胜率至少达到其他领先模型的5倍[14] - 具体性能指标显示显著优势:F1分数达0.2339,Chamfer距离为0.0408,3D IoU为0.4254,ADD-S@0.1为0.7232[15] - SAM 3D Body在复杂情况下表现优异,MPJPE指标为61.7,PVE为60.3,在多个数据集上的PCK指标分别为68.0和75.4[18] SAM 3模型技术突破 - 突破传统分割模型固定标签集的限制,引入可提示概念分割功能,支持通过文本或示例提示定义概念[21][23][24] - 能够处理细微概念如"红色条纹伞",并通过文本指令或选中示例物体来查找分割所有同类物体[22][26][31] - 在LVIS数据集的零样本分割任务中准确率达到47.0,比此前SOTA的38.5提升显著[37] - 在新的SA-Co基准测试中,表现至少比基线方法强2倍[38] - 在视频分割任务中性能优于SAM 2,在多个数据集上的J&F指标达到78.4至89.6[40] 模型架构与实现方法 - SAM 3基于共享的Perception Encoder视觉骨干网络,服务检测器和追踪器模块[41][43] - 创新设计Presence Head解决开放词汇检测中的幻觉问题,解耦识别与定位任务[45] - SAM 3D Objects采用两阶段生成模型:12亿参数流匹配Transformer构建几何,稀疏潜在流匹配细化纹理[48][49][51] - 通过model-in-the-loop数据引擎低成本获取图像-3D配对数据,人类从8个候选中选择最佳匹配[53][54] - SAM 3D Body采用Momentum Human Rig表示法,双路解码器设计分别处理全身和手部细节[55][57][61] 行业影响与数据集 - Meta与艺术家合作构建SAM 3D艺术家物体数据集SA-3DAO,用于评估物理世界图像三维重建能力[20] - 创建SA-Co基准测试评估大词汇量检测和分割性能,要求识别更大概念词汇量[33][34] - 模型能够很好泛化到多种类型图像,支持密集场景重建,标志着基础模型具身化的进展[13][60]
反超Gemini 3!马斯克放出Grok4.1快速推理版,还曝出了新一轮150亿美元融资
量子位· 2025-11-20 04:09
xAI融资与估值动态 - xAI正计划新一轮150亿美元(约1067亿人民币)融资,公司估值将达到2300亿美元(约1.6万亿人民币)[1] - 该估值较2025年3月xAI与X合并后的1130亿美元估值翻了一倍不止[2] - 若传闻属实,xAI估值从2024年底的500亿美元增长至2000多亿美元,在不到一年时间里翻了四倍[25] xAI发展历程与产品布局 - 公司于2023年7月成立,最初定位为公益性公司,于2024年5月放弃公益身份[13][14] - 核心产品包括搭载自家模型的Grok聊天机器人(独立APP及X平台搭载)以及AI驱动的在线百科全书Grokipedia[17] - 2024年5月完成约60亿美元B轮融资,半年后又完成60亿美元C轮融资,投后估值达500亿美元[21] - 2025年3月,xAI以全股票交易方式收购X,合并后公司估值达1130亿美元[22][23] - 合并后于2025年7月被曝出进行50亿美元债务融资和50亿美元股权融资(其中SpaceX投资20亿美元)[25] 行业竞争与市场趋势 - OpenAI凭借ChatGPT每月获得超2亿美元订阅收入,其估值在2025年10月通过员工股份转售被推高至5000亿美元,较同年3月的3000亿美元增长近67%[4][28] - xAI产品Grok目前深度捆绑于X生态,用户规模及商业影响力与OpenAI尚不在同一量级[5] - 大模型公司正经历新一轮估值飞涨,xAI与OpenAI的估值增长速度均十分显著[3][28] 近期技术进展与市场反应 - xAI最新模型Grok 4.1在人类盲选竞技场中败给谷歌Gemini 3[16] - 作为回应,公司快速发布了基准测试上击败Gemini 3的快速推理版Grok 4.1 Fast[29][31] - 针对xAI寻求150亿美元融资(估值2000亿美元)的传闻,马斯克曾直接回应为不实信息,但未进一步解释[8][10]
聊AI,当然得来量子位MEET大会!
量子位· 2025-11-20 04:09
大会概况 - 大会以“共生无界,智启未来”为主题,关注AI技术穿透产业、学科与场景边界,成为社会演进核心动能 [3] - 大会将聚焦强化学习、多模态、芯片算力、AI+行业、AI出海等年度热议前沿技术与产业落地进展 [4] - 大会将包含学术前沿与商业落地的碰撞,以及来自基础设施、模型、产品产业的领先技术成果 [5] - 大会将权威发布人工智能年度榜单与年度AI趋势报告 [6] - 大会预计吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光 [64] 核心发布内容 - 人工智能年度榜单将从公司、产品、人物三大维度评选五类奖项,结果在大会上正式发布 [60] - 年度AI趋势报告将提名正在释放巨大潜力的十大AI趋势,并进行深入分析,提名代表机构与最佳案例 [61] 参会嘉宾背景 - 嘉宾涵盖学术界与产业界领袖,包括来自清华大学、浙江大学、上海交通大学等顶尖高校的学者,以及来自百度、小米、蚂蚁集团、昆仑万维等企业的技术专家 [12][17][21][27][30][35][40][44][48][53][57] - 嘉宾研究领域覆盖大模型、多模态、世界模型、合成数据、语音识别、高性能计算、行为金融学、AI商业化等前沿方向 [13][23][27][40][45][49][54][58] - 多位嘉宾拥有在国际知名企业如微软、谷歌、英伟达、Meta、IBM等的任职经历,具备深厚的技术研发与产品化经验 [13][27][36][40][45]
芯片就像重庆,英特尔说的
量子位· 2025-11-20 04:09
文章核心观点 - 英特尔在重庆举办的技术创新与产业生态大会上,通过生动的比喻阐述了其技术战略和产品规划[6] - 公司展示了在AI PC和数据中心领域的多项技术突破,包括进入埃米时代的制程工艺和面向AI的处理器产品[7][9][30] - 强调通过深度优化软硬件及构建本土生态,以应对算力需求激增和AI普及化的行业趋势[17][27][33][34] 半导体工艺突破 - 英特尔正式跨入埃米时代,下一代AI PC平台Panther Lake已投入量产,采用Intel 18A制程[9][12] - Intel 18A制程融合RibbonFET晶体管和PowerVia背面供电技术,使芯片在相同功耗下性能提升超过15%,或在相同性能下功耗降低25%以上,晶体管密度提升30%[10][16] - RibbonFET技术通过四面包裹方式控制电流,实现更精准开关控制和更低漏电;PowerVia技术将供电电路移至晶体管背面,解决信号与供电拥堵问题[16] AI PC产品与体验 - 基于Intel 18A制程的Panther Lake将于明年1月CES发布,融合Lunar Lake高能效与Arrow Lake高性能,实现多核性能提升50%、图形性能提升50%以上、功耗降低40%[12][14] - Panther Lake整体AI算力高达180 TOPS,为端侧大模型运行奠定物理基础[15] - 公司提出AI高静游戏本概念,追求性能、温度、静音和续航平衡,并通过XeSS技术使轻薄本也能流畅运行3A大作[20][21] - 软件层面引入稀疏注意力、推测解码等技术,使端侧智能体Token吞吐率提升2.7倍[18] 数据中心与算力战略 - 全球AI大模型每月产生Token数量超过一千万亿,算力需求正转化为电力需求,未来五年AI相关电力消耗将增加3.5倍,数据中心累计投资额预计接近7万亿美元[32][33][34] - 至强6处理器扮演GPU的"神仙队友",支持MRDIMM内存介质并提升PCIe 5.0通道数量,引入AMX矩阵加速引擎使向量搜索等场景性能提升超过72%[38] - 公司目标实现"五个九"的运行可用性,并通过TDX技术保障数据安全,计划于2026年推出"至强6+"处理器和下一代GPU产品[38][40] 生态合作与行业落地 - 公司深度融入中国模型生态,通过指令集优化和量化技术支持DeepSeek、通义千问等国产模型在端侧落地,端侧图像搜索专用模型准确率从85%提升至96%[27][28] - 在智能边缘领域,公司通过SoC整合方案帮助视源股份等合作伙伴实现从传统OPS向AI解决方案转型[24][25] - 与火山引擎合作通过AMX优化使AI模型前置数据处理任务耗时降低90%,"弹性预约实例"结合至强6最高节省83%算力成本[42] - 与中兴通讯、华勤技术、超聚变、立讯等合作伙伴在服务器扩展、工程化突破、AI部署效率和高密度计算方面取得显著成果[42]