Workflow
量子位
icon
搜索文档
梁文锋,Nature全球年度十大科学人物!
量子位· 2025-12-09 01:21
梁文锋与DeepSeek入选《自然》年度人物 - 权威科学期刊《自然》公布2025年度十大科学人物榜单,DeepSeek创始人梁文锋因模型对AI领域的重要贡献与变革性影响成功当选[1][3] - 《自然》给予梁文锋的形容词为“Tech disruptor”(科技颠覆者),并提及他金融从业者的身份[4] - 梁文锋为人低调,拒绝了《自然》的采访请求,其模型开放程度与其个人神秘程度形成对比[5] DeepSeek的技术与行业影响 - DeepSeek模型凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量[8][9] - DeepSeek的出现证明,大模型不一定要堆数据、堆参数、堆服务器,也能达到一线水准的能力[10] - DeepSeek近期发布并开源了V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平[11][12] 梁文锋的个人背景与职业历程 - 梁文锋1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉[14][16] - 2008年毕业后投身量化投资创业,其团队在2010年沪深300股指期货推出后乘势发展,自营资金很快超过5亿元[17] - 2015年,梁文锋与校友共同创立幻方量化,一年后推出首个AI模型,使用GPU进行深度学习生成交易仓位[18] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募,被称为国内量化私募“四大天王”之一[19] - 2023年5月,瞄准通用人工智能,幻方量化成立独立新组织“深度求索”,即DeepSeek[21] 另一位中国入选者杜梦然 - 中国科学院深海科学与工程研究所研究员杜梦然同样入选《自然》2025年度十大科学人物,其形容词为“Deep diver”(深潜者)[6][22][23] - 2024年,杜梦然团队在日本东北部的千岛—堪察加海沟底部,使用载人潜水器“奋斗者号”发现了地球上已知最深的基于化学合成的生命群落,挑战了现有深海极端生命和碳循环模型[25] - 杜梦然1987年出生于安徽亳州,拥有中国海洋大学学士学位、硕士学位,后赴美国Texas A & M University攻读博士学位[28][29][31] - 她曾跟随载人潜水器“蛟龙”号、“深海勇士”号、“奋斗者”号下潜20余次,研究成果发表在《Science》等顶级期刊[33] 《自然》年度其他入选者概览 - Susan Monarez:美国疾病控制与预防中心前主任,因坚守科学底线被解职,引发对科学独立性与公共卫生政策的反思[35] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系将论文撤稿纳入考核指标[36] - Tony Tyson:薇拉·鲁宾天文台的构想者与推动者,该望远镜将以前所未有的规模透视暗物质与宇宙演化[37] - Precious Matsoso:成功引导世界卫生组织近200个成员国就首份《全球大流行病条约》草案达成一致[38] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得了延缓疾病进程的关键证据[39] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过释放携带沃尔巴克氏体的蚊子有效降低登革热发病率[40] - Yifat Merbl:从蛋白酶体中发现一个由数千种潜在抗菌肽构成的全新免疫防御系统,颠覆了免疫机制认知[41] - KJ Muldoon:身患超罕见病,在六个月大时接受了首例高度个性化的CRISPR基因编辑疗法,标志着基因医学迈向“一人一药”的精准时代[42]
看完最新国产AI写的公众号文章,我慌了!
量子位· 2025-12-08 12:00
文章核心观点 - 智谱公司发布的新一代视觉推理模型GLM-4.6V,在功能、性能与成本上实现显著突破,其强大的多模态处理能力(涵盖文档、图像、视频、代码等)已能高效完成多种专业任务,对内容创作、研究分析、编程开发等领域的工作模式构成潜在冲击 [1][8][70][71] 模型核心功能与应用场景 - **文档智能处理与内容生成**:GLM-4.6V的“文档智读”功能可快速解读学术论文、财报等复杂文档,并生成结构清晰、图文并茂的总结、对比分析或公众号文章 [2][4][5][7][14][16][17][22][27] - **跨文档对比分析**:模型能同时处理多份文档(如多篇论文或多家公司财报),提取关键数据与图表,进行对比并生成综合性报告 [16][18][19][22] - **视觉界面复刻与前端开发**:通过识别网站截图,GLM-4.6V能自动生成高度还原的HTML和CSS代码,并能根据自然语言指令调整样式(如切换深色模式),大幅提升前端开发效率 [28][30][31][33][35][37][38] - **视频内容理解与总结**:模型能处理长达10分钟的视频,在几十秒内完成内容总结,并支持全文翻译 [41][42][43][44] - **通用视觉与推理任务**:模型能力广泛,包括解答考研数学题、将图表数据转换为表格、OCR识别(支持手机拍照图片和古文手稿)、目标检测等 [46][47][51][54][55][56][58][60][61][63] 模型性能与技术升级 - **版本与参数**:GLM-4.6V分为两个版本,面向云端的高性能基础版GLM-4.6V(106B-A12B)和面向本地部署的轻量版GLM-4.6V-Flash(9B) [67] - **上下文长度**:视觉推理模型的上下文窗口提升至128K tokens [67] - **评测表现**:在MMBench、MathVista、OCRBench等30多个主流多模态评测中取得同级别SOTA结果 [67][68] - **性能对比**:9B版本的GLM-4.6V-Flash整体表现超过Qwen3-VL-8B;106B参数12B激活的GLM-4.6V表现比肩参数量达235B的Qwen3-VL-235B [68] - **技术架构创新**:首次在模型架构中将Function Call(工具调用)能力原生融入视觉模型,打通从“视觉感知”到“可执行行动”的链路 [69] 定价与成本 - **大幅降价**:GLM-4.6V系列相较于GLM-4.5V降价50% [39] - **具体价格**:API调用价格低至输入1元/百万tokens,输出3元/百万tokens(针对0-32K tokens上下文长度) [39] - **详细价目表**:模型根据上下文长度分段计价,例如输入32-128K tokens价格为2元/百万tokens,输出为6元/百万tokens [40]
100万亿Token揭示今年AI趋势!硅谷的这份报告火了
量子位· 2025-12-08 11:36
文章核心观点 - 基于对OpenRouter平台超过100万亿Token使用数据的实证分析,揭示了2025年AI行业的发展趋势,核心结论包括开源与闭源模型关系转变为互补、中国开源模型力量崛起、模型功能向推理与执行系统演进、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等[1][8][12] 开源与闭源模型格局演变 - 开源模型不再是闭源模型的廉价替代品,两者关系已演变为互补,开发者常同时使用两类模型[9][10] - 开源模型使用量稳步增长,预计到2025年底将占据约三分之一的Token用量[10][12] - 开源模型市场从高度集中走向多元化,早期DeepSeek V3和R1曾占一半以上用量,但预计到2025年底,没有单一模型能持续占比超25%,市场将由5~7个模型均分[16][17][18] - 中型模型(参数在150亿到700亿之间)更受市场青睐,小模型正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型上[20][21] 中国开源模型崛起 - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13%,与其他地区开源模型平均13.7%的份额相当[12][13] - 中国模型如DeepSeek、MiniMax、Kimi K2等在开源领域受到青睐,其中DeepSeek在角色扮演和闲聊领域有极高粘性,超过三分之二的流量用于此[1][16][50] - 在编程领域,中国模型如MiniMax已成为快速崛起的新秀,近几周取得显著增长[48] 模型功能与使用范式转变 - 语言模型正从对话系统升级为推理与执行系统,使用推理功能的Token用量从年初可忽略不计增长至超过50%[22] - 模型调用工具的功能使用占比上升,从年初集中于少数模型发展到更多模型支持,缺乏可靠工具的模型有落后风险[29][30][31][33] - 用户任务复杂度提升,从生成短文转向解决难题,如分析完整文档或代码库[35] - 用户平均每次提示词长度增加约4倍,模型完成任务所需Token用量增加近3倍,反映出工作负载更依赖上下文且推理消耗更多[36][39] - AI正从聊天机器人转变为能独立规划步骤、调用工具并完成复杂目标的自动智能体(Agent)[42][43] 主要应用场景与模型偏好 - 编程和角色扮演是AI模型最主要的使用方式[12][44] - 编程查询的Token用量从年初的11%上涨至最近的超过50%,增长最为稳定[45] - 在编程领域,Claude系列长期占据主导地位,大部分时间占比超过60%,但其份额在2025年11月首次跌破60%[47] - OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%,谷歌份额稳定在约15%[47][48] - 在角色扮演领域,开源模型中其使用量占比高达52%,中国与西方开源模型在该领域平分秋色[50] 用户行为与留存特征 - 用户留存呈现“水晶鞋效应”,即新模型发布时若能完美解决特定用户痛点,便能锁定一批高粘性用户,即使后续有更好模型也难以被替换[12][67] - 例如,Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40%高位[67] - 该效应窗口期很短,仅在模型被视为“最前沿”时有效,一旦竞品能力赶超则难以吸引新用户[69][70] - 用户留存模式可分为:成功锁定(如Claude、GPT-4o Mini)、从未合脚(如Gemini 2.0 Flash)、回旋镖效应(用户离开后因性价比或特定能力又回归,如DeepSeek)[74] 市场与区域动态 - AI不再是硅谷独角戏,亚洲地区付费使用量占比从13%翻倍至31%[71] - 北美仍是最大市场,但份额已不足50%[80] - 英语以82%的份额占据绝对主导,简体中文以近5%的份额位居第二[80] 其他关键发现 - 模型价格下降对使用量的影响有限,价格下降10%仅带来0.5%-0.7%的使用量增长[80] - 存在“杰文斯悖论”现象,即模型降价且好用后,用户会在更多场景更频繁地调用,导致总Token用量飙升,总支出可能并未降低[75][76] - 报告数据主要反映开发者与服务端API调用行为,未涵盖通过App或Web直接访问的流量,且平台定价策略可能影响数据代表性[76]
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东
量子位· 2025-12-08 10:53
新公司“明日新程”的创立与定位 - 前小冰公司CEO李笛于2025年12月7日陆奇“奇绩创坛路演日”上,以压轴身份公开其全新创业公司“明日新程”,英文名Nextie,寓意“下一程”[1][2][6][7] - 新公司核心团队由小冰公司核心初创团队构成,包括联合创始人曾敏、大模型与算法负责人王文斓等,目前团队规模约30人[4][44][45][46] - 公司正计划启动一轮千万美元级别融资,陆奇旗下的奇绩创坛是股东之一,但尚未完成正式对接[5][8] 核心技术理念:群体智能与认知模型 - 新公司的技术方向是“群体智能”,旨在教会AI什么是“认知”,以解决个人、组织及大模型普遍存在的认知盲区[11][12] - 技术路径不追求单个模型预训练最大化,而是让一群各有所长、拥有独特视角和认知方法的AI智能体(Agent)对同一问题进行辩论与思维碰撞,综合不同认知进行研判,以逼近更合理的答案[12][13] - 该理念与当前以Manus为代表的去中心化智能体路径不同,更侧重于中心化能力展现,组合不同领域的专家智能体以提供生产力[14][15] - 公司整理了1800年至2020年跨越220年的人类论文,试图构建群体智能演化史,为技术路线提供参考[18] 内测产品“团子”与初步成果 - 公司理念已在内测产品“团子”上得到具象化,该产品有两种运行模式:“官方姐妹团”侧重生活化场景与情感问题,“官方研究团”聚焦课题研究、学术检索与行业洞察[21][22] - 产品推理机制不依靠“思维链”,而是直接展现不同AI智能体间的相互博弈与投票,例如在“姐妹团”模式下,系统会筛选出3名最匹配的AI发起辩论,最终由40位AI“姐妹”投票后总结输出结果[24][27] - 李笛表示,基于群体智能与认知模型的多智能体框架,在内测阶段的大部分案例中,其表现显著优于任何单一大模型或智能体产品,并已取得SOTA成果[30][31] - 公司将成绩归功于群体智能框架下AI之间的对抗学习[32] 商业模式与产品规划 - 商业模式明确不会按Token收费,更倾向于按照任务结果本身定价,原因是不同任务语境中单个Token所承载的信息密度和价值差异极大[33][34][35] - 技术内测已基本完成,产品预计将于明年1月7日正式上线[36] 创始团队背景与关联 - 李笛是小冰公司的创始人与核心灵魂人物,曾主导微软小冰AI聊天机器人从0到1的发起与发展,并于2020年小冰从微软分拆后出任CEO[47][48][49][50] - 2025年5月,小冰公司完成工商信息变更,李笛不再担任公司法人,但仍为第二大股东,法人代表变更为前首席架构师周力,公司董事长为沈向洋[39][40][41][42][43] - 除李笛外,核心团队成员曾敏是小冰联合创始人、前微软首席研发总监,负责小冰开放域对话系统;王文斓是小冰大模型与算法负责人,曾任职于英特尔和虎牙[51][52][53][56][57] - 在当日的奇绩创坛路演中,53个创业项目里有三个来自李笛带出来的团队,李笛可能扮演类似驻场企业家的角色[58][60]
机器人集体到香港户外极限挑战,狗比人强
量子位· 2025-12-08 06:07
赛事概况与核心赛制 - 第五届ATEC科技精英赛线下赛于12月6-7日在香港中文大学举办,是全球首个聚焦实景极端环境的人工智能与机器人赛事[8][26] - 比赛设置垃圾分拣、自主浇花、定向越野和吊桥穿越四个真实世界挑战,旨在全面考察机器人从基础操作到跨地形移动的综合能力[10][13][14] - 比赛规则强调鼓励自主、限制干预,遥操作越少,自主完成越多,得分越高[16] - 浙江大学Wongtsai赛队凭借在机器人全自主智能方面的卓越表现,摘得15万美元冠军大奖[5][25] 参赛队伍表现与策略 - 参赛队伍普遍采取先遥操保底、再自主冲高分的策略,并在具体项目上临场发挥,奇招尽出[17] - 冠亚军队伍Wongtsai和IRMV在垃圾分拣任务中完全依靠自主模块通关,稳稳拿下无遥操的额外加分[23] - 上海交通大学IRMV赛队在吊桥任务中略过拉绳搭桥环节,让机器狗跳过50厘米的空隙[21] - 为应对挑战,选手们进行了临时改装,例如给机器人安装“大脚板”和“雪橇”以防止足部卡在吊桥缝隙中[18] 机器人形态性能对比 - 四足机器人(机器狗)在所有任务中的表现均明显优于双足(人形)机器人[27] - 人形机器人在定向越野项目中因重心高、触点少,在复杂地形如陡梯、碎石路上表现吃力[29] - 在需要稳定抓取和精细操作的任务中,人形机器人因结构复杂、控制链条长,定位或手部调节稍有偏差就难以完成有效抓取[30][31] - 四足机器人表现稳定,既能在浇花、分拣等任务中用背部夹爪完成任务,又在户外越野和吊桥穿越中展现统治级表现[36] 技术挑战与行业洞察 - 户外环境给机器人感知带来巨大挑战,光照、风、阴影等细微环境变化的扰动会累积成误差,影响任务成功率[37][40] - 在垃圾分拣任务中,透明的塑料瓶在室外因反光及背景等因素,导致机器人经常识别失败[39] - 环境扰动如风吹动物体,会迫使机器人的affordance估计必须实时更新[41][42] - 在信号弱的野外,机器人更依赖自身IMU、激光雷达与本地推理能力,难度增加[45] 当前技术短板与未来方向 - 规划层面暴露出机器人普遍缺乏多步骤关联推理和环境改造能力,例如在吊桥任务中难以自主完成“拉绳搭桥”的连续动作[46] - 操作层面普遍存在上半身操作与下半身移动解耦的架构问题,缺少统一的全身运动与操作控制框架[50][51] - 当前许多前沿VLA模型主要聚焦上半身操作,对“移动-操作”的端到端整合支持仍十分有限[55] - 未来重要突破方向是能同时统一移动与操作、实现全身自主控制的端到端机器人模型[56][57] 赛事意义与行业价值 - 比赛暴露了在实验室环境中不易看到的问题,为行业提供了更接近真实应用场景的测评体系[26][58] - 赛事旨在通过极限挑战,推动机器人技术从演示可行走向应用可靠[60] - 赛事设计理念是让机器人在真实碰撞中暴露弱点,因为只有“真问题”才能牵引出真实的技术进步[61] - 比赛的意义在于让整个行业看清机器人离“走进世界”还有多远,以及未来应该补课的方向[59]
量子位编辑作者招聘
量子位· 2025-12-08 06:07
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,经过8年积累,拥有顶流影响力和广泛且备受认可的产业资源[1] - 截至2025年,公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万+[12] - 在新榜和清博等第三方数据平台,公司已是AI以及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向岗位招聘:AI产业方向、AI财经方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生,接受实习且可转正[4][6] - 所有岗位不同能力层级职位均在开放,工作地点位于北京中关村[2][4] 岗位职责详情 - **AI产业方向**:关注基建层创新,包含芯片、AI Infra、云计算;跟进该领域新进展及核心玩家动态;解读前沿论文、开源社区及技术大会报告;参与核心采访,对话产业专家并撰写案例[5][6][7] - **AI财经方向**:关注AI领域创投和财报,跟踪产业链资本动向;产出创投融资、招股书财报解析、公司战略分析等稿件;访谈对话投资人、创业者、产业分析人士[6][9] - **AI产品方向**:关注AI在应用和硬件终端方向的进展;撰写AI应用产品深度评测、跟踪多终端新品发布;对话访谈AI应用创业者、产品专家、终端技术专家[6][10] 任职要求 - **AI产业方向**:对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解;熟悉AI行业供应链与生态;能把复杂技术内容结构化表达;有技术背景、理工或CS/EE方向优先[8][11] - **AI财经方向**:对数据敏感,对财报、股权结构、战略规划感兴趣;逻辑结构强,对商业叙事敏感;热爱对话采访,社交型人格[9][11] - **AI产品方向**:对智能硬件、AI终端趋势敏锐,重度AI产品体验人士;熟悉各大终端厂商业态、体验方法论;有强逻辑、体验表达和结构化能力[10][11] 员工福利与发展 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 员工通过撰写独家原创内容,可建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人会由主编级编辑出任mentor,提供一对一指导[6] - 团队氛围扁平、简单、开放、多劳多得能者上位[6] - 提供行业TOP薪资待遇,五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 随简历需附上科技行业代表作品,或能展现个人写作水平和风格的作品[11]
哈萨比斯:DeepMind才是Scaling Law发现者,现在也没看到瓶颈
量子位· 2025-12-08 06:07
Scaling Law的现状与历史 - 谷歌DeepMind首席执行官哈萨比斯在Axios AI+峰会上力挺Scaling Law,认为其对于实现AGI至关重要[1][6] - 哈萨比斯指出,Scaling Law最早的发现者并非OpenAI,而是DeepMind团队,其内部在2017至2018年期间的研究已发现相关规律,并称之为“Chinchilla Scaling Laws”[6][14][17] - 基于对Scaling Law有效性的确认,DeepMind调整了研究方向并投入更多资源,这被认为是其在大模型领域取得成功、推动Gemini从1.0演进到3.0时代的关键[18] Scaling Law与AGI(通用人工智能)的关系 - 公司认为,无论AGI最终形态如何,Scaling都将是其中的关键组成部分,且当前Scaling尚未到达极限,有必要继续沿此路线将系统推向最大化[21][22] - 哈萨比斯提出,单靠Scaling Law也有可能达成AGI,因为大量数据和计算资源的投入是展现类人智慧能力的合理途径[7][23] - 同时,他也猜测实现AGI可能还需要一两个类似Transformer或AlphaGo级别的重大突破,并预测这个时间点可能在5到10年内[24][26] 对未来12个月AI发展的预测 - **多模态融合**:完整的多模态融合将是主流演进方向,谷歌DeepMind正全力推进,旨在通过交叉融合图像、视频、文本和音频来全面提升模型的推理和创造力[27][28][30] - **视觉智能突破**:以谷歌Nano Banana Pro等图像模型为例,视觉理解能力有显著进展,未来将在更丰富的分析、故事讲述和分步视觉推理方面继续探索[31][32][33] - **世界模型普及**:世界模型是行业关注重点,也是哈萨比斯个人的工作重点,例如谷歌8月上线的世界模型Genie 3,预计下一年该领域将持续受到业界关注[35][36][37] - **Agent可靠性提升**:哈萨比斯认为,现有Agent系统尚不完全可靠,但预计再有一年时间,Agent将能开始接近于可靠地完成委托任务[38][39][40] Gemini的发展与目标 - Gemini 3的成功验证了Scaling Law的有效性,其全网爆火被视为谷歌打了一场漂亮的翻身仗[4][5] - Gemini 3的独到之处在于个性化的深度、简洁的回答、温和反驳不合理观点的能力,并能一键式生成商业级游戏,展现了其基座架构在理解高层次指令和输出高精度细节方面的优势[43][44][45][46] - 公司对Gemini设定的最终目标是成为“通用万能助手”或“通用助手”,下一代Gemini将延续现有优势,出现在更多设备上并无缝融入日常生活,其使用频率将变得和使用手机一样频繁[9][41][46][47]
英伟达4B小模型击败GPT-5 Pro!成本仅1/36
量子位· 2025-12-08 06:07
文章核心观点 - 英伟达团队开发的4B小模型NVARC在ARC-AGI 2竞赛中以27.64%的成绩超越GPT-5 Pro的18.3%,登顶榜首,其单任务成本仅约20美分,远低于GPT-5 Pro的超过7美元,展现出小模型在特定领域通过方法创新实现高性能与高性价比的潜力 [1][2][4] 竞赛成绩与成本优势 - NVARC在ARC-AGI 2公开榜的成绩为27.64%,显著高于GPT-5 Pro的18.3% [2] - NVARC每任务成本仅约20美分,大约是GPT-5 Pro单任务成本(超过7美元)的1/36,成本优势巨大 [4] 技术路径:零预训练与合成数据 - NVARC采用零预训练深度学习方法,不依赖大规模通用数据集进行前期预训练,规避了预训练模型的领域偏见和数据依赖问题 [5] - 团队将复杂推理移至离线的合成数据管道,通过大规模合成高质量数据来训练较小的模型 [9][10] - 具体方法包括利用GPT-OSS-120B等大型模型大规模制作高质量的合成谜题,并将简单谜题混合生成更复杂的新谜题 [14][15] - 通过分阶段独立验证的复杂推理管线,团队建立了一个包含超过320万增强样本的合成数据集,其中每个样本最多有7对输入/输出 [17][18] - 合成数据集的构建详情如下表所示,最终NVARC full部分包含约178.6万个样本,占总样本数(约325.5万)的54.9% [19] 模型架构与训练方法 - 模型核心推理模块基于改进版ARChitects方法,选用小参数模型Qwen3-4B,并通过对话式模板简化谜题理解 [19] - 训练时借助NeMo RL框架和Megatron后端进行监督微调 [20] - 针对ARC-AGI 2“每个任务都是全新规则”的特点,引入了针对每个问题进行测试时微调(TTFT)的LoRA微调技术,让模型在解题前快速适应 [21] - 对ARChitects方法的改进包括在解码阶段对DFS算法进行批处理优化,修复结果非确定性问题,并统一了8种数据增强操作来评估候选解 [22][23] 方法论的启示与行业意义 - 在特定领域任务中,经过针对性优化的小模型性能不逊色于大模型,并具备成本、速度、适配性与领域聚焦的优势 [25] - 将正确的方法用在正确的地方,可以实现更大的价值,这提示行业关注方法创新而非单纯追求模型参数规模 [25]
本周三!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-08 06:07
大会概览 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办,主题为“共生无界,智启未来” [24][37][39] - 大会是AI圈一年一度的盛宴,预计将获得数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》两份重要文件 [35][39][47] 核心议题与亮点 - 大会设置两场高浓度对话:一场是文远知行创始人韩旭与量子位总编辑李根关于GenAI赋能自动驾驶的对话;另一场是探讨AI Agent革新千行百业进程的圆桌论坛 [7][8][13] - 议题内容覆盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向 [3] - 重点关注AI从数字世界迈向物理世界、从“思考的AI”到“行动的AI”的转变,以及Agent如何从陪聊进化为超级助理 [12][16][41][43] 嘉宾阵容 - 大会累计邀请近三十位重量级嘉宾,涵盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授,智源研究院王仲远院长,交大高金朱宁教授等,将分享对“人工智能+”趋势、大模型发展等根本问题的深度判断 [1][17][41][45] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、蚂蚁、谷歌云、亚马逊云科技、高通、昆仑万维、潞晨科技、PPIO、中关村科金等最具代表性的企业 [1][21][41][42][43][44] - 新生创业力量如卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、灵心巧手等也将亲临现场 [28][42][44][45] 议程与内容 - 上午议程聚焦宏观趋势与基础技术,包括“人工智能+趋势”、AI打造超级智能体、混合AI、Agentic AI未来等话题 [41] - 下午议程深入多模态、智能体、算力生态及行业应用,涵盖AI技术突破、基础设施、硬件创新及具身智能平台等 [43][44][45] - 会议以两场重磅发布收尾,分别是《2025人工智能年度榜单》和《2025年度AI十大趋势报告》的发布 [35][42][45] 参会价值 - 大会提供与学术界大咖、产业界领袖及高精尖企业管理层观众交流的机会 [1][31] - 参会者可获得最前瞻的观点、第一视角的实战经验与深度思考,洞悉技术路线、产品逻辑及创业机会的变化 [4][6][11] - 大会内容旨在解决AI落地真实挑战,探讨AI从理论、平台、应用到终端的完整落地路径,寻找从hype走向impact的真实路径 [33][34]
嚯,38%斯坦福本科生是“残疾人”
量子位· 2025-12-08 04:00
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 而且绝非个例……常春藤里有一个算一个,"残疾"比例都高到离谱。 蛤? 38% 的斯坦福本科生都是"残疾人"??? 不过,你要是以为这是"身残志坚"的励志故事,那就大错特错,NoNoNo! 他们的目的只有一个—— 考试时间能延长50%! 斯坦福38%本科生注册"残疾" 根据数据显示,今年38%的 斯坦福大学 本科生注册为"有残疾",其中24%的学生都在秋季学期享受学术或住房特殊照顾。 但事实上,在他们当中,绝大多数并非传统意义上的身体残疾,而是ADHD (注意力缺陷多动障碍) 、焦虑抑郁诸如此类的心理问题。 获得该"残疾"认证的方式也相当简单, 只需要一张基础的医生证明 。 过去可能需要对应的临床数据佐证,例如药物治疗、相关病史等,但随着2008年《美国残疾人法案》 (ADA) 的修订,法律上对残疾的定 义扩充到"阅读、学习、集中注意力、思考"等认知学习过程受影响的群体。 高等教育与残疾协会 (AHEAD) 也随之发布指南,要求高校采取更为宽松的审核制度——更重视学生的个人感受,而不是仅依赖医学诊 断。 与此同时,诊断标准也在逐步放宽,2013年美国精神病学 ...