自主学习
搜索文档
AI浪潮下,10年后的顶尖高校拼什么?丨GAIR 2025
雷峰网· 2025-12-19 00:28
" 技术热潮下,计算机、人工智能算不上「最好学科」。 " 作者丨张嘉敏 编辑丨徐晓飞 AI浪潮下,中国教育能否实现对海外教育的"弯道超车"?10年后的大学是什么样子,顶尖大学的核心竞争 力又是什么?当下及未来,大学生最重要的求生技能是什么? AI对世界的重构,也按下了全球范围内教育界"洗牌"的加速键。 嘉宾们各抒己见,既有对当下教育现状的轻松调侃,也不乏对AI热潮下"教育该走向何方"的冷思考。 杨士强教授结合在清华大学计算机系的管理经验,笑称 家长就是把学校当成"无限责任公司": "学生进来 了,毕不了业,是学校的责任;博士拿不到学位,家长认为是你没有尽到责任,你培养不出来。" 在清华期间,杨士强教授始终在思考一个问题:什么样的学生才是世界一流?沿着姚期智先生的启迪 ——"什么时候清华毕业的博士能与美国一流大学的相较之,人家承认你的博士水平,你才是世界一 流。"他提出了"三出两进出一流"的理念,并付诸于实践。 杨士强(主持人):清华大学教授,CCF会士,鹏城实验室首任党委书记 赵伟:深圳理工大学教务长,澳门大学第八任校长 郭毅可:中国工程院外籍院士,英国皇家工程院院士,香港科技大学首席副校长 赵伟教授则对比了 ...
对谈刘知远、肖朝军:密度法则、RL 的 Scaling Law 与智能的分布式未来丨晚点播客
晚点LatePost· 2025-12-12 03:09
文章核心观点 - 大模型的发展存在“规模法则”和“密度法则”两条主线,前者追求能力跃迁,后者追求效率提升,即单位算力/参数下智能的最大化 [12][13][18] - 行业正从盲目追求模型规模转向追求能力密度,效率提升将加速端侧智能(如手机、汽车)和分布式智能的发展,最终实现每个人的“专属大模型” [9][10][35] - 强化学习尚未出现清晰的Scaling Law,是当前主要瓶颈,未来的关键方向是自主学习(Self-Learning)和“AI造AI” [24][34][36] 大模型演进的明线与暗线 - **明线:规模法则 (Scaling Law)**:自2018年预训练模型出现后,每隔几年模型能力就会跳跃一次,模型正变得更通用,甚至开始接近或超越人类在某些领域的能力 [12] - **暗线:密度法则 (Densing Law)**:这是大模型时代的“摩尔定律”,关注如何用更少的计算和数据资源更高效地获得智能,核心是追求单位计算带来的智能最大化 [13][14][18] - **密度法则的量化表现**:根据研究,大模型的能力密度(衡量单位参数/算力下模型能力的指标)每3.5个月翻一倍,自2023年1月ChatGPT出现后,这一速度在加快 [4][7] 提升模型能力密度的具体方法 - **模型架构优化**:核心方向包括采用稀疏化的混合专家系统以降低算力消耗,以及对注意力机制进行各种效率改进以应对长文本和Agent任务的需求 [19][20] - **数据治理与合成**:通过高质量的数据清洗、精选和合成,可以大幅提升训练效率,例如将预训练数据集精炼至不到原始容量的1/10,效果反而更好 [22][23] - **学习算法演进**:当前重点转向强化学习,但其尚未出现清晰的Scaling Law,主要瓶颈在于难以构建可扩展的环境和可验证的激励 [24][25] - **软硬一体协同优化**:结合芯片制程进步(摩尔定律)与模型能力密度提升,共同推动端侧设备承载以往只能在云端运行的大模型能力 [30][31] 强化学习的现状与未来探索方向 - **当前瓶颈**:强化学习缺乏像预训练那样清晰的Scaling Law,大多数训练仅几千步,如何持续稳定训练并构建“不可破解”的学习环境是核心挑战 [24][25] - **两条探索路径**:一是继续扩大RL的规模,探索开放域的激励定义;二是寻找更高效的新学习方式,提高样本效率,让模型能像人一样通过少量反馈学习新任务 [26][27] - **RL的已验证能力**:只要有足够数据和反馈,强化学习已能在数学、代码等特定任务上达到人类前0.1%甚至0.01%的水平,预示了打造垂直领域“超级专家模型”的潜力 [25] 端侧智能与分布式智能的未来 - **端侧算力规模**:2023年全国端侧算力(主要是手机)是数据中心算力的12倍,信息化本质是分布式算力和信息的结构,智能化也将遵循这一路径 [9][35] - **端侧部署时间表**:结合密度法则提升和芯片路线图,预测到2030年左右,端侧可部署600亿以上参数的模型,5年内端侧很可能承载GPT-4至GPT-5能力的模型 [32] - **具体应用进展**:车端模型量产速度非常快,已与多家车企合作;预计2027年成为关键节点,届时手机可实现大规模强化学习,支持个人数据训练“专属大模型助理” [32][33] - **未来形态**:智能将分布式存在,形成“智能体的互联网”,个人拥有基于终端数据持续成长的“个人大模型”,云端则存在各垂直领域的“专家大模型” [10][35][36] 下一阶段的范式演进:自主学习与AI造AI - **核心方向**:预训练和强化学习之后,下一个大的方法改进是自主学习,即模型能作为一个高效的学习者,根据用户需求在终端上持续学习新技能 [34] - **发展三阶段**:第一阶段是实现自主学习;第二阶段是具备自主学习能力的AI之间的协作;第三阶段是具备创造新符号关系乃至新符号系统的创新能力 [34][35] - **AGI的雏形**:最早的AGI形态可能不是面向消费者的产品,而是面向生产的系统,具备“AI造AI”的能力,即能自主完成数据生产、环境构建、模型训练和部署的全流程 [36]
我们很可能正走向一个“无工作社会”|腾研对话海外名家
腾讯研究院· 2025-11-11 09:33
文章核心观点 - AI革命是继农业革命和工业革命后的第三次重大革命 其影响可能是工业革命的十倍且发生速度快十倍 [6] - 技术扩展人类能力的方向正从身体转向心智 AI革命的核心是提供"按需获取智能" [7] - AI革命不仅是经济变革 更是一场深刻的社会变革 将重塑工作 教育 分配制度 社会关系和全球格局 [8][9] 工作 教育与创造力 - AI将消解大多数专业职业岗位 未来组织可能出现"一个人+一百个AI"的运转模式 5-10年内专业人士需求将大幅减少 [11] - AI社会可能带来"有闲阶层"的崛起 大部分人将面临几乎无限的闲暇时间 需要为"闲暇世界"做好准备 [12][13] - 教育核心任务将从培养劳动力转变为教人激发潜能以享受生活 未来将进入"自主学习"时代 [14] - AI在绘画 作曲 设计等创造性领域展现出惊人能力 大部分创造性活动可被AI取代 挑战人类独特价值 [15] 分配制度与知识产权 - AI将冲击"因工作而获得报酬"的传统分配模式 可能走向"无工作社会" 需要重新思考整个经济体系 [17] - AI可能带来资源富足的"丰裕社会" 但经济利益也可能集中在控制AI系统的少数人手中 加剧贫富差距 [18] - AI时代个人贡献难以认定 知识产权制度可能向"创意共有"演变 个人知识产权保护将变得困难 [19] 社会关系结构 - AI将加速社会活动的"分散化" 远程办公 线上教学等趋势将使集中式组织时代终结 [21] - 医疗健康将被AI变革 智能设备实现日常监测 本地受训人员可处理多数疾病 医院和学校可能变得不必要 [22] - 人类需处理与AI新物种的关系 AI可提供情感价值应对孤独问题 但将迫使我们重新思考"人是什么" [23] 全球格局 - AI天生带有开放与协作基因 可能减轻民族主义隔阂 促进全球普惠发展 任何地方都可免费下载AI工具 [25] - AI革命可能为全球秩序重构提供新契机 中国提供更优越的国际治理模式 结合中西经验可创造更文明和平的世界 [26]
洋葱学园的解法:AI时代的自主学习革命
钛媒体APP· 2025-11-11 02:00
行业背景与痛点 - 当前教育行业面临从知识灌输向培养自主学习能力转变的关键节点,以适应未来对原研创新人才的需求[2][3] - 市场上AI伴学硬件产品功能多局限于拍照搜题和单向知识灌输,缺乏系统化培养自主学习能力的成熟产品体系[2] - 现有工具存在沦为“抄答案捷径”的风险,难以激发学生思维主动性,无法满足家长对能力培养的深层需求[2] 公司产品战略与定位 - 公司正式推出以“激发学习潜能、培养自主学习能力”为核心的「自学破壁计划1 0」,区别于以效率提升为主的AI辅助工具[3] - 产品定位转向对学生内在学习能力的深度唤醒,系统构建学生的目标感、判断力与自我驱动机制[3] - 公司产品设计逻辑为“绝不直接给答案”,旨在成为让家长放心交给孩子独立使用的学习伙伴[12] 自主学习能力解构 - 公司将自主学习能力解构为四个递进阶段:意识启动、动作固化、能力内化、价值观形成[6] - 自主学习是一种必须经由环境营造、刻意练习与持续引导方能形成的高阶能力,无法直接灌输[6] - 公司AI智能学伴系统通过“自驱动力、自学能力、规划意识、探索乐趣”四个核心维度构建自学支持体系[7] AI智能学伴系统功能 - 产品围绕预习、复习、作业、答疑、思考、规划与情感支持七大核心学习场景设计智能体模块[9] - 系统包含AI自学大师、AI私人助教、AI思维教练、AI规划导师、AI自律伙伴与AI情感树洞六大智能体[9] - AI自学大师模块近一个月访问量达393万次,互动量突破1212万次,AI私人助教互动量超过2591万次[12] - AI思维教练采用苏格拉底式追问引导学生构建逻辑,AI自律伙伴运用游戏化机制降低学习启动门槛[11] 技术壁垒与数据优势 - 公司拥有12年教研积累,覆盖1万+动画课程、5000亿条真实学习行为数据,累计服务全国1 1亿学生、400万教师[14] - 公司与超过2000所公立学校达成深度合作,构建了庞大而真实的数据基座[14] - 底层课程框架与资源实现共享,所有智能体通过统一知识图谱与标签体系记录学生画像,实现自适应学习节奏调整[15] 激励与情感支持体系 - 公司构建了高度多样化的激励系统,包括个性化书桌装扮、成就系统、勋章奖励等,适应不同学生偏好[16][17] - “情感树洞”智能体近一个月用户访问量达393万次,留言互动量约26万条,提供情感陪伴与支持[17] - 游戏化机制设计了“PK试验场”功能,学生可通过学习积累积分、提升段位,形成持续正向激励[16] 教育生态角色重塑 - 在AI赋能教育的新阶段,家长角色转变为鼓励与倾听,教师从“知识广播者”转变为“课堂导演”[18][19][20] - 公司开发“AI课堂”解决方案,重构45分钟课堂结构,将课堂时间充分还给学生进行自主学习和小组讨论[19] - 公司AI自主学习模式已在2000余所学校落地,校方成绩数据显示该系统在提升学生学业表现方面有显著成效[20] 长期愿景与市场影响 - 公司旨在打造让孩子开启自主学习之旅门槛最低的产品,最终目标是让学生不再需要外部工具,实现完全自主[21] - 产品超越了传统工具边界,成为塑造终身学习者的“元认知孵化器”,用技术重塑学习的底层逻辑[21]
马斯克预测Grok 5实现AGI概率达10%
环球网资讯· 2025-10-21 04:05
公司技术进展 - xAI公司正在研发的Grok 5大型语言模型有10%的概率实现通用人工智能,且该概率呈持续上升趋势 [1] - Grok 5被视为xAI技术跃迁的关键节点,其全新架构设计或突破现有模型对海量数据的依赖,通过更高效的自我学习系统降低训练成本 [3] - xAI通过优化基于Kubernetes、Rust和JAX的自定义训练堆栈框架,在资源利用率上实现突破 [4] 公司产品迭代 - 2023年11月推出的Grok-1模型以330亿参数实现接近LLaMA 2(700亿参数)的性能,仅用一半训练资源 [3] - 2024年4月发布的多模态大模型Grok-1.5V能通过视觉信息生成Python代码,在RealWorldQA基准测试中超越同类模型 [3] 行业技术定义与对比 - 通用人工智能被定义为能够完成人类通过计算机辅助实现的所有任务的智能系统,其能力上限不会超越全体人类与计算机协同工作的总体水平 [3] - 当前主流AI模型多聚焦于特定任务优化,而通用人工智能需具备跨领域知识迁移、自主学习及创造性思维等人类核心能力 [3] - Grok 5在AI工程领域的表现被称已超越Meta AI实验室前研究负责人安德烈·卡帕斯团队提出的模型规模即性能范式 [4]
日媒:日本孩子为何缺乏自主学习意愿?
环球时报· 2025-08-26 23:09
日本教育现状分析 - 日本教育正经历自明治时代以来约150年的重大转折期 这种变化是全球性现象[1] - 2022年PISA评估显示日本学生在科学素养排名第2 阅读素养排名第3 数学素养排名第5 三大领域均位居世界前列[1] - 但日本学生在自主学习与自我效能感指标方面在37个国家中仅列第34位 表现为缺乏主动学习的意愿与信心[1] 认知技能与非认知技能差异 - 学习能力主要依赖认知技能 而自主学习更多依赖非认知技能(社会情绪技能)[2] - 非认知技能包括:对事物产生兴趣与好奇心 自我激励达成目标 困难情境下坚持不懈 与他人协作建立关系的能力[2] - 日本孩子学习能力很高但整体存在非认知技能不足的问题[2] 教育体系结构性挑战 - 日本文部科学省强调"主动 对话 深入的学习"以应对非认知技能不足问题[2] - 自明治时代以来公教育逐渐取代私教育领域 导致社会情绪技能难以发展[2] - 家庭教育功能弱化使社会情绪技能未能有效培养 学校承担了本不应独自负责的任务[2] - 教师工作负担加重 学校教育环境因此恶化[2] 技能培养的相互关联性 - 认知技能与非认知技能都是人类成长不可或缺的要素[3] - 非认知技能会影响学习能力测试成绩 且高度依赖家庭教育[3] - 家庭教育成果会影响学校教育效果 这一发现基于诺贝尔经济学奖得主詹姆斯·赫克曼的研究[3] 解决方案建议 - 需要文部科学省与学校教育共同努力[3] - 需要家庭和社区重振私教育 形成多种解决方案[3]
专访张祥雨:多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻
海外独角兽· 2025-06-09 04:23
多模态大模型技术发展 - 阶跃星辰发布中国首个千亿参数原生多模态大模型Step-1V,基于DreamLLM框架实现图文生成理解一体化 [3] - 多模态领域预计未来2-3年将迎来两个GPT-4时刻:多模态推理和自主学习 [3] - 当前多模态生成理解一体化面临四大挑战:语言对视觉控制能力弱、图文对齐不精确、数据质量有限、生成模块无法反向影响理解模块 [3] 模型规模与能力关系 - 模型参数扩展到万亿级别时出现能力分化:文本生成和知识问答增强,但数学推理能力随规模增长反而下降 [3] - 大模型推理能力下降的核心原因是next token prediction框架更关注压缩率而非推理精度,导致思维跳步现象 [4][37] - Rule-based RL可通过直接优化任务目标来抑制跳步、强化稳定思维路径,显著提升大模型推理能力 [4] 计算机视觉领域挑战 - CV领域难以仅靠视觉数据实现GPT时刻,因静态图像数据中生成、理解与人类对齐三者割裂 [23] - 对比学习和MIM等方法在小模型有效但缺乏scale up特性,因依赖人工设计的不变性而非数据驱动 [15][16] - 视频数据可能成为突破口,因其蕴含更丰富的时空信息和自然对齐关系 [24] 生成理解一体化难题 - 语言模型通过next token prediction天然实现生成理解一体化,但该范式在多模态领域效果有限 [17] - 实验显示外挂生成模块对理解性能无影响,生成模块可控性差,常产生违反物理常识的输出 [29][31] - 复杂度问题是核心障碍:视觉生成需要考虑的因素远超单步推理能力上限 [52] o1范式突破 - o1范式通过引入Meta CoT实现思维链网状结构,允许模型在关键节点反悔重试 [5] - 该范式成功关键在于预训练语料中已存在多样化思维pattern,RL仅需强化而非创造 [51] - 相比传统RL,语言模型预训练大幅压缩action space,使复杂问题可解 [45] 多模态发展路径 - 短期解决方案是利用图文对齐数据,通过语言模态带动视觉智能 [24] - 长期需突破视频数据利用难题,教学视频中的教学行为可提供丰富action space [63] - 高可控生成技术突破将解开生成与推理的相互依赖死锁,目前OpenAI 4o已展现显著进展 [63][64] 模型架构演进 - 当前transformer架构处理long context存在根本缺陷,需建立分层记忆系统 [67] - multi-agent协作架构可有效解决上下文干扰问题,实现情景隔离式推理 [70] - 架构设计应服务于算法需求,如FFA算法可能彻底改变现有训练范式 [74] 自主学习方向 - 当前rule-based RL面临environment scaling瓶颈,需建立内生学习机制 [76] - 从自然语言反馈中提取多维评价信息是实现自主学习的关键技术难点 [78] - 无限长上下文建模和动态环境交互能力是自主智能体的基础要求 [79]
专访张祥雨:多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻
海外独角兽· 2025-06-08 04:51
多模态大模型发展现状 - 阶跃星辰发布中国首个千亿参数原生多模态大模型Step-1V 基于业内最早的图文生成理解一体化框架DreamLLM [3] - 多模态领域预计未来2-3年将迎来两个GPT-4时刻:多模态推理和自主学习 [3] - 当前多模态生成理解一体化面临四大挑战:语言对视觉控制能力弱 图文对齐不精确 数据质量有限 生成模块无法反向影响理解模块 [3] 计算机视觉领域瓶颈 - CV领域长期缺乏类似NLP的GPT时刻 主要受限于数据标注依赖和自监督方法局限性 [13][15] - 对比学习和MIM等方法在小模型有效 但缺乏scale up特性 因其学习的不变性来自人工设计而非数据驱动 [16][18][19] - 静态图像数据存在本质缺陷:生成 理解与人类对齐三者割裂 难以实现智能质变 [24][25][26] 多模态技术突破方向 - 短期解决方案是利用图文对齐数据 通过文字的自闭环特性赋予模型智能能力 [27] - 长期需探索视频和具身系统 视频数据蕴含更丰富信息但利用难度更高 [27] - 生成理解一体化需先解决视觉空间CoT问题 当前action space过于受限 [55][56] 大模型训练范式演进 - Next Token Prediction存在本质缺陷:更大模型在数学等推理任务上表现反降 因倾向跳步且优化目标与任务目标存在gap [38][40][42] - Rule-based RL通过直接优化任务目标 可抑制跳步并强化稳定思维路径 [44] - o1范式突破在于激发Meta CoT 允许模型在关键节点反悔重试 使推理从单线变为图状结构 [44][53] 多模态数据影响 - 图文混排训练中生成模块产生的gradient噪声大且信息量低 可能破坏语义理解 [62] - 高质量多模态数据应确保图文强相关 避免无关数据导致模型confuse [63][64] - 视频数据蕴含丰富思维过程但清洗难度大 是扩展action space的重要方向 [65][66] 未来技术趋势 - 多模态GPT时刻预计1年内到来 需解决生成可控性和视觉空间推理问题 [68][69] - 当前long context方案存在注意力涣散问题 未来可能采用multi-agent分层记忆架构 [69][73][74] - 模型自主学习是ASI关键路径 需解决环境scaling和自然语言反馈利用问题 [78][80][82]