Meta Learning

搜索文档
深度讨论 Online Learning :99 条思考读懂 LLM 下一个核心范式|Best Ideas
海外独角兽· 2025-09-30 12:06
讨论主题: Online Learning 参与嘉宾: 拾象 Best Ideas 社群 在 OpenAI o1 将 LLM 带入 RL 范式 一年后,我们再次迎来 AI labs 的密集发布周期:OpenAl 在推出 Pulse 后紧接着在今天凌晨推出 ChatGPT 即时支付功能和协议,Anthropic 也同步推出最强编程模型 Claude Sonnet 4.5,能连续专注任务执行超过 30 小时。 这些迭代背后的共同特性是:推动模型在复杂、长程任务上的表现不断精进,甚至直接、实时地参 与人类社会经济活动。 要彻底实现这一目标、真正走入 AGI,更高效的模型进步路径、新的技术范 式一定是当下的关键问题,online learning 极有可能是这个问题的答案。 两周前,海外独角兽组织了一场 「Best ideas」闭门讨论,和一线 AI researchers 围绕 online learning 展开思考。 虽然今天 AI 社区对于 online learning 是什么、以及怎么做还存在非共识,但 online learning 代表了一种新的交互和推理范式,在实现极致个性化的同时能够动态迭代整个 ...
自诩无所不知的大模型,能否拯救笨手笨脚的机器人?
虎嗅· 2025-05-06 00:48
机器人技术现状与挑战 - 当前餐饮机器人主要执行重复性任务如制作汉堡、薄饼等 但缺乏应对复杂厨房环境和突发状况的能力[1] - 传统机器人依赖预设编程 无法处理程序外情况 需要定义所有可能动作及效果[1][4] - 工业机器人如Levatas机器狗在限定场景表现良好 但无法适应开放环境任务[7][9] 大语言模型(LLM)与机器人结合 - ChatGPT等LLM为机器人提供海量知识库 弥补常识缺失 实现自然语言交互[5][12] - Google的PaLM-SayCan系统通过LLM理解高阶需求 如根据"健身完"自动选择健康饮品[21][22] - 南加州大学ProgPrompt方法将LLM生成代码与机器人执行结合 任务成功率显著提升[18][19] 技术突破与创新应用 - LLM参数规模爆发式增长 GPT-4达万亿级 北京智源"悟道2.0"达1.75万亿参数[12] - 普林斯顿团队利用GPT-3描述工具特性 使机器人掌握未见过工具的使用方法[23] - 多模态模型成为新方向 可同步生成语言、图像及行动指令[31] 行业应用前景 - 老年护理、家庭服务等领域潜力巨大 但当前技术尚不成熟[26] - 工业检测领域已实现自然语言控制 降低操作门槛[6] - 餐饮自动化可能被彻底改写 需突破物理执行瓶颈[4][14] 技术局限性 - 机器人传感器与执行器有限 难以匹配LLM的广泛语义理解[9][10] - LLM存在"幻觉"问题 可能生成不合理指令 需传统AI程序校验[27] - 物理世界随机性(如光线变化、物体形状差异)仍制约机器人表现[14] 伦理与社会影响 - 训练数据偏见可能导致机器人行为歧视 如面部识别中的种族差异[28][29] - LLM可能放大社会刻板印象 需建立防护机制[29] - 非洲等地区语言覆盖不足 LLM在非英语环境表现较差[28]