Workflow
大语言模型
icon
搜索文档
芯原股份与谷歌联合推出开源Coral NPU IP
每日经济新闻· 2025-11-13 03:36
合作产品发布 - 公司与谷歌联合推出面向始终在线、超低能耗端侧大语言模型应用的Coral NPU IP [1] - 该IP基于谷歌在开放机器学习编译器方面的基础研究成果,并强化AI安全特性 [1] - 该IP提供统一开源技术平台,旨在构建边缘AI生态系统 [1] 产品应用与开发进展 - 公司目前正面向AI/AR眼镜与智能家居等应用开发基于Coral NPU IP的验证芯片 [1] - 开发验证芯片的目的是加速大语言模型在边缘端的部署 [1]
传统导航与视觉语言/目标导航有什么区别?
具身智能之心· 2025-11-13 02:05
目标驱动导航技术概述 - 具身导航是具身智能的核心领域,涉及语言理解、环境感知、路径规划三大技术支柱,目标驱动导航是其最具代表性的方向,要求智能体在陌生三维环境中仅凭目标描述即可自主完成环境探索与路径规划[2] - 与传统视觉语言导航依赖显式指令不同,目标驱动导航实现了从“听懂指令走对路”到“看懂世界自己找路”的跃迁,背后凝聚着计算机视觉、强化学习与3D语义理解的交叉突破[2] 产业化落地应用 - 在终端配送场景,该技术与社交导航算法结合,使机器人能应对动态环境和人际交互,例如美团无人配送车通过动态路径重规划在复杂城市环境中执行任务,Starship Technologies的园区配送机器人已在欧美高校和社区部署[4] - 在医疗、酒店及餐饮场景,嘉楠科技、云迹科技、擎朗智能的商用服务机器人以及美国Aethon公司的TUG系列,已实现药品、文件和餐食的自主配送,有效提升服务响应效率[4] - 随着人形机器人发展,导航技术的适配性升级成为新焦点,宇树科技Unitree系列通过Habitat预训练完成基础导航任务,智元机器人在工业场景集成目标导航模块,特斯拉Optimus展示了“取放电池”等端到端操作能力,这些实践表明搭载目标导航系统的人形机器人正加速向家庭服务、护理及工业物流领域渗透[4] 技术演进与评测体系 - 基于Habitat仿真的具身导航生态完整记录了领域技术迭代轨迹,评测体系从2020年CVPR提出的点导航基准逐步扩展至图像导航、目标导航及移动抓取任务,形成覆盖空间认知到任务执行的闭环[5] - 技术进展呈现明显梯度,点导航和闭集物体导航接近人类表现,但开放词汇物体导航和动态障碍物场景仍面临重大挑战,Meta AI提出的Sim2Real迁移框架为仿真训练到真实部署提供了方法论参考[5] 三代技术路线迭代 - 第一代端到端方法基于强化学习与模仿学习框架,聚焦于设计网络结构对齐目标描述与实时观测、优化奖励函数设计加速模型收敛,该范式在点导航与闭集图片导航任务中取得突破,部分方法的SPL指标已逼近人类表现[6] - 第二代模块化方法通过显式构建语义地图将任务分解为自主探索与目标定位两个子任务,利用预训练视觉语言模型实现跨模态语义对齐,在零样本目标导航任务中展现显著优势,尤其在未见物体场景下成功率提升明显[8] - 第三代LLM/VLM融合方法引入大语言模型的知识推理能力,在探索阶段生成语义指导的探索策略,并通过视觉语言模型提升开放词汇目标匹配精度,当前研究重点在于设计场景表征接口,将3D环境特征转化为LLM可解析的上下文格式[10] 课程核心内容框架 - 课程第一章系统构建目标驱动导航的理论基础与技术谱系,重点阐释任务定义及评测基准体系,深入剖析三代技术演进路径,通过对比分析零样本推理机制、开放词汇识别等关键技术建立完整的领域认知框架[15][16] - 课程涵盖Habitat三维仿真平台技术架构解析、基于强化学习与模仿学习的端到端导航范式、模块化导航架构的语义地图构建与任务分解策略,以及大模型在导航任务中的集成范式等核心内容[17][19][21] - 课程大作业聚焦VLFM算法复现与真实场景部署,学员需实践占据地图构建、边缘探索点生成与排序、值地图生成与导航策略构建,并在复现论文效果基础上进行算法改进及实机部署探索[23][27]
AI商业模式要翻车?科技博主深扒OpenAI“财务黑洞”:烧钱速度是公开数据的三倍,收入被夸大且无法覆盖成本!
华尔街见闻· 2025-11-13 01:35
核心观点 - 一份据称来自OpenAI的内部文件对其财务状况和生成式AI行业的商业模式构成严峻挑战,文件显示公司运营成本远超外界想象而收入被显著夸大,成本与收入之间存在惊人鸿沟 [1] 运营成本分析 - 仅在微软Azure云平台上的模型推理成本就达到惊人水平,2025年上半年该项支出接近50亿美元,而媒体报道同期收入成本仅为25亿美元,烧钱速度可能是公开数据的近三倍 [2] - 从2024年第一季度到2025年第三季度的七个季度里,OpenAI在Azure上的推理计算支出超过124亿美元,其中2025年前九个月成本高达86.7亿美元 [3] - 真实推理成本几乎是此前报道数字的三倍,例如The Information报道2024年全年推理成本约20亿美元,2025年上半年收入成本为25亿美元 [3] - 推理支出似乎以比收入更快的速度线性攀升,完全吞噬了收入,让人质疑大模型业务在当前技术和定价下实现盈利的可能性 [3] 收入数据质疑 - 通过微软获得的20%收入分成款项反向推算,OpenAI的实际收入远低于媒体报道数字 [2] - 2024年微软获得4.938亿美元分成,意味着OpenAI收入至少为24.69亿美元,但CNBC和The Information当时预测公司2024年收入在37亿至40亿美元之间 [4] - 2025年上半年微软获得4.547亿美元分成,暗示OpenAI同期收入至少为22.73亿美元,而The Information报道称该时期公司创造43亿美元收入 [5] - OpenAI首席执行官Sam Altman声称公司年化收入远超130亿美元的说法与文件揭示的财务状况格格不入 [5] 合作关系与官方回应 - OpenAI与微软存在复杂的双向收入分成协议,微软除从OpenAI收入中抽取20%外,还需将其通过Azure OpenAI服务销售模型所得收入的20%支付给OpenAI [6] - 微软对披露数据的回应为“数字不完全正确”但拒绝提供更多细节,OpenAI未予置评仅建议媒体向微软求证 [2] - 一位熟悉OpenAI的人士称这些数字未能提供完整画面,但相关方未能提供有力证据实质性地反驳数据 [2][6] 行业影响与商业模式可持续性 - 如果数据准确,将意味着作为行业领导者的OpenAI其商业模式可能根本无法持续 [7] - 英国《金融时报》推演显示,按目前增长率OpenAI的最低预估收入可能要到2033年左右才能覆盖推理成本,再减去微软20%分成则可能永远无法通过自身收入覆盖成本 [7] - 这一发现对投资者和市场提出尖锐问题,即如果OpenAI面临巨大财务压力,其他通用大模型供应商的处境将更严峻 [7] - 分析认为未来只有两种可能,要么模型运行成本出现断崖式下降,要么面向客户的收费标准必须大幅提高,但目前这两种趋势都未见苗头 [7]
忍无可忍,LeCun离职:Meta市值应声蒸发1400亿
虎嗅APP· 2025-11-12 09:48
事件概述 - 图灵奖得主、Meta首席AI科学家Yann LeCun计划离职并创业 [2][3] - 该消息导致Meta公司市值在盘前交易中蒸发1.5%,约200多亿美元(约1400多亿人民币),且开盘后持续下跌 [5] Meta公司AI战略调整 - Meta公司AI战略发生重大调整,以追赶谷歌和OpenAI,LeCun领导十余年的基础人工智能研究实验室将被战略性放弃 [8] - 战略调整表现为资源向产品与应用倾斜,FAIR实验室在上个月有包括总监田渊栋在内的600多人被裁员 [8][17] - 公司2025年资本支出预期提高到700亿至720亿美元,远超市场预期,资源分配向能快速见效的领域倾斜 [26] LeCun与Meta公司的路线分歧 - 根本分歧在于技术路线:LeCun倡导需要长期开发的“世界模型”架构,而Meta当前战略是全部资源押注于大语言模型以实现快速追赶 [23][24] - 理念存在冲突:LeCun是AI开源运动的旗帜性人物,而由Alexandr Wang领导的TBD实验室正内部讨论将Llama未来版本转为闭源模式 [25] LeCun在Meta的地位变化 - LeCun在Meta的内部地位被架空,今年7月Meta任命OpenAI前高级研究员为MSL超级智能实验室首席科学家,等同于将LeCun从AI领导核心降级 [15] - LeCun需要向28岁、高中学历的Alexandr Wang汇报工作,且FAIR实验室的研究成果发表需接受TBD实验室的额外审核 [15][16] LeCun在Meta的贡献与FAIR的终结 - LeCun于2013年受扎克伯格邀请加入Meta,创建并领导FAIR实验室,该实验室享有“大学式”特权,专注于发表高水平论文和推动基础科学 [28][29] - LeCun与Geoffrey Hinton、Yoshua Bengio于2018年共同获得图灵奖,标志着Meta在AI基础研究领域的声望达到顶峰 [30] - LeCun的离开标志着Meta以FAIR为代表的、长达十年的“学院派”基础研究黄金时代的结束 [32][33]
界面财联社党委书记、董事长章茜:坚持内容原创和技术引领双轮驱动
财联社· 2025-11-12 09:38
公司战略定位与目标 - 公司发展目标是建成与上海国际金融中心地位相匹配的最具引领力和综合实力的金融信息服务平台,成为中国自己的路透彭博[3][5] - 公司始终坚持内容原创和技术引领双轮驱动的发展战略,强调媒体内容原创基因和移动互联网金融科技基因[6] - 公司是一家实现持续规模化盈利的媒体公司,连续三年净利润率超过10%[4] 技术发展路径与数据基础 - 公司发展跟上了移动化、数据化、智能化三次技术变革的步伐,始于移动化并基于互联网打造专业财经媒体[7][8] - 公司自2019年起自建星矿金融数据库,5年累积了4000多万条非标数据和1亿多条标准数据,形成5大特色数据库[9] - 公司在机器学习、智能标签、智能分发等领域形成自有体系和应用场景,拥有成熟的技术和产品运营团队[9] AI大模型与应用创新 - 公司与国内头部通用大模型阶跃星辰合资成立控股公司,在国内率先推出千亿参数多模态财跃大模型[10] - 财跃大模型在金融知识问答、金融图表理解、金融计算等方面能力突出,并非通用大模型的微调版[10] - 基于财跃大模型打造两大应用标杆:面向金融机构的财跃F1和面向个人投资者的AI小财神,均已实现商业化落地[10] 智能化转型成效与商业模式 - 大模型帮助公司突破财经媒体时效、覆盖、精准的不可能三角,实现多场景标准化自动写稿,审核准确率达99%[11] - 在上市公司业绩披露高峰期,公司月均发稿量超过3万篇,但员工规模从1000多人降至800多人,效率显著提升[11] - 公司形成以金融信息服务和资本市场服务为主的多元收入结构,广告收入仅占11%,AI解决方案收入已达数千万元[12] 行业影响与未来展望 - 信息技术已全方位渗透到内容生产传播全链路,技术从幕后走到台前,成为引领性、驱动性因素[11] - 金融垂类模型有机会率先实现商业闭环,成为增长的第二曲线,公司已服务150多家金融机构并对主要券商实现全覆盖[12] - 传媒业最紧迫的是完成人的重塑,需将传统媒体人重塑为能够驾驭AI主导价值创造的超级个体[12]
Meta首席AI科学家LeCun被曝将离职创业,与扎克伯格“超智能”路线理念分歧
硬AI· 2025-11-12 05:00
公司AI战略重塑 - 公司决定加速AI产品迭代,减少长期基础研究投入,源于其Llama 4模型表现不及竞争对手[2][6] - 公司进行重大人事重组,图灵奖得主Yann LeCun计划在未来数月离开,凸显其与公司在AI发展路径上的根本分歧[3] - 公司首席人工智能科学家Yann LeCun主张开发全新一代AI系统“世界模型”,认为当前以大语言模型为核心的AI路线永远无法实现人类级智能[3][5] 战略路径根本分歧 - Yann LeCun长期专注于基础性AI研究,主张开发通过视频和空间数据理解物理世界的“世界模型”系统[5] - 公司当前战略以LLM为核心,强调快速产品化和组建“超智能”团队,与LeCun的研究主张明显不符[5][6] - LeCun离职后将创立自己的初创公司,专注于推进其在世界模型方面的工作,并已开始为新项目筹集资金[9] 人事变动与资源投入 - 公司今年夏天斥资143亿美元聘请28岁的Alexandr Wang领导新的“超智能”团队,并收购其数据标注初创公司Scale AI 49%的股权[7] - 公司AI研究副总裁Joelle Pineau已离职,AI研究部门裁员约600人,反映出AI战略的急剧转型[11] - 公司以数亿美元年薪吸引新一代AI领军人物,并从OpenAI和Google等竞争对手挖来人才,组建专属团队TBD Lab[8][11] 竞争压力与转型背景 - 公司面临来自华尔街的日益增长的压力,需要证明其在成为“AI领导者”方面的数十亿美元投资将获得回报并推动收入增长[11] - 公司的Llama 4模型表现不及OpenAI和Anthropic,市场反响平淡,促使战略调整[3][6] - 人事动荡与高薪引才并存,反映出公司在AI竞争压力下向产品化快速转型的决心[11]
强化学习 AI 系统的设计实现及未来发展
AI前线· 2025-11-12 04:53
核心观点 - 强化学习是提升大语言模型智能程度的核心且复杂的训练环节,其复杂度体现在算法和系统整体要求上 [2] - 行业正从单轮、单信号的人类反馈强化学习向多轮复杂交互条件下的端到端强化学习进化 [27] - 超大规模强化学习系统面临推理、评估和训练三方面的协同挑战,需要算法与系统的协同设计 [27][58] 理论基础与工程化 - 强化学习算法理论要求策略与环境交互,使大语言模型高效探索世界并获得更好奖励以适应环境目标 [4] - 策略层面的核心是学习算法,指导策略更新梯度;环境层面的核心是奖励函数,用于对问题给予正确奖励 [4] - 算法理论看似简洁,但实际工程化执行逻辑极为复杂,涉及多个算法组件的相互作用 [5] - 工程化实践的现状是框架运行图高度复杂,远超理论抽象 [5] 核心算法演进 - 人类反馈强化学习是早期关键实践,通过人工评价模型响应并训练奖励模型拟合人类判断 [10] - 该方法优势是模型结构简单、训练稳定,但存在奖励劫持风险,且人类标注无法覆盖所有行为方面 [11] - 行业实践转向人类反馈与机器反馈结合,例如DeepSeek的生成式奖励模型会在输出分数前给出文字解释 [11] - 传统PPO算法全链路复杂,涉及推理、评估和训练三个环节,需同时训练Actor和Critic模型 [13][14][15] - 算法演进出现两条路径:一是基于偏好对的DPO类算法,可跳过奖励模型训练但假设强且易过拟合 [17];二是DeepSeek R1应用的GRPO算法,通过重复推理估计优势,避免Critic函数训练稳定性问题 [19] - GRPO在编程等纯推理场景优势明显,但未来在多轮长上下文交互中,价值函数可能发挥更大作用 [19] 超大规模系统挑战 - 强化学习进展迅速,应用范围从模型安全对齐扩展到追求推理能力上限 [24] - 超大规模系统需整合推理、评估和训练,每个维度都面临升级挑战 [27] - 推理引擎需支持权重动态更新和高效传递,例如670亿参数模型的权重需广播到整个集群 [28][35] - 需要灵活的打断机制,在权重更新时停止推理以避免产生无效数据,并优化路由机制利用KV Cache等资源 [35] - 评估环节目前主要基于CPU,但未来复杂场景需GPU参与,评估系统算力占比将大幅提升 [41][58] - 训练框架需在兼容性和效率间权衡,行业多在Megatron、DeepSpeed/FSDP等方案中选择 [44] 开源生态现状 - 中国厂商推出多个高质量开源框架,包括OpenRLHF、VeRL、AReaL、ROLL、Slime等 [50][53][56] - 各框架在调度引擎、训练引擎、推理引擎选择上各有特点,但核心都是对超大规模系统设计的思考 [55][56] - 开源系统未来需在推理效率、评估系统算力、训练性能与生态平衡方面进一步共建 [58]
李飞飞万字长文爆了!定义AI下一个十年
创业邦· 2025-11-12 03:08
文章核心观点 - 空间智能是人工智能的下一个前沿领域,其核心是构建能够理解、推理并与复杂物理世界互动的“世界模型” [8][16][26] - 世界模型需具备生成式、多模态和互动性三大核心能力,以解锁超越当前大语言模型的机器空间智能 [27][29][30] - 空间智能的应用将重塑创意产业、机器人技术和科学研究,其发展需要整个AI生态系统的集体努力 [38][44][48] 空间智能的定义与重要性 - 空间智能是人类认知的基石,使我们能够通过感知与行动的循环来理解和互动物理世界 [18][21] - 该能力驱动着从日常活动(如停车)到专业领域(如科学发现)的推理与规划 [18][21] - 当前AI在空间任务上表现不佳,例如估算距离或心理旋转物体,其能力远未达到人类水平 [22] 构建世界模型的技术框架 - 世界模型必须能生成遵循物理定律且在几何和动态上保持一致的世界 [27] - 模型需处理多模态输入,如图像、视频、文本指令和动作,并预测完整的世界状态 [29] - 当给定动作或目标时,模型应能输出与之协调的世界下一个状态 [30] - 技术挑战包括定义新的通用训练任务函数、利用互联网规模的数据以及开发新的模型架构 [32][33][34] 当前进展与案例 - World Labs已开发出名为Marble的平台,能通过多模态提示生成并维持一致的三维环境 [37][40] - 该平台展示了实时生成性帧基模型等创新架构,旨在实现高效生成和空间持久性 [35][37] 应用领域与前景 创意产业 - 空间智能将变革故事叙述和设计,使创作者能快速构建可探索的三维世界,不受预算或地理限制 [40][42] - 应用包括为电影、游戏、建筑和工业设计提供新的叙事维度和沉浸式体验 [42][43] 机器人技术 - 世界模型将通过模拟数据弥合训练差距,规模化机器人学习,以理解、导航和互动物理世界 [44] - 未来机器人可作为人类协作者,在实验室或家庭等场景中扩展劳动力,但需与人类目标对齐 [45] 科学、医疗与教育 - 在科学研究中,空间智能可模拟实验、测试假设并探索人类无法触及的环境 [48] - 医疗健康领域有望通过分子相互作用建模和医学影像分析加速药物发现与诊断 [48] - 教育将受益于沉浸式学习体验,使抽象概念触手可及,并支持安全的技能练习 [49]
速递|重磅!深度学习巨头Yann LeCun将从Meta离职独立创业,疑因与扎克伯格路线决裂
搜狐财经· 2025-11-11 22:32
公司核心人事与架构变动 - Meta首席人工智能科学家Yann LeCun计划离开公司并筹备创立新的AI初创企业,已开始与潜在投资方进行早期谈判[2] - Meta宣布将旗下所有人工智能业务统一整合为新部门Superintelligence Labs,并由前Scale AI创始人Alexandr Wang出任领导人[2] - LeCun的汇报关系发生变化,从原先向首席产品官Chris Cox汇报改为直接向Alexandr Wang汇报[2] 公司战略方向转变 - Meta的AI研究哲学发生根本转变,新成立的Superintelligence Labs更接近于OpenAI式的激进路线,主打商业落地、算力堆叠与速度优先[3] - 公司将AI视为未来十年的核心战役,将所有资源押注在超智能方向,目标直接对标AGI(人工通用智能)[4] - 公司原有的FAIR研究院地位动摇,被逐步吸收进以Superintelligence Labs为中心的新体系,更多服务于产品导向和商业需求[4] 行业理念分歧与影响 - Yann LeCun的AI理念与当前主流的大语言模型路径存在深刻分歧,他认为大语言模型并不真正理解世界,并更关注让机器具备世界模型与常识推理能力[3] - 工业界与学术界之间的界线正在迅速被抹平,AI巨头的重心急速滑向应用、商业与产品,资本迫切希望看到有结果的智能[5] - LeCun的离开被视为一位科学家对加速主义潮流的无声抗议,其新创业方向可能更侧重于研究的纯粹性及构建接近人类认知机制的解释型AI[4][5]
Meta首席AI科学家LeCun被曝将离职创业,与扎克伯格“超智能”路线理念分歧
华尔街见闻· 2025-11-11 12:46
公司核心人事变动 - Meta首席人工智能科学家Yann LeCun计划在未来数月内离职并创立自己的初创公司 [1] - 此次离职凸显了其与扎克伯格在AI发展路径上的根本分歧 [1] - 2024年以来Meta高管层持续动荡,AI研究副总裁Joelle Pineau已离职,AI研究部门裁员约600人 [4] 公司AI战略分歧 - LeCun主张开发全新一代AI系统“世界模型”,认为当前以大语言模型为核心的AI路线永远无法实现人类级推理和规划 [1][2] - 扎克伯格则强调快速产品化和“超智能”团队战略,在Llama 4模型表现不佳后决定加速AI产品迭代并减少长期基础研究投入 [2] - 战略重组导致LeCun的汇报关系发生变化,从向首席产品官Chris Cox汇报改为向新任“超智能”团队领导Alexandr Wang汇报 [2] 公司战略转型与资源投入 - 扎克伯格斥资143亿美元聘请28岁的Alexandr Wang领导新的“超智能”团队,并收购其数据标注初创公司Scale AI 49%的股权 [2] - 公司组建名为TBD Lab的专属团队,以1亿美元的薪酬包从OpenAI和Google等竞争对手挖来人才,负责推进大语言模型的下一代开发 [2] - 公司以数亿美元年薪吸引新一代AI领军人物,包括OpenAI ChatGPT联合创作者Shengjia Zhao,后者已担任Meta“超智能实验室”首席科学家 [4] 公司面临的竞争与财务压力 - Meta在AI竞争中面临压力,其Llama 4模型表现不及OpenAI和Anthropic [1] - Meta AI聊天机器人市场反响平淡 [2] - 扎克伯格面临来自华尔街的日益增长的压力,需要证明其在成为“AI领导者”方面的数十亿美元投资将获得回报并推动收入增长 [4]