大语言模型(LLM)
搜索文档
企业该如何部署AI?要注意这三大趋势
财富FORTUNE· 2025-12-21 13:11
整个2025年,我与无数企业领袖探讨了他们的AI战略,试图了解哪些措施有效,哪些构成了阻碍。随 着时间推移,我注意到有三个趋势在不同公司和行业中反复出现,它们决定了哪些企业能借助AI取得 成功,哪些会陷入困境。现将这些趋势汇总,分享来自AI转型一线的经验教训。 首先,AI在后端任务中的应用正在蓬勃发展,这表明真正能产生实际影响的往往是那些"枯燥"的工作。 第二个趋势与技术无关,而关乎人:企业如何对待员工,对其AI应用的成败至关重要。然而,或许最 能说明问题的趋势是关于初始战略和动机的:追逐AI技术本身的企业往往失败,而以解决问题为出发 点的企业则能取得成功。 当然,成功的因素远不止这些——从数据治理到安全与合规。但上述这些趋势,无论好坏,正在塑造企 业的AI实践。 摒弃"为AI而AI" 咨询公司韦斯特门罗(West Monroe)的AI与新兴技术负责人埃里克·布朗(Erik Brown)今年早些时候 告诉《财富》,他目睹了许多公司在概念验证未能达到预期后,陷入了"AI疲劳"。他指出,陷入此境地 的企业有一个共同点:要么选错了应用场景,要么误解了AI在该任务中可能(或不可能)发挥的作 用。更具体地说,他们的出发 ...
LeCun离职前的吐槽太猛了
量子位· 2025-12-21 05:45
一水 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 好一个一吐为快! 年底就要正式离开Meta的LeCun,这下真是啥都不藏了。 不看好大语言模型能通往AGI,他就言辞犀利地指出: 通往超级智能之路——只需训练大语言模型,用更多合成数据训练,雇佣成千上万的人在后训练中"教育"你的系统,发明强化学习的新 花招—— 我认为这完全是胡说八道。这根本行不通 。 看不惯即将成为"前任"的Meta的封闭作风,他也直言不讳: Meta正在变得更加封闭……FAIR被推动去从事一些比传统上更偏向短期的项目。 而且还顺带剧透,自己将要创办的新公司仍会继续坚持开放。 以上内容来自LeCun最新参与的一档播客节目。在接近两小时的对谈中,他主要回答了: 总结起来就是,不管是在Meta接近12年的研究经历,还是接下来要创办的新公司,抑或是未来想要实现的AGI,通通都在这里了。 为什么硅谷对扩展语言模型的痴迷是一条死路? 为什么AI领域最难的问题是达到狗的智能水平,而非人类的智能水平? 为什么新公司选择构建在抽象表示空间中进行预测的世界模型,而非直接生成像素的模型? …… 人生下一程:创办新公司AMI 告别工作十二年的老东家,Le ...
凯文・凯利:意外之美|我们的四分之一世纪
经济观察报· 2025-12-19 10:15
文章核心观点 - 凯文·凯利(KK)基于对过去25年技术发展的观察,总结出“意外之快”、“意外之慢”和“意外之路”三大意外,并以此启示未来前瞻需跳出线性思维、关注系统成熟度和跨界创新 [2] - KK认为中国当前所处的位置类似于1980年代的日本,超越美国势不可挡,但最大的风险并非外部遏制,而是内部可能犯下的错误 [1][15] - 推动中国未来25年成长的关键要素包括:开源成为默认选项、科技创业者的信心与超越精神,以及拥抱全球化的反传统文化 [16] 意外之快:智能手机的“非线性爆发” - 智能手机的普及速度与广度远超预期,短短十年间完成了全球数十亿级的渗透,并重构了产业格局,吞噬了相机、MP3、导航仪、钱包乃至电脑的功能 [5] - 其革命性成功并非单一技术突破,而是通信(3G网络)、硬件(触控屏)和软件(App Store生态)等多个领域临界值叠加的结果,本质是技术融合催生的“非线性爆发” [5][6] - 启示在于:未来的爆发点往往是能整合多重需求的新生态载体,而非更高级的旧事物;仅以线性思维进行技术预判会错过生态级颠覆 [6] 意外之慢:VR与自动驾驶的蹒跚之路 - VR(虚拟现实)的发展速度远低于预期,即便是苹果的Vision Pro也未能一炮打红,其“iPhone时刻”迟迟未到 [8] - KK反思对VR的过度热情忽略了技术的系统依赖性,仅视觉体验的突破不足以支撑真正的沉浸式体验,需要其他相关领域的支撑 [8] - 自动驾驶技术(如Waymo的L4级)虽已取得突破,但大规模普及仍需5年以上,因为它不仅是技术问题,更是法律、伦理、社会信任和城市基础设施的系统工程 [9] - 启示在于:技术的落地速度取决于系统成熟度,必须深刻理解木桶原则;配套设施、社会文化和伦理规则的缺位会延缓技术普及 [9] 意外之路:大语言模型与共享经济的另辟蹊径 - 大语言模型(LLM)的发展路径出人意料,最先展现出理性思维能力的竟是语言翻译类人工智能,通过语言产生逻辑,这与传统依赖符号推理的路径截然不同 [11] - LLM遵循“规模原则”,通过持续优化升级和“大力出奇迹”的方式不断迭代,其发展程度令人期待 [11] - 共享经济(如Airbnb和优步)同样是“意外之路”的例证,其成功源于消费习惯的重构以及移动支付、评价体系、GPS定位和算法调度等技术融合降低了信任成本,使反传统模式成为可能 [12] - 启示在于:未来的突破往往来自跨界融合或反传统路径的创新,而非既有路径的优化;困于行业惯例或既有认知会忽略切中真实需求的新路径 [12] 历史教训与中国未来 - 回顾过去50年,KK及其同时代的美国精英曾误判日本崛起势不可挡,但日本最终并未超越美国,其停滞源于内部因素,如对既有发展路径的依赖、对市场开放的抵触,以及企业在面对颠覆性技术时的迟疑与躺平 [14][15] - KK将中国类比于1980年代的日本,认为超越美国势不可挡,但需警惕内部错误重蹈日本覆辙 [1][15] - 展望未来25年,推动中国成长的三大要素是:1)开源成为默认选项,以AI大模型为代表的技术路径将为中国创新赢得全球拥趸;2)科技创新创业者已不再满足于简单模仿,而是在超越路上不断突破;3)“海归”或拥抱全球化的群体引领的反传统文化,更能持续推动创新,因其包容失败、风险和质疑精神 [16] - 最重要的仍是拥抱“意外之美”的探索精神 [17]
凯文?凯利:意外之美|我们的四分之一世纪
经济观察报· 2025-12-19 10:07
(原标题:凯文?凯利:意外之美|我们的四分之一世纪) 编者按: 2025 年,经济观察报以 " 我们的四分之一世纪 " 为年终特刊主题,旨在通过数十位时代亲历者 的故事,共绘一幅属于这段岁月的集体记忆图谱。 二十一世纪的第一个25年即将结束之际,我问凯文·凯利(KK),有哪些发展超乎他的想象?又有哪些 低于他的预期?他简单地将答案归结为"意外之快""意外之慢",以及"意外之路"。 这三大意外也让我们意识到,前瞻未来时,我们往往会低估创新者的颠覆性,因此必须跳出线性思维; 我们也会在一厢情愿中忽略木桶原理;当然,也会有意外之喜,因为另辟蹊径常常带来爆炸式的后果。 归根结底,未来既充满不确定性,也蕴藏诸多可能性,发现意外之美是最大的快乐。 一、 意外之快:智能手机的"非线性爆发" "我没想到智能手机会吃掉一切"——智能手机普及的速度与广度——是KK最直观的意外。2007年 iPhone问世时,多数人将其视为更精致的功能机;但短短十年间,它不仅完成了全球数十亿级的渗透, 更以吞噬一切的姿态重构了产业格局:相机、MP3、导航仪、钱包乃至电脑的功能,被压缩进方寸屏 幕;社交媒体、移动支付、网约车等新生态,借由手机的普及 ...
65岁LeCun被卷回巴黎老家,与小扎一刀两断,曝光神秘AI初创
36氪· 2025-12-05 11:45
核心观点 - Meta首席AI科学家Yann LeCun离职创业 其新公司专注于开发基于“世界模型”的高级机器智能 旨在让AI理解并预测物理世界 这与当前行业过度投资大语言模型的技术路线形成鲜明对立 [1][3][11] - Yann LeCun公开批评大语言模型存在根本性局限 认为其已触及天花板 并将行业资源视为“黑洞” 阻碍了其他AI路径的发展 [6][8] - Meta公司尽管口头支持LeCun的创业 但并未进行财务投资 显示出双方在技术路线和商业兴趣上存在分歧 [1][36][38] 关键人物动态 - Yann LeCun在Meta工作12年后将于年底离职并创业 其新公司专注于开发“世界模型”以实现高级机器智能 [1][3] - LeCun表示Meta是其新公司的合作伙伴但并非投资者 暗示项目范围可能超出Meta的兴趣 [1][36][38] - 媒体报道LeCun计划离职后 Meta股价下跌了2% 据此估计LeCun对Meta的价值约为300亿美元 [38] 技术路线分歧 - Yann LeCun认为大语言模型仅是“token生成器” 缺乏对物理世界的理解、记忆和多步推理能力 几乎过时 [6] - LeCun指出大语言模型是自回归的 属于System 1 没有真正推理 不具备达到人类或狗类智能水平所需的四项能力 [6] - 他认为大语言模型像“黑洞”一样吸干了所有资源和关注 导致其他AI研究领域寸草不生 [8] - 与此相对 Meta公司正投入数十亿美元重金招揽大语言模型专家 甚至由CEO亲自参与挖角 这被视作对LeCun技术路线的一种否定 [8][11] “世界模型”技术理念 - LeCun倡导的“世界模型”是一种基于视觉等感官信息训练的非生成式AI 旨在预测物理世界 其理念可追溯至1943年的心理学概念 [3][12][14] - 他认为真正的智能需要构建“心理模型”或内部表征 以进行规划、推理和与复杂环境交互 而这大部分是通过观察和交互后天学来的 [21][22] - 过去10年 LeCun致力于此方向 前5年探索 后5年基于非生成式架构取得实质进展 并发展出联合嵌入预测架构 [16][20][21] - 世界模型不仅预测下一帧视频 更关键的是预测在不同动作下所有可能结果的分布 因此需要大量交互数据而不仅是视频数据 [25][26] - LeCun用比喻说明差异:大语言模型像盲目滚下山的雪球 而真正的智能应像能感知环境并规划路径的雪人 [27][29][30] 对当前AI发展的批判 - LeCun指出“莫拉维克悖论”依然存在:AI能在律师考试等抽象任务中表现出色 但无法让机器人具备五岁孩子的行动能力 [20][21] - 他认为理解物理世界比理解语言更难 文本只是对人类丰富感知的高度压缩和抽象描述 无法涵盖大部分关于物理世界的直觉和心理模型 [20][32][35] - 人类思考依赖心理意象而非token 因此仅通过缩放语言模型无法产生真正的智能 [20][35] - 他批评硅谷完全被生成式模型迷住 暗示其创业需在硅谷之外的非主流环境如巴黎进行 [38] 行业影响与现状 - 全球科技巨头正将数十亿美元投入大语言模型领域 并相信缩放定律能支持其通向通用人工智能 [4] - 行业围绕大语言模型迅速形成“共识” 但AI领域最顶尖的科学家对其作为智能路径的根本问题仍存在深刻分歧 [40] - 对智能本质的探索尚无定论 技术路径的竞争仍在继续 [40]
AI时代,到底会有什么新职业?
腾讯研究院· 2025-12-01 09:03
AI对就业影响的整体形势 - AI对人类职业与劳动力影响呈现增强、替代、补充、创造四个效应交织的复杂局面[3] - 新技术扩散的非均衡性导致掌握AI的群体效率明显提升,必然对不掌握AI的群体产生劳动力替代[3] - GenAI全面采用可使美国等发达市场劳动生产率提高约15%,但可能导致AI转型期间失业率比趋势水平上升0.5个百分点[3] - 全球有25%的就业岗位面临GenAI影响风险,高收入国家比例高达34%[3] - AI应用尚处早期,替代效应快于创造效应,这种时滞源于技术迭代、产业应用和人才培养的滞后[4] - 企业普遍采取停招、转岗、削减外包三步走策略缓解用工压力,而非直接大规模裁员[5] - 针对人力不足、高危、高强度工作,AI能发挥劳动力补充作用,有助于解决结构性用工难题[5] AI新职业类型 - 分析7家主流AI大模型厂商718个招聘岗位,AI新职业可分为使能者、协作者、治理者、推广者和支持者五大类[8] - AI使能者负责AI技术开发、运维与优化,是生态核心造血角色,招聘岗位数量最多占比近50%[10] - AI协作者作为人机协作桥梁,熟练掌握AI工具提升工作效率,目前招聘岗位占比13.4%[11] - AI治理者为AI制定规则并监督执行,确保符合人类价值观,美国AI公司招募此类岗位数量明显多于中国(72:2)[14] - AI推广者通过市场推广降低AI认知门槛,推动技术普及,岗位特性与互联网公司相比无显著变化[15] - AI支持者为AI产品服务提供人财物等资源保障,岗位类别无明显变化,局部体现与AI交叉结合[18] AI新职业特征 - 职业岗位呈现深度细分趋势,围绕技术应用创新方向进一步专业化,反映AI技术栈的复杂性与专业化需要[20] - AI通用性促使职业呈现跨界融合特征,包括研发与落地融合、多技术多业务融合、非技术与技术融合[22] - 面对AI替代和安全风险,设立以人为本、人机协作的岗位成为企业负责任的表现[22] - AI新职业目前不稳定,随技术迭代呈现较快兴起与收缩,如提示词工程师、数据标注员等岗位需求变化迅速[23] 未来职业增长方向 - AI原生岗位是新职业核心孵化池,2025年7月有超1000家企业发布AI相关岗位7.2万个,同比增幅超10倍[25] - 当前新增招聘以技术岗为主占比84.13%,尤其算法岗位占据大半,未来非技术岗增长潜力大[25] - 服务业是就业规模增长主要领域,中国服务业占GDP比重约56%,远低于美国80%、日本70%、欧盟70%[26] - AI+服务催生个性化、人机协同新职业形态,如AI分镜优化师、多模态提示词工程师、AI数字人训练师等[26] - AI与互联网平台结合推动工作向任务制转变,2023–2024年中国新型灵活就业招聘职位数占比从12.2%跃升至15.2%[27] 企业层面的响应调整 - 企业建立员工代表参与的管理机制评估AI系统,德国电信与工会签署《AI宣言》并制定五级风险评估体系[30] - 针对AI影响大的岗位积极开展再培训和内部转岗,宜家上线AI客服机器人后成功将约8500名员工转岗为室内设计顾问[30]
中山大学最新Cell子刊:AI能够帮助医生克服技术障碍,但存在依赖风险
生物世界· 2025-11-27 04:11
文章核心观点 - 大语言模型能有效帮助医生克服技术障碍,显著提升其参与医学人工智能研究的项目完成率[3][5][7][9] - 大语言模型的应用使医疗AI研究民主化,但同时也存在AI幻觉和医生产生依赖倾向的潜在风险[3][5][6][7][9] 研究背景与挑战 - 跨学科研究推动了科学领域突破,但在生物医学领域,AI等技术的广泛应用受限于技术障碍[2] - 医生因缺乏多学科专业知识或技能,以及难以获得工程支持,在AI技术的问题导向型研究中参与受阻,偏远地区或资源有限的年轻医生面临的挑战更明显[2] 研究设计与方法 - 研究团队开展了一项随机对照试验,招募64名初级眼科医生进行为期两周的“自动化白内障识别”项目[5] - 干预组32人使用大语言模型ChatGPT-3.5,对照组32人不使用,在最小化工程辅助的情况下进行[5] 研究结果与数据 - 干预组项目总完成率高达87.5%,显著高于对照组的25.0%[5][7] - 干预组无辅助完成率为68.7%,远高于对照组的3.1%[5] - 干预组展现出更优的项目规划能力和更短的完成时间[5] - 经过两周洗脱期后,41.2%的成功干预组参与者能在没有LLM支持的情况下独立完成新项目[5][7] 潜在风险与影响 - 42.6%的参与者担心会不加理解地复述AI信息,40.4%担忧AI会助长惰性思维,表明存在潜在依赖性风险[5] - 大语言模型存在幻觉风险,其长期使用形成的依赖风险需进一步研究评估[6][7][9] - 研究提出了与大语言模型有效互动的初步提示指南[7]
别装了,AI巨头们,谁在卡脖子,谁在割韭菜?这张图一目了然
36氪· 2025-11-25 05:59
项目概述 - 卡内基梅隆大学发布首个系统刻画AI供应链的数据集 涵盖数据、算力、模型、资本和人才流向 [1] - 数据集通过抓取数千篇文章、新闻稿和SEC文件构建 并持续每周更新 [3] - 项目旨在绘制AI参与者之间的互动关系 弥补当前行业报告只点名关键机构但缺乏关系刻画的缺口 [9] 数据集规模与关键参与者 - 数据集中包含13,694个独特参与者和18,547对独特参与者组合 [2] - 描述中最常见的词包括openai(出现7,419次)、microsoft(5,273次)、nvidia(5,066次)和google(4,762次) [2] - OpenAI以5,702次关系提及和1,168个独特合作伙伴位居榜首 Microsoft以3,649次关系提及和1,013个独特合作伙伴紧随其后 [2] AI供应链结构与行业演变 - AI供应链描述AI模型、数据和工件在上游生产 以及在下游适配和使用的过程 [3] - 供应链最上游可追溯至人工标注员 最下游延伸至各类AI应用的终端用户 [14][15] - AI行业从过去企业内独立完成各环节 演变为专业化公司接管研发流程中的独立环节 标志着行业走向成熟 [17][19][20] 供应链分析的关键应用 - 识别上游市场集中度造成的瓶颈 可能导致产品或服务中断时的连锁故障 [5] - 揭示市场力量聚集之处 帮助理解生态中不同层级的竞争演化 [9] - 发现AI组织之间的密切财务关系 包括相互投资和循环投资 [6] - 追踪AI在下游各行业的使用与采用情况 有助于追踪AI的危害和同质化等问题 [7] 供应链透明度的重要性 - 看清供应链有助于识别谁在制造瓶颈、攫取超额收益和转嫁风险 避免被技术神话与商业宣传误导 [21] - 理解上下游依赖是设计算力、信息披露、责任归属与安全监管等干预措施的基础 [9] - 未来AI治理需要对整条供应链问责 包括谁提供算力与数据、谁推动落地与扩散、谁获利和承担后果 [22]
大模型正沦为“免费基建”,真正Alpha机会在应用层?
华尔街见闻· 2025-11-24 06:23
核心观点 - AI领域投资重心正从基础设施转向应用层,长期价值在于应用生态而非大语言模型本身 [1] 市场认知与类比 - 当前市场对大语言模型的认知存在误区,LLM正在迅速商品化,如同“人人喜爱的自来水”被免费赠送 [1] - 将LLM现状比作宽带网络建设早期,真正赚大钱的不是提供基础工具的运营商(LLM开发商),而是利用工具创造商业价值的应用开发者 [1] - 多家LLM开发商(如OpenAI)在相似功能上激烈竞争,被比喻为“同时创造10个谷歌” [1] 投资策略与机遇 - 投资策略倾向于成为“利用搜索引擎赚取真金白银的人”,而非搜索引擎的开发者 [1] - 将全部前瞻性精力用于寻找未来2-3年(T+3)的机会 [2] - 最大机遇在于能将AI能力与特定行业深度结合,从而创造巨大效率提升和商业模式变革的初创企业 [2] 对基础设施的谨慎看法 - 对当前市场追捧的AI基础设施持谨慎态度,将英伟达高达5万亿美元的估值与1999年的思科相提并论,认为这是“向后看”的估值 [2] - 预测未来几年美国将投入5000亿美元建设数据中心以满足需求,但这轮建设更像一个“小繁荣”,投入的资本和关注度已经“越位” [2]
瑞银:中国互联网大厂正提升资本开支 加大人工智能领域投入
新华财经· 2025-11-20 07:19
市场情绪与估值 - 2025年有利的市场情绪推动中国互联网行业估值倍数提升至约17倍的调整后市盈率 [1] - 中国主要互联网公司估值相对便宜,美国“科技七巨头”估值约31倍 [1] - 中小市值的垂直领域公司持续跑赢大盘,情绪化消费场景如在线游戏与音乐表现优于实物消费相关标的 [1] 人工智能投入与趋势 - 中国互联网大厂正积极提升资本开支,加大人工智能领域的投入 [1][2] - 资本开支更多由需求驱动,公司更关注图形处理器效率和利用率,能根据需求快速灵活调整投入目标 [2] - 在人工智能芯片层面,芯片性能正快速提升,国内企业通过“超节点”技术弥补国产单颗图形处理器差距 [2] - 大模型开发者正针对本土图形处理器进行算法优化 [2] - 头部云厂商2025年二季度普遍维持全年资本开支指引,重点提升芯片利用率和部署效率 [2] - 大语言模型及人工智能有望成为推动云市场增长的可持续驱动力,并带来传统业务的交叉销售机会 [2] 即时零售与竞争格局 - 中国互联网行业正加大即时零售投入,平台希望通过高频外卖交易带动低频电商业务,提升用户活跃度 [3] - 即时零售短期竞争趋于稳定,行业交易量增长放缓,竞争在四季度末趋于缓和并逐步回归常态 [3]