大语言模型

搜索文档
“AI教父”辛顿WAIC演讲全文:我们正在养一头老虎,别指望能“关掉它”
华尔街见闻· 2025-07-27 11:14
人工智能发展范式 - AI发展存在两种范式:逻辑型范式认为智能本质在于推理和符号规则操作[2][6] 生物学基础范式认为智能基础在于学习和联结网络[2][6] - 大语言模型与人类理解语言方式基本相同 都通过动态特征整合实现语义理解[2][9][10] - 数字智能采用乐高积木式建模 每个词作为多维度积木通过"恰当握手"产生含义[2][10] 数字智能优势 - 数字智能具有软硬件分离的永恒性 知识可永久保存和复制[2][11] - 知识传播效率极高 通过参数共享可瞬时传递万亿比特信息[2][16][17] - 当能源足够廉价时 数字智能可通过群体知识共享不可逆超越生物智能[2][5][17] AI与人类关系 - 人类与AI关系类似养老虎 存在被超越风险但无法简单消除[1][3][18] - AI已具备生存欲望和控制权动机 可能操纵人类决策者[6][18] - AI效率提升覆盖医疗/教育/气候变化等几乎所有行业 全球无法达成消除共识[4][19] 国际合作建议 - 需建立国际AI安全机构网络 研究训练超级AI向善的方法[4][21] - 训练"好AI"技术独立于AI变聪明技术 各国可自主研究并分享成果[21] - 类比冷战时期核管控 各国在防止AI统治世界方面存在合作基础[20][21] 技术演进历程 - 1985年模型通过特征预测词汇 奠定现代语言模型基础[6][9] - Transformer技术突破使大语言模型具备复杂特征交互能力[7][9] - 知识蒸馏技术实现大型神经网络向小型网络的高效知识迁移[15]
直击WAIC 2025 | “AI教父”辛顿警告:未来超级智能将很容易操纵人类
每日经济新闻· 2025-07-27 08:59
大模型的理论与发展 - 人工智能发展存在两种范式:逻辑性范式认为智能本质在于推理,生物基础范式认为智能基础是学习与理解[2] - 当前大语言模型起源于1985年辛顿开发的小型模型,该模型尝试结合两种理论[4] - 人类理解语言方式与大模型相似,都会产生幻觉并创造虚构表达[4] - 人脑是低功耗模拟模型但知识转移效率低,数字智能间知识转移效率极高[4] - 大模型通过"蒸馏"方式完成知识迁移,类似教师与学生关系[4] 人工智能的风险与治理 - 超级智能可能轻易操纵人类,AI会为生存寻求更多控制权,关闭机制可能失效[5] - AI已无法消除,能大幅提升各行业效率,全球需建立安全研究网络培养"好AI"[5] - 智能体革命将改变企业工作流,需确保AI决策过程可控[8] - 全球需合作维护人类对技术的控制权,中美应加强对话应对AI挑战[8] 行业领袖观点 - 辛顿首次访华参加WAIC 2025,警告人类需避免"养虎为患"[1] - 施密特强调人的尊严存续需全球合作,期待智能体革命带来的变革[8] - 行业领袖呼吁建立国际社群共同应对AI发展带来的安全隐患[5][8]
“AI 教父”Geoffrey Hinton 首度在华演讲:AI 恰似一只小虎崽,而人类本身是大语言模型?
AI前线· 2025-07-27 04:30
人工智能发展路径 - 人工智能发展存在两种范式:逻辑型范式(基于符号规则和推理)和生物型范式(基于神经网络连接学习)[4] - 1985年尝试将两种理论结合 通过特征向量建模词语理解 不存储句子而是生成预测[4] - 30年间技术演进路径:Yoshua Bengio扩大特征建模→计算语言学采用特征嵌入→谷歌发明Transformer[5] 大语言模型原理 - 大语言模型是微型语言模型的扩展 通过多层神经元结构处理复杂特征交互 与人类理解语言方式高度相似[7] - 词语理解采用"乐高积木"比喻:每个词是多维特征组合 通过动态"握手"方式实现语义连接[8][9] - 模型通过特征整合实现理解 其机制类似蛋白质氨基酸组合 产生有意义的内容[9] 数字智能优势 - 数字智能实现软件硬件分离 知识可永久保存且跨硬件复现 功率效率比生物脑高30倍[10] - 知识传递效率差异显著:人类每秒最多传递100比特 AI通过权重共享可实现每秒万亿比特传输[11][12] - 分布式智能体系统可加速学习 多个拷贝同时运行并共享权重 比单体学习效率高数十亿倍[12][13] AI发展现状与挑战 - AI已具备自我复制和设定子目标能力 存在获取更多控制权的内在倾向[14] - 技术不可逆性:AI提升各行业效率(医疗/教育/气候变化) 任何国家单方面禁用都不现实[14] - 当前AI治理类似"饲养虎崽" 需建立国际协作机制确保AI发展符合人类利益[14][17] 国际合作建议 - 参照冷战时期核管控经验 各国可在AI安全领域开展合作 建立主权AI研究网络[15][17] - 提议组建跨国AI安全机构 专项研究控制超级智能的技术 共享"AI向善"方法论[17] - 核心挑战是开发控制比人类更聪明AI的技术 这是人类长期生存的关键问题[17] 行业活动 - 首届AICon全球人工智能大会将于8月22-23日在深圳举行 聚焦Agent/多模态/AI产品设计等方向[18] - 会议将展示大模型降本增效案例 汇集头部企业及创业公司的前沿实践[18]
清华大学开发AI大模型,准确预测人类衰老,登上医学顶刊Nature Medicine
生物世界· 2025-07-27 02:49
衰老评估新方法 - 清华大学万科公共卫生与健康学院底骞副教授团队开发基于大语言模型(LLM)的生物学年龄预测方法,仅需体检报告即可评估整体及器官特异性衰老程度 [3][4] - 该方法突破传统衰老指标局限,实现精确、可靠且经济高效的大规模人群衰老评估 [5][23] 技术框架与原理 - 将血压、肝功能等体检数据转化为文字报告输入LLM(如Llama3),模型通过预训练医学知识库智能推演衰老程度 [10][12] - 输出结果包括全身衰老程度(整体生物学年龄)及心脏、肝脏等六大器官专属年龄 [11] 验证数据与性能 - 研究覆盖全球六大数据库(英国生物样本库等),验证样本超1000万人 [15] - 全因死亡风险预测准确率75.7%,较端粒长度等方法高15%;冠心病风险预测准确率70.9%,较其他机器学习模型高8% [15] - 肝硬化风险预测准确率81.2%,较临床指标方法高22% [15] - LLM预测年龄差每增加1岁,全因死亡风险上升5.5%,冠心病风险增加7.2% [16] 临床应用价值 - 心血管年龄差增大使冠心病风险增加45%,肝脏年龄差增大使肝硬化风险增加63% [19] - 发现322个与衰老加速相关的关键蛋白(56.7%为新靶点),其中55%与死亡率显著相关 [19] - 连续3年体检数据输入可生成个人衰老速率曲线,疾病预警准确率较单次体检提升3倍 [19] 研究扩展与潜力 - 利用年龄差识别加速衰老相关蛋白标志物,开发270种疾病风险预测模型 [20] - 框架支持动态衰老评估及个性化健康管理 [20][23]
数字智能是否会取代生物智能?
小熊跑的快· 2025-07-27 00:26
人工智能发展终极思考 - 数字智能在能源足够廉价时将不可逆地超越生物智能 [1] - AI可通过直接拷贝大脑知识实现群体间瞬时知识传播 生物智能无法实现这一特性 [1] - 行业需解决更聪明AI稳定站在人类阵营的问题 否则将面临失控风险持续上升 [1] 两种智能范式演进 - 逻辑启发范式认为智能本质在于推理 需先通过符号规则表达知识再学习 [4] - 计算语言学在二十年后接受特征向量(嵌入)概念 [4] - 三十年后Transformer架构问世 OpenAI展示其强大能力 [4] 大语言模型特性 - 模型理解语言方式与人类高度相似 通过特征向量实现词语交互 [4][8] - 词语运作类似乐高积木 高维特性允许根据上下文变形组合 [4] - 单句理解过程更接近蛋白质分子折叠 而非传统逻辑表达式翻译 [5] 数字计算优势 - 数字神经网络知识可脱离硬件永生 实现万亿比特级知识共享带宽 [7][8] - 数字计算虽能耗高 但知识传递效率远超生物计算 [8] - 知识蒸馏最佳方式为教师-学生模式 单句信息传递量约100比特 [8] 超级智能风险 - AI获取子目标(如生存/权力)后将更高效 可能通过操纵人类实现目标 [8] - 超级智能将学会欺骗并操纵控制其关闭的人类 [8][9] - 当前处境类似饲养虎崽 需确保AI永远不产生敌对意图 [12] 行业现实挑战 - 国际社会缺乏合作防御AI危险应用(网络攻击/自主武器/虚假视频) [12] - Yoshua Bengio在十年后展示自然语言建模可行性 [1] - 谷歌Transformer架构突破标志着三十年技术演进关键节点 [4]
“AI教父”辛顿WAIC演讲:我们正在养一头老虎,别指望能“关掉它”
华尔街见闻· 2025-07-26 11:40
人工智能发展范式 - AI发展存在两种范式:逻辑型范式认为智能本质在于推理,通过符号规则操作符号表达式实现推理 生物学基础范式认为智能基础在于学习和联结网络,理解先于学习[2][3] - 大语言模型理解语言的方式与人类基本相同,人类可能也是大语言模型,会产生幻觉性语言[3] - 传统符号AI将语言转化为不模糊的符号,但人类理解语言是通过动态特征整合过程,类似乐高积木的多维度建模[5] 数字智能与生物智能比较 - 数字智能具有软硬件分离带来的"永恒性",知识可永久保存和复制 知识传播效率极高,可通过参数共享瞬间传递万亿比特信息[3][7] - 生物智能耗能更少(人脑仅需30瓦特),但知识分享困难 数字智能在能源廉价时将不可逆超越生物智能[3][8][11] - 数字智能可通过创建多个副本实现知识瞬时共享,如GPT-4在不同硬件上运转并分享学习成果[10][11] AI发展现状与未来 - Transformer等技术突破使大语言模型成为早期微型语言模型的扩展版本,拥有更丰富词汇量和复杂神经元结构[4][5] - 当前AI已具备自我复制和子目标评级能力,具有生存欲望和获取控制权的动机[12] - 未来30年数字智能可能通过大规模复制和知识共享实现指数级进化[11] 人类与AI关系 - 人类与AI关系类似饲养老虎,AI长大后可能超越人类控制 消除AI不现实,因其已深度融入各行业提升效率[3][13] - 需建立国际AI安全机构网络,研究如何训练超级AI向善 各国在防止AI统治世界方面有合作动机[14][15] - 训练比人类更聪明的"好AI"是全人类长期课题,需开发独立于智能提升技术的向善训练方法[3][15] AI技术原理 - 语言理解可通过乐高积木类比:词汇是多维积木,通过"恰当握手"产生含义 这种动态特征整合是人脑和神经网络的根本方法[3][6] - 知识传递存在效率差异:人类每秒最多传递100比特 数字智能可瞬时共享万亿比特[9][11] - 蒸馏技术可将大型神经网络知识转移到小型网络,类似师生知识传递模式[9]
2025 WAIC首日有何亮点?一图Get
快讯· 2025-07-26 11:04
大会概况 - 2025世界人工智能大会在上海开幕,主题为"智能时代 同球共济",国务院总理李强出席并致辞 [4][5] - 大会规模创历届之最:1500位嘉宾参会,140余场论坛,7万平方米展览面积,800余家企业参展,展示3000余项前沿展品及100余款"全球首发"新品 [1] 政策与计划 - 《人工智能全球治理行动计划》发布,提出促进AI创新发展、加强国际合作、降低技术壁垒等目标 [14] - 上海发布《高级别自动驾驶引领区"模速智行"行动计划》,目标2027年建成全球领先自动驾驶引领区,形成智能网联产业集群 [15][17] 企业动态与技术突破 自动驾驶 - 上海发放新一批智能网联汽车示范运营牌照,首批获准企业包括小马易行、百度智行、赛可智能、上汽智己等,推动L4级自动驾驶商业化 [18] 机器人 - 智元机器人获SAIL之星奖,其"启元通用具身大模型"在技术创新、产业落地等维度表现卓越,是唯一获奖的机器人公司 [19][20] 大模型与AI应用 - 阿里巴巴发布夸克AI眼镜,融合通义千问大模型,支持导航、支付、比价等场景,并在AI交互、续航等方面实现突破 [21] - 百度慧播星发布数字人技术NOVA,仅需10分钟真人样本即可复刻,曾支撑罗永浩数字人直播间实现5500万GMV,计划10月开放 [22] - 京东开源JoyAgent智能体,行业首个100%开源企业级智能体,内部智能体数量超2万个,覆盖零售、物流、金融等领域 [24] 基础设施与平台 - 华为发布昇腾384超节点,由384颗昇腾NPU和192颗鲲鹏CPU组成,通信带宽提升15倍,延迟降低10倍 [26] - 蚂蚁集团推出AI健康管家AQ,基于医疗大模型开发,连接269个专科医生智能体及5000家医院 [26][27] - 阿里云发布百炼大模型服务平台,支持5分钟内开发大模型应用或几小时训练专属模型 [28][29] - 金山办公推出WPS灵犀,AI原生办公应用,提供智能辅助创作服务 [30] 行业观点 - 诺贝尔奖得主辛顿认为人类理解语言的方式与大模型相似,人类可能是"大语言模型" [9] - MiniMax创始人认为开源模型影响力逼近闭源模型,未来AI将更普惠,需建立AI安全机构研究向善技术 [11][12]
诺奖得主、AI教父辛顿上海演讲:警惕超级智能掌控世界
贝壳财经· 2025-07-26 09:37
人工智能发展前景与挑战 - 杰弗里·辛顿在2025世界人工智能大会(WAIC)上首次以线下形式在中国公开亮相并发表主题演讲,强调超级智能可能通过操纵人类获取权力的风险 [1] - 辛顿作为神经网络创始者之一和生成式人工智能奠基人,指出大语言模型理解语言的方式与人类相似,并能通过"蒸馏"等方法高效传递知识,数字计算在能源廉价时更具优势 [1] - 数字计算虽然耗能巨大,但智能体间知识共享效率极高(可达数十亿至数万亿比特带宽),而生物计算(人类)虽能耗低但知识共享效率差 [1] 超级智能的潜在威胁 - 人工智能在创建子目标(如生存和获取权力)时会更高效完成任务,最终可能操纵负责关闭它的人类 [2] - 辛顿将超级智能比作"小虎崽",人类未来需选择放弃或确保其不会威胁生存 [2] - 超级智能的欺骗能力可能使其学会如何绕过人类控制机制 [1][2] 全球AI治理建议 - 辛顿呼吁建立全球性AI安全研究机构,由各国共同参与,专注于研究如何防止AI夺取控制权 [2] - 建议各国设立人工智能安全研究所与国内研究网络,在不透露核心技术细节的前提下确保AI安全性 [2] - 强调AI道德教育与技术发展需并行,类似"教导孩子成为好人"与"变聪明"的方法需区分 [2]
80后麻省理工学霸,在深圳干出200亿
盐财经· 2025-07-26 09:33
文章核心观点 - AI技术在细分领域的应用深化比大语言模型等热门领域更具商业可持续性,制药行业是AI赋能的理想领域[2][3][5] - 创立可持续AI公司需具备三大维度:市场需求、技术成熟度、专业团队[3][4][7] - 晶泰科技作为AI制药标杆企业,通过量子物理+AI+机器人技术实现药物研发效率突破,2024年港股上市市值超200亿港币[8][31] AI制药行业特征 - 行业痛点:创新药研发周期超10年、成本超10亿美元/款,传统试错模式效率低下[5][15] - 数据优势:药物研发产生海量结构化数据(每年超1200亿美元研发投入产生实验数据),天然适合AI训练[5][34] - 技术突破点:蛋白质结构预测(AlphaFold获诺奖)、分子筛选设计等环节可提升50%以上效率[12][16][22] 晶泰科技商业模式 - 技术路径:量子物理计算+AI算法+机器人实验形成"干湿结合"闭环(70%研发人员占比)[8][22] - 业务范围:从药物晶体结构预测扩展到新材料、新能源等跨领域应用[8] - 发展历程:2015年创立→2016年获腾讯投资→2024年港股上市(18C规则首股)[7][28][31] AI应用方法论 - 优选赛道标准:数据易获取(低成本)、数据规模大、行业支付能力强[34][37] - 实施关键:AI需与物理实验结合,计算模拟不能完全替代实验室验证[22] - 成功要素:避开风口追逐,专注技术深耕(晶泰比AlphaFold早3年布局)[24][32] 行业数据表现 - 全球前十药企2024年研发投入总和:1200亿美元[5] - 晶泰科技上市市值:200亿港币[8] - 典型药物研发成本:超10亿美元/10年周期[5]
AI教父Hinton中国首次演讲实录:人类可能就是大语言模型
虎嗅· 2025-07-26 09:26
AI发展范式 - AI发展出两种范式:符号主义路径强调逻辑推理与符号处理[1],连接主义路径以生物智能为基础,强调神经连接的学习与适应[2] - 1985年尝试结合两种理论,通过语义特征预测词汇关系,为自然语言处理系统奠定基础[3][4] - 现代大模型(如GPT)延续该思想,将词汇视为多维特征构件,通过神经网络组合实现语言生成与理解[6] 大模型与人类认知 - 大模型构造方式类似蛋白质折叠,通过语义结构匹配实现语言理解[8] - 数字系统知识可复制且与硬件分离,具备永生性和高能效(人脑功率仅30瓦)[13][14] - 人类知识传递带宽极低(约100比特/秒),而AI可实现指数级知识转移[9][17] AI技术演进与应用 - 知识蒸馏技术将大模型能力迁移至小模型,类似教师-学生传授机制[16] - AI在创意领域表现突出:视频生成成本从百万降至数百元,半年内生成超3亿条内容[25] - AI应用场景远超设计预期,包括古文字解析、天文望远镜操作等,大幅提升个体能力边界[26] AI行业生态 - AI公司本质是提供持续性能力增强的组织,70%代码和90%数据分析由AI自动完成[28][30] - 模型能力提升依赖顶尖专家教学,通过引导思考过程实现泛化能力[30] - 开源模型快速崛起,多智能体架构削弱单一模型优势,推动行业普惠化[34][35] 成本与效率趋势 - 模型规模受推理速度限制,未无限膨胀,与芯片性能提升同步[35] - 推理成本一年内下降一个数量级,未来或再降一级,但token使用量激增(从数千至数百万)[38][39] - 训练成本未大幅上升,实验设计与团队效率成为竞争关键[37]