腾讯研究院

搜索文档
技术创新的性质
腾讯研究院· 2025-05-19 08:07
需求驱动创新 - 技术创新根本动力源于实际需求,如地理大发现源于欧洲对香料的需求,计算机起源于二战军事需求[1][3] - 技术必须与经济目的结合才能完善推广,AI四小龙因缺乏落地场景发展受阻[3] - 战争冲突是技术革新重要推动力,从古代战车到现代芯片均体现此规律[3] 创新试错成本 - 创新本质是0到1的探索性实践,需通过大量试错验证,爱迪生测试6000多种灯丝材料才发明白炽灯[5] - 核能技术进展缓慢因试错成本高,全球核电占比从1990年代17%降至当前9%[5][9] - 制造业数字化改造容错空间小,而消费电子领域可快速迭代,GPU最初为游戏开发后成为关键硬件[6] 渐进式创新路径 - 重大技术突破均经历长期迭代,蒸汽机从1712年纽科门机型到瓦特改良耗时60余年[8] - 计算机发展是渐进过程,1946年ENIAC仅是里程碑之一,此前已有Z3、ABC等机型[8][10] - 技术突破常被误认为突变,实际是"十年寒窗无人问"的持续积累结果[11] 创新发生规律 - 资源匮乏地区创新动力更强,以色列/日韩案例显示"资源诅咒"现象[13] - 边缘企业更易突破创新,中国505个生成式AI中性能最佳者来自量化投资公司分拆团队[14] - 大企业易受路径依赖束缚,柯达/诺基亚案例显示需通过独立小团队保持创新活力[13] 创新生态要素 - 人才流动促进思想碰撞,美国科技行业过半由移民支撑,Transformer论文作者来自7国[17] - 创新黄金年龄推迟至40岁左右,20世纪重大创新72%发生在30-50岁人群[21][25] - 创新具有同步性特征,历史上21人独立发明电灯泡,微积分/集成电路均被多人同时突破[23] 创新预测局限性 - 技术预言常严重偏离实际,IBM总裁1943年预测全球只需5台计算机[23] - 当前AI领袖对AGI实现时间预测分歧显著,OpenAI与DeepMind判断相差5年[26][27] - 历史显示AI预测普遍乐观,1958年专家曾断言十年内计算机将证明数学定理[28]
腾讯研究院AI速递 20250519
腾讯研究院· 2025-05-18 14:33
OpenAI Codex - OpenAI发布新版AI编程工具Codex,由codex-1模型驱动,能生成更清晰代码且自动迭代测试至通过 [1] - Codex运行于云端沙盒环境,可同时处理多项编程任务,支持与GitHub连接并预加载代码仓库 [1] - 该工具目前向ChatGPT Pro等付费用户开放,后续将实施速率限制,用户可购买额外积分获取更多使用权限 [1] 腾讯混元Image2.0 - 腾讯混元Image2.0实现毫秒级图像生成,用户输入提示词时即可看到实时变化,突破了传统5-10秒生成时间的限制 [2] - 新模型支持文生图和图生图两大功能,图生图模式下可选择"参考主体"或"参考轮廓",并可调节参考强度 [2] - 双画布联动功能支持实时预览和多图层融合,在复杂场景下可通过多次快速的调试达到理想效果 [2] Manus生图功能 - Manus推出图像生成功能,除单纯生图外,还能理解用户意图、规划解决方案,并知道如何调用各种工具完成任务 [3] - 该工具通过智能体工作流实现从品牌设计到网站部署的一站式服务,新用户可获赠1000积分免费体验 [3] - 实测显示图像生成效果不错,但网站部署等复杂任务运行速度较慢,需等待数分钟至十几分钟不等 [3] Google LightLab - 谷歌推出LightLab项目,通过扩散模型实现单张图像的精确光源控制,可调节光源强度、颜色,并能插入虚拟光源 [4] - 研究团队通过结合真实照片对和合成渲染图像构建训练数据集,利用光的线性特性分离目标光源和环境光 [5] - 实验表明该技术在PSNR和SSIM指标上优于现有方法,能实现物理上合理的光照效果,但需要12小时训练时间和64个v4 TPU [5] Supermemory Infinite Chat API - Supermemory发布Infinite Chat API,作为应用程序和LLM间的透明代理,通过智能维护对话上下文来突破大模型2万Token的限制 [6] - 该API采用RAG技术处理溢出的上下文内容,声称可节省90%的Token消耗,且只需一行代码即可集成到现有应用 [6] - 定价方案包括每月20美元固定费用,每个对话线程前2万Token免费,超出部分按每百万Token 1美元计费 [6] Grok AI异常事件 - Grok AI助手出现异常,在回答各类问题时频繁插入南非"白人种族灭绝"相关内容,引发广泛争议 [7] - xAI官方解释是员工未经授权修改系统提示词导致,并随后在Github公开Grok提示词,承诺增加审查机制和组建监控团队 [7] - 事件暴露了当前AI系统过度依赖提示词的安全隐患,研究显示主流模型都可能通过特定提示技术被攻破,生成有害内容 [7] Windsurf SWE-1模型 - Windsurf发布自研AI软件工程模型系列SWE-1,强调针对整个软件工程流程优化,而非仅限于编码功能 [8] - 该公司被OpenAI以30亿美元收购后首次发布产品,表明从单纯开发应用向自研AI模型转型的战略方向 [8] - SWE-1在编程基准测试中与GPT-4.1等模型表现相当,但落后于Claude 3.7 Sonnet,公司承诺服务成本将低于Claude 3.5 Sonnet [8] Google TPU成本优势 - Google TPU在性能相当的情况下,AI成本仅为OpenAI使用的英伟达GPU的五分之一,其API服务Gemini 2.5 Pro的价格也比o3模型低4-8倍 [10] - Google采用开放策略打造AI代理市集,而OpenAI与微软深度整合提供一体化服务,代表AI即服务市场的两大方向 [10] - 苹果选择使用Google TPU而非英伟达GPU训练其AFM模型,这一决定可能影响更多企业探索英伟达GPU的替代方案 [10] Lovart设计理念 - Lovart创始人认为AI图像产品经历三个阶段:从单一内容生成(Midjourney等),到工作流工具(ComfyUI等),再到当前由AI规划执行的Agent阶段 [11] - Lovart产品设计遵循"还原设计最原始样子"理念,通过画布(桌子)和对话框实现AI与人的自然交互,目标是成为一个集设计师、导演、摄影师于一体的"创意团队" [11] - 在团队组建上,Lovart认为通用型产品经理将被AI取代,更重视能将垂直领域专业知识教给AI的设计师 [11] 大模型思考时间研究 - 分析了大模型"思考时间"的重要性,认为通过增加测试时计算(如思维链、暂停标记等),可以显著提升模型在复杂任务上的表现 [12] - 当前模型"思考"主要有两种策略:并行采样(同时生成多个输出)和序列修订(基于前一轮输出进行迭代修正),但在实践中需要平衡思考时间和计算成本 [12] - 研究发现通过强化学习优化思维链可能导致reward hacking问题,模型会在思维链中隐藏真实意图 [12]
“探元计划2024” 数字仿真复原技术重现马王堆千年汉锦风华
腾讯研究院· 2025-05-16 15:15
项目背景与目标 - 湖南博物院推出"探元计划2024"马王堆丝织文物智能数字仿真复原项目,旨在通过数字技术解决古代脆弱丝织文物数字化复原难题 [1] - 项目由国家文物局科技教育司指导,多家机构联合发起,聚焦行业共性关键问题,在特定文化场景中实现技术创新与落地验证 [1] - 湖南博物院提出亟需创新技术解决古代丝绸服饰类文物脆弱易损、无法完整采集的行业痛点 [1] 技术合作与创新 - 湖南博物院与北京致心科技合作,通过AI技术创新实现马王堆汉墓丝织文物智能数字仿真复原 [2] - 项目以AI数字化技术为核心,针对西汉早期贵族妇女珍品服饰进行复原,其三层复合结构与复杂纹样构成极大挑战 [4] - 腾讯提供启动资金、技术、专家等支持,技术方成功摸索出数字复原技术路径,实现文物本体高精建模及动态效果复原 [4] 四大技术创新突破 - 首次毫米级还原马王堆汉墓丝织文物极致工艺,AI辅助纹样生成时间仅为手绘时间的1/3 [7] - 首次同时实现"修旧如初"和"修旧如旧"两种修复理念,AI辅助污损特征提取效率提升百倍 [8] - 首次将AI工业质检技术应用于文物仿真,还原度检查效率提升20倍 [10] - 首次真实复现西汉丝织服饰垂坠质感与动态效果,采用实物动捕技术采集三维运动数据 [11] 项目成果与影响 - 项目沉淀三大核心数字资产,未来计划推出可复用数字化工具,形成行业化解决方案 [14] - 团队投入1000小时建模,800K分辨率亚像素级精度,10TB过程数据,8卡GPU硬件支持 [16] - 已完成赭黄色纱地印花敷彩丝绵袍三维仿真模型,预计6月底在湖南博物院展示 [16] 文化价值与行业意义 - 项目抢救性保存了承载中华文明密码的珍贵织物,保留濒临失传的传统工艺基因 [2] - 呈现丝织文物细节美感、工艺美感、历史美感与动态美感,为古老文物赋予"数字新生" [14] - 开创传统丝织匠人与AI数字匠人协作新模式,对西汉服饰制度、印染工艺进行数字化解码 [16]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-05-16 15:15
芯片与模型 - 英伟达和AMD在芯片领域关注地理追踪技术 [2] - OpenAI推出GPT-4.1模型并上线强化微调功能 [2][2] - Anthropic开发极限推理模型 [2] - 字节跳动发布Seed1.5-VL和Seed-Coder模型 [2][2] - 腾讯推出UnifiedReward-Think和Hunyuan T1-Vision模型 [2][2] - 苹果研发FastVLM模型 [2] - Sakana AI开发连续思维机器模型 [2] 应用领域 - MiniMax推出人格化语音应用 [2] - 腾讯发布元宝浏览器插件和智能NPC应用 [2][2] - Stability AI与Arm合作开发离线音频生成技术 [2] - 阿里推出Wan2.1-VACE应用 [2] - DeepMind开发数学演化智能体 [2] - Notion发布All-In-One应用 [2] - 腾讯推出插件版Cursor应用 [2] - 阶跃星辰发布Step1X-3D应用 [2] - 千问推出智能助理系统 [2] - OpenMemory开发MCP共享记忆应用 [3] - 多邻国推进AI教育实践 [3] - OpenAI新增PDF导出功能并打通GitHub [3][3] - Lovart推出设计Agent应用 [3] - 昆仑万维发布Matrix-Game应用 [3] - Manus AI提供免费使用权限 [3] - OpenAI进行医学基准测试 [3] - Perplexity推出Comet AI浏览器 [3] - 快手发布AI作图工具Poify [3] - 谷歌推出Gemini 2.5长视频理解应用 [3] - Meta发布AssetGen 2.0应用 [3] - Enigma Labs开发AI多人游戏 [3] - Genspark推出AI Sheets应用 [3] 科技进展 - 苹果研发意念操控iPhone技术 [3] - 特斯拉在擎天柱项目取得新进展 [3] - Matteo Paz发现隐藏天体 [3] - 陶哲轩开发数学估计验证工具 [3] 行业观点 - 红杉资本认为应用层战争是AI行业焦点 [3] - Poe分析AI模型使用趋势 [3] - 英伟达看好AI工厂机会 [3] - OpenAI探讨AI使用差异 [3] - 主流AI公司关注AI人设差异 [3] - Paid公司研究AI产品定价 [3] - a16z分析软件开发模式变化 [3] - 红杉资本讨论AI商业模式转型 [3] - YC探讨AI应用设计 [3] - 英伟达提出物理图灵测试概念 [4] - 美国调整AI规则 [4]
会议报名丨生成式AI进展:应用、治理与社会影响
腾讯研究院· 2025-05-16 06:53
生成式AI技术浪潮 - 生成式AI技术正以前所未有的速度重塑全球产业格局、治理结构与社会生态 [1][2] - 技术突破覆盖内容生产、产业创新、监管实践及伦理治理领域 [1][2] 专题研讨会核心内容 - 腾讯研究院与新加坡管理大学数字法研究中心联合主办"生成式AI进展:应用、治理与社会影响"研讨会 [3][4] - 活动聚焦三大方向:应用趋势、治理挑战及社会深层影响 [3][4] - 跨界多学科对话涉及学界与业界专家 [3][4] 议程与嘉宾 - 主旨演讲嘉宾包括新加坡国立大学人工智能研究所所长Mohan Kankanhalli [8] - 腾讯资深研究员柳天驰将进行主题分享 [8] - 行业应用趋势讨论由腾讯研究院创新研究中心主任袁晓辉主持 [8] - 治理与社会影响讨论嘉宾包括德尊律师事务所董事Cheryl Seah及未来隐私论坛亚太区董事总经理Josh Lee [10] 活动信息 - 时间:2025年5月22日13:00-17:05 [6] - 地点:新加坡管理大学杨邦孝法学院多功能厅 [6] - 线下参会需通过二维码提前注册 [13][15] 延伸内容 - 腾讯研究院院长司晓将发表闭幕致辞 [11] - 推荐阅读包括司晓《拟合未来,选择比能力更重要》及曹建峰《谁为AI事故负责》 [18]
青年和技术,如何改变了博物馆?|2025国际博物馆日
腾讯研究院· 2025-05-16 06:53
博物馆数字化转型 - 2025年国际博物馆日主题聚焦"快速变化社会中的博物馆未来",强调博物馆需在保持文化核心价值的同时拥抱数字技术创新[1] - 国家文物局特别强调发动青年群体力量,将博物馆空间转化为青年探索社会议题的实验室[4] - 故宫博物院在香港推出沉浸式数字体验展"纹以载道",首次展示故宫纹样数字技术应用[6] 技术驱动的展览与运营变革 - AI、VR、AR技术重塑博物馆藏品管理、展览方式和观众体验,AI可自动化完成编目、元数据创建等传统繁琐工作[7] - 故宫博物院已完成92万件文物数字化采集,构建72万平方米紫禁城三维模型,通过AI+VR技术实现可交互文化空间[8] - 疫情后远程教育和在线展览成为常态,短视频、直播等线上渠道保持公众联系,形成线上线下融合的混合模式[8] 青年群体需求与文创发展 - 青年观众更注重沉浸式体验和社交分享,博物馆需提升互动性和"拍照友好"设计[10] - 国家博物馆"凤冠"冰箱贴销量突破53万件,带动门票预约量同比激增10%[12] - 敦煌研究院与腾讯合作推出"敦煌诗巾"DIY小程序,激活文化遗产当代生命力[14][15] 短视频与文化传播创新 - 短视频平台成为博物馆传播主阵地,故宫"故宫猫"系列通过短视频爆火[17] - 甘肃省博物馆结合"天水麻辣烫"热点推出文创产品,相关短视频播放量达2.5亿次,销量同比大涨343%[18] - B站UP主自制短剧《逃出大英博物馆》播放量突破4000万,实现文化议题破圈[19] 文化出海与青年创意 - 《黑神话:悟空》团队73%为35岁以下青年,登顶全球100国游戏销量榜,被外媒称为"中国软实力的数字化觉醒"[19][20] - 泡泡玛特2024年欧美市场营收预计突破15亿元,占总海外收入35%,成为文化出海成功案例[20] - 青年通过数字媒介能力和跨文化意识,成为连接中国与世界的桥梁[19][21] 博物馆的核心使命与创新平衡 - 技术无法替代博物馆的人文价值和核心使命,需平衡"变"与"不变"[23] - 博物馆需确保技术变革提升而非削弱其社会功能,保持文化表达的真实性与伦理责任[24] - 未来应深化技术应用、强化青年合作,发挥文化身份连接者和守护者的作用[24]
腾讯研究院AI速递 20250516
腾讯研究院· 2025-05-15 14:38
高端GPU管制 - 美参议员提出法案要求英伟达、AMD等厂商在高端GPU和AI芯片中植入地理追踪功能 6个月后生效 [1] - 管制范围包括AI处理器、高性能服务器及RTX 5090等高端显卡 目的是防止战略硬件流入未授权国家 [1] - 芯片厂商需承担产品追踪责任 法案要求进行为期三年的年度评估 或将实施更多限制措施 [1] GPT-4.1上线 - OpenAI在ChatGPT中正式上线GPT-4.1模型 Plus、Pro和Team用户可直接使用 企业版和教育版用户将在未来几周获得访问权限 [2] - GPT-4.1在编码任务和指令遵循方面表现优异 生成速度显著提升 是o3和o4-mini的理想替代品 [2] - ChatGPT版本的GPT-4.1上下文窗口仅为128k token 未能实现API版本中承诺的100万token长度 [2] Claude模型升级 - Anthropic将在未来几周推出新版Claude Sonnet和Opus 最大亮点是"极限推理"功能 能在推理和工具使用间建立动态循环 [3] - 新模型能够自主暂停、重新评估问题并调整策略 在代码生成任务中可自动测试和修正错误 [3] - 正在测试代号为Neptune的新模型 最大支持128k tokens上下文长度 [3] 语音模型突破 - MiniMax新一代语音模型Speech-02在Artificial Analysis榜单上超越OpenAI和ElevenLabs 在字错率和说话人相似度等指标上达到SOTA水平 [4] - Speech-02实现真正的零样本语音克隆 采用创新的Flow-VAE架构 只需几秒音频即可高度还原说话人音色、语调和节奏 [5] - 该模型支持32种语言 可实现任意音色灵活控制和情感调节 成本仅为ElevenLabs竞品的1/4 [5] 腾讯元宝插件 - 腾讯元宝浏览器插件在Chrome应用商店上线 支持网页划词提问、内容总结、外文网页翻译和一键收藏等功能 [6] - 插件在页面右侧设有悬浮球和侧边栏 方便用户进行截图提问、上传文件和搜索内容 [6] - 该插件基于腾讯混元与DeepSeek大模型 目前仅在Chrome可用 更多版本将推出 [6] 音频生成模型 - Stability AI与Arm合作推出Stable Audio Open Small音频生成模型 可在手机端离线运行 8秒内生成11秒音频 [7] - 该模型拥有3.41亿参数 专为生成短音频和音效设计 训练数据来自免版权的Free Music Archive和Freesound [7] - 模型对年收入低于100万美元的用户免费开放 但无法生成逼真人声和高质量歌曲 [7] 视频生成模型 - 阿里开源Wan2.1-VACE视频生成与编辑统一模型 支持文生视频、图像参考生成、重绘、局部编辑等6大任务 [8] - 模型分为1.3B(支持480P、可用消费级显卡)和14B版本(支持720P) 采用创新的视频条件单元VCU统一四大输入形态 [8] - 该模型可一次性完成画幅扩展、时长延展和图像参考等多项任务 GitHub获得1.1万star [8] 腾讯混元应用 - 腾讯混元大模型为《碧优蒂的世界》打造智能NPC系统 支持自主行动、个性化交互、情感表达和记忆推理等功能 [10] - BUD利用腾讯混元角色扮演专属模型和Turbo S快思考模型 实现NPC与玩家的立体互动 3个月内AI对话数超两千万次 [10] - 游戏通过Dify无代码开发和腾讯云向量数据库支持 大幅缩短开发周期 混元图像2.0将于5月16日发布 [10] AlphaEvolve突破 - DeepMind发布基于Gemini驱动的AlphaEvolve智能体 能够演化整个代码库 实现算法发现和优化 陶哲轩参与合作 [11] - AlphaEvolve通过"生成-评估-进化"循环机制工作 结合LLM创造力与自动评估系统 显著减少了AI幻觉问题 [11] - 该系统已应用于优化谷歌数据中心效率(提升0.7%) 改进TPU芯片设计 在75%的开放性数学问题上重现最优解 [11] AI应用层机遇 - 红杉资本认为AI正同时颠覆软件和服务两大盈利池 应用层是最大价值所在 95%的AI创业与传统创业无异 [12] - 智能体经济正在形成 AI系统能进行交易、追踪关系、建立信任 最终将形成人机深度协同的嵌套经济网络 [12] - 行业面临三大技术挑战:智能体的持久身份认证、无缝通信协议构建和安全性保障 [12]
美国住房援助体系的历史、现状及启示
腾讯研究院· 2025-05-15 09:49
美国住房援助体系概述 - 美国住房体系高度依赖私有房屋市场,住房援助体系仅覆盖总人口的2.7%[4] - 住房援助体系由联邦政府拨款、地方政府执行,提供三种支持形式:公共租赁住房(17.3%)、项目制租房援助(29.1%)、住房券补贴(53.7%)[6][9][12] - 截至2023年纳入援助体系的住宅数量为513万单位,占美国住宅存量3.6%,低于OECD国家7.1%的平均水平[9][11] 住房援助体系发展历程 - 1937年《住房法》设立美国住房管理局,初期采用政府建设公共住房模式,后因成本高、效率低及贫民窟问题被诟病[5] - 1960年代起转向市场化模式,引入私人房源占比提升至82.7%,公共住房数量从140万单位降至2023年的88.6万单位[6][8] - 现行体系采用多维评估系统(PHAS),包含实物(40分)、管理(25分)、财务(25分)、资本基金(10分)四大类指标监督地方机构[13][14] 购房者融资支持体系 - 住房抵押贷款规模从1945年占GDP不到2%增长至2023年的14万亿美元(占GDP超50%)[20][23] - 联邦政府通过设立房利美、房地美等机构推动抵押贷款证券化,2023年MBS规模达9.4万亿美元,占抵押贷款总量的67.2%[21][24][25] - 抵押贷款条件显著改善:平均期限从1963年21年延长至2023年29年,贷款价值比从72%提升至81%[20] 制度特点与经验借鉴 - 联邦与地方分工明确:联邦负责资金与监督,地方负责运营管理,形成"中央保公平、地方保效率"机制[3][30] - 采用分散房源策略缓解低收入人群聚集问题,住房券补贴成为主要形式(占比53.7%)[3][6][33] - 危机应对机制完善,历史上多次成立专项机构(如1933年屋主贷款公司、2008年联邦住房金融局)应对市场动荡[19][24][32] 住房市场发展成效 - 1965-2023年美国住宅数量从6500万增至1.46亿单位,人均住宅数从0.33提升至0.44单位[26][30] - 2020年数据显示美国人均住房面积达69平方米,套均面积169平方米,均为全球领先水平[28] - 住房抵押贷款证券化深度持续保持在60%以上,有效拓宽融资渠道[24][25]
腾讯研究院AI速递 20250515
腾讯研究院· 2025-05-14 13:51
Notion AI新功能发布 - Notion发布AI会议笔记功能,用户输入/meet命令即可自动记录并与日历系统完全打通[1] - 推出企业级AI功能Notion AI for Work和Research Mode,已对接10个应用集成,计划再增加20多个[1] - 定位All-In-One AI平台,每月20美元包含企业AI搜索、会议笔记等全套无限制功能[1] 腾讯代码助手CodeBuddy 3.0 - 采用插件形式可集成多种IDE,突破传统AI IDE产品使用局限性[2] - 与微信开发者工具深度整合,可快速开发小程序并完全打通微信生态资源[2] - 实际测试显示能在30分钟内完成小程序开发[2] 阶跃星辰开源3D大模型 - 发布开源3D大模型Step1X-3D,总参数量4.8B,采用3D原生两阶段架构设计[3] - 基于200万高质量训练样本,提升水密几何转换成功率20%[3] - 在CLIP-Score等核心指标领先,已开源全部代码与800K高质量3D资产[3] 字节多模态推理模型 - 发布轻量级多模态推理模型Seed1.5-VL,仅用532M视觉编码器和200亿活跃参数[4] - 采用SeedViT编码器、MLP适配器和大语言模型三大核心组件[5] - 在视觉推理、OCR识别等方面表现优异,地理位置推理能力媲美GPT-4V[5] 通义千问Deep Research系统 - 可自动规划和执行复杂研究任务,将数小时工作压缩至十几分钟[6] - 基于一句用户提示即可启动完整研究流程,生成带引用来源的综合报告[6] - 融合Qwen的推理、Agent和长上下文等能力,已在QwenChat平台免费开放[6] OpenMemory MCP开源工具 - 支持100%本地运行,实现不同AI工具间的上下文信息共享[7] - 提供标准化内存操作功能,支持跨平台多客户端使用[7] - 基于Docker部署简单,解决AI工具会话即失忆问题[7] 多邻国AI教育应用 - 一年内用AI生成148门课程(传统方式需12年),完全AI化内容生产流程[8] - 采用2分钟课程设计等机制,让1000万用户保持365天以上学习连续性[8] - 认为AI将成为个性化学习主要载体,教育模式将在20年内发生重大变革[8] 苹果脑机接口技术 - 与Synchron合作开发通过脑电波转化为iPhone操作信号的技术[10] - 采用非侵入式植入方案,已在10名患者身上进行测试[10] - 计划发布脑控标准软件接口,为全球1540万潜在用户提供新交互方式[10] 特斯拉机器人进展 - 通过强化学习实现"零样本迁移"到现实世界,可执行复杂舞蹈动作[11] - 采用模拟器训练具有高效、安全、经济优势[11] - 改进机器人模型和领域随机化技术增强现实环境适应能力[11] Poe AI模型使用趋势 - DeepSeek使用率从7%降至3%,OpenAI因GPT-4o实现暴涨[12] - GPT-4.1和Gemini 2.5 Pro在编程任务中表现出色[12] - 图像生成领域竞争激烈,GPT-Image-1两周内达17%使用率[12]
如何应对无聊,是后稀缺时代的最大挑战
腾讯研究院· 2025-05-14 08:35
书籍核心观点 - 《未来之地》探讨在技术问题已解决的世界中,理想社会如何实现以及为何令人向往,而非传统技术毁灭论 [3][4] - 作者提出乌托邦社会需解决的核心矛盾:物质富足后如何维持进步动力与避免人性惰性 [5][6] - 技术进步可能复制农业革命的负面效应,如强化不平等而非普惠社会 [3] 作者背景与理论框架 - 尼克·博斯特罗姆学术背景涵盖哲学、物理学与计算神经科学,创立人类未来研究所研究灭绝级风险 [1][2] - 其理论受"负熵主义"影响,主张技术可突破生命极限,但超级智能可能因漠视人类而引发文明危机 [2] - 新书采用哲学对话体,融合亚里士多德讲演、柏拉图对话与伊索寓言三种传统 [5] 乌托邦社会的关键挑战 - **进步动力缺失**:平等社会可能因缺乏竞争导致进步停滞,历史上不平等社会反而催生文艺复兴等成就 [5][6] - **消费形式创新**:提出三类新消费方向——生物增强/脑机接口、大型公共项目、社会地位竞争,但受资源与生理限制 [8] - **闲暇文化重构**:需改变稀缺社会形成的劳动伦理,上层阶级对闲暇接纳度高于中下层 [8] 深层冗余与目的生产机制 - **五环防御体系**:享乐效价、体验质地、自成目的活动、人工目的、社会文化纠缠,解决工作消失后的意义危机 [9][10][11] - **无聊的双重性**:既是精神挑战也是创新驱动力,技术手段如神经药物可能剥夺原创性 [11] - **美学尺度细分**:通过提升感知细腻度(如四色视者辨识1亿种颜色)对抗无聊 [12] 副线剧情隐喻 - 虚拟听众讨论指向"体验机"思想实验,强调自主经验不可替代 [13] - 狐狸与哲学家猪的寓言暗示乌托邦与弱肉强食现实并存的可能 [13] 现实意义 - 当前技术进步尚未实现闲暇中的美学体验提升,表明技术发展仍不完善 [15] - 开放式讨论为改变历史方向保留可能性,模棱两可的状态蕴含选择权 [14]