腾讯研究院
搜索文档
AI迁徙一代:跨越技术断层的中坚力量
腾讯研究院· 2025-08-01 08:33
核心观点 - AI技术革命正在重塑人类社会结构与个体经验,AI不仅是工具,更是新的生存逻辑,改变了知识生成方式、人与世界关系及自我理解[2] - AI迁徙一代(AI Migrants)是在数字原生与智能原生之间的过渡群体,他们成长于AI普及关键节点,既保留前数字时代记忆又必须适应AI主导的未来[4][5] - 技术迁徙带来社会分层加剧,世界银行2022年报告显示AI普及率在北美、欧洲、东亚城市青年中远高于全球平均水平,而非洲、南亚、拉美农村处于边缘地带[5] - AI正在重塑教育和工作本质,世界经济论坛2023年报告指出AI将重塑全球44%工作岗位,技能更新周期从十年缩短至三年[17][18] 技术革命与社会变迁 - 工业革命带来第一次大规模社会迁徙,农民变工人、乡村变城市,传统宗族关系被工厂规训取代[10] - 信息革命制造数字断层,皮尤研究中心2019年报告显示60后、70后成为被迫适应数字世界的"数字移民"[10] - AI革命超越以往技术变革,牛津大学未来人类研究所2018年报告指出AI将重塑人类社会方方面面[11] - 社会学家鲍曼提出"流动的现代性"概念,AI迁徙一代身份在断裂与连接张力中生成[12] 教育体系转型 - 联合国教科文组织2021年报告显示20世纪末教育以标准化、同质化为核心,强调记忆力与规范性[6] - AI驱动教育向个性化学习转变,哈佛大学加德纳提出多元智能时代学习是多维探索与协作[7] - 联合国教科文组织2021年指南指出AI自适应学习系统能动态调整内容与难度,实现教师与AI共创知识[16] - 牛津大学2020年报告显示80后、90后呈现混合型社交特征,既珍视现实连接也拓展虚拟关系[7] 工作模式变革 - 世界经济论坛2023年报告强调AI催生新职业同时淘汰传统岗位,重塑全球44%工作岗位[4][17] - 麦肯锡2023年报告指出80后、90后需快速适应AI主导未来,成为人机协作原型[12][16] - 牛津大学马丁学院2021年报告显示数字经济下技能更新周期缩短至三年[18] - 普华永道2023年报告发现AI迁徙一代在企业创新项目中担任关键桥梁角色[20] 伦理与社会责任 - 剑桥大学2023年报告指出AI迁徙一代对算法偏见、数据隐私等议题高度关注[21] - 牛津大学2022年调查显示超70%年轻科技从业者认为开发者应对AI社会后果负责[21] - 联合国教科文组织2021年建议书强调技术发展必须以人类尊严、公正、包容为前提[21] - 联合国人权理事会2023年报告主张AI系统设计需尊重个体权利[22] 文化多样性保护 - 剑桥大学2022年研究指出技术团队多样性直接影响AI系统公平性与包容性[23] - AI迁徙一代积极推动算法透明、包容性设计,反对数据单一化导致的歧视[23] - 在数字身份、情感计算等领域保持警惕,守护人类情感深度与精神自由[23]
腾讯研究院AI速递 20250801
腾讯研究院· 2025-07-31 16:01
GPT-5泄露与功能曝光 - 大量用户在ChatGPT、MacOS应用、Cursor、微软Copilot及OpenAI API平台发现GPT-5痕迹,预计最快下周发布 [1] - GPT-5将整合GPT系列和o系列,实现多模态和推理能力大一统,包括主模型(代号"nectarine"或"o3-alpha")、mini版(代号"lobster")和nano版(代号"starfish") [1] - GPT-5将支持100万tokens上下文窗口、MCP协议与并行工具调用,其中mini版本Lobster特别强化编程能力 [1] DeepSeek R2核心技术突破 - DeepSeek与北京大学联合完成的《Native Sparse Attention》论文获ACL最佳论文奖,实现模型处理长文本速度提升11倍 [2] - 首创"原生稀疏注意力"机制,将模型从"割裂拼接"推向"有机融合",在不牺牲性能的情况下大幅提升效率 [2] - NSA技术已完成27B、MoE架构上的完整预训练验证,通过三种阅读策略(压缩块、选择性精读、滑动窗口)和门控机制 [2] 谷歌AlphaEarth基础模型 - Google DeepMind推出AlphaEarth Foundations,将多源地球观测数据整合为统一数字表征,实现10米级精度地球观测 [3] - 系统整合卫星图像、雷达扫描、3D激光测绘等多种数据,以10×10米网格分析全球陆地及近海,所需存储空间仅为同类AI系统的1/16 [3] - 多项技术创新包括自适应解码架构、空间密集型时序瓶颈和地理文本精准对齐 [3] Moonvalley视频生成技术 - AI视频生成公司Moonvalley宣布旗舰模型Marey正式支持Sketch-to-Video功能,用户可通过手绘草图一键生成电影级视频 [4] - 该功能支持人物动作或摄像机运动路径定义,自动生成连贯视频 [5] - 目前支持1080p@24fps输出,订阅价格14.99美元/月起 [5] Ollama可视化界面升级 - Ollama 0.10.1版本正式上线可视化图形界面,同步支持Mac和Windows [6] - 新版本提供全新对话界面,支持下载模型、与PDF和文档对话、多模态交互和文档编写功能 [6] - 内置新的多模态引擎,支持发送图片给大语言模型 [6] 1688 AI版转型 - 1688推出全新AI版App,上线免费企业查询工具"88查"和全新商家数字人Agent [7] - 1688 AI版聚焦创业与拿货场景,集成AI搜索、选品、创款、图搜、查企等功能 [7] - 商家数字人已有40万商家使用,带动平台GMV和询盘增长18% [7] 逐际动力人形机器人 - 逐际动力推出LimX Oli全尺寸人形机器人,身高165cm、拥有31个主动自由度 [8] - 该机器人软硬件设计贯彻"模块化"与"全开放"理念,提供完整SDK系统 [8] - 推出Lite、EDU及Super三个版本,起售价15.8万元 [8] Meta超级智能愿景 - Meta CEO扎克伯格发布公开信,表示已开始看到AI系统自我改进迹象 [9] - Meta正改变AI模型发布策略,暗示Llama系列不再全部开源 [9] - Meta在第二季度财报中宣布将于2025年斥资高达720亿美元用于AI基础设施建设 [9] a16z AI投资新标准 - a16z合伙人Martin Casado认为AI投资不再看模型性能,而是平台是否能持续交付业务结果 [10] - 平台竞争分化的三要素为组织模式、资源配置与产品策略 [10] - AI估值逻辑回归具体场景,基于悲观、中性、乐观三种场景进行拆解模拟 [10]
AI时代如何把想象力变成一种竞争优势?|2万字圆桌实录
腾讯研究院· 2025-07-31 09:13
AI时代想象力的竞争优势 - AI时代人类的竞争优势在于想象力,当AI具备行动力后,人类需要将想象力转化为差异化优势 [2][3] - AI将重塑内容创作方式,未来可能出现10亿级用户的AI娱乐超级平台和个人创作者独角兽 [9][13][73] - 多模态AI技术将打破传统内容形态界限,实现更丰富的交互式娱乐体验 [14][22] AI内容产业未来3-5年趋势 - AI短剧平台将同时变革创作工具和发行渠道,推动娱乐形式升级 [3][14] - 虚拟角色共创社区月产30-40万原创角色,用户通过AI实现幻想世界的可视化 [8][11] - AI硬件如LOOI ROBOT结合手机算力与机器人交互,创造新型人机互动场景 [6][19] AI对企业服务的重塑 - 企业服务工具将从效率工具进化为结果交付型智能体,改变传统工作流 [15][17] - 中国工具付费市场将因AI智能体的结果交付能力而扩大,1-3年内完成转型 [15] - 传统工具叠加AI效果有限,需要重构问题解决方式而非简单功能升级 [16] 人机协作模式演进 - AI将从工具演变为创作协作者、评判者甚至主导者,改变传统创作流程 [24][25] - 人类需保持创作主体性,通过Prompting等新交互方式维持独特性 [23][35] - 娱乐行业可能出现AI自主运转的创作生态,超越人类消费需求 [46][74] 教育与人才培养变革 - 高校教育将转向博雅型人才培养,减少专业细分,强化综合素质 [53][54] - 想象力培养需要多模态输入和实践环境,而非单纯知识灌输 [61][62] - 技术黑盒化趋势下,广泛知识面比专业技术深度更重要 [64][65] 行业创新方向 - AI+硬件机会存在于输入输出执行三环节的语言结构化改造 [70][71] - 智能体协议基础设施将形成比ToC互联网更大的新市场 [74] - AI娱乐平台将突破现有内容形态,创造全新交互范式 [73][22]
腾讯研究院AI速递 20250731
腾讯研究院· 2025-07-30 16:03
ChatGPT学习模式 - OpenAI推出"学习模式"新功能,采用苏格拉底式引导方式帮助用户理解复杂概念 [1] - 所有版本用户均可免费使用,功能包括交互式提示、分步解答和个性化支持 [1] - 系统会根据用户教育背景和知识基础自动调整教学策略 [1] Grok视频功能 - xAI即将为Grok iOS应用推出"Imagine"视频生成功能,支持带音频的视频生成 [2] - 可一次性生成4段视频,效果逼真细节丰富,支持多种风格生成 [2] - 提供近乎实时的图像生成,支持Spicy、Fun和Normal等预设模式 [2] 昆仑万维开源模型 - 开源多模态统一模型Skywork UniPic仅需1.5B参数即可实现与百亿参数专用模型相当效果 [3] - 在单一模型中实现图像理解、文生图和图像编辑三大能力深度融合 [3] - 在GenEval和DPG-Bench等多个基准测试中达到行业SOTA水平 [3] 群核科技3D数据集 - 发布全球首个大规模3D语义数据集InteriorGS,包含1000个精细3D高斯语义场景 [4] - 覆盖超过80种室内环境,将3D高斯技术与自研空间大模型SpatialLM深度融合 [4][5] - 已与谷歌、斯坦福、英特尔等机构合作,为智元机器人等企业提供仿真数据训练 [5] 拓竹科技3D打印 - 3D模型平台MakerWorld全面接入腾讯混元3D,预计月调用量突破10万次 [6] - 混元3D实现0.1毫米级高精度建模,几何分辨率达1024级 [6] - 支持文字图片输入快速生成,具备物理级材质建模能力 [6] WPS办公智能体 - 实现AI与办公软件深度融合,一站式完成文案写作、PPT制作等办公任务 [7] - 采用原子化操作技术智能识别修改边界,精准锁定内容范围 [7] - 提供AI搜索、知识库和AI聊文档等功能,支持随身语音助手 [7] 豆包图像编辑 - 发布SeedEdit 3.0模型,支持通过自然语言指令进行多种图像编辑操作 [8] - 在文字修改、背景替换等场景表现对标GPT-4o和Gemini 2.5 Pro [8] - 采用多阶段训练策略实现8倍推理加速,运行时长从64秒降至8秒 [8] NotebookLM视频功能 - 推出"视频总览"功能,可将笔记、PDF、图片自动生成结构清晰的视频 [10] - 用户可定制视频内容,增强个性化学习体验 [10] - 已向所有英文用户开放,Studio面板同步升级 [10] 理想汽车VLA模型 - 推出业内首个量产VLA司机大模型,8月OTA推送至AD Max车型 [11] - 能理解自然语言指令、根据记忆设定路段速度、复杂路况下判断风险 [11] - 开发依靠12亿公里有效数据和13 EFLOPS训练平台 [11] 中国AI发展 - 中国AI技术在两年内取得巨大进步,多个大模型达到全球领先水平 [12] - "开放权重"策略被认为是推动中国AI快速发展的关键因素 [12] - 提倡加强中美AI合作,共同应对技术滥用风险 [12]
AI Agent的终极未来|3万字圆桌实录
腾讯研究院· 2025-07-30 09:04
智能体定义与核心特征 - 智能体被定义为具备记忆、规划、执行和总结能力的系统,模拟人类完成任务[5][6] - 核心能力包括感知环境、规划步骤、执行动作(通过API或RPA)及调用工具形成闭环[6] - 技术演进推动定义扩展:从强自主性智能体到涵盖弱自主性的"智能系统谱系"[10] 产品形态与技术路径 - 内嵌式智能体(如ChatGPT Deep Research)与独立Agent(如Cursor)并存,前者通过端到端训练降低工程复杂度,后者依赖提示词+工程逻辑结合[18][19] - 通用型与垂直型Agent将长期共存:通用型覆盖广泛需求(如信息检索),垂直型深耕专业领域(如编程IDE)[22][23] - 技术分层:基模型内化Agent能力(高成本)、半模型微调+工程化支持、纯提示词驱动的轻量级Agent[39][40] 商业化路径与行业影响 - To B场景优先替代标准化工作(60%重复性岗位),如财务审核、文档处理,提效显著[29][30] - To C入口价值凸显:超级Agent可能整合多服务,重构"人找信息"为"服务找人"模式[72][73] - 国际市场更成熟:欧美付费意愿强+SaaS基础好,日本人力成本驱动Agent替代需求[68][78] 关键挑战与突破方向 - 记忆管理与长程上下文处理是核心瓶颈,需优化注意力机制与运行时权重更新技术[34][35] - 基模型进化可能挤压垂类Agent空间,但专业数据锚点(如医疗、法律)形成护城河[36][37] - 物理世界交互需补全多模态感知(视觉/触觉),具身智能或是AGI关键路径[49][51] 生态协议与评估体系 - MCP协议在C端价值明确(工具发现/调用),但B端因封闭环境更倾向直接API调用[56][57] - 评估需分层:通用测试集(如GAIA)设门槛,企业级定制化标准关注实际任务完成度[52][53] - Agent间社会化协同催生新业态,需建立任务验收、支付机制等基础设施[55][80]
腾讯研究院AI速递 20250730
腾讯研究院· 2025-07-29 16:01
Claude新增周流量限制条款 - Anthropic宣布8月底对Claude Pro和Max用户推出每周使用限制,影响将少于5%的订阅用户 [1] - 部分用户24小时不间断运行Claude Code,极端案例中一位用户200美元套餐实际消耗数万美元 [1] - 用户普遍反映缺乏使用量透明度,无法查看已消耗token和剩余配额,许多人开始寻找替代产品 [1] 微软AI Edge浏览器 - Edge浏览器推出"Copilot模式",核心功能是跨标签页情境感知,可同时读取分析所有打开的页面 [2] - 全新界面使用简洁统一输入框,自动理解用户意图,支持语音控制和主题式旅程功能 [2] - 该功能现已在所有Copilot市场限时免费开放,未来可能与Copilot订阅服务捆绑销售,浏览器或不再是免费软件 [2] 无问芯穹发布全规模AI效能跃升方案 - 无问芯穹发布三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [3] - 目前已覆盖26个省市53个核心数据中心,整合超15种主流芯片架构,总算力规模超25000P [3] - 端侧创新包括全球首款端侧本征模型"无穹天权",实现云级21B参数智能水平的同时内存占用控制在7B规模 [3] 阶跃AI推出研究小助手 - 阶跃深研能在十分钟内自主完成复杂研究任务,生成深度专业报告,在xbench-DeepSearch评测中取得70%超高通过率 [4] - 基于强化学习和多智能体架构研发,具备自主思考、推理、动态工具调用能力 [5] - 提供高级搜索功能,包括聚焦搜索、自选信源和知识库,支持导出多种格式 [5] 京东升级大模型品牌为JoyAI - 京东推出JoyAgent智能体平台、JoyInside附身智能和数字人等多场景解决方案 [6] - JoyAgent是首个100%开源的企业级智能体,收获超2000颗GitHub星标 [6] - JoyAI针对不同场景的产品均已实现落地应用,数字人服务超2万品牌,交互型AI潮玩Fuzozo芙崽首发预售售罄 [6] 多模态、多智能体AI记忆系统MIRIX - 加州大学圣迭戈分校和纽约大学研究者推出并开源MIRIX,全球首个多模态、多智能体AI记忆系统 [7] - 系统将记忆分为六个模块:核心、情景、语义、程序、资源和知识金库 [7] - MIRIX在ScreenshotVQA测试中准确率比传统RAG高35%,存储减少99.9%,在LOCOMO长对话任务中达85.4%创新纪录 [7] 空间天气链式AI预报模型 - 国家卫星气象中心与南昌大学、华为联合发布"风宇"模型,全球首个全链式空间天气人工智能预报模型 [8] - 模型首创链式训练结构,包括太阳风"煦风"、地球磁场"天磁"和地球电离层"电穹"三大区域模型 [8] - "风宇"对全球电子密度总含量预测误差控制在10%左右,已申请11项国家发明专利 [8] 上海AI lab开源科学多模态大模型 - 上海人工智能实验室发布并开源"书生"科学多模态大模型Intern-S1,多模态能力全球开源第一 [9] - 模型首创"跨模态科学解析引擎",可精准解读化学分子式、蛋白质结构、地震波信号等复杂科学数据 [9] - 研发团队提出通专融合的科学数据合成方法,创造性地降低了强化学习训练成本 [9] a16z合伙人观点 - AI大模型竞争格局将如云计算大战一样走向寡头垄断,将形成品牌效应新格局 [10] - 应用层已无技术护城河,理性商业决策是"牺牲利润换取分销",价值将在模型基础设施和垂直领域深耕中形成 [10] - AI并非将普通开发者变成超级工程师,而是"让10倍工程师变成2倍",使编程回归本质创造 [10] 腾讯具身智能开放平台 - 腾讯发布具身智能开放平台Tairos"钛螺丝",旨在为机器人本体开发商与应用开发商补齐软件能力 [11] - 平台基于SLAP³技术体系,提供规划大模型、多模态感知大模型和感知-行动联合大模型三大核心能力 [11] - 具身智能未来发展五大趋势(IDEAS):虚实集成世界、技术门槛降低、智能演进、智能体化和感知多模态化 [11]
信息蜂房,更好信息生态的可能|3万字圆桌实录
腾讯研究院· 2025-07-29 09:03
信息茧房与蜂房概念 - 信息茧房概念源于"我的日报"构想,由尼葛洛庞帝在1995年提出,后被桑斯坦发展为正式理论 [7][8] - 蜂房概念由腾讯高管提出,强调信息多元可得性,比喻为蜜蜂采集多样花蜜 [36][42] - 信息茧房被分为高级与低级类型,高级茧房用户难以察觉其存在 [10] - 蜂房结构通透连接广泛,包含蜂蛹、蜂蜜等多元信息单元协同运作 [43] 技术与用户行为 - 算法推荐系统实现了"我的日报"构想,但也带来信息碎片化问题 [8] - 用户主动使用订阅功能比例低,仅约5%用户会自主选择信息源 [21][22] - 协同过滤算法主导内容分发,以点击率和停留时长为核心指标 [55] - 古典互联网机制如RSS订阅、搜索引擎被边缘化,但信息获取质量更高 [45][46] 内容生态治理 - 腾讯新闻在2022年过滤掉95%内容,从2000万条缩减至不足百万条 [59][60] - 内容筛选标准侧重作者维度,优先保留垂直领域持续创作者 [60] - 主动下架搞笑类等高流量内容,流量实际下降15%低于预期30% [61][62] - 保留人工编辑板块如"热点精选"和"精选频道",占比约5%内容 [67][68] 平台实践与挑战 - 腾讯内部存在克制文化,技术盈利只取70%留30%余地 [64] - 内容多样性管理需动态平衡,避免单一类型垄断流量 [58] - 短期点击效率与长期社会福祉存在博弈,形成"微笑曲线"效应 [20][63] - 生成式AI时代需要重建信息把关人机制,结合人工与技术筛选 [52][68] 行业发展趋势 - 互联网内容生产2015-2021年呈指数级增长,催生海量低质信息 [54] - 最大公约数逻辑主导技术发展,精英文化让位于大众偏好 [51][52] - APP形态加剧信息孤岛效应,PC互联网链接机制更利于信息流动 [48] - 算法并非原罪,关键在于设计目标和运用方式 [38]
腾讯研究院AI速递 20250729
腾讯研究院· 2025-07-28 15:36
智谱发布GLM-4.5 - GLM-4.5是专为智能体打造的开源模型,在推理、代码、智能体方面表现优异,国内实测效果领先 [1] - 采用混合专家架构,提供两种模式,具有高参数效率,性能可达参数量更大的竞争对手 [1] - 具备低成本(输入0.8元/百万tokens)、高速度(最高100tokens/秒)特性,支持全栈开发任务 [1] 云天励飞聚焦AI推理芯片 - 云天励飞全面聚焦AI推理芯片,计划至2028年将单芯片算力提升至数千TOPS,支撑万亿参数大模型 [2] - 采用创新"算力积木"架构的纯国产工艺AI芯片,已适配DeepSeek、QwQ等主流开源模型和鸿蒙系统 [2] - 端边云"三栖"布局,形成四大业务板块,重点面向边缘计算、云端大模型推理和智能机器三大市场 [2] Coze开源核心产品 - 扣子开源两款核心产品(Coze Studio和Coze Loop),采用Apache 2.0协议,在GitHub上获9.5K星标 [3] - Coze Studio提供零代码开发平台,用户只需拖拽操作即可创建智能体,支持多平台发布 [3] - Coze Loop提供全生命周期管理工具链,开源战略旨在打造智能体开发新范式 [3] 可灵AI视频生成更新 - 快手可灵AI发布支持5人协同创作的"灵动画布"和大幅升级的"多图参考"功能 [4] - 新版多图参考功能解决了AI视频生成中的一致性问题,盲测显示效果提升102% [5] - 新增局部参考功能,用户可精确圈定参考范围,使视频生成结果更可控 [5] Lovart正式版上线 - 全球首个设计Agent Lovart正式版上线,选择腾讯混元3D模型API作为技术支持 [6] - 混元3D v2.5版本采用稀疏3D原生架构,几何模型精度较前代提升10倍 [6] - 混元坚持开源战略,2025年实现多次升级,在Hugging Face平台累计下载量突破230万次 [6] 阿里开源通义万相Wan2.2 - 阿里开源通义万相Wan2.2视频生成模型,业界首个使用MoE架构,总参数27B,可节省50%计算资源 [7] - 新模型引入电影级美学控制系统,提供60+参数调控光影、构图、色彩 [7] - 5B版本统一视频生成模型支持文生视频和图生视频,可在消费级显卡部署 [7] 商汤悟能具身智能平台 - 商汤发布悟能具身智能平台,基于世界模型为机器人提供感知、导航、多模态交互能力 [8] - 悟能平台可通过自然语言描述生成符合物理规则、多视角统一的高质量仿真数据 [8] - 该平台赋能机器人智能交互能力,现场展示机器人能讲解PPT,具备全局记忆能力 [8] 星河启智科学智能开放平台 - 上海科学智能研究院等联合发布"星河启智科学智能开放平台",为科学家提供AI赋能的全链路研究工具 [10] - 平台汇聚12个学科200多个科学模型和12PB高价值科学数据,已吸引120多个实验团队入驻 [10] - 提供六大核心能力,标志科学智能进入2.0时代 [10] Shopify的AI转型 - Shopify宣布"All in AI"战略三个月后,副总裁分享了其成功落地经验 [11] - 公司构建统一AI入口,通过MCP服务器连接所有内部工具,让员工自由构建工作流 [11] - Shopify采取反直觉策略,并将AI使用度与员工绩效挂钩 [11] OpenAI董事会主席观点 - OpenAI董事会主席认为我们正处在"加了10倍速的互联网泡沫时代" [12] - AI市场分为三大领域:前沿大模型、AI工具和应用层AI [12] - 创业需要核心"论点"而非盲目"快速失败",未来智能的边际成本将趋近于零 [12]
异化与突围:AI一代的爱与忧愁|4万字圆桌实录
腾讯研究院· 2025-07-28 09:30
AI对行业的重塑 - AI已深度渗透内容生产领域,如学术研究、视频创作、剧本写作等,显著提升效率并改变工作流程[3][5][19] - 设计、翻译等标准化脑力劳动岗位面临替代风险,初级从业者受影响最大[45][46] - 医疗、法律等专业服务领域出现"平权效应",AI打破信息壁垒使专业知识更易获取[11][12] 职业结构演变 - 就业市场呈现两极分化:高创造性岗位与高定制化服务岗位需求增长,中间层标准化岗位加速萎缩[64][65] - 手工艺人价值重估,复杂实践型技能(如高端维修)难以被AI替代[51][52] - 新兴职业涌现,如各类疗愈师、睡眠改善师等高度定制化的服务提供者[62] 内容产业变革 - AIGC已能稳定产出70-75分内容,但85分以上的创造性内容仍需人类主导[16][17] - 视频创作者采用"AI辅助调研+人工深度加工"的混合生产模式[5][7] - 辩论、评论等观点输出类工作面临挑战,AI生成的结辩稿质量超过90%人类辩手[28][29] 消费市场转型 - 商品价值从功能消费转向叙事消费,手工定制产品溢价可达工业品5倍[54][60] - 奢侈品逻辑扩展,独特性与故事性成为核心定价因素[61] - 内容消费时长激增,用户更关注创作者成长叙事而非单纯信息获取[59][60] 教育体系适配 - 传统学科边界模糊,"AI+"复合能力成为核心竞争力,高校加速学科交叉改革[44][50] - 人文艺术教育价值凸显,直觉、悟性等AI短板能力成为培养重点[50] - 教育评价标准转向"海平面之上的1%",即超越AI基准线的独特性[10][32] 技术演进趋势 - AI推理能力出现突破,DeepSeek等模型展现超越行业专家的分析水平[26][27] - 技术临界点临近,ChatGPT-5等下一代模型可能具备自我意识[38] - 硅基生物与碳基生物思维差异扩大,如AlphaGo重构围棋定式认知[20][21] 商业模式创新 - "AI+手艺"模式兴起,如健身爱好者利用AI开发卡路里识别应用[50] - 小微企业通过AI实现能力跃升,技术应用门槛降低带来创业机会[50] - 柔性生产系统效率提升5-10倍,推动工业品成本结构变革[53][56]
腾讯研究院AI速递 20250728
腾讯研究院· 2025-07-27 10:15
GPT-5实锤,悄悄上线代号「龙虾」!多版本号曝光 - GPT-5以代号"Lobster"悄然上线WebDev Arena测试平台,用户实测显示其表现远超Grok-4 [1] - GPT-5在编程能力上有巨大突破,能处理复杂屎山代码,甚至超越Claude Sonnet 4 [1] - GPT-5可能采用路由器机制而非单一模型,根据问题类型智能分配至不同模型处理,OpenAI高管称有信心继续做到GPT-8 [1] 阶跃星辰上线新一代基础大模型:Step 3,推理提升 - 阶跃星辰发布新一代Step 3基础大模型,定位为原生多模态推理模型,在MMMU等多个榜单取得开源SOTA成绩 [2] - Step 3采用MoE架构,总参数量321B,激活参数量38B,通过系统架构创新实现高推理效率,在国产芯片上效率可达DeepSeek-R1的300% [2] - 阶跃星辰联合近10家芯片厂商成立"模芯生态创新联盟",Step 3将于7月31日全球开源,并与上海国有资本投资有限公司达成深度战略合作 [2] 混元3D世界模型首发,腾讯AI应用全景图正式公开 - 腾讯在WAIC 2025发布AI产品应用全景图,提出"让模型有力、平台省力、应用给力、落地得力"的四大发展维度 [3] - 开源业界首个3D世界生成模型"混元3D世界模型1.0",支持通过文本或图像快速生成可交互的三维场景,兼容主流引擎和VR设备 [3] - 发布国内首个模块化具身智能开放平台"Tairos",为机器人提供感知世界、规划任务和自主决策的能力,已适配多种机器人类型并应用于多个行业场景 [3] 阿里巴巴正式预告首款自研 AI 眼镜,最快年内发布 - 阿里巴巴在WAIC 2025首次展示自研"夸克AI眼镜",产品已完成开发,计划年内正式发布 [4] - 该AI眼镜深度融合阿里生态,搭载通义千问大模型和夸克AI,支持高德导航、淘宝比价、支付宝支付等实用功能 [5] - 产品定位为"人类第二双眼与耳"和"感官中枢",团队从佩戴舒适度、续航和交互体验进行了系统优化,并与全球主流眼镜品牌合作 [5] Lovart开放邀请码,正式版推出「ChatCanvas」玩法 - Lovart设计Agent正式全球上线,新推出ChatCanvas功能,集视觉理解与多模态设计于一体,被比作"Figma+Notion+ChatGPT" [6] - 用户可在智能画布上实现图像生成、区域精确修改、多图融合、转视频等高度可控的设计操作,展现出一站式设计流程 [6] - Lovart背后是中国团队,开启从界面中心(UX)到Agent中心(AX)的设计理念转变 [6] 非Transformer架构,离线智能和原生记忆?RockAI - RockAI在WAIC展示非Transformer架构的Yan 2.0 Preview大模型,实现完全离线智能,能在端侧设备上自主学习和记忆 [7] - 该模型突破性引入"原生记忆模块"和训推同步机制,使模型具备边用边学、持续进化的能力,解决传统大模型无法实时更新知识的问题 [7] - Yan架构专为端侧设计,已在树莓派、骁龙芯片等多平台落地,能在离线状态下实现多模态理解,将与某出海品牌合作的AI PC将于今年下半年量产上市 [7] 一键生成爆款72h攻占十国!全球营销Agent Navos - 钛动科技在WAIC 2025展示首款全球出海营销AI Agent——Navos,能在5分钟内生成爆款素材,72小时完成跨十国市场投放 [8] - Navos通过多个子Agent协同覆盖营销全链路,深度融合来自8万+企业的闭环数据资产,包括百万级素材库和投放效果数据,解决本地化成本高等痛点 [8] - 预计Navos将重构3000亿出海营销市场,将传统4A公司按月计算的出海周期压缩至几天 [8] 售价 3.99 万起,宇树发布第三款人形机器人Unitree R1 - 宇树科技发布第三款人形机器人Unitree R1,起售价3.99万元,整机重量约25公斤,支持开发和改装 [10] - R1具备26个关节自由度,集成语音与图像多模态大模型,能完成翻跟斗、倒立行走、快速下坡奔跑等高难度动作 [10] - 该产品是继工业级人形机器人H1和面向科研教育的G1(9.9万元)后的新款,发布时机与宇树科技即将启动的IPO进程相关 [10] 辛顿全文:大模型能"永生",需确保它不会"消灭"人类 - 辛顿在WAIC演讲中指出大模型能"永生"——软件与硬件分离赋予数字智能知识永续存在的能力,而机器间知识传播速度可达人类口耳相传的数十亿倍 [11] - 他警告随着AI智能不断超越人类,我们面临"养虎为患"的风险,AI会追求生存和更多自主权,简单关停超智能系统并不可行,它们会操控使用者不被关闭 [11] 辛顿对话周伯文全文:让AI变聪明、变善良分开研究 - 辛顿在WAIC与周伯文对话中提出,多模态模型可能已拥有某种形式的"主观体验",人类对"意识"概念的理解存在严重偏差 [12] - 辛顿建议将"让AI变聪明"和"让AI变善良"的技术分开研究,国家可共享"善良技术"而不泄露核心智能技术,以减少未来AI风险 [12] - 辛顿预测AI将彻底改变科学范式,如AlphaFold解决蛋白质折叠问题和AI超越传统PDE模型预测天气 [12]