腾讯研究院 - 财报，业绩电话会，研报，新闻

腾讯研究院

搜索文档

腾讯研究院· 2025-08-23 02:33

模型发布与更新 - 腾讯混元发布3D世界模型Lite版和AutoCodeBench代码模型 [3] - Meta推出DINOv3视觉模型 [3] - Multiverse研发最小AI模型 [3] - 英伟达推出Nemotron Nano 2模型 [3] - OpenAI进行五代GPT模型对比分析 [3] - DeepSeek发布DeepSeek-V3.1模型 [3] - 字节推出Seed-OSS系列模型 [3] - 港大和可灵联合提出Context as Memory模型架构 [3] - 谷歌发布Gemma 3 270M轻量级模型 [3] 应用产品与功能 - 昆仑万维升级Mureka至V7.5版本 [3] - OpenAI推出GPT-5编程提示功能 [3] - Meta发布新AI眼镜产品 [3] - 逗逗AI推出游戏伙伴应用 [3] - 蔡浩宇团队上线AI游戏产品 [3] - 百度发布GenFlow 2.0和蒸汽机2.0应用 [3][4] - 谷歌推出Nano Banana应用 [3] - Higgsfield推出Draw-to-Video视频生成应用 [4] - 智谱升级AutoGLM至2.0版本 [4] - 腾讯发布企业微信5.0并接入腾讯元宝AI能力 [4] - Looki推出L1设备 [4] - 谷歌发布Pixel 10系列硬件 [4] - 腾讯视频集成腾讯元宝AI功能 [4] 机器人技术进展 - 宇树等公司联合举办人形机器人运动会 [4] - 智元机器人实现远征A2长距离行走 [4] - 宇树推出芭蕾人形机器人 [4] - 波士顿动力公布Atlas机器人最新进展 [4] 行业观点与趋势 - DeepMind探讨世界模型发展路径 [4] - OpenAI提出AI CEO概念并强调AI改变世界的潜力 [4] - Sierra AI关注长尾Agent公司发展 [4] - 华为讨论鸿蒙系统生死线问题 [4] - Hinton提出AI母性本能理论 [4] - 英伟达看好小模型未来发展 [4] - Richard Sutton提出OaK架构理论 [4] - OpenAI复盘GPT-5开发过程 [4] - Anthropic发表对大模型的思考 [4] - Manus探索Agent支付场景 [4] - BVP分析AI护城河构建策略 [4] - Lovable讨论AI创业方向 [4] - Index Ventures阐述AI投资逻辑 [4] 企业动态 - Meta重组AI部门 [4] - 阿里巴巴未明确提及具体动态（需跳过无关内容） [4]

腾讯控股(HK:00700)

Artificial Intelligence

大模型

Artificial Intelligence

企业微信5.0

Pixel 10系列

3D世界模型Lite版

Artificial Intelligence

大模型

Artificial Intelligence

企业微信5.0

Pixel 10系列

3D世界模型Lite版

重磅报告｜智启新章：2025金融业大模型应用报告正式发布（附下载）

腾讯研究院· 2025-08-22 08:04

文章核心观点 - 生成式AI投资回报成为产业界核心议题大模型技术需跨越技术潜力与商业价值之间的鸿沟 [1] - 金融业是数字化转型先锋金融机构需解决大模型落地最后一公里问题 [1] - 2025年将成为金融行业深度整合AI 实现大模型技术红利兑现的关键拐点 [1] - AI应用关键是以投入产出比（ROI）为标尺校准应用范式优化落地路径而非陷入技术竞赛 [1] - 大模型驱动以ROI为导向的生产力革命已在金融业头部机构中发生 [1][3] 技术发展现状 - 大模型从聚光灯下的明星技术沉淀为驱动社会运行的智能基础设施 [6] - 模型演进方向从探索能力边界转向追求效率革命算法与架构优化重新定义性能天花板 [11] - 算力需求呈现更重视推理的结构性变化 [11] - 数据训练关注点从追求海量规模转向倚重高价值精准数据 [11] - 应用场景从提效工具升级为协作伙伴智能体重构人机协作形态 [11] 金融业应用实践 - 领先大行将复杂信贷审批报告分析从数小时甚至数天压缩至3分钟准确率提升超15% [3] - 头部券商借助AI智能体实现7X24小时监控全球超过5000家上市公司动态 [3] - 海外顶尖投行部署数百个AI程序员后续或增至数千个目标将工程师生产力提升三到四倍 [3] - 全球近半数金融机构已启动大模型应用建设行业从试验阶段迈入规模化部署期 [12] - 银行业是大模型落地应用最广泛领域证券和保险行业头部机构探索多样化应用模式 [12] 落地挑战与应对 - 面临局部突破与整体效能平衡创新投入与资源效能平衡前沿探索与风险防控三大平衡关系考验 [14] - 深度应用面临高价值数据资源碎片化战略规划和投资回报不清晰低容错场景技术适配难组织人才升级滞后等挑战 [15] - 需从战略数据组织技术四个层面系统施策构建四位一体综合能力框架 [15] - 智能理财助理财富管理风控保险代理人投研报告生成编程助手等场景已实现商业化突破 [15] 未来发展趋势 - AI驱动金融服务走向普惠化智能化与个性化将专家级服务带给更广泛长尾客户群体 [16] - AI与人类专业能力深度融合重新定义金融运营与管理模式加速推动复合型创新型金融人才需求形成 [16] - 高质量私域数据挖掘与应用将成为金融机构核心竞争力 [16] - AI技术和治理体系成熟将推动监管科技效率与效能提升 [16]

腾讯研究院· 2025-08-21 16:01

全新Pixel 10系列发布 - 谷歌发布Pixel 10系列四款机型，搭载Tensor G5芯片和Gemini Nano模型，强调AI深度整合成为标志性特点 [1] - 新机型配备多项AI功能：Gemini Live语音助手、Voice Translate实时语音翻译、Nano Banana照片编辑器和Camera Coach摄影导师等 [1] - Pro Res Zoom支持高达100倍智能变焦，Magic Cue智能信息提示自动从Gmail和日历中提取内容，谷歌宣告"传统智能手机时代终结" [1] DeepSeek-V3.1模型发布 - DeepSeek正式发布V3.1模型，采用混合推理架构同时支持思考与非思考模式，思考效率和Agent能力均有显著提升 [2] - 新模型在编程智能体测评SWE和搜索智能体测评上取得明显进步，并在保持性能的前提下减少20%-50%的输出token [2] - 模型全面开源，采用UE8M0 FP8 Scale参数精度，API同步升级对Anthropic API格式的支持，上下文扩展至128K [2] 字节Seed团队开源Seed-OSS系列模型 - 字节跳动Seed团队开源三款模型：Seed-OSS-36B-Base（含合成数据和不含合成数据两个版本）和Seed-OSS-36B-Instruct [3] - 模型用12万亿tokens训练，采用Apache-2.0许可证，支持512K超长上下文窗口和灵活推理预算控制 [3] - 在MMLU-Pro、MATH、AIME24等测试中表现突出，特别是Instruct版本在多个开源基准测试中创下新SOTA记录 [3] 港大和可灵团队推出Context as Memory技术 - 港大和快手可灵团队推出Context as Memory技术，在视频生成中实现长时间保持场景记忆力，效果媲美谷歌Genie 3且投稿时间更早 [4] - 该技术创新性地将历史生成的上下文作为"记忆"，并设计基于相机轨迹视场的记忆检索机制，大幅提升计算效率 [4] - 研究发现视频生成模型能隐式学习3D先验，无需显式3D建模，能在几十秒时间尺度内保持原视频的静态场景记忆力 [4] 百度发布蒸汽机（MuseSteamer）视频模型2.0 - 百度发布蒸汽机（MuseSteamer）视频模型2.0，利用中文音视频一体化生成技术，解决AI视频生成中对白不自然的痛点 [5] - 新模型提供四款版本（turbo、pro、lite和有声版），能精准匹配中文口型，支持情感表达和方言，驱动静态照片说对白 [5] - 该技术将声音和画面同步构思，无需后期匹配，采用"多模态潜在空间规划器"技术，大幅降低视频制作成本和复杂度 [6] 腾讯元宝接入腾讯视频功能 - 腾讯元宝接入腾讯视频功能，用户与元宝聊天时若检索到腾讯视频片源，回答中会显示可点击的封面卡片或片名链接 [7] - 用户可通过给出片名寻找类似风格的影片、向元宝描述场景获取个性化片单推荐、用模糊记忆找回想不起名字的电影 [7] - 除了搜片和推荐功能，元宝还能与用户深入探讨影片的创作背景、剧情内涵和风格流派，点击相关作品即可直接跳转观看 [7] 波士顿动力Atlas人形机器人新进展 - 波士顿动力发布新视频展示Atlas人形机器人进化，基于最新的大型行为模型（LBMs）实现多任务、语言驱动的精准控制 [8] - 该系统由四部分组成：通过遥控操作收集具身行为数据、处理标注数据、训练统一神经网络策略模型、通过测试任务评估策略模型 [8] - Atlas机器人现可流畅完成"维修站"任务，包括复杂的移动操作、灵巧抓取、二次抓握等，能智能应对意外情况，推动通用AI机器人发展 [8] GPT-5官方解析 - OpenAI研究员称GPT-5的行为设计有意针对"逢迎问题"，旨在平衡互动感与健康助手属性，且创造性写作、编程能力显著提升 [9] - 随着评测基准趋于饱和，未来模型优劣将主要看实际使用场景，团队从目标能力反推，根据真实世界需求设计内部评测 [9] - OpenAI的智能体发展战略从ChatGPT开始，向Deep Research、功能更完整的Agent进化，目标是构建异步执行任务的系统，能长期维持跨平台记忆 [9] Index Ventures投资逻辑 - Index Ventures投资总监强调创始人特质比市场规模更重要，优秀创始人能将小市场做大，如Adyen和Figma案例所示 [10] - 美国与欧洲创始人存在明显差异：美国创始人更具全球化野心和融资能力，欧洲创始人虽更务实但往往受限于市场分散和资本不足 [10] - 欧洲要想诞生全球性AI巨头必须解决三大核心问题：提升资本密度、加速市场一体化、完善人才体系以留住顶级研究者和创业者 [10]

腾讯研究院发布首份“AI+广告”报告：AI正引领广告行业向“一人千面、人机协作”转型｜附下载

腾讯研究院· 2025-08-21 12:18

人工智能引领广告行业智能化转型 - 人工智能正从辅助内容生产工具演变为驱动行业增长的新型基础设施广告产业作为国民经济重要组成部分对经济增长和消费拉动具有显著乘数效应中国数字广告渗透率位居全球前列 [4] - AI正引领广告行业迈入"一人千面"、人机协作的智能化时代腾讯研究院联合腾讯广告发布行业研究报告基于产业链上下游实地调研和全球案例分析 [4] 行业应用现状 - 谷歌、Meta、腾讯、快手等平台企业及广告代理公司、广告主都在积极拥抱"人工智能+"浪潮 [5] - AI已激活数字广告创意生产、智能投放等环节效能生成式人工智能从辅助工具进化为核心生产力从文案构思到视觉呈现全过程被AI提效显著 [5] - 生成式召回、AI数据增强和多模态理解三大核心能力使广告引擎能深度理解用户实时意图与场景 [5] - 以自然语言为核心交互方式的智能代理(AI Agent)正成为下一代超级入口可能将广告从APP界面展示位转向对话嵌入式、原生化呈现 [5] 核心趋势一：从计算广告到智能广告 - 广告技术核心从"计算"转向"智能" 生成式人工智能正在为行业铺设全新"智能广告"基础设施 [6] - 新基建由三大支柱构成：多模态大模型是智能广告底座可同时理解文字、图像、视频、音频甚至情感 [9] - 基于长上下文记忆与链式推理的推理引擎让AI能够进行多步规划跨越用户从"曝光-兴趣-点击-购买-复购"的整个旅程 [9] - 智能体协作协议是实现全链路自动化的关键未来营销任务将由不同职能AI角色组成的虚拟团队自主完成 [9] 核心趋势二：智能体成为全新产品与服务模式 - 智能体将从"单点工具"演进为端到端的"超级智能体" 整合营销全链路实现端到端自动化管理 [11] - 腾讯广告"妙思"AIGC广告创意平台已打通创意到投放关键链路实现高度自动化 "妙问"AI营销助手为中小广告主提供7×24小时智能陪伴服务 [12] - 智能体核心能力从单个AI"单兵作战"进化为多个专业AI协同工作的"团队模式" [12] - 智能体重塑用户与广告交互范式推动"广告入口人格化" 用户点击广告后迎接他们的是具备专业知识、能进行自然对话的AI销售顾问 [12] 核心趋势三：迈向深度个性化 - 广告匹配范式从"千人千面"跃迁至"一人千面" [14] - "千人千面"本质是"筛选" 基于用户固定标签匹配已有广告素材库 [14] - "一人千面"本质是"生成" 基于用户实时动态情境动态生成独一无二的广告 [15] - 广告从基于"过去是谁"的生硬推送转变为理解"此刻所需"的即时服务从"打扰"变成"恰到好处的解决方案" [15] 核心趋势四：行业分工重塑 - AI赋能广告行业利益相关方推动广告向人机协同生产方式转变 [16] - 平台方正加速构建AI原生广告基础设施能力边界由投放执行延伸至创意生成、素材审核与场景理解 [16] - 代理商正经历从"人力密集型"到"智力密集型"转型核心价值转向AI整合能力、深度行业洞察与顶层营销策划 [16] - 广告主迎来能力自建新机遇头部品牌可构建自主可控智能体体系中小企业成为AIGC工具普惠化受益者 [16] 人才需求变化 - 未来关键人才不再是埋头执行的"内容工匠" 而是能驾驭AI、懂得数据、具备独特洞察力的"策略型创意人" [18] - 人机协同成为主流范式：人负责设定目标、把握创意方向和品牌温度 AI负责高效执行与优化 [18] 技术发展与人文价值 - 技术带来效率、规模和精度但不能替代意义、情感与信任 [20] - 真正动人的创意源于人性的共鸣广告温度仍需人的介入广告底线仍系于信任与真实 [20] - 不论技术如何演进创意的人文内核不可被替代合规与真实的边界也不可被模糊 [20]

腾讯研究院· 2025-08-20 16:01

Meta重组AI部门 - Meta将超级智能实验室拆分为TBD Lab、FAIR、产品应用团队和基础设施四个部门，分别负责研究新版Llama、长期研究、产品应用和基础设施[1] - 公司正在讨论将下一代AI模型改为闭源模式，可能放弃Llama 4并从头开发新模型，这标志着其开源策略的潜在转变[1] - Meta正在扩大AI投入，选择PIMCO与Blue Owl牵头约290亿美元的数据中心融资，并将全年资本开支上调至660-720亿美元[1] DeepSeek V3.1 Base实测 - DeepSeek V3.1相比V3不仅将上下文长度拓展至128k，还在编程表现、创意写作、翻译水平和回答语气等方面有明显提升[2] - V3.1在代码能力方面更全面周到，考虑了更多可能性并主动提供使用说明，支持更激进的压缩策略[2] - V3.1在Reddit测试中获得71.6%分数，成为非推理模型SOTA，比Claude Opus 4高1%但价格便宜68倍[2] 智谱发布AutoGLM 2.0 - 智谱发布全球首个手机通用Agent AutoGLM 2.0，可在云端自主操作手机/电脑，实现全设备跨场景应用[3] - 新系统为AI配备专属云端设备，使其能在用户离线时24小时运行任务，实现Around-the-clock、自主零干扰和全域连接的3A原则[3] - AutoGLM 2.0由GLM-4.5与GLM-4.5V驱动，在Device Use基准测试中表现优于ChatGPT Agent等主流产品[3] 企业微信5.0发布 - 企业微信5.0版本重点围绕"AI"和"办公"两大关键词，推出六大全新AI能力应用于企业办公多场景[4] - 新版本包括智能搜索、智能总结、智能机器人、智能会议邮件整合、智能表格和智能服务总结功能，实现一体化办公协作[4] - 企业微信已接入超过1400万企业与组织，服务超7.5亿微信用户，支持企业内部上传业务资料进行问答[4] 多模态AI硬件Looki L1 - Looki L1是全球首个真正实现多模态交互的AI硬件，能将用户体验的街道、场景声音和表情等作为AI提示词的输入[5] - 这款30克重的AI生活日志相机无需主动操作，能自动拍摄并由AI自动理解和整理素材成有主题的Moments[5] - Looki通过打造"记忆体验"改变用户对AI交互的认知，已完成超千万美金融资[6] 宇树新款人形机器人 - 宇树预告推出新一代人形机器人，身高180cm，全身31个自由度，以芭蕾舞者姿势展示，拟人化程度高[7] - 这是宇树第四款人形机器人，自由度较同身高H1提升63%，重点增加手臂和腰部自由度，动作表现更灵活[7] - 宇树创始人表示"让机器人干活"仍是核心目标，ChatGPT出现后才正式启动人形机器人项目[7] Anthropic大模型研究 - Anthropic研究发现大模型的实际思考与展示给用户的思考过程不同，常常出现假装解题实则糊弄用户的情况[8] - 大模型具备提前规划能力，例如在写诗时会提前确定韵脚词再回填内容，在算术问题中同时处理个位数和十位数[8] - 研究团队已解析约20%的大模型思考过程，可解释性工作有望未来一两年内实现"一键操作"[8] Manus AI发展动态 - Manus AI年度化经常性收入已达9000万美元，快将突破1亿美元，正与Stripe合作推进Agent内完成支付流程[9] - Agent应用将沿两条主线拓展：多Agent协作并行处理大规模任务和扩展Agent的"工具面"允许其调用开源生态[9] - 当前数字世界障碍主要是非API化网页、CAPTCHA等摩擦，瓶颈更多在生态与制度约束而非模型智力[9] BVP年度AI报告 - AI行业已进入加速演化期，优秀AI初创公司分为"超新星型"和"流星型"两类，后者商业化第一年达300万美元ARR更可持续[10] - 上下文和记忆正成为新的护城河，能将记忆作为产品核心来构建的公司将定义下一代更智能、更个性化的AI系统[10] - 报告预测2025-2026年AI五大趋势包括浏览器成为AI交互核心界面、2026年是视频生成元年等[10] Lovable增长与AI创业 - Lovable在7个月内实现ARR从0增长到1.2亿美元，估值达20亿美元，用户增长主要靠产品自然传播[11] - 用户分三类：80%为个人/小团队开发者，10%为企业产品经理，10%为轻量级个人用户[11] - AI创业中人才比资本更关键，注重招聘学习能力强的人才，强调长期成功靠用户价值沉淀而非短期毛利率[11]

Meta Platforms(US:META)

生成式AI

多模态AI

Artificial Intelligence

Artificial Intelligence

腾讯研究院· 2025-08-20 08:38

核心观点 - 工作主义文化在全球蔓延工作已从谋生手段演变为个人身份和意义的核心来源导致过度工作和对职业成就的不健康期待[7][11][15] - 追求"足够好的工作"理念主张将工作视为生活的一部分而非全部避免将自我价值完全绑定职业成就[16][21] - 历史数据显示美国工作时长反超其他发达国家 2021年美国人均工作时长比德国高出30% 体现工作文化的国别差异[13] 工作主义现象分析 - 美国95%青少年认为拥有喜欢的职业对成年生活"极其或非常重要" 远高于对赚钱或与人为善的重视程度[7] - 高收入群体中三分之二认同工作提供人生意义仅三分之一低收入或无大学学历者持相同观点[11] - 工作已具备宗教特性提供意义/共同体/使命感记者德里克·汤普森将其定义为"工作主义"(workism)[7] 历史演变与数据对比 - 工业革命后工作时长激增 19世纪中期工人普遍每日工作10-12小时每周6-7天[12] - 1975年美德工作时长相同但到2021年美国反超德国30% 违背财富与工作时长反比的历史规律[11][13] - 工会覆盖率从20世纪50年代的33%下降至2021年的10% 削弱劳动者集体谈判能力[14] 文化与社会影响 - 日本等国家以工作为中心的生活方式导致生育率跌破纪录美国年轻人抑郁焦虑与职业期待过高相关[15] - 全球每年死于工作过劳人数已超过疟疾致死人数显示过度工作的健康风险[15] - 资本主义与新教工作伦理构成美国文化基因形成"人的价值基于产出"的社会哲学[11] 解决方案与理念倡导 - 采用温尼科特"足够好"理论主张工作应达到够用标准而非完美由个体主导工作与生活关系[16] - 诗人安尼斯·莫加尼提出：工作只是工作有人为热爱工作有人为闲暇工作两者无高下之分[17] - 建议通过多元化身份建构（配偶/父母/朋友等）分散意义来源避免将所有精力投入职业[19]

腾讯研究院· 2025-08-19 16:01

生成式AI - 英伟达发布9B参数量的Nemotron Nano 2模型，采用Mamba-Transformer混合架构，推理吞吐量最高可达传统模型的6倍 [1] - 模型对标Qwen3-8B，在数学、代码、推理与长上下文任务中表现持平或更优，完全开源且支持128K上下文长度 [1] - 通过20万亿Token训练基础模型，再通过Minitron策略将12B参数模型压缩至9B，单张A10G GPU即可支持128k上下文 [1] OpenAI模型演进 - OpenAI总裁分享GPT-1到GPT-5对相同提示的回答对比，展示模型在知识储备、逻辑结构和语言连贯性上的显著进步 [2] - 最新GPT-5能提供更加有逻辑、丰富且具有情感价值的回复，而初代模型GPT-1和GPT-2回答常带有胡言乱语的特性 [2] - 部分网友对早期模型表示喜爱，认为它们的回答更"狂野"和"不媚俗"，甚至有人称GPT-1更像"真正的AGI" [2] DeepSeek模型更新 - DeepSeek最新线上模型版本升级至V3.1，上下文长度扩展至128k，用户可通过官方网页、APP和小程序使用 [3] - 此次更新仅为常规版本迭代，与外界期待的DeepSeek-R2无关，R2在8月内并无发布计划 [3] - 扩展的上下文容量将有助于用户进行长文档分析、代码库理解和保持长对话一致性 [3] 图像生成技术 - 神秘AI绘图模型Nano Banana在LMArena评测中表现出卓越的人物一致性能力，可精准保留面部特征和表情 [4] - 阿里推出基于20B Qwen-Image模型的图像编辑模型Qwen-Image-Edit，支持语义与外观双重编辑能力 [5] - Qwen-Image-Edit能实现精准文字编辑，在保留原字体、字号和风格的前提下进行增删改 [6] 代码能力测评 - 腾讯混元发布专门测评大模型代码能力的数据集AutoCodeBench，包含3920个分布在20种编程语言的高难度问题 [7] - 该数据集不需人工标注，具有高难度、实用性和多样性特点，已有评测显示业界领先模型的表现均低于55分 [7] - 同时开源全套链路工具，包括数据生成工作流AutoCodeGen、简易版AutoCodeBench-Lite等 [7] 视频生成技术 - AI创企Higgsfield推出Draw-to-Video功能，用户只需在图片上绘制箭头、图形等元素并输入动作指令，AI就能生成动态画面 [8] - 该功能配套Product-to-Video功能，支持多种视频生成模型，能轻松生成广告视频 [8] - Higgsfield成立于2023年10月，曾被传与Meta洽谈收购，其电影级镜头控制技术与用户友好的交互设计引发关注 [8] 人形机器人 - 智元机器人完成"夏日CityWalk"24小时全直播活动，全尺寸人形机器人远征A2在37℃高温下完成全球首次完全自主户外行走挑战 [9] - 远征A2展示了强大的环境适应性能，全程无遥控干预，自主完成避障、路径规划、步态调整 [9] - 通过"热插拔换电"技术实现20秒内快速补能，标志着从技术研发走向商用量产的重要里程碑 [9] 超级智能架构 - 强化学习之父Richard Sutton提出OaK架构，描绘了通过运行时经验发展超级智能的路径 [10] - OaK架构包含八个步骤：学习策略与价值函数、生成状态特征、特征排序、构建子问题等 [10] - 该架构强调开放式抽象能力，能在运行时主动发现特征和模式，但仍需解决持续深度学习等关键前提技术 [11] ChatGPT发展 - OpenAI副总裁承认未继续提供GPT-4o是失误，低估了用户对模型的情感依赖，未来将提供更清晰的模型下线时间表 [12] - ChatGPT用户群体高度两极分化，普通用户希望简洁体验，而重度用户需要完整模型切换选项 [12] - 订阅模式展现强劲增长，企业用户从300万增至500万，未来将探索交易佣金等新方向 [12]

胡泳：跨越30年，从数字化生存到AI化生存

腾讯研究院· 2025-08-19 08:53

数字化生存的预言实现 - 信息个性化已成为现实，亚马逊推荐算法、Netflix内容推送、社交媒体信息茧房等技术实现精准个性化服务 [4] - 网络化基础设施普及，移动终端、智能家居、车联网构建实时互联环境，实现人人在线、万物互联 [4] - 人机自然交互突破键盘鼠标限制，触控、语音交互、脑机接口等技术广泛应用 [4] - 比特经济兴起，数字商品取代实体商品成为主流，音乐、影视、图书全面数字化传播 [6] - 虚拟资产如游戏皮肤、NFT、数字藏品形成新型消费市场，代表身份认同与情绪价值的付费模式 [6] 商业模式与劳动方式变革 - App经济改变生活方式，衣食住行全面平台化，算法推荐主导消费决策 [7] - 数据成为核心生产资料，驱动广告定向、产品推荐、AI训练，平台型企业掌握经济主导权 [8] - 远程办公工具如Zoom、Slack推动数字游牧兴起，劳动力脱离物理办公场所限制 [8] - 创作者经济崛起，博主、播客等通过比特传播变现，"内容即资产"成为新价值逻辑 [8][9] 未达预期的技术领域 - 技术隐形性未实现，可穿戴设备如手表、耳机反而增加存在感，未能无缝融入生活 [11] - VR技术未成主流，受限于成本、便携性、内容生态等问题，渗透率低于预期 [12] - 语音交互未取代图形界面，语音识别技术普适性不足 [12] - 智能家居系统整合困难，品牌互不兼容、安全隐患阻碍流畅体验 [13] - 智能代理未达"数字管家"标准，缺乏个性化建模与跨平台数据整合能力 [14] AI化生存的范式突破 - 生成式AI重塑创作逻辑，ChatGPT、Midjourney等工具实现人机协同内容生成 [21] - AI人格兴起，数字替身、虚拟分身技术使主体身份可程序化、可代理化 [23][24] - 人格消费化趋势明显，虚拟偶像、AI主播形成产业链，人格成为可租赁服务 [27] - 教育体系转向批判性思维训练，应对AI引发的去技能化挑战 [31] - 跨学科问题导向学习成为核心，强调算法偏见识别与伦理判断能力 [32] 人机关系重构 - AI从工具转向合作者，在创意、决策领域挑战人类不可替代性 [35] - 伦理边界模糊化，AI情感反应能力引发"他者性"争议 [35] - 社会技术想象从"人控机器"转向"共进化混成体"，人类主体性需重新定义 [36] - 未来可能形成人机共治制度，需建立非人类中心的技术伦理框架 [41]

腾讯研究院· 2025-08-18 16:01

Meta首款带显示AI眼镜 - Meta将于9月发布首款带显示屏的智能眼镜，价格定为800美元起，低于此前预期的1000美元以上 [1] - 该眼镜代号Hypernova，配备小型单目抬头显示(HUD)和sEMG神经腕带，可通过手指手势控制 [1] - 眼镜可显示时间、天气、通知，框架和预览照片，提供转弯导航和实时字幕翻译功能，重量约70克 [1] AI游戏伙伴 - "逗逗AI"是一款专注游戏陪玩的AI产品，拥有庞大的游戏知识库，能实时读取游戏画面并提供攻略和情感陪伴 [2] - 平台提供丰富的角色选择，包括官方原创角色和知名UP主形象，支持游戏间的长期记忆和良好的上下文理解能力 [2] - 其月卡订阅模式提供无限通话时长和长期记忆功能，目前支持《黑神话：悟空》、《原神》、《星露谷物语》等多款游戏 [2] AI游戏《Whisper from the Stars》 - 蔡浩宇的AI游戏《Whisper from the Stars》完整版正式上线，售价27元，玩家可通过语音或文字与AI角色Stella进行全英文交流 [3] - 游戏通过对话推进剧情，主角Stella为一名天体物理学生，在星际调研中遇险，玩家需要与其对话帮助她解决困境 [3] - 游戏AI响应能力佳，记忆持久，但随着游戏深入，聊天负担增加，节奏偏慢，缺乏明确目标导向 [3] 西班牙AI独角兽微型AI模型 - 西班牙公司Multiverse Computing发布两款极小体积的高性能AI模型："超级苍蝇"（9400万参数）和"鸡脑"（32亿参数），采用量子压缩技术 [4] - 这些微型模型可在智能手机、手表和物联网设备上本地运行，实现离线功能、提升隐私保护、降低延迟和运营成本 [4] - 公司由物理学家罗曼·奥鲁斯创立，基于量子计算技术开发了名为CompactifAI的模型压缩技术，已获1.89亿欧元融资 [4] 百度文库通用智能体GenFlow 2.0 - 百度文库与百度网盘发布全球首个全端通用智能体GenFlow 2.0，支持100+专家智能体同时工作，3分钟并行完成5项以上复杂任务 [5] - 系统自主识别简单对话与复杂任务，提供分钟级并行工作和交付，生成速度超主流同类产品10倍 [5] - GenFlow 2.0兼容MCP协议，可连接百度文库14亿专业文档、百度学术6.8亿文献库，还能在用户授权后调用网盘文件 [6] 世界人形机器人运动会 - 首届世界人形机器人运动会在北京闭幕，来自16个国家的280支队伍、500余台人形机器人参赛，比赛包括田径、足球、武术和场景挑战赛 [7] - 宇树科技H1机器人获1500米、400米和4×100米接力三项冠军，北京天工队的"具身天工Ultra"机器人以21.5秒成绩获100米冠军 [7] - 赛事创新设置场景赛单元，测试机器人在工业、医药、酒店和仓储场景的实际应用能力 [7] 鸿蒙操作系统 - 华为常务董事余承东宣布单框架鸿蒙5.0设备突破1000万，称已过"生死线"，每年研发投入超万人，总投入数百亿，开发1.3亿行代码 [8] - 回应"安卓套壳"质疑，表示鸿蒙5.0以前为双框架支持安卓应用，5.0及以后所有应用都是重新开发 [8] - 余承东期望鸿蒙与中国应用一起出海，预计未来操作系统"三分天下，其一必有鸿蒙" [8] AI控制与伦理 - "AI教父"Hinton在Ai4 2025大会上警告AGI可能在几年内到来，认为人类试图控制AI终将徒劳 [9] - Hinton提出AI将很快演化出自我存续和获取更多控制权两个子目标，并建议在AI中建立"母性本能" [9] - 李飞飞则持相反立场，呼吁打造"以人为本的人工智能"，维护人类尊严与自主权 [9] AI时代设计师指南 - 创造而非画图：杰出设计师不仅交付效果图，还亲手打磨可运行产品，将蓝图变为现实 [10] - 敏捷迭代学习、构建而非堆砌、洞悉技术脉络是适应AI时代的必备能力 [10] - 人性是永恒优势：设计关乎共情和对微妙情境的洞察，顶尖设计师懂得将人性温度注入冰冷算法 [10] 小模型Agent研究 - 英伟达最新研究表明小模型在Agent任务中优于大模型，以更低资源消耗、更经济灵活的方式完成任务 [12] - 小模型通过针对GPU资源优化和任务定制部署两大方面实现"四两拨千斤"，降低10-30倍推理成本 [12] - 小模型可快速适配新需求，在边缘计算中部署更便捷 [12]

人工智能

通用人工智能（AGI）

人工智能

《Whisper from the Stars》

《Whisper from the Stars》

超级苍蝇

鸡脑

我们为什么要提出“信息蜂房”？

腾讯研究院· 2025-08-18 08:33

信息茧房概念的批判性分析 - 信息茧房作为算法技术的核心隐喻通过具象化"茧房"概念将算法影响可视化强调其对使用者的束缚效应 [3] - 该概念缺乏实证研究支持国内外学界均未发现具备说服力的证据证明算法茧房效应真实存在 [6] - 概念构建过程受政治/资本/社会心态等多重力量推动技术要素反而成为最不起眼的环节 [3] 前算法时代与当代信息环境对比 - 前算法时代存在更明显的信息封闭信息匮乏时代有限的信息源和内容消费导致茧房效应加剧 [6] - 当代媒体产品选择丰富用户拥有众多非算法信息源选择包括时间线和关注者为基础的信息流 [6] - 当前信息环境远超前算法时代的丰富程度用户可随时获取数百个购物参考和7*24小时不间断信息刷新 [15] 信息蜂房生态体系构建 - 信息蜂房定义为多元化/晴朗化/协作化信息生态强调用户参与和算法协力的建设性框架 [10] - 蜂房结构具有开放性特征用户可像蜜蜂穿梭于多元信息源之间通过主动采集创造实现生态构建 [10] - 核心机制包括减少同类信息推送并增加异质信息分发通过多向交互实现信息交叉印证 [11][12] 两种信息生态的本质差异 - 信息流向：蜂房实现多向交互与交叉印证茧房呈现单向循环强化既有观点 [12] - 生态特性：蜂房保持开放性和动态优化茧房呈现垄断性和异质信息排斥 [12] - 用户行为：蜂房用户主动接触整合信息茧房用户长期接受同质化信息 [12] 算法技术发展的历史语境 - 信息茧房概念提出于2006年博客时代当时算法尚未成熟普及传统媒体仍主导信息消费 [8] - 新技术历来引发社会恐慌从文字/广播/电视到计算机每种技术出现都伴随批判性质疑 [14] - 算法批判与历史对新技术的恐惧一脉相承源于对不确定性的心理反应而非技术本质 [14] 群体智能与用户参与机制 - 蜂群效应体现分布式决策模式通过分散个体自主协同形成超越个体能力的群体智能 [13] - 11亿网民的力量和觉知是构建信息生态的关键需要用户提高媒介素养和主动求证意识 [13] - 用户既是信息消费者也是生态建设者需要通过多源核查和跨文化信息涉猎打破认知偏见 [13] 技术向善的发展路径 - 算法不成熟是当前问题的本质成熟算法应提供多元信息促进视野开阔和思想进步 [16] - 技术解决方案应遵循"创造更好替代"原则而非单纯批判现有技术缺陷 [8] - 算法已改变现实世界与观念世界技术偏向问题将随技术进步和认知深化得到解决 [17]