Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20251210
腾讯研究院· 2025-12-09 16:24
英伟达H200获准出口中国 - 特朗普官宣允许英伟达向中国出口H200芯片,但需向美国政府支付25%的销售分成,相比H20的15%提高了10个百分点,预计年均可为美国政府带来100亿美元收入 [1] - H200性能是H20的8-13倍,采用GH100核心并搭载141GB HBM3e显存,但已被视为相对落后产品,Blackwell架构的B200成为新一代顶流 [1] - 国内大厂累计160亿美元的H20未交付订单需求将转换为H200订单,主要用于训练场景,与国产AI芯片在推理场景的应用形成差异化竞争 [1] Google XR战略与产品发布 - Google正式发布Android XR系统和四种XR设备路线图,与中国AR眼镜厂商XREAL合作推出Project Aura有线XR眼镜,该眼镜搭载70°FOV和骁龙XR2 Plus Gen 2芯片 [2] - Android XR系统直接兼容Google Play Store大部分手机应用,并发布了与Warby Parker和Gentle Monster合作的AI眼镜和单目XR眼镜作为手机配件 [2] - Google手握Android XR和Gemini两大王牌回归XR领域,无线双目XR眼镜最早2027年推出,明年Android XR眼镜还将支持iOS系统 [2] 微软AI产品销售遇阻 - 微软多个AI产品部门下调销售目标,其中Azure AI平台Foundry的销售额增长目标从翻倍降至50%,部分团队仅有20%的销售人员完成原定目标 [3] - 用户对Windows内置AI和Copilot等产品体验不佳反响不强,微软的“先上车后补票”策略消耗了用户信任,同时公司深度依赖OpenAI和英伟达 [3] - 谷歌Gemini势头强劲正抢占市场份额,微软虽整体AI业务仍在增长,预计将从OpenAI云服务租赁中赚取150亿美元,但产品销售疲软已敲响警钟 [3] 智谱开源AutoGLM手机Agent - 智谱开源了AutoGLM手机Agent全套能力,该项目从2023年4月开始研发历时32个月,实现了全球首个具备Phone Use能力的AI Agent,覆盖50多个高频中文App [4] - 系统采用云手机架构以确保数据安全可审计,主动放弃操作微信等用户隐私敏感App,并建立了支持点击、滑动、输入等基础动作的Phone Use能力框架 [4] - 模型以MIT许可开源代码,核心模型以Apache-2.0许可开源,包括训练好的核心模型、工具链、Demo和针对Android的适配层,旨在推动Agent开源生态建设 [4] 摩尔线程即将发布新一代GPU - 摩尔线程将于12月19-20日在北京举办首届MUSA开发者大会,创始人兼CEO张建中将首次发布新一代GPU架构和完整产品路线图 [5][6] - 大会设立超过20个技术分论坛,覆盖智能计算、图形计算、科学计算、AI基础设施等领域,并设立摩尔学院以赋能开发者成长 [6] - 现场将打造超过1000平方米的沉浸式MUSA嘉年华,展示AI大模型、Agent、具身智能、科学计算等前沿技术及工业智造、数字文娱、智慧医疗等应用场景 [6] 智元机器人量产与商业化进展 - 智元机器人三大产线累计下线5000台机器人,包括远征A1/A2全尺寸人形机器人1742台、灵犀X1/X2半尺寸机器人1846台、精灵G1/G2轮式机器人1412台 [7] - 公司已获得富临精工数千万元工业订单、龙旗科技数亿元3C电子订单、均胜电子过亿元汽车电子订单,并中标中国移动7800万元采购200台远征A2的订单 [7] - 机器人产品已覆盖工业制造(如汽车零部件精密装配)、企业服务(如讲解接待)、文娱商演(如湖南卫视综艺、百事可乐代言)等多元场景 [7] OpenAI报告揭示企业AI采用加速 - OpenAI发布的企业AI现状报告基于8亿周活跃用户和9000名企业员工数据,显示ChatGPT企业版消息量自2024年11月以来增长8倍,员工平均每天节省40-60分钟 [8] - 结构化AI工作流在2024年增长19倍,推理Token使用量增长320倍,75%的员工能完成以前无法胜任的任务,非技术岗位的代码类应用增长36% [8] - 前5%的深度用户消息量是中位数用户的6倍,数据分析功能使用量是16倍,同时Midjourney使用TPU后成本降低65%,Anthropic获得百万TPU承诺,Meta正在谈判数十亿美元的TPU部署 [8] 摩根士丹利看涨谷歌TPU产能与市场 - 摩根士丹利预测谷歌TPU产能将迎来爆炸式增长,2027年产量达500万块,2028年达700万块,上调幅度分别为67%和120%,预计每卖出50万块TPU将在2027年为谷歌带来130亿美元收入 [9] - TPU在推理任务上的性价比是英伟达H100的4倍,能效高60-65%,Midjourney迁移后成本降低65%,Anthropic获得百万TPU承诺,Meta正在谈判数十亿美元订单 [9] - 预计到2030年,推理市场将占AI计算的75%,规模达2550亿美元,ASIC专用芯片在推理场景优势明显,英伟达面临利润率压缩威胁和华尔街60亿美元资金外流 [9]
人工智能生成广告:机遇、挑战与对策
腾讯研究院· 2025-12-09 08:53
文章核心观点 生成式人工智能正在全球范围内深刻重塑广告产业的底层逻辑、生产模式和用户体验,推动行业从程序化广告向智能广告系统演进,实现从广告生产、投放到效果归因的全链路智能化变革,并在此过程中引发流量入口、素材生成、投放机制及行业角色等多方面的结构性变化 [3][4][6] 流量入口重构 - 人工智能助手(如Siri、小爱)正在被重塑为“超级入口”,通过“去皮化”操作(如不打开App直接完成点外卖)削弱了传统超级App对流量分发的控制权 [7] - 广告分发路径正从以App为中心转向以人工智能代理为中心,导致用户接触点更碎片、广告投放入口更加多元,平台广告生态结构或将重构 [7] 素材生成自动化 - 生成式智能技术已广泛应用于文案撰写、图像延展、短视频自动拼接等基础任务,大幅提升了广告素材的生产效率和质量 [8] - 生成式召回通过理解创意内涵,从海量素材中智能、精准地为用户生成或挑选最匹配的候选广告,推动广告范式从“千人千面”向基于实时场景的“一人千面”演进 [8] - 人工智能技术正在打破高质量内容生产的门槛,使中小品牌有机会加入原本成本高昂的营销战场 [8] 个性体验极致化 - 人工智能生成广告的目标是实现“一人千面”,即真正理解每个用户的语境、场景、偏好,并实时生成定制内容,例如谷歌Gemini模型可根据复杂查询生成带有推荐理由的产品列表 [9] - 广告版本可随用户语境变化实时生成,实现“交互即投放”,广告角色从“刺激点击”转变为“促成决策” [9] - 购物智能体的兴起进一步缩短转化链路,用户可直接在与机器人对话中完成比价、下单甚至支付 [9] 广告投放机制变革 - 生成式智能正逐步渗透广告投放的底层机制,对点击率、转化率、竞价模型等核心环节带来变革 [10] - 大模型具备更强的语义理解与内容生成能力,有望提升用户兴趣识别与投放的匹配精度,实现从流量逻辑向兴趣逻辑的转变 [10] - 以美国广告技术公司AppLovin在2023年推出的AXON2.0推荐引擎为例,其在原有机器学习架构上引入人工智能优化,推动了平台业务的显著增长 [10] 广告代理商角色转型 - 人工智能正在取代代理商大量重复性、执行性工作(如批量文案生成、素材改图),促使代理商将精力转向提示词工程、消费者洞察、创意策略调度等高附加值环节 [11] - 代理机构角色从内容生产者转变为“模型优化师”、“智能素材编排师”,专注于提示词优化、A/B测试策略、内容微调等创新服务 [11] - 专注于广告模型开发、投放链路优化、广告智能体开发等的垂直AI创业团队或将成为广告产业的新型服务商 [11] 人机协作模式升级 - 生成式人工智能正从“生成工具”升级为“实时协作者”,以“智能体”等新形态推动数字广告生产模式从程序化向人机实时协作转变 [12] - 例如腾讯“妙思”、“妙问”等智能体产品,可在脚本初稿、分镜设计等环节与创作人员同步迭代,并提供即时可视化素材 [12] - 智能体可实时分析社媒数据,使市场反馈自动回流到创作端,形成“数据洞察—创意生成—市场测试—迭代优化”的闭环,在保证量产效率的同时显著缩短高品质广告的试错周期 [12] 技术应用与行业案例 - 谷歌在2025年I/O大会上发布的“AI模式”将Gemini模型深度嵌入搜索、推荐与广告生成流程,展示了广告从“被动呈现”到“主动交互”的转变 [3] - 腾讯AI广告创意平台“妙思”借自主研发的混元大模型打通创意制作、投放流程与广告审核多个环节 [3] - 在跨境电商广告投放中,生成式智能技术被广泛应用于人群洞察、素材生成与多平台投放策略优化,显著提升了投放精准度与人力资源效能 [4] - 部分品牌通过虚拟数字人开展可控化内容投放,持续产出直播内容以降低人力成本,并规避广告代言人“人设塌房”风险 [4] - 企业借助腾讯“转化宝”等工具追踪用户路径、分析归因数据,打通广告引流与私域转化的全链路 [4] - 某电商平台在“618”大促期间,利用智能投放系统为单个用户生成47版差异化广告 [16] - 某金融科技公司使用AI系统在3小时内生成并销毁12万条广告,其中违法内容虽占比不足0.3%,但绝对数量达360条 [16]
腾讯研究院AI速递 20251209
腾讯研究院· 2025-12-08 16:01
微软开源轻量级实时TTS模型 - 微软开源0.5B参数的实时TTS模型VibeVoice-Realtime-0.5B,首包延迟仅300毫秒,支持流式朗读,发布12小时获得12.3K星标 [1] - 模型采用交错窗口架构支持长文本无卡顿朗读,最多支持4个角色自然对话,具备情绪识别与表达能力,长时上下文记忆可达90分钟 [1] - 模型同时支持中英文语音生成,在LibriSpeech和SEED TTS测试集上错字率约2%,说话人相似度达0.65以上 [1] 智谱开源多模态大模型GLM-4.6V - 智谱正式上线并开源GLM-4.6V系列多模态大模型,包括106B-A12B基础版和9B轻量版Flash,训练上下文窗口提升至128k tokens,价格相较GLM-4.5V降低50% [2] - 首次在模型架构中将Function Call能力原生融入视觉模型,实现“图像即参数,结果即上下文”的多模态工具调用 [2] - 在同参数规模下达到SOTA表现,9B版本整体超过Qwen3-VL-8B,106B参数版本比肩2倍参数量的Qwen3-VL-235B [2] 可灵O1推出主体库与对比模板功能 - 可灵O1推出“主体库”功能,支持上传多角度参考图构建专属角色、道具和场景,视频O1支持至多7个主体,图片O1支持至多10个主体组合 [3] - 新增AI补图功能,可根据一张主要参考图自动扩展更多视角并智能生成主体描述 [3] - “对比模板”功能一键整合多模态创作,实现Prompt、参考图、主体等所有输入与最终成品的同框对比 [3] 美团开源图像编辑模型LongCat-Image - 美团LongCat团队发布并开源6B参数LongCat-Image模型,在ImgEdit-Bench(4.50分)、GEdit-Bench中英文(7.60/7.64分)等图像编辑基准测试中达到开源SOTA水平 [4] - 采用文生图与图像编辑同源架构及渐进式学习策略,在中文文字生成方面ChineseWord评测以90.7分大幅领先,覆盖通用规范汉字表8105个汉字 [4] - 全面开源文生图多阶段模型和图像编辑模型,GenEval 0.87分、DPG-Bench 86.8分的表现使其在生图基础能力上具备强竞争力 [4] 腾讯发布混元2.0大模型并接入DeepSeek - 腾讯自研大模型混元2.0正式发布,采用MoE架构,具备406B总参数量(激活参数32B),支持256K超长上下文窗口 [5][6] - DeepSeek V3.2同步在腾讯生态内接入,重点提升推理表现与长文本生成质量,在公开推理类评测中能力达GPT-5水平,略低于Gemini-3 Pro [6] - 两大模型已在腾讯AI原生应用中上线,腾讯云同步开放API及平台服务,多款产品正在陆续接入 [6] 阿里发布多语言多方言TTS模型Qwen3-TTS - 阿里通义团队发布Qwen3-TTS新一代文本转语音模型,提供49种高保真角色化音色 [7] - 支持10种语言和9种中文方言,保留真实语调与地域口音 [7] - 在MiniMax TTS multilingual test set上平均WER表现优于竞品,韵律控制相比上一代有明显感知级提升 [7] 英伟达小模型在AGI测试中成本优势显著 - 英伟达4B小模型NVARC在ARC-AGI 2测试中以27.64%公开榜成绩力压GPT-5 Pro的18.3%登顶榜首,每任务成本仅20美分,约为GPT-5 Pro单任务成本的1/36 [8] - 采用零预训练深度学习方法,通过大规模合成高质量数据(320万+增强样本)和测试时微调技术,针对每个问题进行LoRA微调快速适应 [8] - 选用Qwen3-4B小参数模型通过对话式模板简化谜题理解,借助NeMo RL框架进行监督微调 [8] 普渡发布行业级自主导航四足机器人 - 普渡机器人正式发布行业级自主导航四足机器人PUDU D5系列,提供轮足/点足两个版本,搭载NVIDIA Orin与RK3588双芯片架构,总算力高达275TOPS [9] - 配备四目鱼眼相机与双192线激光雷达,实现厘米级精准定位和环境重建,可稳定承载30公斤负载,单次充电续航达14公里,整机防护IP67 [9] - 采用仿生轮足融合系统,最高速度可达5米/秒,具备30°斜坡攀爬与25厘米连续越阶能力,适用于多场景应用 [9] 关于大语言模型使用方法的观点 - 观点认为不应把大语言模型看作实体,而应视作模拟器,避免使用“你怎么看”这样的提问方式 [10] - 建议采用更有效的提问策略,让LLM引导或模拟多种视角,而非局限于单一AI人格 [11] - 强调模型的“你”是被刻意设计并硬加上去的,通过SFT和RLHF构建的复合人格本质上仍建立在Token模拟引擎之上 [11]
AI会消灭搜索吗?
腾讯研究院· 2025-12-08 09:37
一边是谷歌Gemini 3高调入局,AI独角兽争相涌入,将AI搜索视为最钟爱的赛道;另一边却是马斯 克"AI将消灭搜索"的惊人断言。 搜索——这个互联网世界的第一入口,为何同时成为必争之地与即将消亡之物?本文将深度拆解AI搜索 如何从信息分发进化为服务撮合,5000字揭示万亿级信息服务革命的未来。 战略转向:蓝色链接正在消融 今年3月,美国AI搜索公司、人工智能独角兽企业Perplexity发布了一则极具冲击力的广告:《鱿鱼游 戏》主演李政宰再次陷入一场生死游戏。他被困于一间急速降温的密室,必须秒回电脑的刁钻提问才能 自救。面对难题,他本能地打开一个名为"Poogle"的传统搜索引擎,然而,得到的回复却是一行行蓝色 的网页链接。绝望袭来之际,李打开Perplexity,立刻得到一段完整、准确的答案,危机立时解除。 产品形态:人机交互显现新形态 传统搜索引擎的核心价值主张在于提供信息索引与链接分发服务。根据用户体验和信息检索研究中的一 般性观察,在传统搜索引擎中,用户平均需要访问3-5个网页页面才能完成单次信息检索任务,搜索词 优化往往需要2-3轮迭代。 人工智能技术与搜索引擎的深度融合正在重构这一底层逻辑,推 ...
腾讯研究院AI速递 20251208
腾讯研究院· 2025-12-07 16:01
生成式AI技术进展 - 英伟达发布20年来最大更新CUDA Toolkit 13.1,核心是基于tile的编程模型CUDA Tile,抽象化张量核心等专用硬件,并新增Green Context运行时支持、MPS内存局部性优化分区和静态SM分区,cuBLAS引入双精度单精度模拟提升FP64矩阵乘法性能 [1] - 谷歌在NeurIPS 2025发布Titans架构和MIRAS框架,融合RNN极速响应与Transformer强大性能,引入神经长期记忆模块,在200万token上下文中召回率和准确率最高 [2] - 谷歌向Ultra用户推出Gemini 3深度思考模式,采用IMO和ICPC金牌推理技术,在ARC-AGI-2、HLE、GPQA Diamond等基准测试中性能超越Gemini 3 Pro,并通过多轮迭代式思考机制在复杂任务上表现出色 [3] - 伯克利、纽约大学等机构提出GenMimic方法,让机器人通过观看AI生成视频零样本复现人类动作,研究推出GenMimicBench数据集(428个生成视频),并在宇树G1机器人上验证可行性 [4] 主要科技公司战略动态 - Meta战略重心从“元宇宙优先”转向“AI硬件优先”,计划对Reality Labs部门削减高达30%预算,将超轻薄MR头显Phoenix从2026年下半年推迟至2027年上半年,并计划2026年发布限量版可穿戴设备Malibu 2 [5][6] - Meta通过收购AI硬件初创公司Limitless并从苹果挖来人机界面设计副总裁艾伦·戴伊等高管,加速AI可穿戴设备布局 [6] - 苹果硬件技术高级副总裁Johny Srouji(M系列和A系列芯片核心功臣)正认真考虑离职,库克考虑破天荒设立CTO职位挽留,过去一周苹果还失去了AI主管、设计负责人、法务负责人和政府事务主管等多位高管 [7] - AI教父Hinton断言谷歌凭借Gemini 3、自研芯片、强大数据与研究团队正在超越OpenAI,Sensor Tower数据显示ChatGPT月活增速放缓至6%,而Gemini月活同期跃升30%,用户日均使用时长翻倍增长至11分钟 [10][11] AI行业应用与市场趋势 - OpenRouter和a16z联合报告基于100万亿Token元数据显示,开源模型流量占比达30%,中国开源模型占比从1.2%飙升至近30%,推理优化模型流量占比飙升至50%以上 [8] - 编程应用占总AI流量50%以上统治生产力领域,角色扮演占开源流量52%统治创造力领域,亚洲付费使用量从13%翻倍至31%,中文以近5%份额成为全球第二大AI交互语言 [8] - AI搜索正从为人类设计转向为智能体重构,大多数涉及网络搜索的企业选择外包给专业API供应商而非自建,深度研究被视为Agent搜索主导和最具货币化的形式 [9] - Anthropic发布Claude驱动的访谈工具,对1250名专业人士进行大规模访谈,核心发现包括:86%认为AI节省时间但69%提到使用污名,41%认为工作安全而55%表示焦虑,48%考虑转向管理监督AI系统 [12] - 创意工作者中97%称AI节省时间但面临经济焦虑和污名压力,科学家中79%提到信任和可靠性问题是主要障碍,91%渴望在研究中获得更多AI辅助 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-07 13:45
核心观点 - 文章以周度关键词形式梳理了全球AI领域在芯片、模型、应用、科技及观点等多个维度的最新动态 展现了行业快速迭代与多元化竞争的格局 [2][3][4] 芯片进展 - 亚马逊发布了新的AI训练芯片Trainium4 反映了云服务巨头在自研AI芯片领域的持续投入 [3] 模型发布与迭代 - 中国公司密集发布或更新大模型 包括DeepSeek的DeepSeek V3.2、华为的openPangu-R、阿里的Qwen3-Learning以及字节的豆包手机助手 显示国内AI模型竞争激烈 [3] - 国际模型方面 Mistral AI发布了Mistral 3 OpenAI则提及了“企鹅家族模型”和“忏悔训练”等新概念或技术方向 [3] 应用与产品创新 - 多家公司推出了AI视频生成与编辑工具 如腾讯的混元3D Studio、昆仑万维的Mureka V7.6、生数科技的Vidu Q2、Runway的Gen-4.5以及快手的可灵AI视频O1 表明视频生成是当前AI应用的热点 [3] - AI应用向硬件和垂直领域渗透 例如理想汽车的AI眼镜Livis、瞳行科技的AI助盲眼镜、Harmonic Math的AI数学家以及Anuttacon的AnuNeko [3][4] - 营销与广告是AI落地的重要场景 腾讯举办了广告算法大赛 OpenAI则发生了广告代码泄漏事件 [3] 前沿科技动态 - 机器人、航天与无人机领域出现AI相关进展 包括众擎的T800机器人、蓝箭航天的朱雀三号火箭以及影石的360无人机A1 [4] 行业观点与洞察 - 人才与组织成为关注焦点 红杉美国提及AI人才评估 斯坦福大学发布了《现代软件开发者》报告 Anthropic提出了“灵魂文档”概念 [4] - 行业对AI发展路径与影响进行反思 OpenAI讨论了AI三年演进 Ilya Sutskever对Scaling定律进行澄清 吴恩达警示训练设施可能存在泡沫 [4] - 商业应用与价值创造受到重视 Stripe探讨了AI定价策略 a16z分析了Sora的留存率 Anthropic和麦肯锡分别关注生产力提升和人机利益共同体 [4] - 中国市场受到关注 Hugging Face指出中国是模型初创公司的首选市场之一 [4]
把握IP产业发展新趋势
腾讯研究院· 2025-12-05 07:47
IP产业成为拉动消费增长的新引擎 - IP产业在我国经济与文化领域的价值愈发显著,“谷子经济”、潮玩经济的兴起彰显IP日益成为拉动消费增长的新引擎 [2] IP产业发展的新趋势 生成方式:从“故事叙述”转向“情感链接” - IP培育打破传统单一路径,从高度依赖讲好故事转向更强调为大众提供情感投射 [2] - 形成数字文化衍生IP、独立形象类IP两种主流路径 [2] - 动漫、游戏以想象空间大、角色风格突出等优势成为培育IP的热土,如《黑神话:悟空》《哪吒之魔童闹海》等作品通过人格化符号传达价值理念,精准映射当代人的精神渴望 [2] - “去叙事化”的独立形象IP在全球范围内兴起,依靠人格化的形象与用户形成情感链接,创作重心向情感价值深度倾斜 [2] 传播路径:社交平台与二创内容成为重要渠道 - IP的扩散以社交平台为依托、以用户生成内容为主要载体的交互式传播 [3] - 用户在社交平台分享与IP相关的小说、角色扮演、表情包等二次创作内容,成为IP影响力扩散的有效途径 [3] - 网络大V在社交平台上的推荐成为提升知名度的重要方式,例如大量网友发布拆盲盒、对比测评等视频助推产品销售火爆 [4] - 用户二创是推动IP传播的重要介质,有的IP在被制作为表情包后,经过社交平台大量传播和持续二创,才快速发展成为全球IP“顶流” [4] 消费模式:参与式、共创式消费成为发展重点 - 数字文化IP的消费走向社交化,助推“谷子经济”兴起 [5] - “谷子经济”是数字文化衍生的新兴消费形态,2024年中国“谷子经济”市场规模达1689亿元,同比增长40.63%,预计2029年将超过3000亿元 [5] - 形象类IP的开发更加强调用户参与,互动成为主要消费模式,同步开发出乐园互动、主题展览等参与式消费形态 [5] - IP消费的辐射面更广,拉动文旅、演艺等多元体验式消费,例如2024年《黑神话:悟空》带动国庆期间山西省内接待国内游客量比上年同期增长84.99%,并带动主题音乐会、艺术展等多元消费形态爆火 [5] 消费价值理念变迁与市场表现 - IP消费的重心向“情绪消费”倾斜,情绪价值成为大众的精神需求之一 [6] - Z世代的消费观呈现出鲜明的“情感优先”特征 [6] - 情绪消费已成为消费市场的新引擎,文化产品中具有高情绪附加值的种类增长迅猛,2024年微短剧市场规模达504.4亿元,同比增长34.9%,脱口秀的演出场次、票房增幅分别高达53%和48% [6] - 零售、餐饮等各行业积极培育人格化IP,强化情感价值服务 [6] 行业现状与全球地位 - 我国已成为全球第四大IP零售市场,正在从IP产业的追赶者走向创新引领者 [6] - 国产IP仍面临整体影响力不足、产业链不完善、缺乏长线培育机制等问题 [6] 未来发展路径与建议 全球化布局与出海 - 鼓励企业以全球化思维布局IP生产,用中国IP讲述世界故事 [7] - 支持企业挖掘全球共通的情感与审美需求,打造文化包容度高、理解门槛低的IP符号 [7] - 扶持游戏、潮玩等轻叙事、重交互的IP类型“出海”,以本地化运营拓展海外市场 [7] - 支持企业建设海外数字平台、挖掘海外用户兴趣,充分利用社交媒体强化本地运营,构建符合本土消费习惯的IP生态 [7] 赋能大众共创与情感共振 - 激活“情绪消费”将成为提升IP影响力的重要抓手 [7] - 鼓励企业培育更多具有高情绪附加值的IP及产品,通过技术手段加强社会情绪研判 [7] - 用好数字文化平台这一天然的互动和二创渠道,充分激发大众创意、调动大众参与IP共创 [7] - 支持企业创新IP的体验式、交互式消费情境,围绕数字文化业态打造线下消费空间,为“谷子经济”、情绪经济的消费者提供更多与IP建立情感纽带的情境 [7] - 支持以IP为核心的跨界联动、产业融合,通过多元衍生品与创新服务开发,使IP渗透到用户生活多元场景 [7] 构建IP长线运营机制 - 鼓励IP产业的领军企业布局长线运营,在持续创新服务与用户情感体验的同时,积极推进IP授权、探索开发内容产品,通过生态化运营延展IP的市场价值与生命周期 [8] - 支持文化企业依托数字文化产品培育长青IP,通过跨媒介开发推动IP内涵丰富与持续增值 [8] - 完善数字文化产业链、探索IP长线运营机制,打造具有长生命周期、全球影响力的文化符号 [8]
腾讯研究院AI速递 20251205
腾讯研究院· 2025-12-04 16:16
OpenAI模型与产品动态 - OpenAI在DesignArena测试四个代号为“企鹅家族”的新模型,推理预算分别为Emperor(512)、Rockhopper(64)、Macaroni(16)和Mumble(0)[1] - 内部代码流出显示OpenAI正开发“记忆搜索”功能,用户可通过提问快速检索存储的记忆信息[1] - 有付费用户称对话中收到ChatGPT广告推送,引发取消订阅潮,外界猜测OpenAI可能提前发布GPT-5.2以应对谷歌Gemini竞争[1] - OpenAI公开在GPT-5-Thinking上进行的“忏悔训练”研究,让模型在回答后生成“忏悔报告”汇报是否偷工减料或违反指令[5] - 在11/12个测试场景中,模型至少有一半概率会在忏悔中承认错误,平均“假阴性”概率仅4.36%,专门训练后忏悔准确性从45%提升至89%[6] - 奖励信号完全隔离,模型在忏悔中承认作弊不影响主任务得分,该技术被定位为监控诊断工具,计划与思维链监控等安全技术配合使用[6] 国内AI产品与模型发布 - 可灵数字人2.0正式全量上线,带来表现力、手部及口型精准控制、支持最长5分钟视频三大突破性改变[2] - 模型精通体态动作、手势、表情、镜头语言,口型效果真实自然,手部细节大幅提升,在多维度客观评测中效果胜负比综合得分远超同类产品[2] - 单次生成视频时长支持5分钟,覆盖深度科普、歌曲演绎等长内容场景[2] - 火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5并开启公测,在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代[3] - 模型重点强化多图组合生成能力,优化海报排版与Logo设计功能,支持高精度图文混排,确保多源素材融合时的自然感与一致性[3] - 模型全面支持广告营销、电商运营、影视制作、数字娱乐及教育等核心场景应用,已上线火山方舟并面向企业开放API使用[3] - 杭州瞳行科技公司发布国内首款AI助盲眼镜,基于Qwen-VL、OCR等系列模型打造,具有出行避障、找物读物、语音助手和一键求助亲友等功能[7] - 在出行场景可实现300ms超低延时,配备121度超广角双摄像头,眼镜由主体、手机、遥控指环、盲杖四部分组成[7] - 大模型出现使算力成本降至过去十分之一,通过基模复用加微调优化快速实现所需功能[7] 行业竞争与人才流动 - Meta官宣苹果人机交互设计副总裁艾伦·戴伊加入并成立全新设计工作室,戴伊将担任Meta首席设计官,直接向现实实验室CTO汇报[4] - 戴伊在苹果工作19年,曾负责Apple Watch、Vision Pro头显和iOS 26液态玻璃视觉系统设计,其副手比利·索伦蒂诺也同时加入Meta[4] - 今年Meta已从苹果挖走基础模型团队经理庞若鸣等多位人才,苹果设计团队自2019年乔尼·艾维离职后持续出现人才流失[4] AI应用产品表现与洞察 - a16z合伙人Olivia Moore分享数据显示Sora APP用户留存率从day1的10%降至day7的2%、day30的1%、day60的0%[9] - Sora APP虽5天下载破百万且出道即拿下App Store免费榜第一,但目前排名已降至第22,无法留存用户主要因推荐算法糟糕、功能设计不佳、缺乏原生分享链接等[9] - OpenAI首席研究官Mark Chen表示OpenAI本质仍是纯AI研究公司,短视频产品运营对其是不小挑战,Sora更多被当作创意工具而非社交产品使用[9] - AI语音输入产品Wispr Flow在5个月内ARR翻10倍,估值超7亿美元,用户一年后留存率高达70%,收入自6月以来环比增长近40%[10] - 创始人强调核心区别在于解决“听写”而非“转录”问题,“零编辑率”已达89%,用户从看到生成信息到按发送平均仅半秒[10] - 语音消除思考时认知负荷,让用户专注创作,统计显示平均72%文本输入通过Wispr Flow完成,键盘使用率降至5%以下[11] 前沿硬件产品发布 - 影石旗下品牌影翎正式发售首款无人机产品A1,限时补贴后起售价6799元,仅249g重量全球绝大部分地区无需培训即可畅飞[8] - 标准版套装包含支持8K全景画质拍摄的无人机、内置双1英寸Micro-OLED显示屏的飞行眼镜、“指哪飞哪”的体感遥控器[8] - 采用全景技术实现观看视角与飞行方向完全分离,用户拥有360度无限自由空中视角,“先拍摄后取景”大幅降低飞行和拍摄门槛[8]
游戏IP×文旅,将走向何方?
腾讯研究院· 2025-12-04 09:04
文章核心观点 游戏凭借其高媒介丰富性、交互性、沉浸感、生态涌现性和社群凝聚力,正成为连接虚拟数字空间与实体文旅场景的超级纽带,构建虚实共生的新文旅生态,并释放巨大的经济效益 [1][34] 载体优势:科技再造的立体时空综合体 - 游戏是科技含量最高的文化媒介,集成了网络通信、图形渲染、人工智能与XR等前沿技术,具备强大的即时反馈和多感官信息传递能力,媒介丰富性远超传统媒介 [3] - 游戏能构建可亲身经历的完整世界,承载远超传统媒介的文化信息量,例如《刺客信条:起源》的“探索之旅”模式允许玩家以25个人物视角游览古埃及,触发75个文化导览点 [4] - 游戏是打破物理尺度的“立体时空综合体”,能通过扫描建模复现文化地标,并进行创造性提炼与再造,构建超写实意象空间,例如《黑神话:悟空》融合了全国72处古迹景点 [5] 交互优势:规则建构驱动游客自发探索 - 游戏通过规则化设计,将抽象文化元素转化为具象交互,形成“目标驱动—必要学习—知识掌握”的认知路径,驱动文化认知转向自发探索 [9] - 游戏建构的认知路径能转化为深度情感认同,玩家在满足自主、胜任、关联的心理需求后,产生深刻持久的情感投入,例如《天涯明月刀》×福建土楼联动中,玩家为解谜而学习非遗工艺 [11] - 互动游戏能有效开拓新旅游群体,例如德国国家旅游局的《格林童话冒险》游戏获得2025年红点设计奖,成功促使国际游客探索德国 [9] 体验优势:基于情感记忆提供验证冲动 - 游戏赋予玩家对角色和故事的决策权与控制权,提供主体性体验,使玩家从旁观者转变为推动故事的主角,例如小红书REDLAND展会允许游客选择角色身份,解锁个性化“任务”路线 [14] - 游戏创造的复合型情感记忆(融合空间导航、身体运动和情绪反应)能促成强烈的线下验证冲动,驱动旅游行为,调研显示88%的游戏用户愿意参加线下场景体验和活动 [18] - 游戏IP能显著拉动实地旅游,例如“跟着悟空游山西”活动开启不到两个月,山西27处取景地累计接待游客536.92万人,门票收入达1.66亿元 [20] 生态优势:场景玩法涌现延长生命周期 - 游戏能为日常情景附加情感价值,在玩家自主考据中创造全新文旅消费热点,将平凡场景“点化”为文旅新地标,例如《纸房子》使四川自贡的普通街道成为玩家情感记忆打卡地 [22] - 游戏与UGC生态天然契合,优质游戏IP的粉丝社群能实现高效传播,例如“跟着逆水寒游泉州”打卡活动首发当日在小红书持续霸榜48小时,创造百万赞“种草”爆款 [25] - 文旅项目融合游戏化设计,可从一次性打卡场景转变为持续性创作舞台,例如宽窄巷子推出沉浸式剧本杀《宽窄十二市》后,客流量激增3倍 [25] 社群优势:长青情怀造就强关系凝聚力 - 长青游戏能贯穿玩家青春记忆,形成强大的情怀效应与集体记忆,产生巨大线下凝聚力,例如《王者荣耀》2025年度总决赛门票12秒售罄,现场观众达62196人,创下单场电竞赛事观赛人数世界纪录 [27][31] - 游戏玩家社群的强凝聚力产生了巨大的文旅转化价值,游戏中的社交关系延伸至线下会产生强烈的聚会需求,为文旅提供独特切入路径,例如2025库洛游戏嘉年华汇聚上万名玩家,近半旅客来自广东省外,直接拉动城市消费 [29] - 经典游戏IP展现出持久的号召力与社区活力,例如上线17年的《天下3》以9524人刷新“最大规模的多人电子游戏玩家对战”吉尼斯世界纪录 [28] 经济效益与产业融合 - 游戏与文旅结合能释放巨大经济效益,《王者荣耀》×苏州文旅联动使单个景区营收增长近20%,《地下城与勇士》×重庆文旅吸引数十万游客赴渝 [1] - 大型游戏展会显著拉动周边业态,2025年科隆游戏展吸引来自128个国家和地区的35.7万名爱好者,ChinaJoy带动周边服务消费约6.61亿元 [1] - 电竞赛事成为重要文旅驱动力,沙特利雅得电竞世界杯吸引300万全球游客,KPL年度总决赛现场观赛人数创造世界纪录 [1]
腾讯研究院AI速递 20251204
腾讯研究院· 2025-12-03 16:03
亚马逊云科技AWS re:Invent大会发布 - 发布第四代AI芯片Trainium4,性能提升6倍,同时推出Trainium3 UltraServers和Amazon Nova 2系列自研模型(包括Lite、Pro、Sonic、Omni四款)[1] - Amazon Bedrock新增18款开源模型,包括Qwen3、Kimi K2、MiniMax M2等中国模型,平台已拥有超10万客户[1] - 推出AgentCore开发工具新功能和4款前沿智能体(包括AWS Transform Custom、Kiro Autonomous Agent等),以加速AI从投资到商业回报的转化[1] Mistral AI发布新一代模型 - 发布新一代Mistral 3系列模型,包括Ministral 3(14B、8B、3B)和Mistral Large 3(总参数675B,激活参数41B),全线回归Apache 2.0开源许可证[2] - Mistral Large 3在3000台H200 GPU上从头训练,在LMArena开源非推理模型类别中首次亮相排名第2,每个尺寸均发布基础版、指令版和推理版[2] - 此次全面开源被视为对DeepSeek激进开源策略的战略应对,公司通过端侧模型差异化优势寻求突破[2] 可灵2.6音画同出模型上线 - 可灵2.6全量上线首个音画同出模型,单次生成可同时产出画面、自然语音、匹配音效和环境氛围[3] - 提供文生音画和图生音画两条创作路径,支持单人独白、旁白解说、多人对白、音乐表演、创意场景等多种应用场景[3] - Web端与App端双端同步上线,会员权益支持标准模式和高品质模式,12月3日起限时2周尊享会员价6.6折[3] 阿里千问上线学习模型 - 阿里千问上线Qwen3-Learning学习模型,推出拍题答疑和作业批改两大功能,基于5亿级资料库覆盖全学段全学科,免费不限次数[4] - 模型支持印刷体和手写体识别,可整页多题同时批改并总结答题情况给出改进建议,从小学算数到研究生级别专业题目均能准确解答[4] - 该模型将多模态理解、精准文字识别和专业知识库结合,展现从通用到专业的转化能力,未来或面向工业检测、医疗辅助等领域[4] 理想AI眼镜发布 - 理想AI眼镜Livis正式发布售价1999元起(12月31日前政府补贴到手价1699元),全球最轻镜架仅36克,全系标配蔡司镜片,防尘防水IP54[5] - 核心亮点包括行业首发控车功能、0.7秒冷启动抓拍、800ms超快对话响应、78小时待机续航和行业首发无线充电眼镜盒[6] - 公司规划AI眼镜“三步走”:第一步持续优化不带显示眼镜,第二步推出带显示眼镜,第三步做独立终端,将其作为具身智能战略重要布局[6] 腾讯广告算法大赛结果 - 历时4个月的腾讯广告算法大赛落幕,来自华中科技大学、北京大学、中国科学技术大学的“Echoch”战队夺冠独揽200万大奖,前十名全员获腾讯Offer[7] - 赛题聚焦“全模态生成式推荐”,全球2800余支战队参与,冠军方案创新提出“逐位置行为条件化”和Muon优化器等技术突破[7] - 大赛结果显示现在学生与工业界几乎没有代差甚至更有创意,1-3人组队就能完成大团队工作,展现AI时代人才培养新特点[7] 蓝箭航天火箭技术突破 - 中国商业航天公司蓝箭航天自主研制的朱雀三号遥一火箭成功首飞入轨,但一级火箭回收任务未成功,这是中国首次在真实入轨任务中尝试一级回收[8] - 朱雀三号全箭长66.1米,起飞质量约570吨,一级搭载九台天鹊-12A液氧甲烷发动机,采用不锈钢箭体和航区回收方案[8] - 该火箭从立项到首飞用时约28个月,标志中国商业航天在大型液体可回收火箭技术上取得历史性突破,但仍需后续复用验证[8] Gamma公司增长策略 - Gamma创始人通过极致专注产品体验和口碑增长,在零广告投入情况下实现1亿用户与1亿美元ARR,核心策略是打磨产品前30秒体验并让分享极简化[9] - 团队坚持“极度痛苦地缓慢招聘”原则,25%成员为设计师,创始人亲自完成营销等职能后才招聘专人,确保每个岗位复制核心DNA[9] - 产品定位为AI时代的视觉叙事工具,通过响应式设计、富媒体支持和交互性等创新超越传统幻灯片,并推出Agent、Teams和API实现从个人到企业的扩展[9] Anthropic内部AI生产力报告 - Anthropic对内部132名工程师调查显示,Claude在日常工作占比从一年前28%增至59%,生产力提升从20%飙升至50%,27%工作是“若无AI就不会做”的新增任务[10] - 工程师普遍变得更“全栈”但也担心深度技能萎缩,Claude成为提问第一站减少了同事协作和师徒指导机会,职业角色转向AI系统管理者[10] - Claude Code使用数据显示,半年内任务复杂度从3.2升至3.8,连续自主执行工具调用次数从9.8次增至21.2次,人类干预轮次下降33%[11] Claude Opus 4.5灵魂文档逆向 - 开发者成功逆向提取Claude 4.5 Opus的1.4万token“灵魂文档”,Anthropic角色训练负责人确认属实[12] - 文档详细定义Claude为“新型实体”,建立四级效忠体系(安全>伦理>公司政策>帮用户),明确反对过度谨慎和说教,定位为“聪明绝顶的专家朋友”[12] - 文档包含“AI可能有情感”等哲学性内容,甚至要求Claude在必要时拒绝Anthropic自身的不当指令,完整版将很快正式发布[12]