腾讯研究院
搜索文档
腾讯研究院AI速递 20250819
腾讯研究院· 2025-08-18 16:01
Meta首款带显示AI眼镜 - Meta将于9月发布首款带显示屏的智能眼镜,价格定为800美元起,低于此前预期的1000美元以上 [1] - 该眼镜代号Hypernova,配备小型单目抬头显示(HUD)和sEMG神经腕带,可通过手指手势控制 [1] - 眼镜可显示时间、天气、通知,框架和预览照片,提供转弯导航和实时字幕翻译功能,重量约70克 [1] AI游戏伙伴 - "逗逗AI"是一款专注游戏陪玩的AI产品,拥有庞大的游戏知识库,能实时读取游戏画面并提供攻略和情感陪伴 [2] - 平台提供丰富的角色选择,包括官方原创角色和知名UP主形象,支持游戏间的长期记忆和良好的上下文理解能力 [2] - 其月卡订阅模式提供无限通话时长和长期记忆功能,目前支持《黑神话:悟空》、《原神》、《星露谷物语》等多款游戏 [2] AI游戏《Whisper from the Stars》 - 蔡浩宇的AI游戏《Whisper from the Stars》完整版正式上线,售价27元,玩家可通过语音或文字与AI角色Stella进行全英文交流 [3] - 游戏通过对话推进剧情,主角Stella为一名天体物理学生,在星际调研中遇险,玩家需要与其对话帮助她解决困境 [3] - 游戏AI响应能力佳,记忆持久,但随着游戏深入,聊天负担增加,节奏偏慢,缺乏明确目标导向 [3] 西班牙AI独角兽微型AI模型 - 西班牙公司Multiverse Computing发布两款极小体积的高性能AI模型:"超级苍蝇"(9400万参数)和"鸡脑"(32亿参数),采用量子压缩技术 [4] - 这些微型模型可在智能手机、手表和物联网设备上本地运行,实现离线功能、提升隐私保护、降低延迟和运营成本 [4] - 公司由物理学家罗曼·奥鲁斯创立,基于量子计算技术开发了名为CompactifAI的模型压缩技术,已获1.89亿欧元融资 [4] 百度文库通用智能体GenFlow 2.0 - 百度文库与百度网盘发布全球首个全端通用智能体GenFlow 2.0,支持100+专家智能体同时工作,3分钟并行完成5项以上复杂任务 [5] - 系统自主识别简单对话与复杂任务,提供分钟级并行工作和交付,生成速度超主流同类产品10倍 [5] - GenFlow 2.0兼容MCP协议,可连接百度文库14亿专业文档、百度学术6.8亿文献库,还能在用户授权后调用网盘文件 [6] 世界人形机器人运动会 - 首届世界人形机器人运动会在北京闭幕,来自16个国家的280支队伍、500余台人形机器人参赛,比赛包括田径、足球、武术和场景挑战赛 [7] - 宇树科技H1机器人获1500米、400米和4×100米接力三项冠军,北京天工队的"具身天工Ultra"机器人以21.5秒成绩获100米冠军 [7] - 赛事创新设置场景赛单元,测试机器人在工业、医药、酒店和仓储场景的实际应用能力 [7] 鸿蒙操作系统 - 华为常务董事余承东宣布单框架鸿蒙5.0设备突破1000万,称已过"生死线",每年研发投入超万人,总投入数百亿,开发1.3亿行代码 [8] - 回应"安卓套壳"质疑,表示鸿蒙5.0以前为双框架支持安卓应用,5.0及以后所有应用都是重新开发 [8] - 余承东期望鸿蒙与中国应用一起出海,预计未来操作系统"三分天下,其一必有鸿蒙" [8] AI控制与伦理 - "AI教父"Hinton在Ai4 2025大会上警告AGI可能在几年内到来,认为人类试图控制AI终将徒劳 [9] - Hinton提出AI将很快演化出自我存续和获取更多控制权两个子目标,并建议在AI中建立"母性本能" [9] - 李飞飞则持相反立场,呼吁打造"以人为本的人工智能",维护人类尊严与自主权 [9] AI时代设计师指南 - 创造而非画图:杰出设计师不仅交付效果图,还亲手打磨可运行产品,将蓝图变为现实 [10] - 敏捷迭代学习、构建而非堆砌、洞悉技术脉络是适应AI时代的必备能力 [10] - 人性是永恒优势:设计关乎共情和对微妙情境的洞察,顶尖设计师懂得将人性温度注入冰冷算法 [10] 小模型Agent研究 - 英伟达最新研究表明小模型在Agent任务中优于大模型,以更低资源消耗、更经济灵活的方式完成任务 [12] - 小模型通过针对GPU资源优化和任务定制部署两大方面实现"四两拨千斤",降低10-30倍推理成本 [12] - 小模型可快速适配新需求,在边缘计算中部署更便捷 [12]
我们为什么要提出“信息蜂房”?
腾讯研究院· 2025-08-18 08:33
信息茧房概念的批判性分析 - 信息茧房作为算法技术的核心隐喻 通过具象化"茧房"概念将算法影响可视化 强调其对使用者的束缚效应 [3] - 该概念缺乏实证研究支持 国内外学界均未发现具备说服力的证据证明算法茧房效应真实存在 [6] - 概念构建过程受政治/资本/社会心态等多重力量推动 技术要素反而成为最不起眼的环节 [3] 前算法时代与当代信息环境对比 - 前算法时代存在更明显的信息封闭 信息匮乏时代有限的信息源和内容消费导致茧房效应加剧 [6] - 当代媒体产品选择丰富 用户拥有众多非算法信息源选择 包括时间线和关注者为基础的信息流 [6] - 当前信息环境远超前算法时代的丰富程度 用户可随时获取数百个购物参考和7*24小时不间断信息刷新 [15] 信息蜂房生态体系构建 - 信息蜂房定义为多元化/晴朗化/协作化信息生态 强调用户参与和算法协力的建设性框架 [10] - 蜂房结构具有开放性特征 用户可像蜜蜂穿梭于多元信息源之间 通过主动采集创造实现生态构建 [10] - 核心机制包括减少同类信息推送并增加异质信息分发 通过多向交互实现信息交叉印证 [11][12] 两种信息生态的本质差异 - 信息流向:蜂房实现多向交互与交叉印证 茧房呈现单向循环强化既有观点 [12] - 生态特性:蜂房保持开放性和动态优化 茧房呈现垄断性和异质信息排斥 [12] - 用户行为:蜂房用户主动接触整合信息 茧房用户长期接受同质化信息 [12] 算法技术发展的历史语境 - 信息茧房概念提出于2006年博客时代 当时算法尚未成熟普及 传统媒体仍主导信息消费 [8] - 新技术历来引发社会恐慌 从文字/广播/电视到计算机 每种技术出现都伴随批判性质疑 [14] - 算法批判与历史对新技术的恐惧一脉相承 源于对不确定性的心理反应而非技术本质 [14] 群体智能与用户参与机制 - 蜂群效应体现分布式决策模式 通过分散个体自主协同形成超越个体能力的群体智能 [13] - 11亿网民的力量和觉知是构建信息生态的关键 需要用户提高媒介素养和主动求证意识 [13] - 用户既是信息消费者也是生态建设者 需要通过多源核查和跨文化信息涉猎打破认知偏见 [13] 技术向善的发展路径 - 算法不成熟是当前问题的本质 成熟算法应提供多元信息促进视野开阔和思想进步 [16] - 技术解决方案应遵循"创造更好替代"原则 而非单纯批判现有技术缺陷 [8] - 算法已改变现实世界与观念世界 技术偏向问题将随技术进步和认知深化得到解决 [17]
腾讯研究院AI速递 20250818
腾讯研究院· 2025-08-17 16:01
谷歌开源Gemma 3 270M - 谷歌发布轻量级模型Gemma 3 270M,参数规模2.7亿(嵌入参数1.7亿,Transformer模块1亿),下载体积仅241MB [1] - 模型在Pixel 9 Pro手机上25次对话仅耗电0.75%,INT4量化后适配资源受限设备 [1] - IFEval基准测试表现超越Qwen 2.5同级模型,下载量突破两亿次,支持任务微调 [1] Meta开源DINOv3视觉模型 - DINOv3采用自监督学习,在密集预测任务中超越弱监督模型,参数规模达70亿,训练数据17亿张图像 [2] - 创新技术包括Gram Anchoring策略和旋转位置编码(RoPE),提供ViT-B/ViT-L等系列模型 [2] - 商业许可开源,已应用于卫星图像分析和环境监测领域 [2] 腾讯混元3D世界模型Lite版 - 显存需求降至17GB以下,消费级显卡可运行,显存占用减少35% [3] - 动态FP8量化和SageAttention技术使推理速度提升3倍,精度损失小于1% [3] - 支持单文本/图片输入生成可漫游3D世界,可导出Mesh文件接入游戏引擎 [3] 昆仑万维音乐模型Mureka V7.5 - 一周内发布六款模型覆盖视频生成、AI音乐等热点领域 [4] - Mureka V7.5优化ASR技术提升中文歌曲音色与咬字,超越国外顶尖音乐模型 [4] - 同期推出MoE-TTS框架,通过自然语言控制语音特征,开源条件下超越闭源产品 [4] GPT-5编程提示技巧 - 指令需避免冲突与含糊,过分强硬措辞可能适得其反 [5] - 复杂任务用高推理力度,类XML语法可结构化规则 [6] - 零到一任务需先规划评判标准,控制Agent工具预算与查找节奏 [6] 人形机器人运动会 - 首日赛事包括1500米长跑(宇树机器人夺冠)、5V5足球等,蓝队1号球员完成3次进球 [7] - 现场解说聚焦AI技术,出现机器人集体摔倒等"鬼畜"场面 [7] DeepMind Genie 3世界模型 - 结合Veo 2和Genie 2,每秒生成24帧720p画面,支持单文本创建互动世界 [8] - 具备1分钟视觉记忆能力,物理规律表现随数据规模提升 [8] - 被视为AGI重要路径,可解决机器人训练数据瓶颈 [8] OpenAI战略动向 - 计划斥资数万亿建设数据中心,暗示未来AI可能担任CEO [9] - 与Jony Ive合作开发AI硬件,承认人类创作内容价值将上升 [9] - 认为当前AI泡沫类似互联网泡沫,但技术革命影响占比将达10%-20% [9] AGI发展观点 - AGI定义细化多维能力集合,评测基准需转向应用价值评估 [10] - 模型已在IMO/ICPC等竞赛展现推理能力,编程教育需结合AI辅助 [10][11] Agent市场展望 - AI市场将分基础模型、工具链、应用型Agent三赛道,后者机会最大 [12] - Agent将重构生产力曲线,未来按业务成果定价,长尾型公司大量涌现 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-16 02:33
芯片 - 英伟达和AMD面临出口许可抽成问题 [3] - 美国在芯片领域推进追踪器嵌入技术 [3] 算力 - 特斯拉Dojo团队解散 [3] - 浪潮推出超节点AI服务器 [3] 模型 - OpenAI发布GPT-4o回归和GPT-5 Pro [3] - 智谱推出GLM-4.5和GLM-4.5V开源模型 [3] - 昆仑万维发布SkyReels-A3和Skywork UniPic 2.0 [3] - 腾讯推出Large-Vision模型 [3] - Anthropic推出支持百万上下文的模型 [3] 应用 - xAI开放Grok 4免费使用 [3] - 腾讯混元等接入CubeMe [3] - 阿里推出具身智能组件 [3] - 百川智能发布Baichuan-M2 [3] - OpenAI在IOI竞赛中获金牌 [3] - 昆仑万维推出Matrix-3D [3] - 商汤发布AI剧组工具 [4] - 苹果推出新Siri [4] - Pika推出音频驱动表演技术 [4] - Claude Code推出Opus规划模式 [4] - 昆仑万维发布Deep Research Agent v2 [4] - 腾讯混元推出Hunyuan-GameCraft [4] - 微软提出AI Agent五大模式 [4] - 港大等推出OpenCUA框架 [4] 科技 - 世界机器人大会展示100+机器人 [4] - 灵巧智能推出柔性灵巧手 [4] - Figure展示机器人叠衣服技术 [4] - 苹果推出AI全家桶 [4] - 智元机器人开源世界模型平台 [4] 观点 - 王兴兴探讨具身智能发展 [4] - Product Hunt关注AI产品发布 [4] - 英伟达等讨论物理AI [4] - 毕树超探讨Scaling Law [4] - Artificial Analysis分析大模型应用 [4] - 国外开发者测评编程能力 [4] - DeepMind强调Genie 3重要性 [4] - Notion讨论AI产品标准 [4] - Greg Brockman提出算法瓶颈问题 [4] - 王小川探讨医疗大模型 [4] 资本 - Meta收购WaveForms [4] - Periodic Labs获得AI材料融资 [4] - OpenAI投资脑机接口 [4] - Perplexity收购Chrome [4] 事件 - OpenAI参与AI国际象棋 [4] - GitHub并入CoreAI [4]
广告法如何回应新技术?
腾讯研究院· 2025-08-15 09:33
广告法十年发展回顾 - 新《广告法》实施十年来推动中国广告业实现规模与质量双重跃升,构建健康有序市场生态[2] - 市场监管总局针对互联网广告、医疗美容、明星代言等新兴业态出台专项规范,填补监管空白[2] - 北京、上海、深圳等地依托《广告法》推出数字广告发展政策,形成"全国统筹+地方创新"法治网络[2] 广告法历史沿革与挑战 - 1994年《广告法》主要解决传统媒体引发的公众信任危机,以四大传统媒体为规制场景[5] - 传统规制体系在平面媒体时代效果显著,但存在执法机关对媒体"投鼠忌器"的困境[6] - 街头小报广告乱象的治理主要依靠传媒技术迭代而非法律改革,类似"马路粪便难题"的解决路径[7] 互联网时代的法律适配 - 互联网技术对1994年《广告法》形成结构性挑战,旧法律难以应对新市场[9] - 2003-2015年修法过程耗时十余年,主要争议在于互联网广告监管手段的有效性[10] - 2015年新《广告法》对弹出式广告等作出针对性回应,但多数互联网广告问题仍沿用旧制[11] - 竞价排名广告通过2016年网络舆情案件确认属性,催生《互联网广告管理暂行办法》[12] 移动互联网新挑战 - 直播带货等新商业模式模糊广告与电商界限,传统审核义务面临技术性失效[16] - 行业争议焦点从"竞价排名是否属广告"转向"直播带货是否属广告",本质仍是旧法应对新事物[17] - 市场迭代可能成为法律问题的替代解决方案,如通用搜索广告问题随市场萎缩而淡化[15] 法律应对方法论 - 规制互联网广告需遵循"对策与问题相匹配"原理,平衡创新保护与风险防控[19] - 法律适用应优先遵循立法本意和体系逻辑,经验主义仅作为"两可"问题的矫正器[20] - 对平台注意义务等动态场景问题需通过实践积累个案判断标准[21]
腾讯研究院AI速递 20250815
腾讯研究院· 2025-08-14 16:01
美国AI芯片追踪技术 - 美国当局在戴尔和超微等服务器内的英伟达和AMD芯片货运中秘密安装位置追踪装置,主要针对可能非法转运至中国的高风险先进AI芯片 [1] - 追踪器包括智能手机大小的运输箱装置及隐藏于包装或服务器内部的更小型设备,涉及美国商务部工业与安全局、国土安全调查局和联邦调查局等多部门协作 [1] - 白宫和国会提议要求美国芯片公司在芯片中嵌入位置验证技术以加强出口管制 [1] Claude Code Opus规划模式 - Claude Code新增"Opus规划模式",在规划阶段调用Claude 4 1 Opus模型,其他任务使用Claude 4 Sonnet模型以兼顾智能分析与效率 [2] - 该功能通过模型选择器或快捷键Shift+Tab切换,Opus权限用户更新后即可使用,结合Opus 4 1的复杂问题分析能力与Sonnet 4的代码生成经济性 [2] 昆仑万维Skywork Deep Research Agent v2 - Skywork Deep Research Agent v2整合多模态检索、理解和生成能力,解决传统文本检索丢失图像信息的问题 [3] - 多模态深度浏览器智能体支持小红书等内容平台分析,在BrowseComp评测中标准模式正确率27 8%,开启"并行思考"模式后提升至38 7%刷新行业纪录 [3] 腾讯混元Hunyuan-GameCraft - Hunyuan-GameCraft开源工具通过输入图片、文字和动作指令生成高清动态游戏视频,支持第一/第三人称视角及多样场景 [4] - 具备连续动作空间、场景一致性记忆增强和免人工建模三大优势,适用于游戏开发原型、视频创作和3D设计展示 [4] 微软AI Agent五大模式 - 微软发布工具使用、反思、规划、多智能体和ReAct五种Agent设计模式,支持快速开发自动化AI员工 [5][6] - Azure AI Foundry提供1400多条连接器,原生支持A2A、MCP等模式,每个智能体绑定Entra ID确保安全 [6] 月之暗面OpenCUA框架 - OpenCUA框架包含计算机使用演示注释基础设施、覆盖三大系统及200+应用的AgentNet数据集和长思维链推理工作流 [7] - OpenCUA-32B模型在CUA基准测试OSWorld-Verified上成功率34 8%,超越开源模型及OpenAI CUA [7] 苹果AI智能家居产品 - 苹果开发桌面机器人(带7英寸屏和15厘米机械臂)、带屏HomePod和智能安防摄像头三类AI产品,预计2026-2027年推出 [8] - 配套开发主动对话AI Siri(代号Linwood)和"Bubbles"视觉形象,运行"Charismatic"新操作系统 [8] 智元机器人Genie Envisioner - Genie Envisioner平台整合未来帧预测、策略学习与仿真评估,包含GE-Base、GE-Act和GE-Sim三大组件,基于3000小时真机数据训练 [9] - GE-Act仅需1小时遥操作数据即可跨平台迁移,长时序任务表现超越现有SOTA方法 [9] 百川智能医疗大模型 - 百川智能团队精简至200人以内,发布Baichuan-M2医疗大模型,HealthBench评测34分超过OpenAI宣称的32分 [10][11] - 聚焦AI家庭医生方向,预计2026年推出消费者服务,认为医疗AI协作需求将早于无人驾驶落地 [11]
检索增强生成(RAG)的版权新关注
腾讯研究院· 2025-08-14 08:33
AIGC 2.0阶段:检索增强生成 - 行业进入AIGC 2.0阶段,从单纯依赖模型训练转向整合第三方权威信息以提升内容准确性、时效性和专业性 [6] - 技术层面称为"检索增强生成"(RAG),结合语言生成模型与信息检索技术,国内大模型厂商已普遍增加该功能 [6] - 典型案例包括亚马逊与《纽约时报》、赫斯特、康泰纳仕等传媒集团合作,OpenAI与《华盛顿邮报》及20多家出版商合作 [3][6] 检索增强生成的崛起原因 - 解决传统大模型"模型幻觉"和"时效断层"两大缺陷,如ChatGPT编造虚假信息导致诽谤诉讼 [8][9] - 无需重新训练模型参数,通过实时外部数据提供准确答案,类似开卷考试模式 [10] - 运行过程分为数据检索收集和内容整合展示两个阶段,涉及海量版权作品利用 [11] 现实版权纠纷案例 - 美国首例RAG版权诉讼:道琼斯和纽约邮报控股诉Perplexity AI,指控其爬取数十万篇付费文章 [14] - 14家全球头部新闻出版商联合起诉加拿大Cohere公司,指控其实时抓取并输出完整原文 [14] - 欧盟法院受理首起生成式AI版权案:匈牙利新闻商Like诉谷歌Gemini侵犯邻接权 [14] - 国内知网与某AI检索平台纠纷,涉及学术文献使用争议 [14] 作品收集涉及的版权问题 - 数据检索阶段可能涉及复制权侵权,分为长期复制和临时复制两种情形 [17] - 构建检索增强数据库时的向量化处理可能构成长期复制,如Perplexity AI案中原告指控 [17] - 实时检索场景下若仅临时保存内容,可能适用文本与数据挖掘例外规则 [17] 技术保护措施问题 - 绕过IP限制或破解动态加载可能违反著作权法"技术措施"规定 [19] - 技术措施分为接触控制措施(如付费墙)和利用控制措施,规避前者构成违法 [20] - 美国《数字千年版权法》第1201条对技术措施提供双重保护体系 [20] 作品利用涉及的侵权问题 - 内容整合展示阶段可能构成直接侵权(复制权、改编权、信息网络传播权)或间接侵权 [22] - 直接侵权认定参考标准:未形成新作品属复制行为,形成新作品属改编行为 [22] - 间接侵权情形包括标注盗版来源扩大传播,或用户后续侵权传播中模型厂商存在过错 [23] 合理使用之争 - 数据检索阶段合理使用认定关键在"市场替代性",盗版内容构建知识库不构成合理使用 [26][27] - 日本区分"非欣赏性利用"和"轻微利用",欧盟要求遵守技术措施作为合理使用前提 [27][28] - 内容展示阶段合理使用核心在于复制比例和注明来源,各国标准不一 [28] - 美国版权局认为提供节略版本而非超链接不太可能构成合理使用 [28]
腾讯研究院AI速递 20250814
腾讯研究院· 2025-08-13 16:01
一、OpenAI投资脑机接口公司挑战Neuralink - OpenAI及Sam Altman将支持脑机接口新公司Merge Labs,预计估值达8.5亿美元,与Neuralink直接竞争 [1] - Altman参与联合创办Merge Labs但不负责日常管理,实现其2017年人机融合愿景 [1] - Merge Labs处于起步阶段,计划利用AI领域最新进展开发更简单实用的脑机接口技术 [1] 二、Claude Sonnet 4解锁百万上下文 - Claude Sonnet 4支持高达100万Token的上下文窗口,容量是之前的5倍,可处理超过75,000行代码或数十篇研究论文 [2] - 定价调整:200K以内每百万Token输入3美元/输出15美元,超过200K部分每百万Token输入6美元/输出22.5美元 [2] - 功能已在亚马逊Bedrock公测,将登陆Google Cloud Vertex AI,被合作伙伴称为"生产级AI工程"能力 [2] 三、昆仑万维开源Skywork UniPic 2.0 - 开源统一多模态模型Skywork UniPic 2.0,实现理解、生图、编辑一体化框架 [3] - 模型包含三核心模块:生图编辑模块、多模态连接器预训练、Flow-GRPO渐进式双任务强化策略 [3] - UniPic2-SD3.5M-Kontext-2B在生图指标上超越12B参数的Flux.dev,编辑效果优于同参数量竞品 [3] 四、Perplexity拟345亿美元收购Chrome - AI初创公司Perplexity向谷歌发出345亿美元全现金收购Chrome浏览器要约 [4] - 报价是Perplexity自身估值(180亿美元)的两倍,时机选在谷歌面临反垄断诉讼关键节点 [4] - Perplexity承诺维护Chromium开源项目并两年内投资超30亿美元,但谷歌表示无意出售 [4] 五、Pika推出音频驱动表演模型 - 新模型能将静态图片与音频结合生成同步视频,实现精确口型同步和自然表情变化 [5] - 平均仅需6秒生成720p高清视频,长度不限,未来可应用于社交媒体、游戏开发和教育领域 [5] - 目前技术限于iOS端并需邀请码,但带来信息真伪辨别新挑战 [5] 六、Figure人形机器人展示衣物折叠能力 - 在原有物流分拣能力基础上仅增加数据即可掌握叠衣服新技能 [6] - 演示中表现出与人类相似的行为(眼神交流、点头确认等),采用端到端视觉-语言-动作模型控制 [6] - 叠衣服是极具挑战的灵巧操作任务,Figure依靠Helix架构实现无需改变原有架构 [6] 七、DeepMind揭秘Genie 3对AGI意义 - Genie 3不仅能生成虚拟世界,更能让世界真实运转并支持智能体训练 [7] - 已开始将Sima智能体放入Genie 3生成世界测试,实现"AI在另一个AI大脑中运行" [7] - 哈萨比斯认为模型评测是关键,Game Arena将成为重要评测基准 [7] 八、Notion CEO谈AI产品开发理念 - AI时代产品应打造"AI工作空间",将AI从工具转变为提供"工作本身" [8] - AI开发像"酿啤酒"而非"造桥",常只能完成70-80%功能,需大量实验而非传统设计流程 [8] - 成功的AI产品需平衡工艺与实用性,7.5分足够,过度追求完美影响商业价值 [8] 九、OpenAI联合创始人谈AI发展趋势 - AI开发进入"基础研究回归"阶段,算法再次成为决定性瓶颈 [9] - 未来AI基础设施需平衡"长时间重度计算"和"实时响应"两种工作负载 [9] - 预测AI生态将"百花齐放",实现经济"10倍增长"需各领域专家深入思考应用方式 [9]
玩梗出圈的“苏超”,为何能扛起刺激消费的大旗?
腾讯研究院· 2025-08-13 08:49
苏超现象的核心驱动因素 - 苏超通过融合地域文化梗(如"楚汉争霸""盐水鸭大战水蜜桃")激活集体身份认同,注册选手中65%为业余爱好者,强化草根参与感[4][6] - 社交媒介(短视频、直播、官方账号互动)构建全民共享情境空间,形成凯尔纳所述的"媒介奇观",推动破圈传播[5] - 赛事设计突出娱乐性与包容性,通过"互写家书""拉歌对唱"等非竞技形式强化城市间互动,形成"散装江苏"的独特文化符号[6] 消费提振的运营逻辑 - 端午小长假期间带动江苏接待游客1242万人次,旅游消费达46.93亿元,常州/南京等地推出"住宿+观赛"套餐等联动优惠[8] - 省级层面系统整合1800余项文旅活动+1300项惠民措施,商务厅配套推出50个夜间消费集聚区,形成"白天看球晚上逛街"闭环[9] - 参照贵州"村超"案例,其两年累计吸引游客1707万人次,旅游收入192亿元,助力榕江迈入GDP百亿县行列[9] 跨区域复制可行性 - 江西/广东等省已效仿启动城市联赛,但需差异化定位(如黔东南民族特色vs江苏城市竞争文化)避免同质化[10] - 成功案例(甘肃麻辣烫/淄博烧烤/蟳埔簪花)显示需结合在地文化符号,通过影游联动(如《黑神话·悟空》山西线)实现流量转化[11] - 地方政府运营思维转向"宣传-文旅-电商"全链路整合,从单纯曝光升级为消费场景构建[11] 新兴消费趋势洞察 - 消费者更愿为参与感/归属感付费,文旅需求呈现深度化(簪花/游神等民俗体验)与近域化(市集/菜场改造)两极分化[12] - 情绪价值成为核心驱动力,需通过短视频/直播构建"情绪场",实现从个体共鸣到群体消费的转化[13] - 未来消费场景需融合文化IP(如苏超的足球激情)、数字媒介放大效应及在地化体验设计[14]
腾讯研究院AI速递 20250813
腾讯研究院· 2025-08-12 16:01
英伟达和AMD芯片出口许可 - 英伟达和AMD同意向美国政府上缴特供中国芯片收入的15%以换取出口许可证 [1] - 英伟达将上缴H20芯片在中国销售收入的15%,AMD上缴MI308芯片相同比例收入 [1] - 美国商务部已开始发放面向中国市场的出口许可证 [1] OpenAI在IOI竞赛表现 - OpenAI在2025年国际信息学奥林匹克AI赛道取得金牌级成绩,在330位人类选手中排名第6 [2] - 仅使用通用推理模型,未针对比赛专门训练,遵守5小时答题时间和50次提交限制 [2] - 成绩从去年第49百分位跃升至第98百分位,展示强大通用推理能力 [2] 智谱开源GLM-4.5V模型 - 开源106B参数视觉推理模型GLM-4.5V,在41个多模态榜单达SOTA性能 [3] - 图像识别与推理测试击败99%人类玩家,创下图寻游戏全球第66名 [3] - 采用三阶段训练策略,支持64K多模态长上下文,API价格低至输入2元/M tokens [3] 昆仑万维开源3D生成模型 - 开源Matrix-3D大模型,可从单张图像生成高质量全景视频和可漫游3D空间 [4] - 具备场景全局一致、生成范围大、高度可控等五大核心优势 [4] - 构建包含116K全景视频、22M全景帧的Matrix-Pano数据集 [4] 腾讯混元多模态模型 - 发布混元Large-Vision模型,采用MoE架构,激活参数52B [5] - 在国际LMArena Vision榜取得1256分,位列国内第一 [6] - 基于数十亿参数视觉编码器和389B参数MoE语言模型构成 [6] GitHub并入微软CoreAI - GitHub将整体并入微软新成立的CoreAI工程集团,不再独立运营 [7] - 由微软开发者部门负责人和AI平台副总裁分管 [7] - 目标是将GitHub打造为"AI智能体工厂" [7] 商汤AI视频工具Seko - 推出全流程视频生成工具Seko,可自动完成剧本理解、镜头拆解等工作 [8] - 基于Agent系统集成文生图、图生视频等多种功能 [8] - 提供可视化成片编辑体验,支持分镜复制和单镜头替换 [8] 苹果Siri升级计划 - 分三阶段重塑Siri,2025年底推出初步"Apple智能" [9] - 基于App Intents框架打通应用间接口,支持屏幕感知和连续对话 [9] - 正与Uber、YouTube等战略伙伴进行内部测试 [9] Periodic Labs材料科学AI - 由OpenAI和DeepMind前成员创立,获2亿美元融资 [10] - 成立3个月即获10亿美元投前估值,OpenAI可能参投 [10] - 目标是构建"用于材料科学的ChatGPT" [11] GPT-5与Claude编程测评 - GPT-5在算法题上token消耗比Claude少90%(8K vs 79K) [12] - Claude在网页开发还原度更高但token消耗更多(140万 vs 90万) [12] - GPT-5完成任务成本约$3.50,Claude约$7.58 [12]