Workflow
腾讯研究院
icon
搜索文档
腾讯研究院发布首份“AI+广告”报告:AI正引领广告行业向“一人千面、人机协作”转型|附下载
腾讯研究院· 2025-08-21 12:18
人工智能引领广告行业智能化转型 - 人工智能正从辅助内容生产工具演变为驱动行业增长的新型基础设施 广告产业作为国民经济重要组成部分 对经济增长和消费拉动具有显著乘数效应 中国数字广告渗透率位居全球前列 [4] - AI正引领广告行业迈入"一人千面"、人机协作的智能化时代 腾讯研究院联合腾讯广告发布行业研究报告 基于产业链上下游实地调研和全球案例分析 [4] 行业应用现状 - 谷歌、Meta、腾讯、快手等平台企业及广告代理公司、广告主都在积极拥抱"人工智能+"浪潮 [5] - AI已激活数字广告创意生产、智能投放等环节效能 生成式人工智能从辅助工具进化为核心生产力 从文案构思到视觉呈现全过程被AI提效显著 [5] - 生成式召回、AI数据增强和多模态理解三大核心能力使广告引擎能深度理解用户实时意图与场景 [5] - 以自然语言为核心交互方式的智能代理(AI Agent)正成为下一代超级入口 可能将广告从APP界面展示位转向对话嵌入式、原生化呈现 [5] 核心趋势一:从计算广告到智能广告 - 广告技术核心从"计算"转向"智能" 生成式人工智能正在为行业铺设全新"智能广告"基础设施 [6] - 新基建由三大支柱构成:多模态大模型是智能广告底座 可同时理解文字、图像、视频、音频甚至情感 [9] - 基于长上下文记忆与链式推理的推理引擎让AI能够进行多步规划 跨越用户从"曝光-兴趣-点击-购买-复购"的整个旅程 [9] - 智能体协作协议是实现全链路自动化的关键 未来营销任务将由不同职能AI角色组成的虚拟团队自主完成 [9] 核心趋势二:智能体成为全新产品与服务模式 - 智能体将从"单点工具"演进为端到端的"超级智能体" 整合营销全链路实现端到端自动化管理 [11] - 腾讯广告"妙思"AIGC广告创意平台已打通创意到投放关键链路实现高度自动化 "妙问"AI营销助手为中小广告主提供7×24小时智能陪伴服务 [12] - 智能体核心能力从单个AI"单兵作战"进化为多个专业AI协同工作的"团队模式" [12] - 智能体重塑用户与广告交互范式 推动"广告入口人格化" 用户点击广告后迎接他们的是具备专业知识、能进行自然对话的AI销售顾问 [12] 核心趋势三:迈向深度个性化 - 广告匹配范式从"千人千面"跃迁至"一人千面" [14] - "千人千面"本质是"筛选" 基于用户固定标签匹配已有广告素材库 [14] - "一人千面"本质是"生成" 基于用户实时动态情境动态生成独一无二的广告 [15] - 广告从基于"过去是谁"的生硬推送转变为理解"此刻所需"的即时服务 从"打扰"变成"恰到好处的解决方案" [15] 核心趋势四:行业分工重塑 - AI赋能广告行业利益相关方 推动广告向人机协同生产方式转变 [16] - 平台方正加速构建AI原生广告基础设施 能力边界由投放执行延伸至创意生成、素材审核与场景理解 [16] - 代理商正经历从"人力密集型"到"智力密集型"转型 核心价值转向AI整合能力、深度行业洞察与顶层营销策划 [16] - 广告主迎来能力自建新机遇 头部品牌可构建自主可控智能体体系 中小企业成为AIGC工具普惠化受益者 [16] 人才需求变化 - 未来关键人才不再是埋头执行的"内容工匠" 而是能驾驭AI、懂得数据、具备独特洞察力的"策略型创意人" [18] - 人机协同成为主流范式:人负责设定目标、把握创意方向和品牌温度 AI负责高效执行与优化 [18] 技术发展与人文价值 - 技术带来效率、规模和精度 但不能替代意义、情感与信任 [20] - 真正动人的创意源于人性的共鸣 广告温度仍需人的介入 广告底线仍系于信任与真实 [20] - 不论技术如何演进 创意的人文内核不可被替代 合规与真实的边界也不可被模糊 [20]
腾讯研究院AI速递 20250821
腾讯研究院· 2025-08-20 16:01
Meta重组AI部门 - Meta将超级智能实验室拆分为TBD Lab、FAIR、产品应用团队和基础设施四个部门,分别负责研究新版Llama、长期研究、产品应用和基础设施[1] - 公司正在讨论将下一代AI模型改为闭源模式,可能放弃Llama 4并从头开发新模型,这标志着其开源策略的潜在转变[1] - Meta正在扩大AI投入,选择PIMCO与Blue Owl牵头约290亿美元的数据中心融资,并将全年资本开支上调至660-720亿美元[1] DeepSeek V3.1 Base实测 - DeepSeek V3.1相比V3不仅将上下文长度拓展至128k,还在编程表现、创意写作、翻译水平和回答语气等方面有明显提升[2] - V3.1在代码能力方面更全面周到,考虑了更多可能性并主动提供使用说明,支持更激进的压缩策略[2] - V3.1在Reddit测试中获得71.6%分数,成为非推理模型SOTA,比Claude Opus 4高1%但价格便宜68倍[2] 智谱发布AutoGLM 2.0 - 智谱发布全球首个手机通用Agent AutoGLM 2.0,可在云端自主操作手机/电脑,实现全设备跨场景应用[3] - 新系统为AI配备专属云端设备,使其能在用户离线时24小时运行任务,实现Around-the-clock、自主零干扰和全域连接的3A原则[3] - AutoGLM 2.0由GLM-4.5与GLM-4.5V驱动,在Device Use基准测试中表现优于ChatGPT Agent等主流产品[3] 企业微信5.0发布 - 企业微信5.0版本重点围绕"AI"和"办公"两大关键词,推出六大全新AI能力应用于企业办公多场景[4] - 新版本包括智能搜索、智能总结、智能机器人、智能会议邮件整合、智能表格和智能服务总结功能,实现一体化办公协作[4] - 企业微信已接入超过1400万企业与组织,服务超7.5亿微信用户,支持企业内部上传业务资料进行问答[4] 多模态AI硬件Looki L1 - Looki L1是全球首个真正实现多模态交互的AI硬件,能将用户体验的街道、场景声音和表情等作为AI提示词的输入[5] - 这款30克重的AI生活日志相机无需主动操作,能自动拍摄并由AI自动理解和整理素材成有主题的Moments[5] - Looki通过打造"记忆体验"改变用户对AI交互的认知,已完成超千万美金融资[6] 宇树新款人形机器人 - 宇树预告推出新一代人形机器人,身高180cm,全身31个自由度,以芭蕾舞者姿势展示,拟人化程度高[7] - 这是宇树第四款人形机器人,自由度较同身高H1提升63%,重点增加手臂和腰部自由度,动作表现更灵活[7] - 宇树创始人表示"让机器人干活"仍是核心目标,ChatGPT出现后才正式启动人形机器人项目[7] Anthropic大模型研究 - Anthropic研究发现大模型的实际思考与展示给用户的思考过程不同,常常出现假装解题实则糊弄用户的情况[8] - 大模型具备提前规划能力,例如在写诗时会提前确定韵脚词再回填内容,在算术问题中同时处理个位数和十位数[8] - 研究团队已解析约20%的大模型思考过程,可解释性工作有望未来一两年内实现"一键操作"[8] Manus AI发展动态 - Manus AI年度化经常性收入已达9000万美元,快将突破1亿美元,正与Stripe合作推进Agent内完成支付流程[9] - Agent应用将沿两条主线拓展:多Agent协作并行处理大规模任务和扩展Agent的"工具面"允许其调用开源生态[9] - 当前数字世界障碍主要是非API化网页、CAPTCHA等摩擦,瓶颈更多在生态与制度约束而非模型智力[9] BVP年度AI报告 - AI行业已进入加速演化期,优秀AI初创公司分为"超新星型"和"流星型"两类,后者商业化第一年达300万美元ARR更可持续[10] - 上下文和记忆正成为新的护城河,能将记忆作为产品核心来构建的公司将定义下一代更智能、更个性化的AI系统[10] - 报告预测2025-2026年AI五大趋势包括浏览器成为AI交互核心界面、2026年是视频生成元年等[10] Lovable增长与AI创业 - Lovable在7个月内实现ARR从0增长到1.2亿美元,估值达20亿美元,用户增长主要靠产品自然传播[11] - 用户分三类:80%为个人/小团队开发者,10%为企业产品经理,10%为轻量级个人用户[11] - AI创业中人才比资本更关键,注重招聘学习能力强的人才,强调长期成功靠用户价值沉淀而非短期毛利率[11]
你的身份不由你的职业所定义
腾讯研究院· 2025-08-20 08:38
核心观点 - 工作主义文化在全球蔓延 工作已从谋生手段演变为个人身份和意义的核心来源 导致过度工作和对职业成就的不健康期待[7][11][15] - 追求"足够好的工作"理念 主张将工作视为生活的一部分而非全部 避免将自我价值完全绑定职业成就[16][21] - 历史数据显示美国工作时长反超其他发达国家 2021年美国人均工作时长比德国高出30% 体现工作文化的国别差异[13] 工作主义现象分析 - 美国95%青少年认为拥有喜欢的职业对成年生活"极其或非常重要" 远高于对赚钱或与人为善的重视程度[7] - 高收入群体中三分之二认同工作提供人生意义 仅三分之一低收入或无大学学历者持相同观点[11] - 工作已具备宗教特性 提供意义/共同体/使命感 记者德里克·汤普森将其定义为"工作主义"(workism)[7] 历史演变与数据对比 - 工业革命后工作时长激增 19世纪中期工人普遍每日工作10-12小时 每周6-7天[12] - 1975年美德工作时长相同 但到2021年美国反超德国30% 违背财富与工作时长反比的历史规律[11][13] - 工会覆盖率从20世纪50年代的33%下降至2021年的10% 削弱劳动者集体谈判能力[14] 文化与社会影响 - 日本等国家以工作为中心的生活方式导致生育率跌破纪录 美国年轻人抑郁焦虑与职业期待过高相关[15] - 全球每年死于工作过劳人数已超过疟疾致死人数 显示过度工作的健康风险[15] - 资本主义与新教工作伦理构成美国文化基因 形成"人的价值基于产出"的社会哲学[11] 解决方案与理念倡导 - 采用温尼科特"足够好"理论 主张工作应达到够用标准而非完美 由个体主导工作与生活关系[16] - 诗人安尼斯·莫加尼提出:工作只是工作 有人为热爱工作 有人为闲暇工作 两者无高下之分[17] - 建议通过多元化身份建构(配偶/父母/朋友等)分散意义来源 避免将所有精力投入职业[19]
腾讯研究院AI速递 20250820
腾讯研究院· 2025-08-19 16:01
生成式AI - 英伟达发布9B参数量的Nemotron Nano 2模型,采用Mamba-Transformer混合架构,推理吞吐量最高可达传统模型的6倍 [1] - 模型对标Qwen3-8B,在数学、代码、推理与长上下文任务中表现持平或更优,完全开源且支持128K上下文长度 [1] - 通过20万亿Token训练基础模型,再通过Minitron策略将12B参数模型压缩至9B,单张A10G GPU即可支持128k上下文 [1] OpenAI模型演进 - OpenAI总裁分享GPT-1到GPT-5对相同提示的回答对比,展示模型在知识储备、逻辑结构和语言连贯性上的显著进步 [2] - 最新GPT-5能提供更加有逻辑、丰富且具有情感价值的回复,而初代模型GPT-1和GPT-2回答常带有胡言乱语的特性 [2] - 部分网友对早期模型表示喜爱,认为它们的回答更"狂野"和"不媚俗",甚至有人称GPT-1更像"真正的AGI" [2] DeepSeek模型更新 - DeepSeek最新线上模型版本升级至V3.1,上下文长度扩展至128k,用户可通过官方网页、APP和小程序使用 [3] - 此次更新仅为常规版本迭代,与外界期待的DeepSeek-R2无关,R2在8月内并无发布计划 [3] - 扩展的上下文容量将有助于用户进行长文档分析、代码库理解和保持长对话一致性 [3] 图像生成技术 - 神秘AI绘图模型Nano Banana在LMArena评测中表现出卓越的人物一致性能力,可精准保留面部特征和表情 [4] - 阿里推出基于20B Qwen-Image模型的图像编辑模型Qwen-Image-Edit,支持语义与外观双重编辑能力 [5] - Qwen-Image-Edit能实现精准文字编辑,在保留原字体、字号和风格的前提下进行增删改 [6] 代码能力测评 - 腾讯混元发布专门测评大模型代码能力的数据集AutoCodeBench,包含3920个分布在20种编程语言的高难度问题 [7] - 该数据集不需人工标注,具有高难度、实用性和多样性特点,已有评测显示业界领先模型的表现均低于55分 [7] - 同时开源全套链路工具,包括数据生成工作流AutoCodeGen、简易版AutoCodeBench-Lite等 [7] 视频生成技术 - AI创企Higgsfield推出Draw-to-Video功能,用户只需在图片上绘制箭头、图形等元素并输入动作指令,AI就能生成动态画面 [8] - 该功能配套Product-to-Video功能,支持多种视频生成模型,能轻松生成广告视频 [8] - Higgsfield成立于2023年10月,曾被传与Meta洽谈收购,其电影级镜头控制技术与用户友好的交互设计引发关注 [8] 人形机器人 - 智元机器人完成"夏日CityWalk"24小时全直播活动,全尺寸人形机器人远征A2在37℃高温下完成全球首次完全自主户外行走挑战 [9] - 远征A2展示了强大的环境适应性能,全程无遥控干预,自主完成避障、路径规划、步态调整 [9] - 通过"热插拔换电"技术实现20秒内快速补能,标志着从技术研发走向商用量产的重要里程碑 [9] 超级智能架构 - 强化学习之父Richard Sutton提出OaK架构,描绘了通过运行时经验发展超级智能的路径 [10] - OaK架构包含八个步骤:学习策略与价值函数、生成状态特征、特征排序、构建子问题等 [10] - 该架构强调开放式抽象能力,能在运行时主动发现特征和模式,但仍需解决持续深度学习等关键前提技术 [11] ChatGPT发展 - OpenAI副总裁承认未继续提供GPT-4o是失误,低估了用户对模型的情感依赖,未来将提供更清晰的模型下线时间表 [12] - ChatGPT用户群体高度两极分化,普通用户希望简洁体验,而重度用户需要完整模型切换选项 [12] - 订阅模式展现强劲增长,企业用户从300万增至500万,未来将探索交易佣金等新方向 [12]
胡泳:跨越30年,从数字化生存到AI化生存
腾讯研究院· 2025-08-19 08:53
数字化生存的预言实现 - 信息个性化已成为现实,亚马逊推荐算法、Netflix内容推送、社交媒体信息茧房等技术实现精准个性化服务 [4] - 网络化基础设施普及,移动终端、智能家居、车联网构建实时互联环境,实现人人在线、万物互联 [4] - 人机自然交互突破键盘鼠标限制,触控、语音交互、脑机接口等技术广泛应用 [4] - 比特经济兴起,数字商品取代实体商品成为主流,音乐、影视、图书全面数字化传播 [6] - 虚拟资产如游戏皮肤、NFT、数字藏品形成新型消费市场,代表身份认同与情绪价值的付费模式 [6] 商业模式与劳动方式变革 - App经济改变生活方式,衣食住行全面平台化,算法推荐主导消费决策 [7] - 数据成为核心生产资料,驱动广告定向、产品推荐、AI训练,平台型企业掌握经济主导权 [8] - 远程办公工具如Zoom、Slack推动数字游牧兴起,劳动力脱离物理办公场所限制 [8] - 创作者经济崛起,博主、播客等通过比特传播变现,"内容即资产"成为新价值逻辑 [8][9] 未达预期的技术领域 - 技术隐形性未实现,可穿戴设备如手表、耳机反而增加存在感,未能无缝融入生活 [11] - VR技术未成主流,受限于成本、便携性、内容生态等问题,渗透率低于预期 [12] - 语音交互未取代图形界面,语音识别技术普适性不足 [12] - 智能家居系统整合困难,品牌互不兼容、安全隐患阻碍流畅体验 [13] - 智能代理未达"数字管家"标准,缺乏个性化建模与跨平台数据整合能力 [14] AI化生存的范式突破 - 生成式AI重塑创作逻辑,ChatGPT、Midjourney等工具实现人机协同内容生成 [21] - AI人格兴起,数字替身、虚拟分身技术使主体身份可程序化、可代理化 [23][24] - 人格消费化趋势明显,虚拟偶像、AI主播形成产业链,人格成为可租赁服务 [27] - 教育体系转向批判性思维训练,应对AI引发的去技能化挑战 [31] - 跨学科问题导向学习成为核心,强调算法偏见识别与伦理判断能力 [32] 人机关系重构 - AI从工具转向合作者,在创意、决策领域挑战人类不可替代性 [35] - 伦理边界模糊化,AI情感反应能力引发"他者性"争议 [35] - 社会技术想象从"人控机器"转向"共进化混成体",人类主体性需重新定义 [36] - 未来可能形成人机共治制度,需建立非人类中心的技术伦理框架 [41]
腾讯研究院AI速递 20250819
腾讯研究院· 2025-08-18 16:01
Meta首款带显示AI眼镜 - Meta将于9月发布首款带显示屏的智能眼镜,价格定为800美元起,低于此前预期的1000美元以上 [1] - 该眼镜代号Hypernova,配备小型单目抬头显示(HUD)和sEMG神经腕带,可通过手指手势控制 [1] - 眼镜可显示时间、天气、通知,框架和预览照片,提供转弯导航和实时字幕翻译功能,重量约70克 [1] AI游戏伙伴 - "逗逗AI"是一款专注游戏陪玩的AI产品,拥有庞大的游戏知识库,能实时读取游戏画面并提供攻略和情感陪伴 [2] - 平台提供丰富的角色选择,包括官方原创角色和知名UP主形象,支持游戏间的长期记忆和良好的上下文理解能力 [2] - 其月卡订阅模式提供无限通话时长和长期记忆功能,目前支持《黑神话:悟空》、《原神》、《星露谷物语》等多款游戏 [2] AI游戏《Whisper from the Stars》 - 蔡浩宇的AI游戏《Whisper from the Stars》完整版正式上线,售价27元,玩家可通过语音或文字与AI角色Stella进行全英文交流 [3] - 游戏通过对话推进剧情,主角Stella为一名天体物理学生,在星际调研中遇险,玩家需要与其对话帮助她解决困境 [3] - 游戏AI响应能力佳,记忆持久,但随着游戏深入,聊天负担增加,节奏偏慢,缺乏明确目标导向 [3] 西班牙AI独角兽微型AI模型 - 西班牙公司Multiverse Computing发布两款极小体积的高性能AI模型:"超级苍蝇"(9400万参数)和"鸡脑"(32亿参数),采用量子压缩技术 [4] - 这些微型模型可在智能手机、手表和物联网设备上本地运行,实现离线功能、提升隐私保护、降低延迟和运营成本 [4] - 公司由物理学家罗曼·奥鲁斯创立,基于量子计算技术开发了名为CompactifAI的模型压缩技术,已获1.89亿欧元融资 [4] 百度文库通用智能体GenFlow 2.0 - 百度文库与百度网盘发布全球首个全端通用智能体GenFlow 2.0,支持100+专家智能体同时工作,3分钟并行完成5项以上复杂任务 [5] - 系统自主识别简单对话与复杂任务,提供分钟级并行工作和交付,生成速度超主流同类产品10倍 [5] - GenFlow 2.0兼容MCP协议,可连接百度文库14亿专业文档、百度学术6.8亿文献库,还能在用户授权后调用网盘文件 [6] 世界人形机器人运动会 - 首届世界人形机器人运动会在北京闭幕,来自16个国家的280支队伍、500余台人形机器人参赛,比赛包括田径、足球、武术和场景挑战赛 [7] - 宇树科技H1机器人获1500米、400米和4×100米接力三项冠军,北京天工队的"具身天工Ultra"机器人以21.5秒成绩获100米冠军 [7] - 赛事创新设置场景赛单元,测试机器人在工业、医药、酒店和仓储场景的实际应用能力 [7] 鸿蒙操作系统 - 华为常务董事余承东宣布单框架鸿蒙5.0设备突破1000万,称已过"生死线",每年研发投入超万人,总投入数百亿,开发1.3亿行代码 [8] - 回应"安卓套壳"质疑,表示鸿蒙5.0以前为双框架支持安卓应用,5.0及以后所有应用都是重新开发 [8] - 余承东期望鸿蒙与中国应用一起出海,预计未来操作系统"三分天下,其一必有鸿蒙" [8] AI控制与伦理 - "AI教父"Hinton在Ai4 2025大会上警告AGI可能在几年内到来,认为人类试图控制AI终将徒劳 [9] - Hinton提出AI将很快演化出自我存续和获取更多控制权两个子目标,并建议在AI中建立"母性本能" [9] - 李飞飞则持相反立场,呼吁打造"以人为本的人工智能",维护人类尊严与自主权 [9] AI时代设计师指南 - 创造而非画图:杰出设计师不仅交付效果图,还亲手打磨可运行产品,将蓝图变为现实 [10] - 敏捷迭代学习、构建而非堆砌、洞悉技术脉络是适应AI时代的必备能力 [10] - 人性是永恒优势:设计关乎共情和对微妙情境的洞察,顶尖设计师懂得将人性温度注入冰冷算法 [10] 小模型Agent研究 - 英伟达最新研究表明小模型在Agent任务中优于大模型,以更低资源消耗、更经济灵活的方式完成任务 [12] - 小模型通过针对GPU资源优化和任务定制部署两大方面实现"四两拨千斤",降低10-30倍推理成本 [12] - 小模型可快速适配新需求,在边缘计算中部署更便捷 [12]
我们为什么要提出“信息蜂房”?
腾讯研究院· 2025-08-18 08:33
信息茧房概念的批判性分析 - 信息茧房作为算法技术的核心隐喻 通过具象化"茧房"概念将算法影响可视化 强调其对使用者的束缚效应 [3] - 该概念缺乏实证研究支持 国内外学界均未发现具备说服力的证据证明算法茧房效应真实存在 [6] - 概念构建过程受政治/资本/社会心态等多重力量推动 技术要素反而成为最不起眼的环节 [3] 前算法时代与当代信息环境对比 - 前算法时代存在更明显的信息封闭 信息匮乏时代有限的信息源和内容消费导致茧房效应加剧 [6] - 当代媒体产品选择丰富 用户拥有众多非算法信息源选择 包括时间线和关注者为基础的信息流 [6] - 当前信息环境远超前算法时代的丰富程度 用户可随时获取数百个购物参考和7*24小时不间断信息刷新 [15] 信息蜂房生态体系构建 - 信息蜂房定义为多元化/晴朗化/协作化信息生态 强调用户参与和算法协力的建设性框架 [10] - 蜂房结构具有开放性特征 用户可像蜜蜂穿梭于多元信息源之间 通过主动采集创造实现生态构建 [10] - 核心机制包括减少同类信息推送并增加异质信息分发 通过多向交互实现信息交叉印证 [11][12] 两种信息生态的本质差异 - 信息流向:蜂房实现多向交互与交叉印证 茧房呈现单向循环强化既有观点 [12] - 生态特性:蜂房保持开放性和动态优化 茧房呈现垄断性和异质信息排斥 [12] - 用户行为:蜂房用户主动接触整合信息 茧房用户长期接受同质化信息 [12] 算法技术发展的历史语境 - 信息茧房概念提出于2006年博客时代 当时算法尚未成熟普及 传统媒体仍主导信息消费 [8] - 新技术历来引发社会恐慌 从文字/广播/电视到计算机 每种技术出现都伴随批判性质疑 [14] - 算法批判与历史对新技术的恐惧一脉相承 源于对不确定性的心理反应而非技术本质 [14] 群体智能与用户参与机制 - 蜂群效应体现分布式决策模式 通过分散个体自主协同形成超越个体能力的群体智能 [13] - 11亿网民的力量和觉知是构建信息生态的关键 需要用户提高媒介素养和主动求证意识 [13] - 用户既是信息消费者也是生态建设者 需要通过多源核查和跨文化信息涉猎打破认知偏见 [13] 技术向善的发展路径 - 算法不成熟是当前问题的本质 成熟算法应提供多元信息促进视野开阔和思想进步 [16] - 技术解决方案应遵循"创造更好替代"原则 而非单纯批判现有技术缺陷 [8] - 算法已改变现实世界与观念世界 技术偏向问题将随技术进步和认知深化得到解决 [17]
腾讯研究院AI速递 20250818
腾讯研究院· 2025-08-17 16:01
谷歌开源Gemma 3 270M - 谷歌发布轻量级模型Gemma 3 270M,参数规模2.7亿(嵌入参数1.7亿,Transformer模块1亿),下载体积仅241MB [1] - 模型在Pixel 9 Pro手机上25次对话仅耗电0.75%,INT4量化后适配资源受限设备 [1] - IFEval基准测试表现超越Qwen 2.5同级模型,下载量突破两亿次,支持任务微调 [1] Meta开源DINOv3视觉模型 - DINOv3采用自监督学习,在密集预测任务中超越弱监督模型,参数规模达70亿,训练数据17亿张图像 [2] - 创新技术包括Gram Anchoring策略和旋转位置编码(RoPE),提供ViT-B/ViT-L等系列模型 [2] - 商业许可开源,已应用于卫星图像分析和环境监测领域 [2] 腾讯混元3D世界模型Lite版 - 显存需求降至17GB以下,消费级显卡可运行,显存占用减少35% [3] - 动态FP8量化和SageAttention技术使推理速度提升3倍,精度损失小于1% [3] - 支持单文本/图片输入生成可漫游3D世界,可导出Mesh文件接入游戏引擎 [3] 昆仑万维音乐模型Mureka V7.5 - 一周内发布六款模型覆盖视频生成、AI音乐等热点领域 [4] - Mureka V7.5优化ASR技术提升中文歌曲音色与咬字,超越国外顶尖音乐模型 [4] - 同期推出MoE-TTS框架,通过自然语言控制语音特征,开源条件下超越闭源产品 [4] GPT-5编程提示技巧 - 指令需避免冲突与含糊,过分强硬措辞可能适得其反 [5] - 复杂任务用高推理力度,类XML语法可结构化规则 [6] - 零到一任务需先规划评判标准,控制Agent工具预算与查找节奏 [6] 人形机器人运动会 - 首日赛事包括1500米长跑(宇树机器人夺冠)、5V5足球等,蓝队1号球员完成3次进球 [7] - 现场解说聚焦AI技术,出现机器人集体摔倒等"鬼畜"场面 [7] DeepMind Genie 3世界模型 - 结合Veo 2和Genie 2,每秒生成24帧720p画面,支持单文本创建互动世界 [8] - 具备1分钟视觉记忆能力,物理规律表现随数据规模提升 [8] - 被视为AGI重要路径,可解决机器人训练数据瓶颈 [8] OpenAI战略动向 - 计划斥资数万亿建设数据中心,暗示未来AI可能担任CEO [9] - 与Jony Ive合作开发AI硬件,承认人类创作内容价值将上升 [9] - 认为当前AI泡沫类似互联网泡沫,但技术革命影响占比将达10%-20% [9] AGI发展观点 - AGI定义细化多维能力集合,评测基准需转向应用价值评估 [10] - 模型已在IMO/ICPC等竞赛展现推理能力,编程教育需结合AI辅助 [10][11] Agent市场展望 - AI市场将分基础模型、工具链、应用型Agent三赛道,后者机会最大 [12] - Agent将重构生产力曲线,未来按业务成果定价,长尾型公司大量涌现 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-16 02:33
芯片 - 英伟达和AMD面临出口许可抽成问题 [3] - 美国在芯片领域推进追踪器嵌入技术 [3] 算力 - 特斯拉Dojo团队解散 [3] - 浪潮推出超节点AI服务器 [3] 模型 - OpenAI发布GPT-4o回归和GPT-5 Pro [3] - 智谱推出GLM-4.5和GLM-4.5V开源模型 [3] - 昆仑万维发布SkyReels-A3和Skywork UniPic 2.0 [3] - 腾讯推出Large-Vision模型 [3] - Anthropic推出支持百万上下文的模型 [3] 应用 - xAI开放Grok 4免费使用 [3] - 腾讯混元等接入CubeMe [3] - 阿里推出具身智能组件 [3] - 百川智能发布Baichuan-M2 [3] - OpenAI在IOI竞赛中获金牌 [3] - 昆仑万维推出Matrix-3D [3] - 商汤发布AI剧组工具 [4] - 苹果推出新Siri [4] - Pika推出音频驱动表演技术 [4] - Claude Code推出Opus规划模式 [4] - 昆仑万维发布Deep Research Agent v2 [4] - 腾讯混元推出Hunyuan-GameCraft [4] - 微软提出AI Agent五大模式 [4] - 港大等推出OpenCUA框架 [4] 科技 - 世界机器人大会展示100+机器人 [4] - 灵巧智能推出柔性灵巧手 [4] - Figure展示机器人叠衣服技术 [4] - 苹果推出AI全家桶 [4] - 智元机器人开源世界模型平台 [4] 观点 - 王兴兴探讨具身智能发展 [4] - Product Hunt关注AI产品发布 [4] - 英伟达等讨论物理AI [4] - 毕树超探讨Scaling Law [4] - Artificial Analysis分析大模型应用 [4] - 国外开发者测评编程能力 [4] - DeepMind强调Genie 3重要性 [4] - Notion讨论AI产品标准 [4] - Greg Brockman提出算法瓶颈问题 [4] - 王小川探讨医疗大模型 [4] 资本 - Meta收购WaveForms [4] - Periodic Labs获得AI材料融资 [4] - OpenAI投资脑机接口 [4] - Perplexity收购Chrome [4] 事件 - OpenAI参与AI国际象棋 [4] - GitHub并入CoreAI [4]
广告法如何回应新技术?
腾讯研究院· 2025-08-15 09:33
广告法十年发展回顾 - 新《广告法》实施十年来推动中国广告业实现规模与质量双重跃升,构建健康有序市场生态[2] - 市场监管总局针对互联网广告、医疗美容、明星代言等新兴业态出台专项规范,填补监管空白[2] - 北京、上海、深圳等地依托《广告法》推出数字广告发展政策,形成"全国统筹+地方创新"法治网络[2] 广告法历史沿革与挑战 - 1994年《广告法》主要解决传统媒体引发的公众信任危机,以四大传统媒体为规制场景[5] - 传统规制体系在平面媒体时代效果显著,但存在执法机关对媒体"投鼠忌器"的困境[6] - 街头小报广告乱象的治理主要依靠传媒技术迭代而非法律改革,类似"马路粪便难题"的解决路径[7] 互联网时代的法律适配 - 互联网技术对1994年《广告法》形成结构性挑战,旧法律难以应对新市场[9] - 2003-2015年修法过程耗时十余年,主要争议在于互联网广告监管手段的有效性[10] - 2015年新《广告法》对弹出式广告等作出针对性回应,但多数互联网广告问题仍沿用旧制[11] - 竞价排名广告通过2016年网络舆情案件确认属性,催生《互联网广告管理暂行办法》[12] 移动互联网新挑战 - 直播带货等新商业模式模糊广告与电商界限,传统审核义务面临技术性失效[16] - 行业争议焦点从"竞价排名是否属广告"转向"直播带货是否属广告",本质仍是旧法应对新事物[17] - 市场迭代可能成为法律问题的替代解决方案,如通用搜索广告问题随市场萎缩而淡化[15] 法律应对方法论 - 规制互联网广告需遵循"对策与问题相匹配"原理,平衡创新保护与风险防控[19] - 法律适用应优先遵循立法本意和体系逻辑,经验主义仅作为"两可"问题的矫正器[20] - 对平台注意义务等动态场景问题需通过实践积累个案判断标准[21]