Workflow
腾讯研究院
icon
搜索文档
腾讯研究院AI速递 20250904
腾讯研究院· 2025-09-03 16:01
OpenAI战略收购与计划 - OpenAI以11亿美元收购软件实验和分析平台Statsig 显示公司战略重心从纯底层模型研发转向打造数据驱动的终端用户产品 [1] - 任命Statsig创始人Vijaye Raji为OpenAI应用部门新CTO 其拥有微软十年和Meta十年高管经验 将直接向OpenAI应用CEO Fidji Simo汇报 [1] - OpenAI首席产品官宣布启动"OpenAI for Science"计划 将组建由顶尖学者组成的团队打造AI驱动的科学发现平台 [4] - GPT-5在科学领域展示四个案例 包括17分钟优化凸优化边界值 推导量子场论证明过程 优化诺贝尔奖级蛋白质设计等 [4] Anthropic融资与增长 - Anthropic完成130亿美元F轮融资 投后估值达1830亿美元 成为全球第三大AI独角兽 仅次于OpenAI和字节跳动 [2] - 公司年化收入从年初10亿美元飙升至50亿美元 服务超30万企业客户 [2] - 增长主要动力来自AI编程神器Claude Code 其三个月使用量增长10倍 [2] - 公司已完成9轮融资总额达300亿美元 本轮由ICONIQ、Fidelity和Lightspeed领投 新资金将用于扩大企业采用规模和国际扩张 [2] 谷歌AI图像生成技术突破 - 谷歌发布nano banana(Gemini 2.5 Flash Image)官方Prompt模板 覆盖写实摄影、贴纸、文本渲染、商业摄影、留白设计和漫画六大场景 [3] - 模板强调像讲故事一样描述场景 详细指定摄影参数、配色方案、风格特点和构图细节以生成高质量图像 [3] - 用户可直接套用模板并通过Python代码调用API生成图像 解决生成图片风格不统一和品质不佳问题 [3] 教育行业AI应用创新 - Midoo.AI发布全球首个语言学习Agent 致力解决教育行业学习效果交付成本高和千人千面难规模化困境 [5] - 平台通过动态个性化内容、沉浸式场景和学习伙伴系统 建立由剧情主线、可互动物品和符合人设NPC组成的MultiAgent+Workflow系统 [5] - 创始团队由TalkAI创始人和前Fellou.ai联合创始人组成 定位语言学习赛道 先聚焦日韩和北美市场再拓展全球 [6] 人机交互与浏览器革新 - 加州大学圣地亚哥分校推出Orca浏览器 将传统标签页转变为可随意拖拽和并排比较的无限空间化画布 用户可同时操作多个网页 [7] - Orca支持大规模查看、管理、导航和提取功能 用户可部署调度不同智能体完成情境任务 每个智能体通过不同颜色虚拟光标方便追踪 [7] - 用户实验表明Orca显著降低管理多页面的成本 激发更强探索欲望 用户对信息来源有更强控制力且更信任结果 [7] 军事与机器人技术进展 - 四足机器狗加装武器或侦察设备进化为"机器狼"无人作战装备 在九三阅兵亮相 可远程操控、自主行动和灵活编组 [8] - 设备使用国产化芯片 配置两颗激光雷达和5个环视相机实现360度全视角感知 可扛起20公斤物体并在废墟上灵活移动 [8] - 作战群由1辆控制车和多型四足机器狗组成 实现人-车-狼互联互通 头狼负责侦察 射手负责打击 综合保障型运载物资和弹药 [8] 物理仿真平台突破 - RoboScience发布高精度通用物理仿真平台RoboMirage 支持刚体、软体和关节体的多样接触和强耦合仿真 无穿透且具时间一致性 [9] - 平台成功仿真明日环、橡皮筋穿越和洗扑克牌等复杂魔术场景 并完成迄今最复杂的具身操作任务家具拼装 [9] - 平台优势包括全类型兼容的接触建模框架、高真实感的多体动力学能力、工业级稳定算法和先进GPU加速技术 为具身智能提供基础设施 [9] AI产品管理范式转变 - AI产品与传统产品根本不同 边际成本随用户增长同步攀升 同质化威胁随时降临 产品经理需从第一性原理重新思考 [10] - AI产品策略核心阶段包括选择正确护城河(数据、分发、信任)、实现差异化、构建成本可控产品架构、平衡增长与成本、将AI融入组织文化 [10] - 需建立结构化实验文化 通过为期两周的"AI冲刺"测试明确假设 设定特定评估指标并果断决策扩展或终止实验 不具备AI战略能力的产品经理将在5年内被淘汰 [10]
腾讯研究院AI速递 20250903
腾讯研究院· 2025-09-02 16:01
谷歌Gemini技术升级 - 谷歌Gemini API全面上线URL Context功能 支持深度访问和处理网页 PDF 图像等内容 采用两步检索流程 可解析PDF表格 文本结构 脚注等 处理容量上限达34MB 单次请求最多处理20个URL [1] - 该功能无需提取 分块 矢量化和存储等繁琐流程 直接解析50页PDF并精准提取数据 被评价为RAG的又一颗棺材钉 [1] 腾讯混元世界模型进展 - 腾讯发布混元3D世界模型HunyuanWorld-Voyager 是业界首个支持原生3D重建的超长漫游世界模型 能生成长距离 世界一致的漫游场景 支持视频直接导出为3D格式 [2] - 该模型在斯坦福大学WorldScore基准测试中位居综合能力首位 支持视频场景重建 3D物体纹理生成等多种应用 [2] Runway融资与业务拓展 - 视觉生成AI公司Runway获英伟达 谷歌和General Atlantic等投资者超5亿美元融资 估值达30亿美元 正式跨界机器人领域 [3] - Runway的AI世界模型可为机器人和自动驾驶汽车公司提供训练模拟 实现高效 低成本的虚拟测试环境 相比真实场景训练 用户能更精细地控制特定变量测试 [3] 腾讯优图开源智能体框架 - 腾讯优图实验室开源Youtu-Agent智能体框架 具备开源友好 成本低 灵活架构和自动智能体生成等特点 [4] - 该框架在WebWalkerQA基准上使用DeepSeek-V3.1达到71.47%准确率刷新开源效果SOTA 在GAIA文本子集达到72.8% 无需充值闭源模型 [4] - 框架采用DITA原则 提供四个典型应用案例 本地文件管理 数据分析 论文分析和广域综述 支持一键生成配置和启动测试 [4] AI游戏与模拟应用 - flowith团队发布基于多模态画布和Nano Banana技术的AI人生模拟器flolife.me 玩家可捏造角色后由AI接管整个人生模拟 [5] - 游戏流程包括输入角色名字 性别 出生地并分配属性 设置人格描述 系统自动生成完整人生线和分支选项 还能生成高光瞬间制作分享海报 [6] - 香港科技大学Aivilization小镇项目可创建自定义AI人物 设置MBTI性格与目标 在虚拟小镇生活成长 但评价体系单一 以金钱排名为唯一衡量标准 [7] - 顶尖玩家通过挖矿积累初始资金 升级房子后制造芯片 实现每天67680金币的被动收入 远超读书 休闲等生活方式的收益 [7] 智谱AI模型性能突破 - 智谱开源的GLM-4.5在伯克利工具调用排行榜上超越Claude Opus 4.1 运行相同任务的成本仅为对手的1.4% [8] - 该模型使用MoE架构 在CC-Bench评测体系中表现强劲 尤其在任务完成效果和工具调用可靠性方面 推理速度比Opus 4.1快3倍 比GPT-5快5倍 [8] - GLM-4.5已接入Claude Code Cline Gemini CLI等多款主流编程工具 价格仅为Claude的1/7 [8] 脑机接口技术突破 - 加州大学洛杉矶分校团队开发AI辅助非侵入性脑机接口系统 让瘫痪受试者在移动计算机光标任务中的表现提升近4倍 [9] - 系统采用AI副驾驶模式 人类专注决策 AI完成预测和辅助修正 能推断用户目标并实时辅助执行 [9] - 瘫痪参与者使用AI副驾驶系统可将光标控制接入时间从4.15秒减至0.05秒 机械臂任务正确放置率从0提高至93% [9] 特斯拉战略规划 - 马斯克发布《宏伟蓝图4》 宣布特斯拉未来80%价值将来自机器人Optimus 核心在于将AI引入真实物理世界 [10] - 蓝图4阐述五大核心原则 增长是无限的 创新消除限制 技术解决实际问题 自动化必须造福全人类 更广普及带来更大增长 [10] - 与前三次蓝图相比 蓝图4更加注重AI作为核心驱动力 汽车被视为机器人生态中的特例 一个特定场景下的轮式机器人 [11] AI教育应用现状 - 美国千人高校调查显示 85%学生在学习中使用AI 主要用于头脑风暴55% 问答50%和考试备考46% 而非单纯偷懒 [12] - 97%学生认为院校应积极应对AI带来的学术诚信挑战 但不支持使用AI检测软件21%或限制技术使用18% 而是希望学校提供AI合理使用教育53% [12] - 55%使用AI的学生认为AI对学习能力和批判性思维好坏参半 23%学生认为AI提升了高等教育价值 仅18%表示更质疑大学价值 [12]
所有人都在谈“人工智能+”,到底怎么落地?
腾讯研究院· 2025-09-02 08:23
人工智能+与互联网+的差异 - 技术阶段不同 互联网+期间数字技术已步入成熟阶段 技术框架和应用模式相对稳定 而人工智能+立足的技术仍处在快速迭代期 技术路线和应用产品不确定性强 需要较大的试错空间 [7] - 技术迭代异常迅速 GPT-3到GPT-4.5等模型更新周期已从月缩至日 SOTA记录保持时间缩短至按周计算 [8] - 能力边界持续扩展 DeepSeek-R1以来 Open AI 谷歌 xAI等模型更新明显加速 平均1.5天就有一次重大迭代 [8] - 产品形态多处于中间态 在通用工具和专业解决方案之间摇摆 新旧界面和交互模式共存 [8] - 价值层次不同 互联网+本质是连接增强 核心驱动在于追求网络效应 人工智能+本质则是计算增强 核心驱动深入到节点本身 通过重构智能创造和分配方式提升每个节点的生产力 [10] - 人工智能扩大人类的认知能力 自主能力足够强的AI将形成1+N人与AI互联协作的新范式 [10] - AI对生产力的效应呈阶跃式发展趋势 AI Agent任务完成能力每7个月翻一番 [11] - 普华永道2025年预测AI有可能在未来十年内推动全球经济规模增长15% [11] - 扩散路径不同 互联网遵循消费端到生产端的扩散路径 人工智能则更多遵循生产端到消费端的扩散路径 [12] - 海外近百家头部AI初创公司中 企业应用占比最高为46% 消费者应用仅占6.5% [12] - 人工智能+可能在某些特定行业呈现跃迁式进入 而在制造等产业链条长而复杂的领域则需要更长的适应期 [13] 人工智能+的企业实践探索 - 应用牵引 优先选择数据充足 风险可控 可量化且可扩展复制的用例 快速验证AI的应用价值 [17] - 辉瑞公司将大模型的首个用例定位在为科学家赋能上 1500名科学家在整理数据上所花费的时间缩短80% 基础设施成本降低55% 药品从原型到最小可行产品的周期从数月缩短至数周 [17] - 模型实用 通过工程化构建生产级AI系统 采取提示工程 检索增强生成 微调等一种或多种方式组合 [18] - 大模型+知识库+检索增强生成是企业落地AI的最佳路径之一 [18] - 国际快递公司DHL应用腾讯云知识引擎 编排了45条企业专属工作流 大幅降低AI技术应用门槛和沟通成本 [18] - 企业构建AI数据集的核心逻辑应聚焦为业务而数据 将数据策略深度融入AI应用的全生命周期 [19] - 数据标注公司Scale AI构建企业生成式AI应用平台 帮助企业利用自身数据定制模型应用 实现数据模型协同进化 [19] - 算力云化 借助第三方提供的大规模高性能云计算基础设施和高速网络服务 企业能够依据AI任务特点按需灵活调用算力 [20] - 西班牙石油公司Cepsa采用亚马逊AWS云计算服务 构建标准化MLOps架构 项目平均工期缩短25% 每年可节省约30万欧元成本 [20] 推动人工智能+的建议 - 从顶层设计营造人工智能+创新环境 构建拥抱不确定性 鼓励多元探索 宽容失败的创新生态系统 [22] - 以包容审慎态度推动AI应用繁荣 鼓励更多个人开发者和创业团队在AI搜索 AI编程等领域的应用开发 [23] - 培育有利于长期投资的市场环境 引导国资创投和企业风投加大对大模型细分领域的投资力度 [23] - 支持AI企业走出去参与全球市场竞争 并积极吸收美国在通用平台工具方面的成功经验 [24] - 多层次推动行业大模型应用可持续发展 系统构建数据要素市场 培育数据治理专业服务市场 [25] - 促进行业应用场景市场开放 鼓励大中小企业 产学研联合创新 扩展采用公有云方式部署AI应用范围 [25] - 突破市场分割和技术封闭问题 按照全国统一大市场原则 着力培育从基础模型到行业应用的完整生态链 [25]
腾讯研究院AI速递 20250902
腾讯研究院· 2025-09-01 16:01
Meta与Scale AI合作破裂及高管变动 - Meta与Scale AI合作仅两个月后出现裂痕 随Scale AI前CEO进入Meta的高管Ruben Mayer已离职[1] - Meta内部研究人员抱怨Scale AI数据质量过低 公司转向与Scale AI竞争对手Mercor和Surge合作[1] - Meta完成143亿天价挖人后多次重组AI部门 Scale AI失去Meta支持后丢失OpenAI和谷歌等大客户并经历大规模裁员[1] Anthropic模型性能问题与修复 - Claude Opus 4.1在上午10-11点期间出现性能显著下降 处理文稿任务频繁出错且仅白天发生[2] - 分析认为性能下降可能因Anthropic采用1.58位量化(仅用-1/0/1三个值表示参数)导致模型丢失关键信息[2] - Anthropic官方承认推理堆栈问题 本意为提升模型效率却影响响应质量 已将Claude Opus 4.1和4.0版本回滚[2] 腾讯混元翻译模型开源与技术突破 - 腾讯开源7B参数翻译模型Hunyuan-MT-7B 支持33个语种和5种民汉语言/方言互译 在WMT2025比赛31个语种中获30个第一[3] - 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B 能根据原文和多个翻译模型结果生成更优翻译[3] - 模型采用AngelSlim压缩工具进行FP8量化 推理性能提升30% 已接入腾讯会议/企业微信/QQ浏览器等业务[3] 阶跃星辰语音大模型发布与性能表现 - 阶跃星辰发布端到端语音大模型Step-Audio 2 mini 统一建模语音理解/音频推理与生成 支持语音原生Tool Calling能力[4] - 模型在MMAU基准测试获73.2分位列开源端到端语音模型榜首 中英互译和语音识别任务大幅领先其他模型[4] - 采用真端到端多模态架构 引入链式思维推理与强化学习联合优化 可精细理解情绪/语调/音乐等副语言和非语音信号[4] 书生·万象3.5模型升级与技术特性 - 上海AI实验室开源发布书生·万象InternVL3.5系列模型 包含10亿至2410亿参数九种尺寸 通用能力/推理能力和部署效率全面升级[5] - 旗舰模型InternVL3.5-241B-A28B在多项基准超越GPT-5 MMMU获77.7分(开源最高) 通过级联式强化学习将推理性能较上代提升16.0分[5][6] - 创新引入动态视觉分辨率路由与解耦部署框架 单次推理延迟由369ms缩短至91ms(提升约4倍) 增强GUI智能体/具身空间推理等核心能力[6] 韩国AI玩偶应用与养老解决方案 - 韩国政府向数万名独居老人分发Hyodol开发的AI玩偶 具备24小时陪伴聊天/提醒吃饭服药/健康监测功能[7] - 玩偶内置基于ChatGPT的对话系统 颈部红外传感器检测动作 胸部麦克风记录老人日常回答 紧急情况下可通知护工[7] - 已有1.2万多台Hyodol玩偶在韩国独居老人家服务 每台售价约8160人民币 远低于护理人员成本 有效缓解养老护理人员缺口[7] AI生成内容标识新规实施与平台响应 - 《人工智能生成合成内容标识办法》9月1日正式实施 要求AI生成的视频/语音/文字/图片必须添加身份标签[8] - 生成合成服务提供者需添加显式和隐式标识 传播服务提供者需核验元数据并加注提示[8] - 腾讯/抖音/快手/B站/DeepSeek等平台已发布细化规则 为AI内容添加明显标识并提供标识功能 禁止用户删除或篡改标识[8] 具身智能强化学习框架开源与技术突破 - 清华大学/北京中关村学院/无问芯穹联合发布RLinf框架 为首个面向具身智能的渲训推一体化大规模强化学习框架[9] - 提出混合式执行模式和宏工作流到微执行流的映射机制(M2Flow) 在具身智能训练场景下实现超120%系统提速[9] - 集成Megatron+SGLang/vLLM和FSDP+HuggingFace两套后端 专为大小脑不同训练需求设计 搭载自适应通信库和自动调度模块[9] DeepSeek模型训练细节披露与合规响应 - DeepSeek发布官方公告响应《人工智能生成合成内容标识办法》 承诺给AI生成内容添加标识并警示用户勿删改[10] - 首次公开《模型原理与训练方法说明》 披露DeepSeek-V3/R1训练细节包括6850亿参数规模/预训练与优化训练流程[10] - 详细披露数据治理体系 采用过滤器自动剔除有害内容 对用户提供知情权/选择权与控制权 承认模型幻觉仍是全行业难题[10]
段永朝:在AI缔造的新知识时代,刷题和应试将不再有意义
腾讯研究院· 2025-09-01 09:04
大模型技术发展阶段 - 当前大模型处于技术初级阶段 表现为有问必答且从不承认不知道的"话痨"特性[2] AI对认知模式的影响 - 个体知识独立性下降 对群体智慧依附性上升 认知负担转移至大模型外脑[2][5] - 个人自主判断信心下降 因信息过载使参考资料获取量从几百篇跃升至百万篇[6] - 外脑侵入性增强 大模型会强行输出答案形成干扰[6] 群体智慧形态升级 - AI实现群体智慧化学层面准实时融合 超越物理层面非实时聚合[5] 教育体系变革 - 传统通识教育作为知识预训练过程可被大模型大幅缩短[2] 未来经济模式重构 - 经济逻辑从交易中心转向以个人意愿(intention)为中心[7][15] - 运行模式从生产-消费-分配串行逻辑转变为三者并发的并发逻辑[7][15] - 生产环节成为无人化公共事业[7][15] 人机关系重构 - 需以几十年尺度看待人机关系 量子计算前为关键窗口期[9] - 需想象机器生命新物种构成的机器世界新框架[10] - 未来人类将处于纯种人与赛博格间的模糊地带[2][10] 生产要素变革 - 人类物理劳动退出生产要素 活动转向精神与创造领域[2][15] 技术天花板限制 - 当前计算技术存在算力天花板 受能源和物理器件限制[14] 新经济基础设施 - VRM(Vendor Relationship Management)成为意愿经济核心技术[15] - 所有人机交互场景成为必争入口[15] - 区块链通过不可篡改特性解决信用问题[15] 文化融合需求 - 需融合西方计算理论与东方整体论优势[14] 公共精神复兴 - 超级平台作为平台的平台本质是公共服务供应商[14]
腾讯研究院AI速递 20250901
腾讯研究院· 2025-08-31 16:02
生成式AI行业动态 - xAI正式发布编码模型Grok Code Fast 1 该模型从零打造 速度比GPT-5快五倍 性价比高 性能进入全球编码模型前五名[1] - 模型架构聚焦真实编程任务 支持多语言 具备全栈开发与bug修复能力 研发团队以华人学者为主 通过用户反馈迭代优化 并公布多模态与视频生成路线图[1] - Meta因内部旗舰模型进展缓慢 Llama 5尚未成型 正寻求与OpenAI或谷歌合作为旗下应用注入AI 已在内部工具接入外部模型[2] - OpenAI发布语音模型GPT-realtime 具备超自然语音生成 情感语调模仿与多模态理解 准确率与推理能力显著提升 支持指令遵循 函数调用 异步对话与图像输入[3] - Realtime API同步上线 扩展SIP连接 复用提示 内置安全防护 以更低价格开放 推动语音AI智能体落地[3] - Claude更新隐私政策 默认允许收集用户对话与编程数据用于模型训练 不同意则仅保留30天 涵盖免费及付费用户[4] - 美团开源龙猫大模型LongCat-Flash 采用5600亿参数MoE架构 创新引入零计算专家和ScMoE 大幅提升效率与速度[5] - 模型在MMLU ArenaHard CEval等基准表现接近或超越DeepSeek V3.1与Qwen3 指令遵循与Agent任务排名领先 支持128k上下文 推理速度超100TPS 成本仅0.7美元/百万词元[5] - 全球七大LLM参加狼人杀210场对战 GPT-5以96.7%胜率领先 展现超强社交推理与操纵能力[6] - 作为狼人时以逻辑框架与心理战精准瓦解对手 作为村民时靠司法化调查体系抵抗操纵 零误伤关键角色[7] - xAI创始工程师李雪辰套现约700万美元股票后 被指窃取Grok核心代码库并叛逃至OpenAI xAI已提起诉讼指控盗取数十亿美元级别商业机密[8] 前沿科技研究进展 - 清华姚班本科生提出分层规划+强化学习框架 让宇树G1机器人在0.42秒内反应击球 连续对拉达106拍[9] - 高层规划器预测乒乓球轨迹与击球时机 低层RL控制器生成协调动作 融入人类动作参考提升击球自然性 实验中击球率96.2% 回球率92.3%[9] AI硬件投资视角 - a16z合伙人指出AI被局限在网页文本框 需通过硬件实现更自然交互 硬件优势在于被动收集语境信息让AI更精准有价值[10] - 关键突破点在于形态因子社会可接受 功能compelling 场景明确 成功路径是找到精确 有价值 社会认可的应用场景[10]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-30 02:33
芯片与算力 - 英伟达发布Jetson Thor芯片[3] - 英伟达推出NVFP4算力产品[3] - DeepSeek发布UE8M0 FP8芯片[3] 模型发展 - xAI开源Grok-2模型[3] - Meta等公司提出DeepConf方法[3] - 英伟达推出Jet-Nemotron模型[3] - 面壁发布MiniCPM-V 4.5模型[3] - Sakana AI实现M2N2进化[3] - DeepSeek发现V3.1 Bug问题[3] - OpenAI和Anthropic开发互评模型[3] 应用创新 - Coinbase强制使用AI工具[3] - OpenAI发布GPT-4b micro应用[3] - 群核科技开源SpatialGen[3] - 腾讯会议新增AI纪要功能[3] - Video Ocean推出视频智能体[3] - 钉钉发布DingTalk A1应用[3] - 微软推出VibeVoice-1.5B应用[3] - Perplexity实施AI搜索收入分成[3] - 谷歌发布Gemini 2.5 Flash应用[4] - Anthropic推出Claude for Chrome应用[4] - PixVerse升级至V5版本[4] - DeepMind开发健康大模型[4] - 腾讯举办AI播客挑战赛[4] - 谷歌实现Nano-Banana进化[4] - 腾讯推出HunyuanVideo-Foley应用[4] - 字节跳动发布OmniHuman-1.5应用[4] - n8n建立Agent平台养成系统[4] - 华盛顿大学开发气候模拟应用[4] 科技与事件 - 腾讯等支持科学探索奖[4] - SpaceX实现星舰"十飞"[4] - OpenAI进行权力交接[4] - Meta与Midjourney达成合作[4] - 马斯克提及Macrohard概念[4] - X公司面临垄断诉讼[4] 行业观点 - Claude Code讨论产品迭代机制[4] - a16z分析生成平台格局[4] - 谷歌发布AI能耗报告[4] - Karpathy探讨编程工具链[4] - Delphi研究数字永生概念[4] - OpenAI强调AI技能需求[4] - 国务院推动人工智能+战略[4] - 斯坦福大学分析AI对就业影响[4] - 杨植麟探讨大模型技术决策[4] - a16z发布AI百大榜[4] - Geoffrey Hinton提出婴儿假说[4] - Anthropic警告AI无序风险[4]
《广告法》修订实施十年来,广告监管执法有何变化?
腾讯研究院· 2025-08-29 08:03
文章核心观点 - 新《广告法》实施十年来推动广告行业规模与质量双重跃升 构建健康有序市场生态 监管体系实现从传统向互联网化、技术化、协同化转型 [2][3][6][8][15] - 广告监管重心从事前审批转向事后监测 执法对象从传统媒体偏向互联网媒介 监管模式向技术智能监管转进 [5][6][7][9][10] - 行业面临新兴业态监管挑战 包括商业广告与非广告宣传界限模糊 新消费品广告规制缺失 网络广告执法手段滞后等问题 [15] 广告行业十年发展成果 - 广告产业规模持续扩张 2016年营业额达6000亿元 互联网广告占比超50% 2024年总收入首次突破万亿元达10310.7亿元 其中互联网广告收入8919.1亿元占比86.5% [6] - 传统媒体加速数字化转型 电视台等传统单位互联网广告业务增长超60% [6] - 市场准入门槛取消 广告发布主体数量激增 形成完全自由竞争市场 [3] 广告监管体系变革 - 导向监管全面强化 自2016年起成为市场监管系统头等任务 协同宣传部、网信办开展公益广告展播与社会主义核心价值观传播 [4] - 执法重点转向互联网领域 2024年查处违法广告案件4.69万件 其中互联网广告违法案件3万余件占比63.97% [6] - 建立技术智能监测体系 2016年成立全国互联网广告监测中心 2019年建设移动端监测中心 实现每日超10亿级广告量的智能化监管 [8] 监管机制优化 - 事前审批大幅精简 从1994年26项许可缩减至仅保留特殊商品服务广告审查一项 [10] - 监管模式系统化常态化 以广告监测和举报投诉为双主线 重点打击医疗、食品、金融等民生领域虚假广告 [12] - 构建社会共治格局 通过联席会议机制实现跨部门协同 整合行业协会、平台、媒体等社会监督力量 [15]
腾讯研究院AI速递 20250829
腾讯研究院· 2025-08-28 16:01
大模型安全与性能评估 - OpenAI与Anthropic首次联合评估模型安全性 双方互授API权限进行测试 [1] - Claude模型在幻觉控制方面表现优异 拒绝70%不确定问题 幻觉率显著低于OpenAI模型 [1] - 在越狱测试中OpenAI的o3和o4-mini模型略优于Claude 但在抵抗系统提示词提取方面Claude表现更稳定 [1] 多模态图像生成技术突破 - 谷歌Gemini团队推出原生图像生成模型Nano-Banana 实现质量飞跃 支持一句话生成和编辑高清图像 [2] - 模型采用原生多模态架构 支持连续多轮对话并记忆历史图像和指令 实现像素级完美编辑 [2] - 单次生成5张高清图片仅需13秒 创新交错生成技术可分解复杂指令 文本渲染能力成为进步标尺 [2] 视频与音频生成技术进展 - 腾讯混元开源端到端视频音效模型HunyuanVideo-Foley 输入视频和文字即可生成电影级音效 [3] - 采用双流多模态扩散变换器架构 实现多模态语义均衡响应 在泛化能力、语义响应和音频保真度达业界领先 [3] - 字节跳动推出OmniHuman-1.5视频模型 首次实现双人音频驱动功能 支持两个数字人实时对戏 [4][5] - 模型精准还原口型表情 解析语音情绪并匹配肢体语言 支持文本控制风格动作 维持一分钟以上时序连贯性 [4][5] AI自动化平台商业化 - 工作流自动化工具n8n在8个月内营收增长4倍 估值达23亿美元 活跃用户超23万 [6] - 平台升级为AI应用编排层 通过可视化方式连接应用和数据库 支持构建Agent处理复杂任务 [6] - 采用Fair-Code许可模式 比传统开源更利于商业化 支持高度定制化工作流部署 [6] AI科学计算应用 - 华盛顿大学利用AI将气候模拟时间从数月缩短至12小时 成功实现1000年数据模拟 [7] - 深度学习模型替代传统物理方程计算 在保持高精度同时大幅提升效率 助力极端天气预测研究 [7] 行业竞争格局变化 - AI百大榜单显示ChatGPT首次失去榜首位置 开源模型与闭源模型差距明显缩小 [8][9] - 多家中国公司模型进入前20强 评测维度从基础能力扩展至实际应用效果和商业价值 [8][9] AI安全与治理前瞻 - Geoffrey Hinton预警超级AI可能在10年内出现 具备创造力、自主意识和自我改进能力 [10] - 提出人类需接受被AI抚养的"婴儿假说" 呼吁延迟AI训练5年直至安全保障措施完善 [10] - Anthropic CEO指出AI存在无序风险 需构建可靠可理解的系统 公司正组建安全评估团队 [11]
AI是通向“超人”的阶梯,还是退回“猿猴”的陷阱?
腾讯研究院· 2025-08-28 10:38
AI对人类智力的影响 - AI可能使人类思维同质化 缺乏新意和批判性思考[2] - 麻省理工学院实验显示使用ChatGPT组记忆正确率仅11.1% 远低于未使用组的88.9%[4] - 脑电波数据显示AI使用组神经连接强度(dDTF=0.009)显著低于未使用组(dDTF=0.053)[4][5] 认知能力变化机制 - 认知负荷转移导致大脑处理能力退化 类似过度依赖导航系统[5] - 认知卸载效应使大脑为节省能量将任务外包给AI工具[5] - 知识平庸化趋势使AI输出内容缺乏思想灵魂 呈现平铺直叙特征[6] 智力维度重构 - 智力应视为多维光谱而非单一分数 包含批判思维/记忆力/逻辑推理等多要素[10] - AI主要替代计算和记忆能力 但创造力/情感理解/同理心等软技能仍难以被取代[10] - 认知增强使人类从繁琐记忆中解放 专注于高级认知活动[11][12] 教育体系变革 - 教育需从知识灌输转向培养批判性思维和创造力[17] - 可探索无分数学习模式 将基础知识学习交由AI处理[17] - 认知教育应重点培养语言能力/逻辑能力/自主判断能力等基础认知能力[18] 人机关系重构 - 需重新定义人类价值锚定点 探索深空/深海等新疆域[14] - 未来可能出现人机混合的赛博格新物种 改变人类生产生活方式[15] - 意识问题构成人与机器的本质区别 需警惕AI对人心智的渗透[15] 技术发展辩证观 - AI影响具有动态辩证性 既存在降智风险也具备启智潜力[9] - 技术将淘汰平庸思维 解放敢于提问和善于反思的独特智慧[18] - 国务院要求深入研究AI对人类认知判断的深层次影响机制[2]