Workflow
腾讯研究院
icon
搜索文档
联合调研|2025空间设计行业 AI 应用趋势调研
腾讯研究院· 2025-05-27 08:06
行业趋势与调研背景 - 2024年AIGC技术浪潮推动设计行业生产力进步,同时引发技术焦虑,D5联合1810位设计从业者探讨"AI+设计"的机遇与挑战,并发布《2024设计行业AI应用展望》报告[1] - 2025年AI产品将趋向多元成熟,进一步渗透设计环节,D5联合腾讯研究院、学术团体及行业媒体发起《2025 AI+空间设计行业应用调研》[1] 调研核心议题 - 聚焦AI设计工具在类型和应用场景的年度拓展情况[2] - 挖掘不同细分领域中可复制的AI应用实践成果[2] - 探讨多学科融合趋势下AI对设计师的赋能潜力[2] 调研执行细节 - 调研对象为国内空间设计从业者,采用问卷形式收集数据,截止日期为2025年6月20日[2] - 最终将整合调研结果与行业访谈,形成公开年度报告[2] 合作机构 - 调研由D5主导,腾讯研究院提供学术支持,知名学术团体及行业媒体共同参与[1][2]
AI的落地难题、应用案例和生产率悖论
腾讯研究院· 2025-05-27 08:06
AI企业应用现状 - AI的2C应用渗透率已达39.6%(美国居民生成式AI),但企业应用仍处早期阶段,模型厂商侧重技术炫耀而非落地场景[2] - A股上市公司提及AI的企业数量从2020年172家增至2023年超1200家,但占比不足20%;美国AI企业采用率仅5.4%,欧盟平均13.5%(各国区间3.1%-27.6%)[2] 行业应用差异与信息密度 - 信息密度高的行业AI应用更深入:A股计算机行业70%企业提及AI(超250家),电子/通信/传媒/银行紧随其后;超半数行业提及比例不足10%,煤炭行业零提及[4][5] - 美国信息业AI采用率最高(18.1%),专业/科学/技术服务超10%,农林牧渔最低(1.4%)[8][9] 典型应用领域案例 - **编程**:谷歌30%新代码由AI生成,微软20%-30%;YC孵化器25%初创公司代码库95%为AI生成,Python进展显著于C++[11] - **广告**:腾讯AI广告点击率从1%提升至3%;全球生成式AI广告支出2026年将达500亿美元(占数字广告6%)[14][16] - **客服对话**:Klarna AI助手处理三分之二客服对话(230万次/月),效率提升5.5倍(11分钟→2分钟);医疗领域Abridge估值27.5亿美元,部署超100个卫生系统[17] 传统行业转型挑战 - **基础不佳**:全球85%IT支出未上云,数据孤岛普遍[19] - **精度不高**:大模型平均幻觉率6.7%(最高29.9%),工业模型需96%以上准确率[20] - **软硬不调**:中国SaaS占比仅12.7%(全球60%),IaaS占比74.2%[20] - **考核与组织**:IT部门产出难量化,转型需一把手推动[21][22] 通用技术的生产率悖论 - 蒸汽机/发电机/计算机均经历数十年滞后才显著提升生产率(蒸汽机100年、发电机90年、计算机40年)[24][26] - 当前AI未扭转美国劳动生产率下滑趋势(2024Q1下降0.8%),或处于"播种阶段"[30]
腾讯研究院AI速递 20250527
腾讯研究院· 2025-05-26 15:53
海光信息与中科曙光并购 - 海光信息通过换股方式吸收合并中科曙光,两家企业总市值合计超4000亿元 [1] - 海光为国产CPU及GPU龙头,中科曙光为服务器及算力基础设施龙头,两家有频繁关联交易 [1] - 此次重组旨在抢抓信息技术产业发展机遇,实现产业链互补,形成多元算力业务整合 [1] Lilian Weng新公司Thinking Machines - OpenAI前安全副总裁Lilian Weng分享其新公司产品——用于AI训练的手动调参仪表盘 [1] - Thinking Machines由多位OpenAI核心员工组建,未发表论文但估值已达90亿美元 [1] - OpenAI计划在2026年前推出能让ChatGPT"无处不在"的硬件设备 [1] Google基于Gemma模型的变体 - Google发布三款基于Gemma的模型变体:MedGemma、SignGemma和DolphinGemma,分别面向医疗、手语和动物语言领域 [2] - MedGemma包含4B多模态模型和27B文本模型,能处理医学图像分类、报告生成和临床文本推理,可在单GPU上运行 [2] - SignGemma用于手语翻译,DolphinGemma是400M参数模型,用于预测和生成海豚语言信号 [2] AI教育工具VideoTutor - VideoTutor面向K12教育,输入问题或主题后可自动生成类似可汗学院风格的短视频课程 [3][4] - 该工具提供结构化脚本、动态视觉效果和专业旁白,支持100多种AI语音和40多种语言,生成时间仅需1-3分钟 [3][4] - 技术结合大语言模型、AI动画引擎和高级文本转语音技术,覆盖数学、科学、语言等学科,支持个性化定制 [4] 企业微信智能机器人升级 - 企业微信"智能机器人"基于企业内部资料结合DeepSeek与混元等大模型深度思考回答员工问题 [5] - 新功能支持添加在线文档、微盘文件夹等到知识集,知识维护更灵活,并可通过API接口与业务系统打通 [5] - 支持单聊和群聊对话,企业管理员可在一分钟内配置专属智能机器人,适用于企业百事通、AI导师等多种场景 [5] 人形机器人格斗比赛 - 杭州举行全球首个人形机器人格斗比赛,机器人们展示打拳、闪避、肉搏等动作,采用三回合赛制 [6] - 最终小黑(AI策算师)击败小绿获得冠军,机器人们展示了直拳、勾拳、扫腿等十种动作组合 [6] - 格斗涉及机体设计、动作控制等多方面挑战,背后采集了职业搏击选手的数据,但仍由人类操控 [6] iOS 19设计更新 - 苹果将在WWDC 2025发布iOS 19等系统的重大设计更新,代号"Solarium",是自iOS 7以来最大规模的视觉更新 [7] - 新设计语言借鉴visionOS元素,使用更多透明度效果、新图标和修订导航方式,实现跨设备和操作系统的视觉统一性 [7] - 更新将涵盖iOS、macOS、watchOS和tvOS等系统,可能特征包括Frosted Glass元素、更圆润的"squircle"图标和浮动UI元素 [7] Anthropic对AI自动化的预测 - Anthropic核心技术成员Douglas预测,到2027-2028年,AI模型将有能力自动化几乎所有白领工作 [9] - Claude 4在软件工程领域表现突出,能处理极其模糊的需求,自主完成任务,AI工具已将资深工程师效率提升1.5-5倍 [9] - 未来趋势指向AI Agent普及,到2025年底,通用型AI Agent能处理各种浏览器内事务将变得明显 [9] 红杉中国推出Agent基准测试xbench - 红杉中国推出双轨评估体系"xbench",追踪AI模型的理论能力上限与Agent在真实场景的落地价值 [10] - xbench分为AGI Tracking与Profession Aligned两条路径,前者测试模型关键能力边界,后者关注垂直领域实际价值 [10] - 评估设计能跟踪Agent能力的技术-市场契合点(TMF),预测AI接管现有业务流程的时间点,分析成本效益与专业能力提升速度 [10]
“AI的真正价值不在于有多酷,而在于多有用、多可靠”
腾讯研究院· 2025-05-26 09:02
生成式AI技术发展 - 生成式AI三大技术路径包括大语言模型(LLMs)、视觉语言模型(VLMs)和扩散模型(Diffusion Models),其中扩散模型在多模态生成领域取得突破性成果 [6] - 语音生成技术(TTS)在大模型赋能下实现音色、情感、语气、风格、方言控制等方面的技术革新 [7] - 当前技术仍面临幻觉现象、精细控制不足、真实知识整合困难等挑战 [6] 行业应用趋势 - 生成式AI的"组合性"和"协作性"成为数字经济重要特征,开源生态系统大幅降低使用门槛 [11] - AI Agent在DeFi领域已实现无人值守链上应用,Web3与AI结合形成"协作智能+代币化经济"模式 [11] - 语音Agent在商用场景中面临响应速度与幻觉控制等技术瓶颈,需围绕用户场景构建闭环能力 [12] - 企业开始将Agent嵌入工作流,实现"人机共创"效率提升,推动业务流程重构 [14] 商业化与创业方向 - 开源模型释放开发潜力,但需警惕"大模型套壳"创业模式,应建立用户网络效应与商业壁垒 [12] - "超级个体"时代来临,AI Agent可能拥有独立身份、财产与交易能力,形成"Agent社会" [12] - 创业公司应聚焦高质量数据与定制化知识积累,实现差异化竞争 [12] 治理挑战 - AI治理面临私营公司主导开发与政府监管意愿不足的矛盾,国际合作机制尚未形成 [16] - 当前治理框架能解决"无知者"问题但难以约束"冷漠者",需加强需求端应对策略 [20] - 法律规制应聚焦行为本质而非技术手段,保持技术中立以适应长期发展 [21] - 需关注大语言模型垄断问题,促进语言文化多样性,中文模型发展有助于生态平衡 [21] 社会影响与伦理 - AI应用带来决策让渡、情感替代、人类增强等现象,可能削弱真实人际联系 [23] - 需防止过度依赖AI导致人类思维能力"短路",应增强创造力而非替代 [23] - 治理机制需兼具适应性与敏捷性,通过价值对齐等内部机制构建安全可靠的AI [23] 未来发展展望 - AI加速迈向通用人工智能(AGI),"token用量"成为衡量智能化程度的新指标 [25] - "智力即服务"时代来临,需通过跨学科合作前瞻应对技术社会影响 [25] - AI与Web3结合形成新型经济模式,Agent基础设施与生态系统建设成为重点 [11][12]
腾讯研究院AI速递 20250526
腾讯研究院· 2025-05-25 15:57
英伟达Blackwell GPU - 英伟达因美国出口管制在中国AI芯片市场份额从95%暴跌至50% [1] - 推出新款阉割版Blackwell GPU售价6500-8000美元远低于H20的1-1.2万美元 [1] - 新芯片采用GDDR7内存技术内存带宽约1.7TB/秒以符合出口管制限制要求 [1] Claude 4技术进展 - Claude 4采用可验证奖励强化学习(RLVR)范式在编程和数学等有清晰反馈信号的领域取得突破 [2] - 预计明年将出现能独立完成实际工作的软件工程Agent [2] - 预测到2026年底AI将具备足够的"自我意识"能执行复杂任务并判断自身能力边界 [2] Google Veo3视频生成模型 - Veo3视频生成模型实现流畅真实的动画效果和同步音效解决物理逻辑问题 [3] - 能精确呈现复杂场景细节包括流体动态、质感表现和人物动作支持多种镜头风格和特效 [3] - 已达近电影级画质支持非语言音效和多语言旁白 [3] OpenAI o3模型漏洞发现能力 - o3模型在Linux内核SMB实现中发现远程0-day漏洞CVE-2025-37899表现优于Claude Sonnet 3.7 [4] - 在3.3k行代码测试中100次运行8次成功识别已知漏洞误报率约1:4.5 [4][5] - 独立发现新UAF漏洞且洞察力超越人类专家能指出修复方案不足 [5] 字节BAGEL多模态模型 - BAGEL具备GPT-4o级图像生成能力整合图像理解、生成、编辑和3D生成于单一7B参数模型 [6] - 采用MoT架构包含两个专家模型和独立视觉编码器展现出能力涌现过程 [6] - 在多项基准测试中超越多数开源和闭源模型支持带图推理、复杂图像编辑和视角合成 [6] 腾讯"野朋友计划" - 推出AI物种识别与智能体问答交互功能可识别用户拍摄的生物并提供专业知识 [7] - 通过自然语言对话解答生物习性、迁徙规律等深度信息将专业术语转化为生活化表达 [7] - 用户上传的图片和互动内容将用于模型训练同时为科研提供数据 [7] OpenAI首款AI硬件 - 开发脖挂式设备形似iPod Shuffle无屏幕但配备摄像头和麦克风 [8] - 旨在突破屏幕界限提供更自然交互可连接手机和PC预计2027年量产 [8] - 市场上已有类似AI穿戴设备但网友对隐私安全和实用性存疑 [8] AI科学家团队新药发现 - AI科学家团队在2.5个月内发现治疗干性老年性黄斑变性的新药Ripasudil [10] - Robin多智能体系统自动化了科学发现全过程结合多个智能体完成研究流程 [10] - AI发现了人类未曾想到的治疗路径完全主导研究框架 [10] Anthropic产品开发逻辑 - 最好的AI产品往往"自下而上"生长而非计划出来从底层实验中发现潜力 [11] - 未来核心问题将从"是否AI生成"转向内容溯源、可信度与可验证性 [11] - Anthropic内部70%代码由Claude生成组织面临"非工程环节"效率瓶颈 [11] Character.AI发展观点 - 最佳AI应用尚未被发明现阶段AI领域状态类似炼金术 [12] - 通用性与易用性应并行发展Character.AI选择构建既可用又极度通用的产品 [12] - 大语言模型的价值在于利用有限训练转化为广泛应用关键挑战是计算能力 [12]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-05-23 09:10
算力发展 - OpenAI在阿布扎比建设数据中心以提升算力基础设施 [2] - NVIDIA推出GB300等新一代算力产品 [2] - 华为发布CloudMatrix 384等高性能算力解决方案 [2] - Google持续优化TPU应用以增强计算效率 [2] 模型进展 - Windsurf推出SWE-1模型聚焦特定领域性能 [2] - 智源研究院发布BGE向量模型提升语义理解能力 [2] - 腾讯更新模型矩阵强化多场景适配性 [2] - 谷歌推出Gemini Diffusion模型拓展生成能力 [2] - Mistral发布Devstral模型聚焦开源生态 [2] 应用创新 - OpenAI推出Codex工具优化代码生成效率 [2] - 腾讯发布混元图像2.0和游戏视觉生成平台提升内容创作能力 [2][3] - 谷歌推出LightLab、Veo 3、NotebookLM APP等多款AI工具覆盖编程、视频生成及笔记场景 [2][3] - 微软发布Coding Agent和Magentic-UI强化开发辅助功能 [2][3] - 字节推出语音播客应用探索音频内容生成 [3] - 英伟达DreamGen项目聚焦3D内容生成 [3] - 昆仑万维推出天工超级智能体整合多模态能力 [3] 科技突破 - 中国团队在视触融合挑战赛中取得技术进展 [3] - 微软利用AI发现新物质推动材料科学 [3] - UC伯克利研发低成本机器人降低AI硬件门槛 [3] 行业观点 - GitHub强调代码编写在AI时代的重要性 [3] - Anthropic预测AI编程将改变开发范式 [3] - a16z分析AI编程领域的投资机会 [3] - Gartner提出智能应用设计原则 [3] 企业动态 - OpenAI正式收购io公司 [4] - 腾讯研究院建立ima AGI知识库推动行业研究 [4]
探元计划香港站|AI 赋能历史溯源,解码九龙寨城中华文脉基因
腾讯研究院· 2025-05-23 07:47
探元计划2024香港场景活动 - 活动聚焦文化与科技融合 推动文化遗产数字化保护 来自文化 技术 运营领域的专家共同参与[1] - 活动包括实地调研九龙寨城公园 香港历史博物馆 现场体验大模型智能体 AI互动叙事游戏与三维虚拟空间[3] - 项目成果将在深圳文博会和香港书展展出[13] 项目背景与发起方 - 探元计划由国家文物局科技教育司指导 中国文物信息咨询中心 腾讯SSV数字文化实验室等联合发起[3] - 香港联合出版集团与华粹星光公司合作开展"在九龙城 阅见香港"项目[3] - 项目从全国81个文化需求场景中脱颖而出 入选探元计划六大文化共创场景[4] 项目技术应用 - 开发多模态知识智能体 支持两文三语交互 助力用户了解九龙城历史并创作故事[4] - 设计AI互动叙事游戏 以寻物解谜玩法激发历史文化探索兴趣[4] - 构建九龙寨城三维虚拟空间 还原不同历史时期风貌[4] 项目意义与目标 - 通过数字科技活化出版资源 构建AI赋能的沉浸式文化场景[9] - 增进香港居民对国家身份认同 向海外展现中华文化影响力[9] - 解决历史记忆碎片化 青年认知片面化等文化传承挑战[10] 专家研讨重点 - 强调技术与文化双向赋能 借助大模型提升传播精准性[11] - 推动用户参与从单向输出向共建共享转变[11] - 聚焦教育与文旅场景 构建可持续发展模式[11] 项目创新路径 - 技术应用创新:重构故事创作生产线[10] - 内容传播创新:游戏化沉浸体验激活传播场景[10] - 持续生态创新:开放知识库鼓励社会共创[10]
大模型巨浪的下一个方向:AI Ascent 2025的十个启示
腾讯研究院· 2025-05-23 07:47
AI市场与产业趋势 - AI将创造万亿美元级别市场机会,发展要素已就位,市场价值主要聚集在应用层[3][7] - 基础大模型数量将屈指可数,基模企业将重点投入强化学习推动能力突破[3][10] - 智能体经济逐步形成,未来智能体可转移资源、进行交易,催生"Agent-first"公司浪潮[9][19] 技术发展与创新方向 - 模型潜力仍有10-100倍空间,需算法突破与算力投资,测试时计算成为新缩放维度[10][17] - 未来模型趋向稀疏化与专业化,混合专家模型可实现10-100倍质量/计算量提升[17] - 编码能力飞跃使"初级工程师"水平AI一年内实现,物理机器人2-3年具备20项实用功能[15][18] 商业模式与产品策略 - 商业模式需适应价值重心转移,"品味"或成稀缺资产,用户或通过"信令"跨服务登录[3][22] - 自下而上探索开发更有效,模型能力与产品研发需紧密结合,避免"GUI思维"局限[21] - 杀手级应用已现(如ChatGPT),产品需从"副驾驶"转向"自动驾驶"模式[7][12] 企业组织与管理变革 - 组织需转向"随机性思维",从规则驱动转向概率管理,学习"管理Agent"新范式[8] - AI代码生成占比超70%后,代码审查成效率瓶颈,需优化协作流程[24] - 保持小团队高敏捷性,初创公司更易适应快速变革,需培养长期心理韧性[13] 垂直领域应用前景 - 编程为首个广泛应用场景,AI通过API调用实现任务执行,推动智能体模式转型[11] - 多模态模型加速科研,神经网络替代传统模拟器可实现30万倍加速[18] - 教育领域AI代码生成潜力大,通用信息检索与工作辅助将成商业化重点[19]
腾讯研究院AI速递 20250523
腾讯研究院· 2025-05-22 15:09
OpenAI技术更新 - Responses API新增MCP服务支持,开发者可简化外部服务连接流程,无需手动函数调用[1] - 新版API强化安全控制,通过allowed_tools参数和权限管理防止工具滥用[1] - 新增图像生成、Code Interpreter、文件搜索功能,并引入后台模式等新特性[1] 微软开源项目 - 发布Web Agent项目Magentic-UI,支持自动浏览网页和代码操作,用户可实时监控干预[2] - 采用协同规划和执行机制,生成任务计划需用户确认,集成神经样式引擎等创新技术[2] Mistral开源模型 - 发布240亿参数模型Devstral,可在RTX 4090或32GB Mac上运行,SWE-Bench测试得分46.8%超越GPT-4.1-mini[3] - 采用Apache 2.0许可证,商用定价为每百万输入Token 0.10美元,输出Token 0.30美元[3] xAI实时数据API - 推出Live Search API为Grok AI提供实时数据访问,支持X平台和网页内容检索[4][5] - 提供搜索控制功能如结果数量限制和时间范围指定,结合DeepSearch展示推理过程[5] OpenAI硬件布局 - 以65亿美元收购前苹果设计官Jony Ive的硬件团队io,开发AI耳机和可穿戴设备,预计2026年发布[6] - 关联公司LoveFrom将承担ChatGPT界面设计,Ive称此为职业生涯最重要工作[6] 昆仑万维AI办公产品 - 发布天工超级智能体,集成5个专家智能体,支持文档、PPT、表格生成,成本为OpenAI的40%[7] - 基于deep research技术,支持信息溯源和个人知识库构建,已开源相关框架[7] 微软大气AI模型 - 推出大气模型Aurora,计算速度比IFS数值预报系统快5000倍,训练周期仅4-8周[8] - 在空气质量、热带气旋预测中表现优异,采用3D Swin Transformer架构[8] Gartner智能应用原则 - 提出智能应用五大原则:自适应体验、嵌入式智能、自主编排、互联数据和可组合架构[9] - 强调AI需深度嵌入业务逻辑,实现跨系统自然语言交互和自动化流程优化[9] AI编程市场趋势 - AI Coding市场价值约3万亿美元,开发者角色将向产品经理或QA工程师转变[10] - 新范式降低编程门槛,但系统架构等专业知识仍为软件开发核心[10]
吴恩达:如何在人工智能领域打造你的职业生涯?
腾讯研究院· 2025-05-22 09:35
人工智能职业发展路径 - 编码人工智能被视为新时代的基础读写能力,类似于历史上语言读写能力的普及过程 [7][8] - 人工智能技术为编码提供了新范式,使计算机能从数据中提取知识,相比传统软件工程更具普适性 [8] - 线性回归等基础AI模型可应用于披萨店需求预测等实际场景,展示AI在各行业的广泛应用潜力 [9] 职业发展三阶段框架 - 学习基础技能:包括机器学习、深度学习、数学和软件开发等核心领域 [12][16] - 从事项目工作:与缺乏AI专业知识的利益相关者合作,面临项目管理和迭代挑战 [13] - 找到合适工作:需适应公司对AI角色认知不一致的情况,建立支持性社区 [14] 核心技术技能体系 - 基础机器学习:线性回归、逻辑回归、神经网络等模型及核心概念如偏差/方差 [17] - 深度学习:神经网络基础知识、超参数调整、卷积网络和序列模型 [17] - 相关数学:线性代数、概率统计、微积分,用于算法调试和优化 [18][23] - 软件开发:Python编程、数据结构算法、TensorFlow/PyTorch等库的使用 [18] AI项目管理方法论 - 五步项目确定法:从业务问题识别到资源预算的系统化流程 [26][32] - 项目选择策略:技术挑战性、团队合作、影响力及作为垫脚石的潜力 [36] - 执行方法论:根据成本选择"准备-瞄准-开火"或"准备-开火-瞄准"策略 [38][39] 求职策略与职业转换 - 角色转换优先于行业转换:建议先在同一行业转换AI角色,再考虑跨行业 [48] - 信息面试价值:了解目标公司AI岗位实际工作内容和所需技能的有效方式 [53][54] - 求职流程优化:研究角色和公司、准备面试、选择团队和谈判薪资的系统方法 [58] 职业长期发展要素 - 团队合作能力:处理大型项目时影响他人和被影响的关键技能 [65] - 社区建设:比单纯社交更有效的职业网络发展方式 [65] - 习惯养成:在学习、工作等方面保持长期纪律性的重要性 [67]