Workflow
Software and Internet
icon
搜索文档
李飞飞3D世界模型爆火后,国内首个免费版来了:我当了回「为所欲为」的造物主
36氪· 2025-12-22 09:21
腾讯混元世界模型1.5产品发布 - 腾讯混元团队上线了国内首个开放体验的实时世界模型TencentHY WorldPlay 1.5 [1] - 该模型能够根据用户输入的文字或单张图片,生成一个可供实时操控和探索的3D虚拟世界 [1] 核心功能与技术亮点 - 支持文字生成世界,用户通过文字描述可生成如过山车、千禧年跨年夜等多样化的3D场景 [2][4][11] - 支持单图生成场景功能,可将如《千里江山图》等图片转化为可游览的3D空间,并保留原艺术风格 [14][16] - 具备实时交互生成能力,通过原创的Context Forcing蒸馏方案及流式推理优化,模型能以24 FPS的速度生成720P高清视频 [7] - 通过重构记忆机制实现长范围的3D一致性,支持分钟级内容的几何一致性生成,用于构建高质量3D空间模拟器 [7] - 采用流式DiT架构,能够边接收用户实时控制信号边生成画面,保证了极低的操控延迟 [21] - 模型支持实时文本触发事件,用户可通过一句话指令在5秒内平滑改变世界状态,如让天色从亮变暗 [17][19] 产品体验与效果 - 文字生成场景的等待时间约为5-8秒 [4] - 生成的场景具有高写实度,例如过山车场景中皮肤纹理、金属划痕等细节清晰可见 [4] - 在千禧年场景等测试中,模型对三维空间有较好理解,物体能保持相对位置关系,无明显漂移 [11] - 在处理大跨度视角切换时,如海景房场景,窗框、立柱等直线条未发生扭曲,展现了良好的三维空间一致性 [13] - 目前模型在处理第一视角高速运动场景时存在挑战,可能生成静态的“定格瞬间”以供细节观察 [9] - 在复杂场景中,近处物体的细节可能缺乏锐利边缘,呈现“AI粘滞感”或类似油画的柔软效果 [11] - 实时物理模拟尚存瑕疵,例如爆炸后近处水面未能呈现波动效果 [21] 行业意义与未来展望 - 世界模型代表了从语言智能向空间智能的关键发展,旨在让AI理解并操作三维物理世界,是通往通用人工智能的关键一步 [23] - 该领域获得全球科技公司如Google、Meta、OpenAI及腾讯的重点关注与投入 [23] - 该技术使艺术从“被欣赏”变为可“自由游览”,为内容创造与交互提供了全新范式 [16] - 尽管当前在流畅度和交互深度上仍有提升空间,但世界模型赋予了用户创造世界的自由,具有广阔的未来想象空间 [25]
智者勇进 接续奋进新江苏|百度秒哒上线以来创造价值超50亿元 未来三年将扶持100万创造者创收
扬子晚报网· 2025-12-21 04:50
文章核心观点 - AI应用开发正从实验探索阶段进入规模化商业变现的新阶段,其标志是无代码/低代码平台显著降低了应用开发门槛,使非专业开发者能够快速构建并运营可产生实际经济价值的商业应用[1][5] 百度秒哒平台进展与数据 - 平台上线8个月累计生成超50万个商业应用,日新增应用涨幅超150%[1] - 生成的应用中带有后端的占到一半,覆盖教育、商业、内容创作、企业服务等200余个场景[1] - 平台累计创造的经济与效率价值已超过50亿元[1][3] - 平台用户中81%为非程序员用户,主要集中在职场人群与高校群体[3] - 生成的应用已累计服务超过1000万用户,每天约有近10万人使用这些应用解决真实问题[3] - 目前已有超2万个应用接入支付能力,累计完成超过8万笔真实交易[3] 产品战略与技术支持 - 核心目标是将应用开发从少数专业开发者手中解放出来,通过“自然语言化”的方式让更多人构建可用、可运营、可变现的商业应用[2] - 技术体系由需求模型、代码模型与UI模型协同运转形成数据飞轮,并沉淀优质代码库、UI库与需求库以构建能力与数据壁垒[2] - 依托百度智能云的全栈AI能力,包括Agentic数据库、高性能沙箱与云工具体系,保障应用在复杂场景下的可用性、可交付性与可商用性[2] 商业化应用形态与案例 - 商业化应用主要呈现三类形态:电商小程序/小游戏等直接变现工具、帮助一线人员搭建内部系统的业务软件、以及落地到具体场景的AI提效应用[3] - 实践案例包括:工程师为油气行业搭建系统节省成本达百万元、自媒体创作者开发AI拍照助手获得付费转化、医疗教育从业者搭建数字化服务产品、在校学生开发工具型应用实现传播与变现、12岁开发者创建二次元卡牌游戏与亲子MBTI智能体等[4] 行业影响与未来趋势 - AI开发工具使得大量过去因成本过高而“不值得开发”的小众需求首次具备被系统性满足的可能[4] - 工具的进化正在推动“个人即公司”的趋势,加速超级个体的涌现[4] - 随着无代码平台与创作者生态成熟,AI时代下一阶段的竞争将围绕构建覆盖“创作—分发—变现”的完整应用生态展开[5] 公司扶持计划 - 百度发布“创造者筑梦计划”,未来三年将通过流量扶持、交易分成、商单对接与技术支持帮助100万名创造者实现创收[1] - 2026年将从所有优质项目中筛选15个高商用潜力项目开通快速通道,个人开发者项目有机会获得百万元以上级别投资[1]
腾讯任命OpenAI前科学家姚顺雨为首席AI科学家,升级大模型研发架构
中国经营报· 2025-12-20 07:53
腾讯AI战略与组织架构调整 - 公司邀请前OpenAI科学家姚顺雨出任首席AI科学家,直接向总裁刘炽平汇报,引发行业高度关注 [1] - 公司同步进行大模型研发架构升级,新成立AI Infra部、AI Data部和数据计算平台部 [1] - 姚顺雨同时兼任AI Infra部和大语言模型部负责人,向技术工程事业群总裁卢山汇报 [1] 调整背景与战略意图 - 接近公司的消息人士表示,此次调整旨在全面强化公司大模型研发体系与核心能力,标志着公司AI发展进入加速阶段 [1] - 此前一个月,在2025年第三季度财报电话会议上,已有市场声音质疑公司在大模型领域的资本支出不够积极,可能影响模型竞争力 [1] - 当时总裁刘炽平回应称,公司对已取得的进展感到满意 [1] 行业竞争环境 - 公司面临字节跳动豆包月活用户突破1亿、阿里巴巴通义千问在B端市场强势扩张的竞争压力 [1] - 此次架构调整和人才引进,透露出公司在AI赛道上的紧迫感 [1]
腾讯等多家厂商亮相SIGGRAPH Asia2025
证券日报网· 2025-12-19 13:40
行业会议与趋势 - 第18届SIGGRAPH Asia 2025会议以“生成式复兴”为主题,聚焦人工智能如何重塑创意产业 [1] - 大会吸引全球超过7000名参会者及600余位演讲嘉宾,腾讯、华为、Adobe等技术公司展示了最新AI与图形学科技成果 [1] 公司技术参与与展示 - 腾讯在会议期间举办了以“神经图形与生成式AI”为主题的多场技术研讨会,展示3D感知世界模型等领域的最新进展 [1] - 腾讯游戏共带来9篇入选论文以及3场专题分享,核心围绕AI重塑资产制作、引擎渲染等方面与全球专家进行探讨 [1] 具体技术成果与突破 - 腾讯游戏技术团队发表的论文《Imaginarium:视觉引导的高质量场景布局生成》提出了一种视觉引导的高质量3D场景布局生成方法,旨在解决开放世界游戏中海量非核心区域布局耗时费力的行业痛点 [2] - Imaginarium是一套基于AI的智能场景生成系统,能理解文字指令并自动生成符合特定美术风格且布局合理的3D场景,尤其适合快速构建大地图中的非关键区域 [2] - 该系统的突破在于不仅能模仿“如何摆放”,更能通过推理场景逻辑和叙事意图来理解“为何这样摆”,实现类似人类专家的“慢思考” [2] - 腾讯游戏展示了覆盖光照、动画、物理模拟、几何处理与实时渲染等核心引擎模块的技术成果,旨在通过AI创新为未来游戏带来更沉浸、更流畅的交互体验 [2]
中移“创马”人工智能专题高校赛总决赛收官
搜狐财经· 2025-12-19 08:19
赛事概况与规模 - 中国移动创客马拉松大赛人工智能专题高校赛暨2025年大学生科技创新总决赛在广州圆满收官,赛事由中国移动互联网有限公司主办,并得到中国移动通信集团有限公司及广州市天河区发展和改革局的联合指导 [1] - 该赛事是中国移动重要的科技创新赛事,自2016年起已连续举办九届,累计征集超过3.6万个创新项目与解决方案,吸引超过10万名创新人才参与 [1] - 本次大赛以“做科创青年,用 AI 为世界求解”为主题,聚焦高校群体与AI技术融合,是“创马”品牌在AI赛道的延伸及科创生态的升级实践,吸引了全国超过30所高校的172支优秀队伍参赛 [1] 赛事支持与产业导向 - 广州市天河区作为“创新强区”,正加速构建“12126”现代化产业体系,为科技创新提供优质发展环境,并通过场地、资金、产业链对接等多维度保障,积极助力青年科创项目落地与成果转化 [3] - 主办方中移互联网有限公司向参赛团队全面开放其核心技术能力,学生可调用企业级资源进行开发实践,打通从理论到应用的落地通道 [3] - 赛事聚焦AI主题,针对性设置了“AI+安全”、“AI+云产品”、“AI消息通话智能体”、“AI+低空经济”、“AI+Web3.0”五大命题赛道,与产业发展方向高度契合 [3] - 赛前设置了训练营,由专业导师提供课题分析、技术答疑等多元指导,为晋级队伍精准赋能,以提升实战能力 [3] 评审与展示 - 总决赛评审团由院士专家,以及中国移动、华为、阿里、字节跳动等企业的技术与产品负责人组成,政府单位领导也到场指导,为赛事注入强劲专业力量 [4] - 参赛队伍通过项目演示和成果汇报全方位展现创新思路与技术落地能力,评审专家则围绕技术可行性、产业适配性、商业价值潜力三大核心维度展开深度质询 [4]
回望2025·实物见变迁丨App里的新生活——2025年人工智能渗透日常方方面面
新华社· 2025-12-19 00:20
AI应用用户规模与市场渗透 - 截至2025年10月,中国AI移动端用户规模已达7.2亿 [1] - 华为应用市场数据显示,豆包App安装量达26亿次,DeepSeek安装量达12亿次 [1] - 元宝、Kimi等AI应用产品紧随其后,市场呈现多强竞争格局 [1] AI在日常工作与生活中的具体应用 - AI已成为生活“帮手”,例如用于辅导孩子作业、规划旅游行程等场景 [2] - AI已成为职场“助手”,广泛应用于制作PPT、撰写报告、处理数据等工作流程 [2] - 用户使用AI的目标从“尝鲜”转向深度嵌入工作流,以实现效率提升 [2] AI在电商及商业场景的深度融合 - 电商平台是AI技术应用的高密度领域,AI已深度融入消费者购物全流程 [3] - 京东JoyAI大模型在2025年“双十一”期间已应用于超过1800个场景,服务超过300万商家 [3] - 京东数字人直播成本仅为真人主播的1/10,效果超越80%的真人主播,已服务超过4万个品牌,覆盖超60个商品类目,累计观看人数突破1700万,带动商品交易总额超7亿元 [3] - 后台AI“店长”可自动分析竞品价格、库存与用户需求,智能设置优惠以减轻商家运营负担 [3] AI技术演进与产品迭代 - AI产品本身持续进化,例如灵光AI助手基于全代码生成的多模态输出能力,提供更丰富的创作体验 [2] - AI技术正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和生活方式 [4] AI对产业格局与交互范式的影响 - AI智能体正实现从“人找服务”到“服务找人”的转变,成为下一代交互范式,并可能逐步取代传统App [4] - 端侧AI智能体的发展可能使传统App逐步“隐形化”,根据用户情境智能化推送服务 [4] - 行业预计未来3至5年将是超级App与AI智能体共存的混合期 [5] AI发展面临的挑战 - AI智能体在端侧运行涉及大量实时数据处理,其数据安全与隐私保护是技术与监管需解决的核心问题 [5] - AI智能体通过个性化服务替代传统App,可能改变以广告、应用内购和订阅为主的现有盈利模式,引发产业生态博弈 [5] - “豆包手机”作为初代智能体手机案例,其市场表现显示AI智能体完全替代现有App生态仍面临挑战 [4]
AI赋能内容分发,华为信息流创作者沙龙在北京成功举办
搜狐财经· 2025-12-18 21:57
鸿蒙生态与终端发展 - 搭载鸿蒙操作系统5及以上版本的终端设备数已突破2700万 [3] - 全新发布的鸿蒙操作系统6在互联、智能、安全、流畅等方面带来全面提升 [3] 华为浏览器内容战略与用户数据 - 公司推出全新的“华为浏览器+X”内容战略,增加短剧、小说、杂志、合集、视界等多元内容品类 [3] - 华为浏览器当前的AI用户渗透率已达到30% [7] - 全新推出的资讯助手功能通过AI赋能为用户带来更智能的信息流内容体验 [7] 内容生态合作与伙伴进展 - 环球网自2019年起与华为信息流合作,后续将深化“内容+技术+场景”融合,聚焦内容协同、栏目共建及热点内容加热合作 [11] - 《读者》杂志2025年新媒体图文类年度总阅读量达40.8亿,视频类年度播放量达4亿 [14] - 《读者》后续与华为的合作将持续深耕图文内容矩阵,并开启视频领域合作,打造文化表达新范式 [14] 创作者支持与平台能力 - HNC平台将为创作者提供更深度的数据分析能力,帮助进行账号维度的内容运营和管理 [7] - 平台会将智能动态识别的热门及稀缺话题发布,以牵引创作者的价值内容生产 [7] 激励计划与生态建设 - 华为信息流在2025年推出了视界频道激励计划,以技术体验创新牵引高质量内容生产 [16] - 2026年将发布两大全新激励计划“摘星计划”和“繁星计划”,通过现金激励和流量扶持等手段牵引内容的精品化和深度化运营 [16] - 公司将持续激励精品和垂类内容生产,为鸿蒙生态信息流内容高质量发展提供推动力 [16]
小米自研大模型MiMo-V2-Flash正式开源上线;腾讯混元世界模型1.5发布丨AIGC日报
创业邦· 2025-12-18 00:07
小米AI大模型进展 - 小米集团在2025年小米人车家全生态合作伙伴大会上宣布,其自研AI大模型Xiaomi MiMo-V2-Flash已正式开源上线,被称为迈向Agent时代的全新语言基座[2] - 根据公布的时间表,小米已推出推理大模型MiMo-7B、视觉推理大模型MiMo-VL、原生端到端音频生成模型MiMo-Audio、端侧视觉语言大模型MiMo-VL-Miloco以及具身大模型MiMo-Embodied[2] 行业领袖对AI前景的看法 - 小鹏汽车董事长何小鹏认为,当前没有AI泡沫,未来AI市场存在巨大机遇[2] - 何小鹏指出,任何科技时代在阶段或局部都可能存在泡沫,但这是市场从混沌到有序的必然竞争过程,AI必将推动社会巨大变革[2] 腾讯AI模型发布 - 腾讯正式发布混元世界模型1.5,该模型允许用户通过输入文字描述或图片来创建专属的互动世界[2] - 用户可通过键盘、鼠标或手柄实时控制虚拟相机的移动和转向[2] OpenAI生态合作扩展 - OpenAI宣布Apple Music即将加入与ChatGPT集成的合作伙伴阵营,其他即将上线的应用还包括Adobe、Airtable、Clay、Lovable、OpenTable、Replit和Salesforce[2] - 去年10月,OpenAI在ChatGPT中推出应用功能,首批合作平台包括Spotify、Booking.com、Canva、Coursera、Figma、Expedia和Zillow[2] - OpenAI同时发布了应用软件开发工具包预览版,开发者将能借助该工具包将自家应用接入ChatGPT生态[2]
腾讯升级大模型研发架构 引入前OpenAI研究员姚顺雨任要职
新浪财经· 2025-12-17 13:57
公司战略与组织架构调整 - 腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化其大模型的研发体系与核心能力 [1] - 任命Vinces Yao(姚顺雨)为首席AI科学家,同时兼任AI Infra部和大语言模型部负责人,其背景为清华和普林斯顿大学毕业,曾任OpenAI研究员,是OpenAI首批智能体产品Operator与Deep Research的核心贡献者 [1] - AI Infra部负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理服务等核心技术 [2] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [2] - 此次架构升级旨在强化工程化优势,提升AI大模型研究能力,聚焦AI战略布局,提升研发效率 [2] 公司人才与产品进展 - 近期混元团队加速招募AI人才,来自大厂、AI六小虎的数位核心员工已加入腾讯,以支撑高强度的技术攻坚 [2] - 混元旗舰模型TurboS是业界首个基于混合线性注意力机制落地的超大规模MoE模型,自年初发布后保持每月一个版本的迭代速度 [3] - 腾讯于12月5日推出最新旗舰模型混元2.0,并于今日发布世界模型1.5,该模型系国内首个开放体验的实时世界模型 [3] 行业竞争动态 - 不仅腾讯AI提速,字节跳动、阿里巴巴等大厂年内AI战略决心明确,重磅动作频频 [3] - 字节跳动旗下豆包手机受关注,其火山引擎FORCE原动力大会预计将发布豆包大模型新品 [3] - 阿里巴巴已成立千问C端事业群,由原智能信息与智能互联两个事业群合并重组而来,包含千问APP、夸克、AI硬件、UC、书旗等业务,首要目标是将千问打造成一款超级APP,成为AI时代用户的第一入口 [3] 行业发展趋势与竞争关键 - 国内大厂正围绕算力设施层、模型层、应用层全面发力 [4] - AI应用层面的竞争不会简单收敛为大厂之间的较量,随着算力和基础模型能力普及,行业差异化的关键转向围绕具体使用场景与行业工作流程构建可持续的竞争力壁垒,这类能力是第三方独立厂商最具价值且最难被规模化复制的竞争优势 [4]
腾讯大模型研发架构升级 OpenAI前研究员任要职
上海证券报· 2025-12-17 12:39
腾讯AI组织架构升级 - 公司于12月17日升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化大模型研发体系与核心能力 [2] - Vinces Yao(姚顺雨)出任首席AI科学家,向总裁汇报,并兼任AI Infra部与大语言模型部负责人 [2] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理服务等核心技术 [2] - AI Data部负责大模型数据及评测体系建设,数据计算平台部负责大数据和机器学习的数据智能融合平台建设 [4] 腾讯AI技术进展与产品落地 - 混元大模型过去一年发布超过30个新模型,12月5日发布的混元2.0在复杂推理与文本生成场景表现国内领先 [4] - 混元3D模型保持全球领先水准,开源社区下载量超过300万 [4] - 腾讯元宝AI应用用户规模稳居国内前三,AI能力已融入微信、QQ、音乐、会议等国民级产品 [4] - 混元大模型已在公司内部超过900款应用和场景中落地,包括腾讯会议、微信、广告、游戏等 [5] - 公司内部超90%的工程师使用腾讯云代码助手CodeBuddy,50%新增代码由AI辅助生成,代码评审环节AI参与度达94% [5] 腾讯AI战略与投入 - 管理层明确资本支出变化主要反映AI芯片供应节奏变化,而非AI战略方向调整,强调不会在AI竞争中掉队 [8] - 公司更强调研发开支的重要性,第三季度一般及行政开支同比增长18%至342亿元,主要由于研发投入增加 [8] - 第三季度研发投入达228亿元,同比增长28%,尤其是AI相关举措持续加码 [8] - 微信最终会推出一个AI智能体,让用户在微信生态内完成从需求理解到服务交付的完整流程 [8] 行业竞争态势 - AI人才已成为科技巨头战略布局的核心资源,国内外公司均重金招揽顶尖人才 [7] - 阿里云CTO、通义实验室负责人周靖人成为阿里巴巴合伙人,业内认为此举释放出阿里持续加码AI核心能力建设的明确信号 [7] - 行业竞争进入深水区,公司管理层认为中国目前不存在一个足够好的决定性模型,各模型处于差不多的发展速度 [8]