Workflow
Skywork Super Agents
icon
搜索文档
昆仑万维方汉:通用Agent是伪命题,AI Office仍有存在空间丨MEET2026
量子位· 2025-12-15 05:57
文章核心观点 - AI技术正经历从通用大模型到可执行智能体的拐点,其底层动力是推理能力提升和长思维链成熟后,“过程”开始被批量学习与调用 [1][3] - 智能体(Agent)的本质并非通用人工智能(AGI),而是一种可验证过程的自动化系统,擅长将已被人类验证过的流程规模化复制,但不擅长创造新范式 [2][12][16] - 智能体将最先落地于流程稳定、结果可验证的AI Office场景,并最终重塑公司组织,使人类从重复执行者转变为过程的架构者 [5][12][28] 昆仑万维公司介绍与业务 - 公司成立于2008年,2015年上市,业务覆盖全球100多个国家和地区,全球月活用户近4亿 [8] - 2024年前三季度公司营收58亿,其中海外收入占比高达93% [8] - 公司自2020年开始AI业务,2022年12月发布中国首个开源的13B中文预训练大模型,2024年5月推出Skywork Super Agents产品 [8] - 公司AI音乐Mureka、Skywork Super Agents、AI社交Linky在海外已产生实际收入并高速成长 [11] Skywork Super Agents产品特性 - 产品形态为从通用到专业的智能体,包括五个专家Agent和一个通用Agent [11][12] - 其PPT模式可在5分钟内生成30页PPT,该模式占当前日活跃用户(DAU)的40%,是用户使用量和好评量双排名第一的功能 [11][12] - 产品具备强大的多模态输出能力,可一键生成Word、PPT、Excel、播客、视频、小程序等内容,并支持上传多种格式文件、录音、网址进行内容生成 [13] - 产品所有内容附带清晰可追溯的参考文献,旨在彻底解决AI幻觉问题 [13] - 自2024年5月22日发布后,产品在下半年进行了紧密迭代,不断增加智能体种类并升级功能 [15] 对智能体(Agent)的行业认知 - 技术拐点出现:大模型完成了从“背答案”到“背过程”的关键跃迁,以ChatGPT为起点,到DeepSeek等模型通过更高效、更长推理的方式,实现了过程的泛化 [5][18] - 智能体大行其道的根本逻辑在于“过程可学习”实现了大规模的工业化和产业化 [20] - 智能体擅长数学、代码和结构化决策,但不擅长创新、范式突破和新框架 [12][16][19] 智能体的落地场景与挑战 - **首要落地场景**:AI Office,因其流程稳定、跨行业使用、结果可验证 [12][21] - **垂类场景挑战**:医疗、金融、建筑、法律、制造等行业缺乏高质量的过程数据集,这是阻碍智能体在这些领域应用的关键问题 [21][24] - **类比历史**:智能体的发展类似PC操作系统,通用智能体可能是一个伪命题,而像AI Office这样的通用产品以及各行业的专业软件将共存 [25] 通用智能体的渠道竞争格局 - **操作系统与硬件**:对于手机上的通用智能体,只有硬件手机厂商才能决定其设备上可以安装什么,其他智能体厂商不具备此能力 [12][26] - **浏览器**:被视为相对公平的渠道,因为全球主要浏览器(如Chrome、Firefox、Edge、Opera)数量有限且开放插件生态 [26] - **办公软件**:如飞书、钉钉、WPS、Office是重要入口,但办公软件需求是长尾市场,仍为第三方软件留有空间 [26] - **即时通讯**:由于社交网络效应,垄断性更强,作为通用智能体入口,其他厂商难以介入 [27] - **搜索引擎**:大模型聊天机器人(如ChatGPT、豆包、千问)本质上是分食传统搜索引擎市场,而搜索引擎在每个国家通常只会有1到2个胜利者 [27] 智能体时代对组织与人类角色的影响 - **组织重塑**:公司内部的流程属于过程数据,只要可验证就可以被智能体自动化,每个岗位将变成智能体的执行上下文 [12][28] - **角色转变**:重复操作的岗位将消失,人类员工将转变为“过程架构师”或“过程设计者”,负责维护旧流程和创造新流程 [12][28][31] - **类比黑灯工厂**:如同黑灯工厂的员工负责制造流程的维护与迭代,未来人类将成为智能体流程的维护者和创造者 [28][29]
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
36氪· 2025-12-11 07:32
大会概况与行业趋势 - 量子位主办的MEET2026智能未来大会吸引了近30位产业代表、近1500名线下观众及超过350万线上观众,反映了行业对AI未来的高度关注 [5] - 2025年AI领域呈现发展、分裂与重构的态势,迫使所有参与者明确未来方向,行业普遍相信下一段增长曲线就在眼前 [3] - 2025年被公认为“Agent元年”,AI智能体技术成为核心焦点,行业高能节点集中爆发 [1][57] 大模型与AGI发展路径 - 以DeepSeek为代表,AI正从鉴别式走向生成式与推理式,新一轮人工智能是信息智能、物理智能和生物智能的融合 [8] - 未来5到10年,基础大模型将像操作系统一样在全球范围内收敛到不超过10个 [8] - 主战场将走向“智能体互联网”时代,智能体会取代大部分SaaS和App,成为交互的默认形态,并被视为通往AGI的必经之路 [8] - 大模型推动AI从弱人工智能迈向通用人工智能,并推动机器人进入2.0通用具身智能时代 [11] - 所有生成模型本质上都是在拟合数据分布,开源模型LLaDA采用扩散语言模型架构,在相同计算量下可比自回归模型参数规模更小,并具备直接修改token等优势 [17] - 当模型与数据规模持续增大时可能出现能力涌现,预计未来几年,有标准答案的人类最难考试可能也难不住机器 [55] - Scaling Law能走多远具有不确定性,国内仍需有少量顶级团队紧跟全球前沿,探索其极限 [55] 智能体(Agent)的演进与落地 - AI正从“思考与回答”转向“自主行动与创造”,真正成熟的智能体必须具备自主分析、决策与执行落地的能力 [35] - 智能体是一套包含认知规划、行动协作、分析反馈三层能力的完整闭环智能系统 [35] - Agent Infra本质上是AI时代的操作系统,管理模型能力、工具调用等“智能资源”,其核心在于Runtime,以提供跨环境通用运行能力 [35] - 过去一年Agent进化明显,在PPT制作、编码等核心工作流中能交付实习生水平的结果,越来越多软件垂类在采用AI能力提升效率 [66] - 一个成功的Agent构建需要三个模块:底层的模型“大脑”、中间的代码、以及相当于“手和脚”的tools模块 [15] - 企业实现智能体落地,优化重点集中在场景选择评估、内部数据知识整理、模型选择构建三个需要循环迭代的环节上 [19] - 企业级智能体落地与ToC的最大不同,在于对“规模化、成本效率和精度”的极致要求 [19] - 多数Agent存在负毛利问题,完成任务的代价高于用户支付意愿,这对创业者和基础设施提供商是巨大挑战 [66] - 当前Agent在三四线城市和日常生活中的渗透率较低 [66] 多模态与第三代Scaling范式 - 2025年往后,第三代Scaling范式的关键在多模态,智源研究院的悟界·Emu3.5通过统一自回归架构,将Next-Token Prediction升级为在多模态数据上的Next-State Prediction [11] - 视频是能大规模获得的、模拟真实世界的高效载体,包含时间、空间、物理、因果关系及意图等各种要素 [11] - 今年多模态和执行端应用带来显著ROI,新的多模态模型提升了智能体对图像视频的理解能力,打开了更多数字空间场景 [66] 端侧与混合AI - AI行业演进分为四个阶段:感知AI、生成式AI、智能体AI、以及能理解并响应真实物理世界的物理AI [13] - 端侧大模型能力快速提升,两年前只能跑1-2K上下文,去年可跑4K,今年已支持8K-16K,特殊场景下甚至可实现最长128K的端侧部署 [13] - 终端侧正在从单一文字模态向支持文本、图片、视频、音频、语音等多模态甚至全模态方向演进 [13] - 在终端侧运行大模型的最大好处之一是个性化,但主要面临内存、带宽和功耗控制等挑战 [13] - 端侧模型不是云端大模型的小参数版本,其关键在于自主学习和记忆,而Transformer架构模型无法在端侧实现这一点 [42] 算力、芯片与基础设施 - 商汤大装置算力总规模达32000P,通过算电协同精准预测电力消耗,已实现年化降低7%电费,年度碳减排超3000吨,综合算效提升15% [31] - 商汤联合国内十余家厂商发布“商汤大装置算力Mall”,客户可自由组合调配国产算力资源、平台工具和行业模型服务 [31] - 国产芯片替代是渐进过程,昆仑芯已在搜索线上系统全量用于推理,但大规模训练场景仍是难点 [44] - 当前重要发展方向是MoE,能扩大参数规模同时不增加激活参数规模,但会带来通信占比提升等系统层面新挑战 [44] - 单颗芯片性能已成为AI算法发展瓶颈,太初元碁自主设计的TC link可实现128卡间的高速互联拓展,为AI算法增长提供硬件基础 [39] - 国内发展人工智能产业离不开开源生态,行业需要企业共同组建开源平台 [39] 具身智能与物理AI - 具身智能被视为一种专门面向物理世界、独立于虚拟世界语言/多模态模型的基础模型 [47] - 物理世界存在高度随机性,现有模型架构、训练方法和数据能力难以对其做出充分准确刻画 [47] - 如果以未来十年为尺度,具身智能基础模型甚至有可能反过来吞噬现有多模态模型的生存空间 [47] - 目前的具身大模型存在不好用、不通用、不易用的问题,尚未达到“ChatGPT时刻” [11] - 未来几年内,人形机器人要进入通用开放环境自主进行复杂工作几乎不可能,应立足于在特定真实场景实现“星火燎原”式的落地发展 [55] - 在物理场景应用中,需要解决双脑架构集成问题:大语言模型给出指令后,端侧需有类似小脑的模型进行快速执行 [66] - 灵巧手是具身智能的核心零部件,中国在机器人与灵巧手领域优势明显,灵心巧手在触觉传感器、电机、减速器三大核心部件坚持自研 [53] - 光轮智能全栈自研“测量-建模-求解”三位一体仿真解决方案,以缩小sim2real gap,加速世界模型与物理AI落地 [49] 商业化落地与行业应用 - 2025年行业更关心如何做行业落地、场景赋能和商业化变现 [25] - 企业服务方向最容易落地的三个方向是:工程流程自动化、行业研究报告、智能化办公助手 [25] - 大模型在千行百业里落地才能产生最大价值,其价值在很多场景尚未真正发挥出来 [29] - 有三类企业需要行业或私有模型:传统大型企业、有海量数据的中小企业、颠覆行业的新兴公司 [29] - 用大模型做To B,最关键的是后训练或Agent化,仅调API无法形成差异性,开源模型需经“专业训练”才能战胜闭源模型 [29] - 卓世科技在医疗健康领域,利用大模型融合2000多种常见病、常见药服务社区医院,并训练专业病种大模型辅助三甲医院诊疗 [25] - AI在工业制造落地需组合拳,大模型融合视觉和时序模型处理生产传感数据,作为大脑自动化调配生产和调优工艺 [25] - 百度文库的AI学习平台OREATE AI新版本上线一个月月活突破140万,登顶ProductHunt全球日榜第一 [9] - 昆仑万维的Skywork Super Agents产品,其PPT模式可在五分钟内生成30页PPT,40%的日活用户使用该模式 [37] 企业组织与生产力变革 - AI进程最直接的落地场景是AI Office [37] - Agent将重写公司组织,因为可验证的流程可以被自动化,重复操作岗位将消失,取而代之的是过程架构师 [37] - 对于企业,核心诉求不是买AI工具,而是能够直接对业务结果负责的AI运营智能体 [51] - 现在不是“AI+”的时代,而是“运营xAI”,AI从工具跃迁为业务主体 [51] - 年轻人是AI生产力释放的主力军,经验丰富的从业者需为企业创造释放AI潜力的生产关系 [51] 经济学影响与全球竞争 - 据估算,AI在今后的十年里每年可提升全球经济增长0.5到0.7个百分点 [23] - AI改变了稀缺的概念,当AI替代人进行工作决策时,可能会出现人和算法、算法和算法之间的竞争 [23] - 未来不应考虑哪个行业绝对安全,而应思考如何掌握AI技术并与AI共生 [23] - 通用Agent的渠道之争对传统渠道是生死之战,只有手机硬件厂商才能决定自己手机上可以装什么Agent [37] - 谷歌主导的A2A协议支持企业内部及企业间智能体的安全有效通信,Gemini模型拥有100万Token超长上下文并迈向AI行动时代 [21] - 开源对AI进化速度至关重要,如果每家公司都闭源,研究速度可能会降低为原来的千分之一 [33] 技术架构与未来突破 - 人工智能要发展到下一个台阶,需要突破Transformer和反向传播算法两座大山 [42] - 每台设备拥有自主学习能力并向物理世界学习,会产生群体智能,这才是迈向通用人工智能的最佳途径,现有大模型本身不产生知识,只是传播知识 [42] - 大公司应双管齐下:一方面使用当前领先技术,另一方面进行探索性研究以寻找下一个重大突破 [33] - 类比生物进化中的“间断平衡”,AI发展是“长期停滞+突然跃迁” [33] - 从POC迈向生产部署面临挑战,生产环境需解决安全、扩容、成本、高可用及处理非优化数据等一系列问题 [15] - 模型定制化面临挑战,Amazon SageMaker AI提供的Nova Forge允许在基础模型训练阶段就引入自有数据进行定制,效果优于训练后微调 [15] - 真正“好用”的AI智能体核心标准包括:采用AI原生方式开发以替代工作流环节、具备可进化性、能像靠谱同事一样持续稳定执行任务并支持人机协作 [66] - 每个人每天使用的最高频的三个APP中有两个是Agent时,才意味着AI Agent进入新发展阶段 [66]
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
量子位· 2025-12-11 06:54
大会概况与行业共识 - 量子位主办的MEET2026智能未来大会吸引了近30位产业代表、近1500名线下观众及超过350万线上观众,反映了行业对AI未来的高度关注 [8] - 2025年AI领域呈现发展、分裂与重构的态势,迫使所有参与者明确未来方向 [4] - 行业共识认为,AI正处在下一段增长曲线的起点,从云到端、从模型到智能体(Agent)、从软到硬均存在重要机会 [5] 人工智能发展趋势与范式演进 - AI正从鉴别式走向生成式与推理式,并在高效率、低成本和开源生态中加速落地 [10] - 新一轮人工智能是信息智能、物理智能和生物智能的融合,本质上是原子、分子和比特的融合 [10] - AI行业演进被划分为四个阶段:感知AI、生成式AI、智能体AI(可自主行动)和物理AI(能理解并响应真实物理世界) [19] - 2025年被认为是“Agent元年”,智能体技术开始在各行各业验证价值 [81] - 人工智能的演进过程与生物进化相似,呈现“长期停滞+突然跃迁”的特点,开源对加速进化至关重要 [49] 大模型与AGI路径 - 未来5到10年,基础大模型将在全球范围内收敛到不超过10个,类似于操作系统 [10] - 大模型推动AI从弱人工智能迈向通用人工智能(AGI),并推动机器人进入通用具身智能时代 [16] - 通往AGI的必经之路是“智能体互联网”时代,智能体将取代大部分SaaS和App,成为默认交互形态 [10] - Scaling Law能走多远存在不确定性,但国内仍需有顶级团队探索其极限,一旦出现新的涌现现象可能打破发展饱和 [79] - 扩散语言模型架构(如LLaDA)提供了自回归模型之外的另一种路径,在相同计算量和性能目标下可能所需参数更小,并具备直接修改token等优势 [25] 智能体(Agent)的发展与应用 - 智能体的本质是可验证过程的自动化,擅长数学、代码和结构化决策,现已发展到拐点 [55] - 一个成功的智能体构建需要三个核心模块:提供决策的底层模型“大脑”、中间代码、以及作为“手和脚”的工具(tools) [22] - 认知偏差、落地断层、体验割裂是当前用户使用AI产品的三大痛点 [13] - 百度推出的超级智能体框架调度中枢GenFlow月活用户达千万级,自称是全球最大的通用智能体 [13] - 智能体将重写公司组织,重复操作的岗位将消失,取而代之的是过程架构师 [55] - 企业级智能体落地的关键在于三个平台:作为认知中枢的大模型平台、提供感知的AI能力平台、沉淀企业记忆的AI数据平台 [28] - 企业服务落地最容易的三个方向是:工程流程自动化、行业研究报告、智能化办公助手 [37] - 衡量“好用”智能体的核心标准包括:能交付相对完整的结果、具备可进化性、采用AI原生方式开发、以及具备可控性和可解释性 [92] - 当前多数智能体存在负毛利问题,完成任务的成本高于用户支付意愿,这是创业者和基础设施提供商的巨大挑战 [92] 多模态与具身智能 - 2025年往后,第三代Scaling范式的关键在多模态 [16] - 智源研究院的悟界·Emu3.5通过统一的自回归架构,将Next-Token Prediction升级为在多模态数据上的Next-State Prediction,标志着AI从语言学习迈入多模态世界学习 [16] - 具身智能应被视为独立或平行于虚拟世界语言模型、专门面向物理世界的基础模型 [67] - 当前具身大模型面临不好用、不通用、不易用的挑战,尚未达到“ChatGPT时刻” [16] - 视频是能够大规模获得的、模拟真实世界的高效载体,包含时间、空间、物理、因果关系等多种要素 [16] - 在物理场景应用中,需要解决“大脑”(大语言模型)与“小脑”(端侧快速执行模型)的双脑架构集成问题 [92] 从云端到边缘的AI部署 - 终端侧运行大模型的最大好处之一是个性化 [19] - 端侧模型能力快速提升:两年前只能运行1-2K上下文,去年达4K,今年已支持8K-16K,特殊场景下甚至可实现最长128K的端侧部署 [19] - 终端侧正从单一文字模态向支持文本、图片、视频、音频、语音等多模态甚至全模态方向演进 [19] - 端侧运行大语言模型面临内存、带宽和功耗控制等挑战,需通过量化与压缩、并行解码技术、先进NPU与异构计算架构来解决 [19] - 端侧模型的关键在于自主学习和记忆,而Transformer架构模型无法在端侧实现这一点,突破Transformer和反向传播算法是AI发展到下一台阶必须跨越的两座大山 [61] 算力、芯片与基础设施 - 商汤的算力总规模达32000P,其智算中心通过算电协同等技术,已实现年化降低7%电费,年度碳减排超3000吨,综合算效提升15% [46] - 国产芯片替代是渐进过程,大规模训练场景的替代是难点 [64] - 当前重要发展方向是混合专家模型(MoE),它能扩大参数规模而不增加激活参数,但会给系统带来通信占比提升等新挑战 [64] - 单颗芯片性能已成为AI算法发展瓶颈,需要如TC link这样的高速互联技术实现128卡间扩展,为AI算法增长提供硬件基础 [58] - Agent Infra(智能体基础设施)本质上是AI时代的操作系统,管理模型能力、工具调用与任务执行等“智能资源” [52] 行业落地与商业化 - 2025年行业更关心如何做行业落地、场景赋能和商业化变现 [37] - 大模型在千行百业中落地才能产生最大价值,其在很多场景的价值尚未真正发挥 [43] - 三类企业需要行业或私有模型:传统大型企业、有海量数据的中小型企业、颠覆行业的新兴公司 [43] - 用大模型做To B业务,最关键的是后训练或Agent化,仅调用API无法形成差异化 [43] - AI在工业制造落地是一个组合拳,需大模型融合视觉和时序模型来处理生产数据,作为大脑进行分析决策和工艺调优 [37] - 昆仑万维的Skywork Super Agents产品中,PPT模式可在五分钟内生成30页PPT,该模式被40%的日活跃用户使用 [55] - 百度文库的AI学习平台OREATE AI新版本上线一个月月活突破140万,曾登顶ProductHunt全球日榜第一 [13] - 光轮智能通过全栈自研的“测量-建模-求解”三位一体仿真解决方案,缩小仿真与现实的差距(sim2real gap),以加速世界模型与物理AI落地 [70] 自动驾驶与机器人 - L2+/L2++与纯无人的L4难度差距巨大,真正的L4公司需要至少有二、三十辆车的纯无人车队运营半年以上 [40] - 预测称,如果特斯拉不装激光雷达,三年之内其在旧金山无法达到Waymo的自动驾驶水平 [40] - 随着大模型发展,若算力等条件满足,预测8年后可能出现开车能力超越99.99%人类司机的自动驾驶“AlphaGo时刻” [40] - 未来几年内,人形机器人进入通用开放环境自主进行复杂工作几乎不可能,应立足于在特定真实场景实现“星火燎原”式的落地 [79] - 灵巧手是具身智能的核心零部件,中国在机器人与灵巧手领域优势明显,甚至是遥遥领先 [76] 数据、仿真与开源生态 - 智源研究院过去两年多开源了2200多个模型,下载量突破6.9亿次;开源近百个数据集,下载量超120万次 [16] - 扩散架构模型LLaDA相比自回归模型更为data-hungry,对数据需求更大、吸收数据更快 [25] - 模型定制化面临挑战,Amazon SageMaker AI提供的Nova Forge能力允许在基础模型训练阶段就引入自有数据进行定制,效果优于训练后再微调 [22] - 国内发展人工智能产业离不开开源生态,行业需要企业共同组建开源平台 [58] 经济影响与组织变革 - 据估算,AI在今后的十年里每年可提升全球经济增长0.5到0.7个百分点 [34] - AI改变了稀缺的概念,并可能引发人机竞争及算法间的竞争 [34] - 未来不应寻找不会被AI替代的“安全”行业,而应思考如何与AI共生 [34] - 年轻人是AI生产力释放的主力军,经验丰富的从业者需为企业创造释放AI潜力的生产关系 [73] - 给AI创业者的建议包括:在增量中找市场、在专业里找空间、在业务中找场景、在结果中找收益 [73]
Agent引爆产品新思维、奇点智能研究院正式成立!2025 全球产品经理大会首日精彩速览
AI科技大本营· 2025-08-15 13:56
产品经理角色演变 - PC时代产品经理角色更偏向"需求分析师",移动互联网时代转向"用户体验设计者"[1] - 大模型和Agent技术正在重塑产品经理工作方式,打破角色边界并升级思维模式[1] - 2025全球产品经理大会汇聚40余位专家及1000多位与会者,探讨AI产业趋势[1] 奇点智能研究院成立 - 由CSDN与Boolan联合发起,定位为人工智能前沿技术和产业落地的创新研究机构[3] - 聚焦计算范式、开发范式和交互范式转换,设立六大研究领域[5][7] - 与华东师范大学合作成立"开源创新与变革联合实验室",计划发布全球开源发展报告等研究成果[5] 大模型驱动的AI产业生态 - 基础大模型经历从"训练"到"推理"范式转换,强化学习推动"经验数据时代"[10] - SOTA模型内置Agent和Tool Use能力,大模型从Chatbot进化到Agentic模型[11] - Vibe Coding(氛围编程)创造增量市场,有望实现"可塑软件"和低成本编程[12] - 自然语言对话界面重构智能应用形态,带来应用服务化等新趋势[13] - 未来智能体生态可能由多元设备(眼镜、手机、汽车等)作为交互入口[14] 生成式AI与生产力革命 - 昆仑万维发布全球首款AI Agent架构Office智能体Skywork Super Agents,将8小时工作量缩短至8分钟[18] - 昆仑万维开源多款多模态模型,覆盖音频驱动数字人、交互式世界模型等领域[19] - 海外AI API调用统计显示编程类占比87%,角色扮演类占5.4%[20][22] - 行业化大模型是必然趋势,通用Agent难以覆盖所有行业[23] - ToB场景核心是"增效",ToC场景核心是"降本"[23] GenAI应用交互设计 - 当前GenAI产品多以"助手"形态存在,受现有环境约束明显[25] - 交互设计核心任务:高效获取任务与上下文、便捷审核与应用结果[26][29] - 鼠标双击唤起助手可能成为GenAI时代的新型交互方式[28] AI时代的产品人味 - 当前AI工具存在交付模式单一、环境感知不足、交互设计不直观等问题[34] - 产品设计需平衡"天道(环境)、人道(人类需求)、AI道(技术)"[34] - YouMind通过多模态优化和内容可编辑性提升"人味",实现AI与用户双向协作[36][37] AI时代的产品经理机遇 - AI时代产品方法论面临跳跃式颠覆,产品经理既是受益者也是被颠覆者[40] - 技能边界被打破,"一人公司"模式可能普及[41] - 开源模型推动全产业链协作式创新,对产品经理具有战略意义[44][45] Chat BI与数据挑战 - Chat BI最大挑战是企业数据基础薄弱,原始数据质量影响分析结果[46][47] AI产品用户体验 - AI产品需明确功能优化与数据能力的边界,避免过早依赖语言模型升级[48] - 创业公司应集中资源在关键节点形成差异化优势[49] 行业应用与合作伙伴 - 大会设置12大专题,覆盖生成式AI、Agent设计、企业级应用等领域[51] - 鸿蒙生态、万兴科技等合作伙伴展示创新成果[51]
烧钱抢滩AI,昆仑万维的“大厂梦”代价几何?
36氪· 2025-06-16 11:55
公司战略转型 - 公司从网页游戏起家,逐步拓展至移动游戏、社交网络、浏览器等领域,并曾跟进元宇宙、新能源等风口,现全面转向AI领域,提出"All in AGI与AIGC"战略[2] - 公司董事长兼CEO方汉表示,AI是公司从"中厂"迈向"大厂"的关键机会,目标是重塑商业模式并获取红利[3] - 公司未来将专注于AI业务,除少数财务投资外不再进行其他行业控股型或长期投资[19] AI业务布局 - 公司于2023年4月发布"天工"大模型,宣称是国内首个对标ChatGPT的双千亿级大语言模型,发布后市值一度达793亿元[4] - 已形成AI内容应用矩阵,包括音乐创作平台Mureka(年化流水1200万美元)、AI社交应用Linky(月活300万/单月收入超100万美元)、短剧平台DramaWave(月活千万级)等[4][5][6][7] - 向上游延伸布局,2023年以6.8亿元收购AI算力芯片企业艾捷科芯58%股权,构建算力-大模型-应用链条[9] 商业化进展 - Mureka V6版本搭载全球首款带思维链的音乐生成模型,宣称听感超越Suno V4达到行业顶尖水平,2025年3月访问量333万[4] - Linky在谷歌应用商店下载量超1000万次,短剧平台DramaWave海外投放量居行业首位(5月投放素材11万条)[6][16] - AI游戏项目《猫森学园》进展顺利,自研引擎Spark AI拟于2025年7月上线[9] 财务表现 - 2024年营收56.6亿元(首次突破50亿),但亏损15.9亿元,为上市十年首亏;2025年Q1继续亏损7.7亿元[11][12] - 研发投入占比从2022年15.54%升至2024年28.22%,销售费用2024年达23.04亿元(同比增42.23%),2025年Q1销售费用8.7亿元(同比增92.11%)[10][13][15] - 游戏业务萎缩明显,营收贡献从2020年12亿元降至2024年4.44亿元,占比从40%以上降至7.85%[17] 行业竞争态势 - 公司"天工AI"月活711万,国内排名第12,与头部产品(豆包/DeepSeek/Kimi等)存在数量级差距[20] - 采取垂直领域差异化策略,在音乐生成(Mureka)、AI社交(Linky)等细分市场取得"SOTA"头衔,但多数产品市场反响一般[20][21] - 海外运营经验丰富(90%营收来自海外),可规避国内AI内卷,但需面对用户付费意愿和黏性挑战[19][21]
AI基础设施完善,细分领域应用望步入拐点
国泰海通证券· 2025-06-05 01:00
报告行业投资评级 - 维持传播文化业“增持”评级 [1][2] 报告的核心观点 - 2024年以来AI技术完善稳定,应用端效果显现,部分赛道和产品有初步成绩,建议关注具备优秀产品布局和潜力的公司 [2] 赛道趋势 - AI应用发展经历“纯文字 - 静态图像/声音 - 动态视频”过程,赛道相继发展,且驱动AI赛道从“单一模态/单一任务”到“多模态综合/复杂任务”演变 [3] 商业化目标 - 以“获客 - 粘性 - 付费”框架看AI应用趋势,收入=用户获取×用户留存×用户付费,涉及安装数、DAU、付费率等指标,核心能力包括流量、稳定性、性价比等 [13][15] 赛道对比 - 用户规模上,成熟产品聚集流量,AI助手与图片编辑类靠前,如deepseek产品有突破式增长;用户粘性上,社交互动产品功能完善,有用户形成交互粘性;用户付费方面,教育赛道付费习惯好,内容生产工具优质产品可收取高价 [4] - 展示了2025年4月部分AI产品的APP MAU及MAU变化情况,包括ChatGPT、豆包等国内外产品 [19] - 展示了2025年3月部分AI产品的APP MAU及日均时长情况 [25] AI综合助手 - 豆包和元宝作为AI原生应用,APP MAU稳居前列,国内前五名中有夸克、豆包、DeepSeek、元宝和Kimi智能助手,全球来看豆包和元宝MAU分别位列第3和第6 [29] - 豆包上线一年率先开启视频对话功能,或引领AI助手交互方式变革,它具备多种能力,2025年5月23日新增视频通话问答功能 [32] - 腾讯元宝依托腾讯混元大模型,APP于2024年5月30日上线,2025年2月升级,支持两大模型,完成全场景覆盖并拓展到知识类垂类场景 [35] AI视频 - AI视频赛道有稳定需求,可灵、海螺等产品有稳定访问量,用户使用充分 [40] - 谷歌发布VEO3,能实现“音画同步生成”,具备强大音效和对话生成能力,物理模拟和口型同步表现出色 [44] AI Agent - Manus定位AI Agent,能完成复杂任务,已取消邀请码、放开访问权限并推出收费方案 [50] - 昆仑万维发布天工超级智能体(Skywork Super Agents),在GAIA能力测试上得分第一,产品定位“AI Office智能体” [52] AI陪伴 - AI陪伴有多个成熟产品,大多以UGC形态运营并丰富功能,如星野APP用户可创作虚拟NPC,交互方式多样 [57] - 《EVE》定位3D虚拟女友,预设NPC基本特征,PV视频受关注,与其他产品有区别 [62] - 《奇点Chat》基于《奇点时代》IP推出,有养成体系和付费点尝试,设计了好感度系统和会员付费体系 [67] 相关公司评级 - 恺英网络、三七互娱、巨人网络、完美世界、吉比特、美登科技等公司评级为增持,并给出了股价、市值、EPS、PE等数据 [75]
Agent真的卷疯了,AI办公Agent也来了。
数字生命卡兹克· 2025-05-21 16:53
产品定位与功能 - 昆仑万维推出垂直办公场景的AI智能体Skywork Super Agents 专为文档 PPT 表格等办公场景优化[2][3][5] - 产品分为海外版和国内版 海外版网址为https://skywork.ai 国内版网址为https://www.tiangong.cn[5] - 提供文档 PPT 表格 网页 播客五种模式 其中文档 PPT 表格被定位为"专家级场景"[5][6] 核心功能亮点 - PPT模式支持细分场景选择 包括旅游观光 历史文化 科技技术等垂直领域[7][8] - 表格模式可自动处理数据 生成可视化图表 并分sheet展示分析结果[61] - 文档模式细分12种子场景 包括商业报告 简历 营销广告等专业类型[7] - 播客模式支持通过Prompt生成音频内容 通用模式可创作音乐等多样化内容[72][74] 交互设计创新 - 采用选择式交互替代传统对话式 降低用户输入成本[15][17] - 关键节点设置用户确认机制 包括任务清单确认和大纲确认环节[18][19] - 支持在线编辑生成内容 实现"最后一公里"的办公闭环[27] 技术实现特点 - 使用代码生成PPT 保持风格统一性[21][23] - 整合知识库功能 支持上传参考文件进行内容生成[30][31] - 基于音乐模型Mureka实现音乐创作功能[77] 商业化策略 - 采用积分制收费模式 任务复杂度决定积分消耗量[78] - 国内版定价仅为海外版1/3 采取差异化定价策略[84] - 每日赠送1200积分降低使用门槛[79] 开源生态布局 - 开源DeepResearch Agent框架 提供开发者社区支持[86][90] - 开放MCP接口 允许调用文档 PPT 表格生成能力[91] - GitHub开源地址为https://github.com/SkyworkAI/DeepResearchAgent[90]