Workflow
Software and Internet
icon
搜索文档
阿里夸克发布新AI创作平台“造点”,可一句话P图
新浪科技· 2025-09-25 03:36
产品发布 - 阿里巴巴AI旗舰应用夸克发布全新AI创作平台"造点" [1] - 平台集成AI生图与AI生视频两项核心能力 [1] - 率先接入通义万相Wan2 5 成为国内最先支持音画同步视频生成的平台之一 [1] 技术能力 - 在生图方面引入全球领先图像生成模型Midjourney V7 [1] - 结合夸克自研技术 提供图像与视频兼备的一站式创作体验 [1] - 用户可实现一句话P图 AI创意视频等玩法 [1] 访问渠道 - 用户可直接访问zaodian quark cn [1] - 可通过夸克PC端"AI生图"进入"造点"体验最新模型能力 [1] - 夸克APP端提供轻量化的创作体验 [1]
3年拟投入3800亿元
深圳商报· 2025-09-24 23:34
公司投资计划 - 未来3年将投入3800亿元用于建设云和AI基础设施 总额超过过去十年总和 [1] - 持续追加更大投入 2032年全球数据中心能耗规模将较2022年提升10倍 [2] 技术发展路径 - 提出通往超级人工智能ASI的三阶段演进路线:智能涌现、自主行动、自我迭代 目前处于第二阶段 [1] - 大模型定位为下一代操作系统 将成为承载用户 软件与AI计算资源交互调度的中间层 [1] - 通义千问坚持开源开放路线 致力于打造AI时代的Android [2] 产品与技术进展 - 发布通义大模型"七连发" 在模型智能水平 Agent工具调用和Coding能力等方面实现多项突破 [2] - 旗舰模型Qwen3-Max性能超过GPT5和Claude Opus 4 跻身全球前三 [2] - 正在打造全新AI超级计算机 同时拥有最领先的AI基础设施和最领先的模型 [2] 战略合作 - 与英伟达在物理AI领域达成合作 阿里云人工智能平台PAI将集成英伟达Physical AI软件栈 [3] - 将为企业用户提供数据预处理 仿真数据生成 模型训练评估等全链路平台服务 [3] - 合作旨在缩短具身智能 辅助驾驶等应用的开发周期 [3] 业务定位 - 阿里云定位为"全栈人工智能服务商" [2] - 构建作为"下一代计算机"的超级AI云 为全球提供智能算力网络 [2]
七连发!阿里多款重磅发布亮相云栖大会
搜狐财经· 2025-09-24 11:32
大语言模型技术突破 - 阿里云发布通义旗舰模型Qwen3-Max 性能超过GPT5和Claude Opus 4 跻身全球前三 [3] - Qwen3-Max预训练数据量达36T 总参数超过万亿 在SWE-Bench Verified测试中获69.6分位列全球第一梯队 [3] - 在Tau2-Bench测试中获得74.8分 超过Claude Opus4和DeepSeek-V3 在AIME 25和HMMT数学推理测试中均获满分100分 [3] 下一代基础模型架构 - 发布Qwen3-Next基础模型架构 总参数80B仅激活3B 性能媲美235B模型 [4] - 采用混合注意力机制和高稀疏度MoE结构 训练成本较密集模型Qwen3-32B降低超90% [4] - 长文本推理吞吐量提升10倍以上 为模型训练推理效率设立新标准 [4] 编程模型升级 - 千问编程模型Qwen3-Coder与Qwen Code、Claude Code系统联合训练 推理速度更快且代码安全性提升 [4] - 开源后API调用量在OpenRouter平台激增1474% 位列全球第二 [4] - 具备一键完成项目部署和问题修复能力 广受开发者和企业好评 [4] 多模态模型突破 - 视觉理解模型Qwen3-VL在32项核心能力测评中超过Gemini2.5-Pro和GPT5 [9] - 支持百万tokens上下文 视频理解时长扩展到2小时以上 具备3D Grounding能力 [10] - 全模态模型Qwen3-Omni音视频能力获32项开源SOTA 支持多模态混合训练 [10] 视觉基础模型进展 - 通义万相Wan2.5-preview系列涵盖文生视频/图生视频/文生图/图像编辑四大模型 [13] - 视频生成时长从5秒提升至10秒 支持24fps的1080P高清视频生成并实现音画同步 [13] - 图像生成能力全面升级 支持中英文文字和图表生成 具备一句话图像编辑功能 [13] 语音模型新产品 - 发布语音大模型通义百聆 包含语音识别模型Fun-ASR和语音合成模型Fun-CosyVoice [15] - Fun-ASR基于数千万小时真实语音数据训练 具备强大上下文理解能力 [15] - Fun-CosyVoice提供上百种预制音色 适用于客服、直播电商、消费电子等场景 [15] 模型生态与市场地位 - 通义大模型家族包含300个模型 覆盖全尺寸全模态 全球下载量突破6亿次 [17] - 衍生模型突破17万个 成为全球第一开源模型 服务超100万客户 [17] - 2025年上半年中国企业级大模型调用市场位列第一 客户包括苹果、英伟达、微软等知名企业 [17]
大模型七连发,外国人馋透了!阿里云栖大会全栈升级够狠
机器之心· 2025-09-24 09:23
全栈AI体系升级 - 公司在2025云栖大会上发布全系列新模型 实现全方位技术突破 覆盖基础大模型、模型架构、代码专用模型、视频生成模型和全模态模型[2] - 新模型在智能水平、Agent工具调用、Coding能力、深度推理和多模态方面相较以往有大幅进步 多数已可直接上手使用和体验[4] - 公司宣布未来三年将投入超过3800亿元用于建设云和AI硬件基础设施 持续升级全栈AI能力[43] 基础模型突破 - 新一代旗舰模型Qwen3-Max正式发布 总参数量超过1万亿 分为指令和推理两大版本[7][8] - 模型在中英文理解、复杂指令遵循、工具调用和编程能力上实现突破 大幅减少大模型幻觉[8] - 在SWE-Bench评测中获得69.6分位列全球第一梯队 在Tau2 Bench测试上取得74.8分超过Claude Opus4和DeepSeek V3.1[8] - 推理增强版本Qwen3-Max-Thinking-Heavy实现结合工具的深度思考 在AIME25、HMMT等数学能力评测中获得满分 为国内首次[10] - 发布下一代基础模型架构Qwen3-Next 总参数80B仅激活3B 性能媲美千问3旗舰版235B模型[12][14] - 训练成本较密集模型Qwen3-32B大降超90% 长文本推理吞吐量提升10倍以上[14] 专用与多模态模型 - 编程模型Qwen3-Coder结合Qwen Code与Claude Code进行联合训练 具备强大代码生成和补全能力[17] - 该模型在OpenRouter平台调用量激增1474% 全球第二[18] - 视觉理解模型Qwen3-VL成为系列最强大视觉语言模型 核心模型Qwen3-VL-235B-A22B现已开源[19][21] - Instruct版本在关键视觉基准测试中优于Gemini 2.5 Pro Thinking版本在多模态推理任务上达到SOTA性能[21] - 模型具备视觉智能体、视觉编程及3D检测能力 能自主进行电脑和手机界面操作[22][23] - 上下文拓展至百万tokens 视频理解时长拓展到2小时以上[25] - 全模态模型Qwen3-Omni开源三大版本 在36项音视频领域公开评测中获32项开源最佳性能SOTA[26] - 音频识别、理解、对话能力比肩Gemini2.5-pro 支持文本、图像、音频、视频全模态输入[26] - Qwen3-Omni-30B-A3B-Captioner为全球首次开源的通用音频caption模型[27] 生成模型与语音技术 - 通义万相累计生成3.9亿张图像和7000万个视频[29] - 推出Wan2.5-preview系列模型 涵盖文生视频、图生视频、文生图和图像编辑四大功能[31] - 视频生成时长达到10秒 支持24帧每秒的1080P高清视频生成[31] - 首次实现音画同步的视频生成能力 能生成匹配的人声、音效和音乐BGM[31] - 新增语音大模型通义百聆Fun 包括语音识别模型Fun-ASR和语音合成模型Fun-CosyVoice[33][35] - Fun-ASR由数千万小时真实语音数据训练而成 Fun-CosyVoice提供上百种预制音色[35] 开源生态与战略布局 - 公司已开源300余款通义大模型 全球下载量突破6亿次 衍生模型突破17万个 稳居全球第一[41] - 超过100万家客户接入通义大模型[41] - 通义大模型家族覆盖从0.5B到480B的全尺寸和基础模型、编程、图像、语音、视频的全模态[37] - 公司战略路径包括坚定通义千问的开源开放路线打造AI时代的安卓系统 以及构建作为下一代计算机的超级AI云[45] - 大模型将替代现代操作系统地位成为链接所有真实世界工具的接口[45]
阿里巴巴吴泳铭:阿里云要做AI时代的安卓
新浪财经· 2025-09-24 07:25
AI战略方向 - 公司认为实现通用人工智能AGI已是确定性事件 但只是起点 终极目标是发展出能自我迭代 全面超越人类的超级人工智能ASI [1] - 公司AI战略通过两大核心路径实施 通义千问坚定开源开放路线 致力于打造AI时代的安卓 [1] - 公司构建作为下一代计算机的超级AI云 为全球提供智能算力网络 [1] 技术平台定位 - 公司旗下阿里云将通过通义千问打造AI时代的安卓 [1] - 公司定位超级AI云为下一代计算机 [1]
阿里云大模型产品七连发
第一财经· 2025-09-24 06:41
2025云栖大会现场,阿里云CTO周靖人发布七款大模型产品,包括大语言模型通义旗舰模型 Qwen3-Max、下一代基础模型架构Qwen3-Next及系列模型、千问编程模型Qwen3-Coder、视觉理 解模型Qwen3-VL、全模态模型Qwen3-Omni、视觉基础模型Wan2.5-preview系列、语音大模型通 义百聆。 ...
吴泳铭:2032年阿里云全球数据中心能耗规模将提升10倍
贝壳财经· 2025-09-24 06:37
为支撑这一宏大愿景,吴泳铭表示,阿里巴巴正在积极推进三年3800亿的AI基础设施建设计划,并将 会持续追加更大的投入。根据远期规划,为了迎接ASI时代的到来,对比2022年这个GenAI的元年, 2032年阿里云全球数据中心的能耗规模将提升10倍。 此外,云栖大会开幕式上,阿里通义旗舰模型Qwen3-Max重磅亮相,性能超过GPT5、Claude Opus 4 等。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行 榜上位列第三,正式版可望再度实现突破。 编辑 杨娟娟 校对 杨利 新京报贝壳财经讯(记者罗亦丹)9月24日,在杭州召开的云栖大会上,阿里巴巴集团CEO、阿里云智 能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起 点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能ASI。 吴泳铭首次系统阐述了通往ASI的三阶段演进路线:第一阶段:"智能涌现",AI通过学习海量人类知识 具备泛化智能。第二阶段:"自主行动",AI掌握工具使用和编程能力以"辅助人",这是行业当前所处的 阶段 ...
阿里夸克发布全新AI创作平台“造点” 已接入通义万相Wan2.5
证券日报之声· 2025-09-24 06:34
产品发布 - 阿里巴巴AI旗舰应用夸克正式发布全新AI创作平台"造点" 集成AI生图与AI生视频两大核心能力 成为国内首个支持音画同步视频生成的平台[1] - 平台率先接入通义万相Wan2.5 并引入全球领先的图像生成模型Midjourney V7 结合夸克自研技术提供一站式创作体验[1] 技术能力 - 视频生成支持10秒时长 单次生成可实现完整剧情故事 支持24帧/秒的1080P高清视频 画面质量满足电影级场景创作需求[3] - 模型具备极强指令遵循能力 可在视频生成中完成运镜等复杂连续变化的控制[3] - AI生图全面支持Midjourney V7多项核心能力 包括多图参考、风格代码、精细化参数控制 满足专业创作者高阶需求[3] - 平台在亚洲人像生成、中文文字生成、国风元素方面表现突出 适用于电商、平面设计及影视游戏等应用场景[3] 用户体验 - 夸克APP端提供轻量化创作体验 支持"一句话P图"和"AI创意视频"等趣味玩法 满足日常修图需求如滤镜、美颜、去路人[4] - 同时支持换发型、换背景、风格转换、3D手办生成等热门AI场景[4] - 用户可通过zaodian.quark.cn或夸克PC端"AI生图"访问平台 即日起至9月30日限时7天免费体验视频生成能力[3] 市场反响 - 内测期间吸引大量专业AIGC创作者 诞生"中世纪油画大合唱""文物吃月饼""巨物猫咪去旅行"等爆款作品[3] - 创作者反馈视频模型升级后音频视频可同步输出 大幅提升创作效率 画质细腻稳定[3]
A股异动丨阿里概念股强势,杭钢股份涨停,阿里云算力投入将指数级提升
格隆汇APP· 2025-09-24 05:50
阿里AI基础设施投资计划 - 阿里巴巴集团宣布积极推进3800亿AI基础设施建设并计划追加更大投入 [1] - 阿里云全球数据中心能耗规模预计从2022年至2032年提升10倍以迎接ASI时代 [1] - 阿里云算力投入将实现指数级增长以支持GenAI发展 [1] A股阿里概念股表现 - 杭钢股份(600126)涨停且总市值达352.24亿 [1][2] - 中电鑫龙(002298)涨停且总市值达92.81亿 [1][2] - 市北高新(600604)涨停且总市值达109.4亿 [1][2] - 网达软件(603189)上涨7.54%且总市值达61.51亿 [1][2] - 东软集团(600718)上涨6.95%且总市值达137.35亿 [1][2] - 科大讯飞(002230)上涨6.33%且总市值达1269.58亿 [1][2] - 阳光电源(300274)上涨5.87%且总市值达3150.66亿 [1][2] - 东软载波(300183)上涨5.50%且总市值达83.41亿 [1][2] - 巨人网络(002558)上涨5.63%且总市值达878.96亿 [1][2] - 万润科技(002654)上涨5.04%且总市值达132.12亿 [1][2] - 昆仑万维(300418)上涨4.70%且总市值达570.06亿 [1][2] - 金桥信息(603918)上涨4.43%且总市值达67.2亿 [1][2]
阿里夸克发布AI创作平台"造点",通义万相Wan2.5生成视频7天免费
格隆汇· 2025-09-24 03:58
产品发布与功能特性 - 阿里巴巴AI旗舰应用夸克于9月24日正式发布全新AI创作平台"造点" 集成AI生图与AI生视频两大核心能力 并率先接入通义万相Wan2.5 成为国内首个支持音画同步视频生成的平台 [1] - 平台依托通义万相Wan2.5模型 可生成与画面匹配的人声 音效和背景音乐 支持10秒时长视频生成 单次生成即可实现更完整剧情故事 支持24帧/秒的1080P高清视频 画面质量满足电影级场景创作需求 [3] - 在AI生图方面 "造点"全面支持Midjourney V7的多项核心能力 包括多图参考 风格代码 精细化参数控制等 满足专业创作者在构图 风格表达与细节打磨上的高阶需求 [3] 技术优势与差异化 - 模型具备极强指令遵循能力 可在视频生成中完成运镜等复杂连续变化的控制 [3] - 结合夸克自研技术 平台在亚洲人像生成 中文文字生成 国风元素等方面表现突出 适用于电商 平面设计及影视游戏等应用场景 [3] - 平台提供图像与视频兼备的一站式创作体验 内测期间诞生多款爆款作品如"中世纪油画大合唱" "文物吃月饼" "巨物猫咪去旅行" 视频中人物口型 动作 神态 配乐一气呵成 [3] 用户访问与市场推广 - 用户可直接访问zaodian.quark.cn或通过夸克PC端"AI生图"进入平台 即日起至9月30日所有用户可限时7天免费体验通义万相Wan2.5视频生成能力 [6] - 夸克APP端提供轻量化创作体验 支持"一句话P图" "AI创意视频"等趣味玩法 同时满足日常修图需求如滤镜 美颜 去路人 并支持换发型 换背景 风格转换 3D手办生成等热门AI场景 [6]