Workflow
通义万相2.6系列模型
icon
搜索文档
【数智周报】MiniMax和智谱通过港交所聆讯;OpenAI据悉计划以8300亿美元估值筹资至多1000亿美元;寒武纪:拟使用27.78亿元资本公积金弥补亏损
钛媒体APP· 2025-12-21 04:23
行业观点与战略动向 - 埃隆·马斯克公开质疑核聚变发电的经济性,认为建造小型反应堆是浪费,并计划每年部署规模堪比美国全国电力四分之一的100GW太阳能AI卫星 [2] - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,任命前OpenAI研究员姚顺雨为首席AI科学家并兼任AI Infra部、大语言模型部负责人 [6][7] - TikTok CEO周受资发布内部信,更新美国业务方案:将成立由甲骨文、银湖及MGX等投资者持股45%的新合资公司负责数据安全,字节跳动保留19.9%股份并继续控制电商、广告等商业活动,相关事宜计划在2026年1月22日前完成 [28][29] 国内大模型与AI应用进展 - MiniMax(稀宇科技)已通过港交所聆讯,计划于2026年1月挂牌上市,若成功将成为全球从成立到IPO最快的AI公司,目前服务超200个国家2.12亿用户及超10万企业客户 [5][6] - 智谱华章已通过港交所上市聆讯 [6] - 字节跳动正推进与联想合作,为其AI手机预装AIGC插件 [8] - 豆包大模型1.8发布,面向多模态Agent场景优化,工具调用与复杂指令遵循能力增强 [9] - 千问APP开始接入阿里生态,首站接入高德地图,可调用导航、打车等底层服务 [10] - 阿里发布通义万相2.6系列模型,是国内首个支持角色扮演功能的视频模型,支持音画同步、多镜头生成 [11] - 生数科技推出可商用的一站式AI视频Agent解决方案Vidu Agent,能自动产出15秒/30秒完整广告片 [12] - 百度发布文心健康管家,定位“全能家庭医生”,覆盖全周期健康服务,并推出“原子计划”向行业免费开放100+AI能力 [13][14] - 美团发布并开源SOTA级虚拟人视频生成模型LongCat-Video-Avatar,支持音频、文本、图像生成视频等多种功能 [18] 芯片、算力与基础设施 - 中科曙光发布并真机展出了国产万卡级AI集群系统scaleX万卡超集群 [3] - 紫光国微成立中央研究院,主要研究方向包括面向具身机器人等应用的端侧AI芯片新架构 [3] - 沐曦股份在科创板挂牌上市,发行价104.66元/股,募集资金41.97亿元,开盘后股价大涨,收盘报829.90元/股,涨幅692.95%,总市值突破3300亿元 [17][20] - 壁仞科技通过港交所上市聆讯 [21] - 寒武纪公告拟使用27.78亿元资本公积金弥补亏损 [4] - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配 [20] - 百度旗下昆仑芯即将完成股改,加速推进冲刺上市步伐 [20] - 小米开源总参数309B(激活15B)的MoE模型MiMo-V2-Flash,其API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,推理价格仅为Claude Sonnet 4.5的2.5% [16] - 上海交通大学科研团队在《科学》杂志发表成果,实现新一代光计算芯片LightGen,实测算力和能效相比顶尖数字芯片提升2个数量级 [19][20] - 日本印刷株式会社(DNP)成功开发出相当于1.4纳米等级的NIL纳米压印技术,计划2027年量产 [29] 海外巨头动态 - 英伟达CEO黄仁勋透露,作为向OpenAI投资1000亿美元计划的一部分,目前尚未支付任何款项 [22] - 英伟达发布采用混合型Mamba-Transformer专家混合架构的Nemotron 3开源模型系列,其Nano版本吞吐量较前代提升4倍 [23] - OpenAI计划以高达8300亿美元估值筹资至多1000亿美元,最早于2025年第一季度末完成 [24] - OpenAI发布新一代图像模型GPT-image-1.5,性能提升最多4倍,成本便宜约20%,并全面接管ChatGPT中的图像生成功能 [25] - 前OpenAI首席技术官Mira Murati创办的Thinking Machines Lab估值达500亿美元,其产品Tinker新增接入万亿参数级推理模型Kimi K2 Thinking [26][27] - 谷歌推出最新人工智能模型双子座3 Flash,性能超越双子座2.5 Pro,速度提升约3倍,运行成本更低 [28] - 甲骨文一个价值100亿美元的密歇根数据中心项目因融资谈判陷入僵局而停滞 [27] - 苹果据称计划到2027年秋季将其iPhone产品线从五款扩展至七款,包括首款可折叠iPhone和20周年纪念版“全屏”iPhone [27] - OpenAI正洽谈从亚马逊融资至少100亿美元,并使用其人工智能芯片 [29] - 英特尔计划以约16亿美元收购AI芯片初创公司SambaNova [30] 融资与并购 - 多模态AI企业智象未来完成A+轮融资,京东集团等参投,已启动B轮融资筹备 [31] - 银河通用机器人完成3亿美元新一轮融资,创具身智能领域单轮融资纪录,由中国移动链长基金领投 [32] - 格蓝若机器人完成数千万元A+轮融资,由湖北省人形机器人产业投资基金领投 [33] - 首形科技完成新一轮融资,由中国互联网投资基金与蚂蚁集团联合领投 [34] - 星源智机器人完成超亿元天使+轮融资,由赛富基金与凯联资本领投 [35] - 云深处科技完成超5亿元C轮融资,由招银国际和华夏基金联合领投 [36] - 众擎机器人完成10亿元A1+及A2轮融资,由黄浦江资本等领投 [37] 合作与生态 - 爱诗科技与阿里云达成全栈AI合作,阿里云将为爱诗科技旗下用户破亿的PixVerse视频生成大模型提供全球化算力及模型服务支持 [15]
全球功能最全的视频生成模型来了
量子位· 2025-12-17 10:00
公司产品发布 - 阿里发布了新一代通义万相2.6系列模型,该模型一次性覆盖文生视频、图生视频、参考生视频、图像生成和文生图,是目前全球功能最全的视频生成模型 [1] - 该模型在视频创作上推出了Sora2目前还没有的多音频驱动生视频能力,并同步引入了音画同步、多镜头叙事等能力 [2] 视频生成核心能力升级 - **视频参考生成**:支持视频参考,模型能提取其中主体的外观与音色,并结合提示词生成新视频内容,可用于单人表演或双人合拍等场景 [12] - **多镜头叙事**:支持多镜头生成,保持镜头间关键信息一致,可通过简单提示词完成分镜 [12] - **自然声画同步**:在多人对话等复杂场景中,语音与动作匹配更稳定 [12] - **长视频生成**:单条视频最长15秒(参考生视频最长10秒) [12] - **基础能力提升**:在指令理解与执行、画面真实度及整体美学表现等方面均有加强 [12] 视频生成能力实测表现 - **视频参考生成效果**:在主体一致性和提示词理解上做得比较扎实,能实现1:1还原,口型匹配较为准确,动作、表情与台词语义能够对应,但生成结果中的声线并未完全沿用原视频 [11] - **声画同步效果**:在双人剧情对话等复杂场景中,动作与语言能形成完整互动,模型能补全台词并添加与动作匹配的拟声细节,能区分不同角色的情感变化,但在多角色台词绑定上仍有提升空间,偶尔会出现角色说错台词或字幕语音未完全对齐的情况 [13] - **画面质感与美学**:在画面质感和美学呈现方面有提升,能准确呈现如“第一人称赛博城市飞行视角”等复杂提示词,生成具有电影级画面质感、节奏紧凑、科幻感强烈的视频 [13][14] - **多镜头叙事效果**:对多镜头叙事的理解较为到位,镜头中的主要动作和转场均能得到完整呈现,镜头衔接自然,但对于提示词中描述不够充分的抽象动作(如“探头观察”)仍存在理解难度 [15][17][18] 图像生成能力升级 - 图片生成功能在美学理解、人像生成、文字处理、历史文化及知识IP语义理解上带来新升级 [18] - **风格化能力**:能及时掌握并生成新的美学风格,如生成具有高饱和色块拼接、像素风处理的“星露谷风格”插画 [19][20][22] - **人像生成能力**:在人像光影方面的处理更好,能生成具有清晰明暗分区、面部结构立体、肤质细节自然、具有电影感和空间层次感的半身人像 [22][24] - **中英文处理与排版能力**:能生成中英文对照排版的美食宣传海报,在构图排版上判断靠谱,主体突出,文字层级分明,达到成品水准 [25][27] 整体评价与可用性 - 模型在音视频参考、声画同步、风格理解方面表现不错,但在个别场景下仍会出现画面逻辑偏差、多角色台词对不上、复杂动作理解不到位等小问题 [7][28] - 对于日常短视频创作和二创而言,模型已经是可用且好用的水平,用户敢多跑几次而不用每次都碰运气 [7][28][29] - 模型还在多图融合、美学要素迁移、历史知识语义理解上做了提升 [30]
阿里发布通义万相2.6系列模型,上线首个角色扮演功能;xAI已组建企业级AI销售团队丨AIGC日报
创业邦· 2025-12-17 00:08
1.【OpenAI聘请谷歌高管Albert Lee担任企业发展副总裁】OpenAI当地时间12月15日证实,已任命 谷歌企业发展主管Albert Lee为公司企业发展副总裁。Lee将于当地时间16日正式加入OpenAI,向 首席财务官Sarah Friar汇报工作。(同花顺财经) 2.【韦氏词典将表示AI劣质内容的"slop"评为年度热词】韦氏词典编辑出版商美国韦氏出版公司日前 宣布,将英文单词"slop"评选为2025年度热词,并将其定义为"通常由人工智能(AI)批量生成的低 质量数字内容"。韦氏出版公司在其网站上表示,2025年大量劣质内容在互联网上泛滥成灾,包括荒 谬的视频、失真的广告图像、庸俗的宣传内容、以假乱真的假新闻、由AI创作的质量低劣书籍以及被 称为"工作废料"的低效工作报告等。这些内容既引发公众反感,却又被大量消费和传播。 (新华社) 3. 【阿里发布通义万相2.6系列模型,上线首个角色扮演功能】12月16日消息,阿里发布新一代万相 2.6系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级。据介绍,万相2.6进一 步提升了画质、音效、指令遵循等能力,单次视频时长实现国内最高的1 ...
周鸿祎回应“前高管称帮做假账几十亿”;“蚂蚁阿福”冲上苹果应用总榜第三位;全球五大PC厂商都将涨价;蜜雪冰城进军北美市场丨邦早报
创业邦· 2025-12-17 00:08
【 周鸿祎回应 "前高管称帮做假账几十亿" 】 12 月 16 日,一则" 360 前高级副总裁、三点钟社群核心发起人玉 红炮轰 360 公司创始人周鸿祎"的消息在社交平台传播。消息称一名 ID 为"玉红"的人表示,自己帮助周鸿祎做假 账至少几十亿元,并声称拥有相关数据,将会全网公布。有群聊截图显示,玉红还提到周鸿祎的游戏项目全部财务 造假。 12 月 16 日傍晚, 360 集团创始人、董事长周鸿祎发布 360 集团《关于玉红恶意诋毁 360 集团创始人周鸿祎先 生的严正声明》 称,玉红所称 "财务造假"等言论完全背离事实。 360 集团始终坚持合规经营,严格遵守国家法律 法规及证券市场规则,定期接受权威机构审计,财务公开透明、健康合规。 360 集团称,针对玉红对 360 集团、 完整早报音频,请点击标题下方小耳机收听 创始人周鸿祎先生及相关企业家的恶意诽谤, 360 集团将依法采取法律措施追究其法律责任,坚决维护企业声誉与 合法权益。 在声明中, 360 集团表示,玉红曾担任 Gamewave 游戏公司负责人,该公司十多年前被原 360 美股上市主体 Qihoo360 收购。玉红 2014 年入职 36 ...
阿里电影级视频模型万相2.6系列上线,功能比Sora2还全,人人都能当导演
AI前线· 2025-12-16 06:39
作者 | 木子 12 月 16 日,阿里发布了新一代 通义万相 2.6 系列模型 。 这次更新不是某一项能力的单点升级,而是 5 款新模型同时上线 ,包括: 文生视频、图生视频、参考生视频、图像生成,和文生图 ——覆盖从图像到 视频、从一次性生成到可复用创作的多个关键环节。 万相,是阿里"通义大模型家族"的一员(此外还有千问、百聆等)。初代万相于 2023 年 7 月上线,最早以图像生成能力为主,并率先面向企业用户开 放测试。 经过 2 年多的发展,今年 9 月阿里率先在国内发布音画同步的视频生成模型万相 2.5,极大提升视频创作的效率,在权威大模型评测集 LMArena 上, 万相图生视频位居国内第一。 如今的 万相 2.6 更是成为了 国内首个支持角色扮演功能的视频模型, 画质、音效、指令遵循等能力也进一步提升了,单次视频时长实现国内最高的 15s,还新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,满足专业影视级场 景需求。 另外,万相 2.6 也是全球功能最全的视频生成模型功能 ,比大名鼎鼎的 Sora2 还 多了一项"多音频驱动生视频"功能 ...
新一代万相2.6系列模型发布:支持角色扮演、多镜头生成功能
凤凰网· 2025-12-16 06:22
公司产品发布 - 阿里巴巴旗下通义万相团队发布新一代万相2.6系列模型 [1] - 该版本被定义为国内首个支持角色扮演功能的视频生成模型 [1] - 模型集成了音画同步、多镜头生成及声音驱动等能力 [1] 技术能力与升级 - 模型通过多模态联合建模,可对输入视频的时序信息、主体特征及声学要素进行学习,旨在实现生成视频在画面与声音上的整体一致性 [1] - 分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落 [1] - 此次升级重点提升了画质、音效与指令遵循能力 [1] - 单次生成视频时长最高支持15秒 [1] - 新增的角色扮演功能允许用户上传个人视频并结合提示词,模型可自动完成分镜设计、角色演绎与配音,生成具备电影感运镜的短片 [1] 应用场景与市场定位 - 角色扮演功能主要面向广告设计、短剧制作等专业场景 [1] - 目前,万相模型家族已具备文生图、图像编辑、文生视频等十余种视觉创作能力 [1] 产品获取与商业化 - 用户可通过官网体验万相2.6 [1] - 企业用户可通过阿里云百炼平台调用模型API [1]
阿里发布通义万相2.6系列模型,上线角色扮演功能
新浪财经· 2025-12-16 05:50
12月16日,阿里发布新一代万相2.6系列模型,该系列模型面向专业影视制作和图像创作场景进行了升 级,是国内首个支持角色扮演功能的视频模型。 今年9月,阿里在国内发布音画同步的视频生成模型万相2.5,新发布的万相2.6同时支持音画同步、多镜 头生成及声音驱动等功能。 ...