Sora2
搜索文档
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2025-12-31 03:37
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机将系统级AI智能体深度集成于操作系统,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在全景式检阅中国AI产品发展,深度洞察未来产业格局,寻找代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,要求产品在技术上突破并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘2025年崭露头角、具备2026年爆发潜力的创新产品,代表AI技术前沿方向 [8] - 十大细分赛道TOP3评选针对热度最高的10个领域,包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、增长、活跃、粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]
我的2025年度AI大盘点 - 前路已明。
数字生命卡兹克· 2025-12-31 01:21
年度大模型 - **年度写作大模型为GPT-5.2 Thinking**,该模型在指令遵循、风格迁移和世界知识方面表现极佳,超越了Gemini 2.5 Pro和GPT-4.5 [2] - **年度Coding大模型为Gemini 3.0 Pro**,其超强的前端能力和审美,能够帮助用户快速实现创意灵感 [4][7][8] - **年度绘图大模型为Nano Banana**,该模型掀起了远超GPT-4o的潮流和热度,成为AI绘图领域分水岭级别的模型,并体现了原生多模态的优势 [10][14][15] - **年度音乐大模型为Suno V5**,该模型是2025年AI音乐领域的绝对王者,将领域天花板拉高了数个级别,并在B站等平台引发了大量二创视频的井喷 [16][18] - **年度声音大模型为MiniMax Speech 2.0**,该模型在2025年5月15日发布,首次在多项指标上超越11Labs,实现了逼近真人级别的情感表达 [19][22][23] - **年度视频大模型为Sora2**,该模型以其高度真实和趣味性的生成效果,成为2025年最令人印象深刻和破圈的AI视频模型 [24][26] - **年度大模型为DeepSeek R1**,该模型于2025年1月20日发布并开源,其推理效果媲美当时顶级的闭源模型OpenAI o1,而API价格仅为后者的3.7%,奠定了中国在开源模型领域的领军地位 [27][29][30][31] 年度AI产品与功能 - **年度AI编程产品为Claude Code**,该产品能探索本地代码库上下文、修改文件、运行CLI工具,并支持将工作流封装为自定义Skill [43][45] - **年度AI设计产品为Lovart**,该产品是首个设计类垂直Agent,专为设计场景优化,集成了文字编辑、Touch Edit、Mockup等功能,并经常首发最新的绘图和视频模型 [46][47][48] - **年度AI功能为ChatGPT DeepResearch**,该功能可将查找资料的效率提升百倍千倍,能在10到30分钟内搜索全网数据并生成一篇深度研究报告,质量不亚于研究员工作10小时到1周的成果 [49][50][51] - **年度AI应用为Manus**,该应用作为第一个通用Agent,开启了Agent时代,将Agent概念向前推进了一大步,并于2025年被Meta以数十亿美金的价格收购 [55][60][61][62] - **年度AI硬件为Plaude Note Pro**,该硬件开创了能贴在手机背后的AI硬件新品类,具备录音、实时转录、自动总结会议要点等功能,并以百万销量证明了市场需求的真实性 [65][66][68][72]
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2025-12-30 03:57
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek以强推理和透明化思考引领智能助手迭代;Manus实现全链路自主任务处理,成为通用AI Agent;Lovart等通过多智能体协作简化工作流程;即梦AI等在多模态生成上取得进步;豆包AI手机将系统级AI智能体深度集成于操作系统,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在全景式检阅中国AI产品发展,深度洞察未来产业格局,寻找代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强、在技术突破和实际应用场景中展现巨大价值的100款AI产品 [7] - 「创新AI 100」旨在挖掘2025年崭露头角、具备2026年爆发潜力的创新产品,这些产品代表AI技术前沿方向,有望引领下一阶段行业变革 [8] - 榜单另设10大细分赛道TOP3专项提名,以精准反映各领域发展态势,赛道包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、增长、活跃、粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]
标题不贴合需求核心,推测你可能想围绕科技产业博弈等方面生成标
搜狐财经· 2025-12-27 11:03
现象描述 - Sora2一经发布便成为现象级产品 相关话题在社交媒体上的讨论量于一周内突破10亿次 日下载量超过62万次 迅速攀升至应用下载榜首 [1] 战略与商业模式 - Sora2的开发是企业构建内容生态闭环的重要战略布局 其盈利模式包括订阅服务、企业定制化解决方案以及广告分成等多元化途径 [2] - 为研发Sora2 企业投入了巨额资金 研发成本可能高达85亿美元 巨大的财务压力倒逼公司加速商业化进程以尽快实现盈利 [2] 技术与生态壁垒 - Sora2依靠强大的技术护城河突围 解决了AI视频生成领域长期存在的画质、逻辑连贯性等痛点 通过先进的物理模拟技术使生成的视频更加真实自然 极大地提升了生产力 [3] - 企业构建了完善的生态闭环 整合了内容创作者、平台方、广告商等多方资源 形成了一个相互促进、协同发展的生态系统 进一步巩固了其市场地位 [3] 行业竞争格局 - 在AI视频生成领域 Sora2面临包括Meta、亚马逊等科技巨头以及一些中国厂商的激烈竞争 [4] - Meta凭借其庞大的社交用户基础试图在AI视频领域分一杯羹 亚马逊则利用其云计算优势为AI视频生成提供强大的算力支持 中国厂商则以其高效的研发速度和本地化优势积极参与市场竞争 [4] 行业影响与未来展望 - Sora2的出现标志着AI视频生成领域进入全新阶段 它不仅重塑了内容产业的上下游产业链 也对互联网格局产生了深远影响 [8] - 有行业项目组透露 金管道信息科技有限公司正通过优化算法、降低算力成本等方式应对成本压力 [8] - 未来 随着技术的不断进步和市场的逐渐成熟 AI视频生成将为内容产业带来更多的可能性 推动整个行业向更高水平发展 [8]
永久激活密钥:68PO6-8JK9Y-ET81K-P6K9J-62ZLC
猿大侠· 2025-12-24 01:06
公司产品与服务 - 公司核心产品为“Molica AI”,是一款聚合了全球领先AI模型的平台,集成了包括ChatGPT5.2、Gemini3.0 Pro、Nano Banana Pro、Sora2、Veo3.1、Claude4.5、Grok4.1、Midjourney、SUNO、DeepSeek3.2等超过20个模型 [1][2][11] - 产品提供网页版与APP版,无需使用特殊网络工具即可访问所有集成AI [3] - 公司运营已持续3年,共更新了156个版本,拥有超过500万注册用户及超过100万会员用户 [2] - 公司为知名投资机构所投资,并与人民邮电出版社为合作伙伴 [2] 促销活动与定价 - 公司正在进行年终促销,原价998元的终身会员限时降价至296元,折扣幅度约为原价的3折 [2][4] - 该促销活动限100个名额,时间为12月24日至12月26日,售完后将恢复原价998元 [2][4][5][69] - 购买会员可获赠价值总计超过2000元人民币的AI变现教程,包括《AI搞副业教程》(价值799元)、《AI写作变现实战》(价值599元)和《AI做公众号爆文》(价值699元) [60][61][62] 集成AI模型功能亮点 - **文字与代码模型**:集成了Gemini3.0 Pro、ChatGPT5.2和Claude4.5,分别擅长推理与数学、综合文案与分析、以及代码生成 [6] - **图像生成模型**:接入了Nano Banana Pro(基于Gemini 3.0构建),在中文稳定性和文字渲染能力上表现突出,支持4K输出及自定义图片尺寸 [14] - **视频生成模型**:集成了Sora2和Veo3.1,可根据文字提示生成高质量视频,并实现音画同步 [35][40] - **绘画模型**:接入了Midjourney,在画质、美感和创意想象力方面表现卓越,支持文生图、图生图、扩图等官方全部功能 [43][49] - **音乐生成模型**:集成了SUNO的最新V5版本,可根据歌词和风格提示生成完整歌曲 [52][56] 价值主张与竞争优势 - 平台通过聚合多个顶级AI模型,为用户提供了极高的性价比,避免了用户为每个AI单独付费和切换的麻烦 [2][9] - 根据公司对比,若单独订阅各AI模型官方高级版,每月总费用远超296元,而该平台提供一次性付费终身无限使用 [67] - 平台强调其提供的均为各模型的最新版本和高级功能 [6][49] 市场拓展与生态建设 - 公司正在面向全国招募经销商和代理商,认为AI行业处于政策红利期,市场空间巨大 [64][65] - 公司通过留言抽奖活动赠送5个终身会员,以进行用户互动和产品推广 [71]
信仰与突围:2026人工智能趋势前瞻
36氪· 2025-12-22 09:32
文章核心观点 - 人工智能行业在ChatGPT发布三周年之际,竞争白热化,模型性能差距缩小,发展面临天花板质疑,但产业对AGI的到来仍充满信仰与探索 [1] - 行业展望2026年,将面临智能瓶颈与投资回报焦虑,同时也在规模法则、多模态、研究探索、物理AI仿真数据、AI for Science、模型应用一体化、个性化软件、行业落地ROI验证、AI眼镜及AI安全等多个方向寻求突围 [1] Scaling Law与AGI进化路径 - 行业主流信仰通过增加算力、数据、参数的Scaling Law可驱动智能持续增长直至AGI,但近期模型智能升级放缓及数据枯竭论引发质疑 [2] - 反对观点认为大模型仅是拟合语言相关性,而非真正理解世界,智能需包含抽象、因果推理等,且规模法则正接近极限,未来突破需更好的学习方式而非简单扩展规模 [2] - 在底层架构与训练方法无颠覆性变革背景下,Scaling Law仍是目前最可靠、实用的增长路径,因其能力提升可预测、产业投入可评估、人才与工程体系可延续迭代 [3] - 近期Gemini 3的表现与DeepSeek V3.2研究印证了规模法则现阶段依然有效 [3] - 美国AI新基建规划大型数据中心总装机容量超45吉瓦(GW),预计吸引超2.5万亿美元投资,黄仁勋提出在预训练、后训练强化学习及推理过程中均存在规模法则,支撑算力持续增长 [3] - 数据是当前大模型进化最迫切难题,高质量可用数据稀缺,行业正探索通过合成数据、推理过程数据、强化学习数据、多模态数据等构建可工程化、可规模化的数据生成体系 [4] - 未来将是New Scaling Law时代,不仅堆砌算力,更注重数量与质量扩展,结合算力资源充沛,有望通过算法与架构优化带来底层突破,AGI可能来自规模与结构性创新(如世界模型、具身智能等)的结合 [4] 多模态技术的突破与意义 - 谷歌Gemini、OpenAI Sora等多模态模型实现了对内容的深度理解与生成,迎来了多模态的ChatGPT时刻 [5] - 多模态技术从感知(如视觉)方向探索智能进化,类比生物进化中视觉的出现触发了认知能力的阶段性跃迁,有望推动AI智能出现非线性跃升 [5][7] - 大语言模型仅通过文本学习经过人类加工的“二手世界”,多模态模型通过图像、视频等对世界状态的直接投射,包含空间、时间及物理约束信息,为形成更稳健的世界模型提供可能 [9] - 多模态为人工智能打开了“感知-决策-行动”闭环的可能性,与工具使用、机器人控制结合,可通过环境反馈持续优化,实现智能跃升 [10] 研究探索与创新方向 - 研究驱动是大模型行业核心范式,以小团队多方向并进的赛马机制有效,预计2026年在底层架构、训练范式、评测方法、长期记忆、Agent等领域有望诞生更多突破 [11] - 全球涌现一批非共识的技术实验室:伊利亚的SSI聚焦安全超智能,融资30亿美金 [12];Mira的Thinking Machines Lab推出产品Tinker帮助微调模型 [12];李飞飞的World Labs专注空间智能 [12];杨立昆的AMI目标构建理解物理世界的系统 [12];欧洲的H Company研发能解决复杂现实问题的超级Agent [12] - 底层架构与训练范式出现创新研究:日本的Sakana AI站在Scaling Law对立面,探索演化式模型与群体智能协作以降低算力依赖 [13];Liquid AI开发可连续演化的液体神经网络架构 [14];谷歌提出嵌套学习(Nested Learning)概念,设计快慢系统协同解决灾难性遗忘问题 [14] - 评测牵引成为重要研发范式,行业正探索应对静态刷榜数据污染等挑战的新方法,包括构建面向Agent与长期任务的跨步、跨工具评测体系(如SWE-bench、AgentBench),以及基于游戏、模拟世界的动态交互式仿真环境评测 [15] 仿真数据在物理AI中的应用 - 机器人物理世界数据采集成本高(真机采集一条数据成本1-10美元)、速度慢,仿真生成数据边际成本趋近于零且可并行,在早中期研发中将成为主流,Sim-to-Real鸿沟正被生成式AI填平 [17] - 仿真数据在规模覆盖、可控可复现、跨本体迁移方面具有优势,能低成本覆盖长尾场景,支持多机器人多任务训练统一对齐 [18] - 产学研界已有实践:上海人工智能实验室的合成数据集InternData-A1包含超63万条轨迹、7433小时数据,覆盖4种具身形态、70项任务,基于其预训练的模型在仿真与真实任务上表现与官方模型相当 [18];银河通用发布灵巧手合成数据集DexonomySi,包含超950万条抓取姿态,覆盖超1万个物体,并基于此开发了具身大模型GroceryVila实现机器人双手自主取物 [18];谷歌的Genie 3为机器人训练提供无限可能的模拟环境 [18] - 仿真存在建模误差(如接触、材料、传感器噪声)及难以覆盖真实世界无穷意外组合的局限,尤其在软体物体、长周期可靠性、高风险人机共处等场景 [19][20] - 在物理AI早中期研发中,仿真预计承担90%以上的数据与验证工作,真机数据用于物理锚定与校准,仿真正成为物理AI的数据基础设施 [21] AI for Science (AI4S)的进展 - AI4S最具象征意义的成果是AlphaFold,但普遍质疑其离产业应用仍远,未能根本改变药物研发等领域的周期与成本 [22] - 2026年可能成为转折点,AI4S正从模型驱动的学术突破转向系统工程化的科研生产力 [22] - 核心障碍在于验证太贵太慢且难复制,当前积极变化是AI正被直接嵌入实验系统:谷歌DeepMind计划2026年在英国建立基于AI的自动化科研实验室,形成假设生成、机器人执行、数据回流的闭环,首次让AI4S从建议者变成执行者 [23] - 国家层面推动:美国通过《启动创世纪任务》行政令,将AI4S上升为国家战略,由能源部牵头建立全国性AI科学平台,整合联邦科研数据、超算资源和AI模型,聚焦先进制造、生物技术等关键领域,有望解决高质量科学数据匮乏的痛点 [25] - 2026年可能在某些领域出现研发周期数量级压缩,自动化实验与AI workflow成为头部机构标准配置,科研组织开始围绕AI agents重构分工 [26] 模型应用一体化与网络效应 - 大模型目前能力虽强但平台效应弱,未形成类似移动互联网的网络效应,ChatGPT周活接近10亿,但模型不会因用户增多自动变强,用户间连接弱 [27] - “裸模型”阶段因交互是一次性、私有的,难以直接回流训练与复用,且创造的价值源于对个体能力提升而非用户间关系密度,因此AI更多是生产力工具而非平台 [28] - 模型与应用一体化是破局点,当模型拥有稳定身份、长期记忆并持续参与用户工作流时,AI才具备成为平台的能力 [28] - 一个方向是模型接入更多应用(+AI),如GPT推出智能购物、群聊功能,Sora2推出Cameo个人数字形象功能以建立社交关系链 [29] - 更具颠覆性的方向是构建智联网新形态(AI+),即个人、团队、组织拥有自己的Agent并彼此协作,形成AI原生的网络效应 [31] - 未来Agent网络效应可能出现多种形式:交易型网络(形成服务型Agent与用户Agent的双边市场)[32];知识型网络(用户打磨的隐性技能库使模型越用越聪明)[32];工作流型网络(复杂任务流程被模块化、标准化并广泛复用)[32];社交型网络(AI成为组织内的超级连接器促进协作)[32] - 模型应用一体化的真正意义在于构建以模型为认知核心、应用为关系容器、Agent为基本节点的智能网络 [33] 个性化软件与AI编程 - AI Coding逼近普适生产力,软件正从工业化产品变为高度个性化、情境化、即时化的工具,进入软件3.0时代 [35] - Anthropic首席执行官预测未来3-6个月AI将编写90%的代码,12个月内几乎所有代码可能由AI编写 [35] - 美团内部已有52%的代码由AI生成,90%的工程师频繁使用AI工具,部分团队依赖AI完成90%以上代码编写 [35] - 腾讯月均新增代码3.25亿行,超90%工程师使用AI编程助手CodeBuddy,50%的新增代码由AI辅助生成 [35] - 软件生产核心瓶颈从编码能力转向问题定义能力,自然语言等成为主要编程接口,出现“vibe coder”称谓 [38] - 编程供给充裕将激活需求侧长尾市场,软件可千人千面,实现从人适应软件到软件适应人的范式转移,满足曾因市场规模小而被忽略的个性化需求 [39] - 部分解决通用问题的微软件将被分享复用,形成小规模生态(如Hugging Face Spaces上的小应用、Chrome插件)[39] - 软件平权时代来临,编写软件像写文章一样简单,核心竞争力转向共情、问题定义与想象力 [40] 行业落地与ROI验证 - AI行业落地从早期概念验证(PoC)进入核心业务流程,企业关注点从技术先进性转向可衡量的业务价值,ROI与性价比成为第一性问题 [41] - 麦肯锡报告显示,至少在一个职能中常态化使用AI的企业比例从78%升至88%,但多数仍处探索或试点阶段,企业层面规模化部署稀少,AI高绩效企业仅6% [41] - OpenAI企业调研显示,ChatGPT Enterprise周消息量增约8倍,员工人均消息量提升30%,组织平均推理token消耗增长约320倍,75%员工认为AI提升工作速度或质量,平均每日节省40-60分钟,重度用户每周节省超10小时 [42] - 早期AI应用多以Copilot形态承担边缘任务,对组织整体效率影响有限,当前积极变化是AI开始深入行业流程中后段 [43] - 下一步可验证收益将来自生产效率、客户响应、营销指标、研发生产力提升,未来深度收益将来自流程再造、智能体协同、供应链智能化等领域 [44] - 工作模式向“一个人+N个智能体”转变,企业管理逻辑将重构为以结果交付、质量稳定性和风险控制为中心的新范式 [44] AI眼镜的发展前景 - AI眼镜销量达1000万台是成为大众消费品的临界点,预测Meta Ray-Ban等产品2026年单品牌有望冲击此目标,巴克莱研究预测2035年销量将达6000万副 [45] - 雷朋制造商依视路将提前实施年产能1000万件可穿戴设备计划以满足需求 [45] - 硬件做减法是成功关键,Meta放弃高成本显示模组,将重量控制在50克以内,结合大模型多模态能力,首先成为合格穿戴与拍照设备,降低制造难度与用户门槛 [47] - AI眼镜将改变软件生态,操作逻辑从以应用为中心转向以意图为中心,自然语言交互主导,技能商店(Skill)可能取代应用商店 [48] - 眼镜摄像头产生的第一视角海量数据可为机器人训练提供数据,并可能催生基于视觉关注度的全新推荐与广告模式 [48] - 个人隐私、数据脱敏及相关法律伦理规范在AI眼镜领域尤为重要 [48] AI安全与治理 - AI能力提升与AGI逼近使安全关注度提升,调研显示66%受访者经常使用AI,但超半数(58%)认为其不可信赖,公众信任度呈下降趋势 [50][51] - 安全算力成为重点,预计超10%的算力将投入安全领域(涵盖安全评估、对齐实验、红队测试等)[54] - OpenAI曾承诺将20%算力用于超级智能对齐研究但未兑现,伊利亚成立的SSI公司专注超人工智能安全,融资30亿美金,估值320亿美元 [54] - 美欧法规提案将高风险模型的系统测试、评估、监控列为强制义务,安全算力将形成刚性成本,且随着模型能力增长,安全评估对算力需求指数级放大 [54] - AI治理委员会成为趋势,越来越多企业建立深度嵌入研发全流程的安全伦理机构 [55] - 例如:Google DeepMind有Responsibility & Safety团队参与全过程 [55];微软有Aether委员会其结论纳入工程必选流程 [55];Anthropic设立长期利益信托(LTBT)机制并推动宪法AI(Constitutional AI)将安全嵌入训练 [55] - AI安全与负责任正演变为与算力、算法、数据同等重要的基础性要素,缺乏可信安全机制的模型将难以进入关键行业与主流市场 [56]
信仰与突围:2026人工智能趋势前瞻
腾讯研究院· 2025-12-22 08:33
文章核心观点 文章回顾了人工智能行业自ChatGPT发布三年来的发展历程,指出当前大模型性能差距缩小、发展面临天花板质疑,但同时产业对AGI的信仰与探索依然坚定[2] 展望2026年,行业在焦虑与分歧中,有望在技术路径、多模态、研究范式、数据生成、行业应用及新硬件等多个方向实现突围[2] 1. 规模法则的演进与争议 - **对规模法则的质疑声增大**:随着大模型智能升级放缓及数据枯竭论出现,业界对Scaling Law的质疑增多,认为其可能接近极限,真正的智能需要抽象化、因果建模等能力,而非简单扩展规模[3] - **规模法则现阶段依然有效且演进**:在底层架构无颠覆性创新的背景下,Scaling Law因其能力提升可预测、产业投入可评估、人才工程体系可延续等优势,仍是可靠的工程化增长路径[4] 谷歌Gemini 3和DeepSeek V3.2的表现印证了其现阶段有效性[4] - **向“新规模法则”时代迈进**:未来的发展将不仅是堆砌算力,而是向数据数量扩大与质量提升两个方向扩展,结合世界模型、具身智能等结构性创新,以寻求底层突破[5][7] 2. 多模态技术的突破与意义 - **迎来“多模态的ChatGPT时刻”**:谷歌Gemini、OpenAI Sora等模型已能深度理解并生成多模态内容,标志着关键突破[8] - **多模态是智能非线性跃升的关键**:类比生物进化中视觉的出现触发了认知能力跃迁,多模态技术让AI从学习“二手”文本世界转向感知更接近真实世界的结构性约束,为形成稳健的世界模型提供了可能[8][12] - **开启“感知-决策-行动”闭环**:多模态与工具使用、机器人控制结合,使AI能在环境中通过反馈持续优化,实现智能跃升[13] 3. 研究探索与组织创新 - **研究驱动与赛马机制**:以小团队开展多方向并行实验是OpenAI等机构的有效组织方式,契合技术快速迭代的特点[15] - **涌现多元化的前沿实验室**:包括聚焦安全超智能的SSI(已融资30亿美元)、专注可靠性的Thinking Machines Lab、研究空间智能的World Labs、追求高级机器智能的AMI以及研发超级Agent的H Company等[16] - **底层架构与训练范式创新活跃**:如Sakana AI探索演化式模型与群体智能以降低算力依赖;Liquid AI开发可连续演化的液体神经网络;谷歌提出嵌套学习以解决灾难性遗忘问题[17] - **评测范式向动态与复杂任务演进**:为解决静态刷榜和数据污染问题,行业正构建围绕Agent能力、需要多步规划与长期记忆的评测体系,如SWE-bench、AgentBench等[17] 4. 仿真数据在物理AI中的核心作用 - **仿真数据成本优势显著**:机器人真机采集一条数据成本在1-10美元,而仿真生成边际成本趋近于零,且能并行运行数万实例[19] - **仿真数据覆盖长尾场景并具可复现性**:能以指数级低成本覆盖极端光照、稀有故障等长尾场景,并锁定变量,便于问题诊断与回归测试[20] - **产学研实践验证其有效性**:上海人工智能实验室的InternData-A1数据集包含63万条轨迹,基于其训练的模型在多项仿真与真实任务上表现与官方模型相当;银河通用发布的DexonomySi数据集包含超950万条抓取姿态,并基于此开发了端到端具身大模型[20] - **形成“仿真主供给、真机强纠偏”工业范式**:在物理AI研发中,仿真预计承担90%以上的数据与验证工作,真机数据则用于物理锚定与最终验收,该范式已在NVIDIA、DeepMind等公司实践[23] 5. AI for Science 迈向系统工程化 - **从模型突破转向科研生产力**:AI4S正从AlphaFold式的象征性成果,转向系统工程化的科研生产力提升,这是行业被真正改变的前兆[24] - **AI嵌入自动化实验闭环**:谷歌DeepMind计划2026年建立AI自动化科研实验室,AI将负责假设生成与实验编排,与机器人执行形成可规模化的闭环,首次让AI从建议者变为执行者[25] - **国家战略推动数据与资源整合**:美国通过《启动创世纪任务》行政令,将AI4S上升为国家战略,旨在整合联邦科研数据、超算资源训练科学基础模型,解决高质量数据匮乏的痛点[28] - **2026年可能成为研发模式转折起点**:虽难言全面商业落地,但某些领域研发周期可能出现数量级压缩,自动化实验与AI工作流成为头部机构标准配置[29] 6. 模应一体与智联网雏形 - **大模型缺乏原生网络效应**:ChatGPT周活近10亿,但用户交互是一次性、私有的,难以形成反馈闭环与用户间连接,AI是生产力工具而非平台[31][32] - **模型与应用一体化是破局点**:当模型拥有稳定身份和长期记忆,并深度参与用户工作流时,才具备成为平台的基础[32] 探索方向包括模型接入更多应用(如GPT的智能购物、群聊功能)以及构建以Agent为节点的智联网[32][34] - **智联网可能催生多种网络效应**:包括交易型网络(Agent间形成服务双边市场)、知识型网络(用户打磨的技能经验共享)、工作流型网络(生产范式持续进化)以及社交型网络(AI成为超级连接器)[35][36] 7. 软件生产进入个性化时代 - **AI编程接近普适生产力**:Anthropic CEO预测未来12个月内几乎所有的代码都可能由AI编写;美团内部已有52%的代码由AI生成;腾讯超过90%的工程师使用AI编程助手,50%的新增代码由AI辅助生成[37] - **软件生产核心瓶颈转移**:从编码能力转向问题定义能力,自然语言成为主要编程接口,出现“vibe coder”[40] - **激活长尾需求与实现软件平权**:极低的构建成本使软件能千人千面,满足曾因市场规模小而被忽略的个性化、情景化需求,软件成为人类表达与解决问题的基本媒介[40][41] 8. 行业落地聚焦性价比与ROI - **企业关注点转向可衡量业务价值**:AI行业应用的第一性问题从技术先进性转向投资回报率与性价比[43] - **规模化部署仍存差距但使用量增长**:麦肯锡报告显示,88%的企业至少在一个职能中使用AI,但进入规模化阶段的比例很低,AI高绩效企业仅6%[43] OpenAI调研显示,ChatGPT Enterprise周消息量增约8倍,75%的员工认为AI提升了工作速度或质量,重度用户每周可节省超10小时[44] - **应用深入流程中后段并重构工作范式**:AI正从边缘任务深入核心业务流程,未来收益将来自流程再造、智能体协同等领域[44] 工作最小单元可能变为“一个人+N个智能体”,企业管理逻辑将转向以结果交付为中心[45] 9. AI眼镜迈向千万台临界点 - **出货量有望突破千万台分水岭**:预测Meta Ray-Ban等产品在2026年单品牌销量有望冲击1000万台;巴克莱预测2035年销量达6000万副;制造商依视路计划实施年产能1000万件的生产计划[45] - **“硬件减法”策略成功**:Meta通过放弃高成本显示模组,将眼镜重量控制在50克以内,结合大模型多模态能力,优先作为穿戴拍照设备,降低了制造难度与用户门槛[47] - **重塑交互逻辑与软件生态**:交互从以应用为中心转向以意图为中心,自然语言为主导;技能商店可能取代应用商店;摄像头产生的第一视角数据将赋能空间智能研发并可能催生新的推荐与广告模式[48] 10. AI安全成为研发与应用必选项 - **公众信任度下降凸显安全重要性**:全球调研显示,尽管66%受访者经常使用AI,但超半数(58%)认为其不可信赖,信任度较2022年呈下降趋势[50] - **安全算力投入成为热点**:预计超10%的算力将投入安全评估、对齐实验等领域;伊利亚成立的SSI公司已融资30亿美元,专注超智能安全;欧美法规可能使安全算力成为刚性成本[53] - **企业建立深度嵌入的治理机构**:如Google DeepMind的Responsibility & Safety团队、微软的Aether委员会、Anthropic的长期利益信托与宪法AI机制,将安全深度嵌入研发全流程[54] - **安全演变为基础性要素**:可信安全机制成为进入关键行业的前提,监管框架使安全实践从最佳实践变为准入门槛[55]
用手机就能当导演,硬刚Sora2的万相2.6接入千问APP
新浪财经· 2025-12-17 11:36
产品发布与功能创新 - 12月16日,阿里千问APP上线最新视频生成模型万相2.6,并向所有用户免费开放[2] - 基于万相2.6,千问APP上线“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与朋友或名人同框出演AI短片[2] - 万相2.6是全球功能最全的视频生成模型,支持音画同步、多镜头生成及声音驱动等功能,也是国内首个支持角色扮演功能的视频模型[4] - “AI小剧场”玩法基于角色扮演功能,目前全球仅OpenAI的Sora2大模型有类似功能[4] - 万相2.6的某些功能如音频驱动生视频,Sora2尚未实现[5] 技术实力与行业地位 - 千问APP接入影视级视觉大模型,使AI不仅是专业工具,也能释放普通人的想象力[5] - 公司拥有全栈自研的强大技术底座,今年9月在国内率先发布音画同步的视频生成模型万相2.5[5] - 在权威大模型评测集LMArena上,万相图生视频位居国内第一[5] - 在语言模型领域,阿里千问已具备比肩GPT的实力,英伟达开源的多个模型基座来自千问[6] - 爱彼迎Airbnb CEO表示公司大量依赖阿里千问,认为其比OpenAI更好更便宜[6] - 在大模型赛道,公司已成为实力全面硬刚OpenAI的中国科技公司[6] - 公司已在全球开源300多款模型,在全球主要模型社区的下载量突破7亿,衍生模型突破18万个[6] - 阿里千问超越美国Meta的Llama,成为全球第一的开源模型家族[6] 应用表现与用户增长 - 千问APP公测一个月,迭代速度惊人,共计更新18个版本,在创作、学习、办公三大场景能力持续增强[5] - 用户数量增长破纪录,公测一周下载量即破千万[5] - 公测23天,月活跃用户数(含APP、Web、PC端)突破3000万,成为全球增长最快的AI应用[5]
中国版Sora2来了!阿里千问接入万相2.6
经济观察报· 2025-12-17 04:46
公司产品与技术发布 - 阿里千问APP于12月16日同步上线并免费开放了最新的视频生成模型万相2.6 [3] - 万相2.6是全球功能最全的视频生成模型,同时支持音画同步、多镜头生成、声音驱动及角色扮演功能 [1] - 基于万相2.6的核心能力,千问APP上线了“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与他人同框出演AI短片 [1][3] - 该角色扮演功能目前仅美国OpenAI公司的Sora2大模型有类似能力 [1] - 万相2.6的音频驱动生视频功能,是Sora2尚未实现的 [4] 产品表现与用户增长 - 千问APP公测一个月,迭代速度惊人,共计更新18个版本 [4] - 公测一周下载量即突破千万 [4] - 公测23天,月活跃用户数(含APP、Web、PC端)突破3000万,成为全球增长最快的AI应用 [4] 技术实力与行业地位 - 千问APP的快速迭代基于阿里全栈自研的强大技术底座 [4] - 今年9月,阿里在国内率先发布音画同步的视频生成模型万相2.5,其在权威评测集LMArena的图生视频项目中位居国内第一 [4] - 在语言模型领域,阿里千问已具备比肩GPT的实力 [4] - 英伟达开源的多个模型,其基座都来自于千问 [4] - 爱彼迎Airbnb CEO表示公司大量依赖阿里千问,并认为与OpenAI相比,千问更好更便宜 [4] - 在大模型赛道,阿里已成为实力全面硬刚OpenAI的中国科技公司 [4] 开源生态与全球影响 - 阿里已在全球开源300多款模型 [5] - 阿里模型在全球主要模型社区的下载量突破7亿 [5] - 基于阿里开源模型衍生的模型数量突破18万个 [5] - 阿里千问超越美国Meta的Llama,成为全球第一的开源模型家族 [5]
千问App接入视频生成模型万相2.6
每日经济新闻· 2025-12-17 03:30
公司动态 - 阿里巴巴旗下千问App于12月16日同步上线最新视频生成模型万相2.6,并向所有用户免费开放 [1] - 基于万相2.6模型的核心能力,千问App上线了“AI小剧场”功能,在国内首次实现“角色合拍”玩法,用户可与朋友或名人同框出演AI短片 [1] - 截至12月17日,千问App公测满一个月,在此期间该App迅速迭代,共计更新了18个版本 [1] 行业技术 - 千问App新上线的“AI小剧场”玩法是基于其视频生成模型万相2.6的角色扮演新功能 [1] - 目前,仅美国大模型公司OpenAI旗下的Sora2大模型具备类似的功能 [1]