Workflow
可灵2.6
icon
搜索文档
用AI规模化生产好内容,可灵AI携手全球创作者叩响临界点大门
21世纪经济报道· 2025-12-22 11:51
文/吴佳楠 拿已经生成好的图片,给AI大模型提出"跑出一个灾难片场景"的指令,短短一分钟的时间,就能自动生 成如同电影质感般的流畅视频;即将消失的历史遗址能用AI进行数字修复,进行数字艺术再创作的现 代化动态演绎…… 在生成式AI的大航海时代,AI技术赋能"视频"这一复杂又具传播势能的内容形态,正叩开日常生活和艺 术创作的大门,通过技术、艺术与影视的跨界探索,重塑内容生产力。 面对这股AI浪潮,中国的科技巨头自然加速布局前沿技术。进入12月,可灵"上新"可灵O1新模型,并 在之后连续发布了音画同出模型可灵2.6、可灵数字人2.0、可灵O1主体库&对比模版等多个更新。 可灵AI产品及运营负责人温园旭在会上展示他们最新发布的可灵O1多模态视频模型时,给出了技术生 态视角的回应:"随着模型的不断更新和迭代,有越来越多的创作者加入使用AI模型和工具,迸发出非 常好的创意,可灵AI珍视与各界伙伴合作的机会,共同推动'用AI规模化生产好内容'临界点的加速到 来。" 当AI视频生成迈入规模化应用前夜,如何通过"生态协作"重新定义AI视频创作的可能性边界,成为全球 艺术、学术、影视工业及AI技术领域的顶尖专家与前沿创作者共同 ...
用AI规模化生产好内容,可灵AI携手全球创作者叩响临界点大门
21世纪经济报道· 2025-12-22 11:47
文/吴佳楠 拿已经生成好的图片,给AI大模型提出"跑出一个灾难片场景"的指令,短短一分钟的时间,就能 自动生成如同电影质感般的流畅视频;即将消失的历史遗址能用AI进行数字修复,进行数字艺术 再创作的现代化动态演绎…… 在生成式AI的大航海时代,AI技术赋能"视频"这一复杂又具传播势能的内容形态,正叩开日 常生活和艺术创作的大门,通过技术、艺术与影视的跨界探索,重塑内容生产力。 当 AI 视 频 生 成 迈 入 规 模 化 应 用 前 夜 , 如 何 通 过 " 生 态 协 作 " 重 新 定 义 AI 视 频 创 作 的 可 能 性 边 界 , 成 为 全 球 艺 术 、 学 术 、 影 视 工 业 及 AI 技 术 领 域 的 顶 尖 专 家 与 前 沿 创 作 者 共 同 热 议 的 话 题。 面对这股AI浪潮,中国的科技巨头自然加速布局前沿技术。进入1 2月,可灵"上新"可灵O1新 模型,并在之后连续发布了音画同出模型可灵2 . 6、可灵数字人2 . 0、可灵O1主体库&对比模 版等多个更新。 在首届香港国际AI艺术节期间,由快手可灵AI主办的"AI创作全球生态论坛"上,紫荆文化集 团副总经理丁伟表示, ...
多行业联合人工智能 12 月报:科技竞赛打开估值上限-20251208
华创证券· 2025-12-08 13:01
核心观点 - 策略核心:当前正处于康波周期下的科技竞赛阶段,参考90年代美股互联网牛市,中国科创板块的估值上限仍有继续打开的空间[3][14] “十五五”规划首次提出“抢占科技发展制高点”,政策聚焦于卡脖子领域(如集成电路、工业母机)和未来产业(如量子科技、具身智能)[3][14] - AI产业链:端侧硬件(如苹果链、机器人链)增长稳健可持续,应用侧当前应重点关注ToB端的商业化落地[3][15] 从PEG和资本开支两个视角筛选,显示器、计算机硬件、半导体设备、PCB、光学元件、集成电路封测、电子终端品等行业值得重视[3][16] - 行业动态:11月人工智能板块整体表现偏弱,CS人工智能指数下跌3.5%,人工智能指数下跌4.0%[22] 但板块估值仍处于历史中等偏上水平,如CS人工智能指数10年PE分位为71%[23] 策略观点 - 估值空间:参考1995-2000年美国互联网牛市,信息技术板块估值在康波周期上行中普遍创下新高,中国当前科创估值上限打开程度与彼时仍有差距,整体估值或仍有上行空间[3][14] 例如,在上一轮牛市中,思科、微软等公司PE提升倍数显著(如思科从8.2倍升至31倍)[18] - 政策导向:“十五五”规划明确要抢占科技发展制高点,具体方向包括突破集成电路、工业母机等卡脖子领域核心技术,以及培育量子科技、具身智能等未来产业[14][19] - 投资视角: - PEG视角:筛选26年预测净利润增速分位高于当前PE分位的TMT三级行业,包括显示器、计算机硬件、半导体设备、游戏、物联网、电信应用、消费电子零部件等[16][20] - 资本开支视角:筛选资本开支/折旧摊销力度大于1.5且26年预测净利润增速大于30%的行业,包括半导体材料/设备、光学元件、显示器、PCB、集成电路封测、电子终端品等[16][21] 电子行业 - 行业景气:Scaling law依旧有效,多模态和Agent模型不断推出,推动AI算力需求加速向上[3][33] 英伟达FY26Q3营收达570亿美元,同比增长62%,并已锁定Blackwell与Rubin平台相关的5000亿美元营收可见度[38][39] - 投资建议:AI基础设施仍处早期,PCB需求有望维持高增长[33][40] PCB产业链重资产属性强,产能释放与产品结构优化可推动业绩非线性提升,应关注产能储备充足、受益新技术发展的标的[33][40] 推荐景旺电子、东山精密、胜宏科技、工业富联、生益电子、生益科技、沪电股份和鹏鼎控股等[33][40] 计算机行业 - 竞争阶段:新模型密集落地,AI竞争进入“强推理+原生多模态”阶段[3][33] - 重点模型: - 月之暗面Kimi K2 Thinking:11月6日发布并开源,采用混合专家架构,总参数量1万亿,支持256K上下文窗口,在多项基准测试中超越GPT-5等闭源模型[34][41] 其API定价具有竞争力,输入价格仅为每百万tokens 0.15美元(缓存命中)[42] - 谷歌Gemini 3:11月19日发布,以1501分登顶LMArena排行榜,并推出增强推理的Deep Think模式[34][43][44] - 谷歌Nano Banana Pro:11月20日发布,实现文本到图像生成的原生多模态突破,支持4K分辨率输出[34][45] - DeepSeek V3.2:12月1日发布,其标准版推理能力达GPT-5水平,Speciale长思考增强版在IMO、ICPC等国际竞赛中斩获金牌[34][46][47] 传媒行业 - 长期观点:长期看好AI产品应用落地及商业化进度加速[3][35] - 关注方向:建议关注AI Agent(生产力方向)、AI陪伴(泛娱乐方向)、AI多模态(音视频、3D)、AI教育(付费意愿高)及AI端侧等方向[35][57] - 重点公司动态: - 阿里巴巴:通义千问Qwen3-Max上线深度思考模式,并开源高效图像生成模型Z-Image[51] - 快手:可灵2.6全量上线,支持“音画同出”,并发布数字人2.0版本[54] - 字节跳动:豆包手机助手与中兴通讯达成合作,引发市场关注,中兴通讯A股当日涨停(+10%)[56] - 投资建议:建议关注阿里巴巴、腾讯控股、阜博集团、快手、美图等标的[35][57][59] 人形机器人行业 - 投资逻辑:以基本面为锚,寻找估值弹性,产业正从概念验证迈向商业化落地[3][36] - 市场审美:对细分方向的偏好排序为:增量零部件 > 特斯拉相关供应链 > 国产机器人供应链 > 丝杠 > 其他零部件 > 设备 > 场景,反映了市场对“确定性”与“弹性”的权衡[36][62] - 行情回顾:自2023年以来,人形机器人指数共经历五次主要行情,均与特斯拉Optimus进展、国内厂商入局及产业链扩产等催化密切相关[62] 汽车行业 - 核心事件: - 智驾量产:全球首搭地平线HSD及征程6P的星途ET5于11月28日上市,售价14.99万元,标志着顶级智驾底座进入规模化部署阶段[37][63] - 公司上市:文远知行与小马智行相继于11月登陆港交所[37][70] 小马智行港股IPO募资额(绿鞋后)可达77亿港元,成为2025年全球自动驾驶行业最大IPO[65][70] - 业务进展:小马智行Q3财报显示,其第七代Robotaxi在广州实现单车盈利转正,日均订单达23单/辆[65] 文远知行Q3 Robotaxi业务营收3530万元,同比增长7.61倍[66] - 投资建议: - 整车:重点推荐吉利汽车(低估值修复),关注比亚迪,并重点推荐江淮汽车(新品多、弹性大)[37] - 智驾:推荐地平线机器人,关注禾赛科技、速腾聚创、小马智行等[37] - 机器人:推荐拓普集团、敏实集团、银轮股份、双环传动等[37] 精选组合 - 华创证券人工智能研究中心12月精选组合为:上游-生产工具:卓易信息;上游-算力基础:景旺电子、地平线机器人;下游-端侧硬件:恒立液压、信捷电气;下游-场景应用:阿里巴巴[4][11]
Lovart悄悄上的这个新功能,就是我心中设计的神。
数字生命卡兹克· 2025-12-05 01:20
Lovart产品功能与价值主张 - 公司在黑色星期五促销期间提供4折优惠,其最高等级年费会员价格为948美元,约合7000元人民币 [2][3] - 用户购买会员的核心动机之一是获得包括NanoBanana Pro 4K版本、Midjourney、可灵O1、可灵2.6以及新上线的Seedream4.5在内的多款AI工具的一年免费使用权 [5][7][8] - 公司新上线的“编辑文字”功能,结合Nano Banana Pro,被一位拥有十几年经验的设计师认为拥有颠覆传统设计游戏规则的能力 [8][9] “编辑文字”功能详解与应用 - 该功能旨在解决AI生成图片(如PPT)无法修改文字的传统痛点,用户上传图片后,功能可在几秒钟内提取所有文字至右侧编辑框 [17][19][30] - 用户可直接在文本框内修改文字(例如改为抽象语录),点击应用后约十几秒即可生成新图片,新文字会按照原图样式极度精准地呈现 [32][34] - 该功能不仅能修改常规文字,甚至能处理传统设计中经过栅格化、钢笔工具调整或笔画拼接的特殊样式文字,实现了过去无法直接编辑的文字的修改 [34][35] - 功能的技术实现可能涉及多模态结构化识图,将文字拆解为可编辑框,再利用Nano Banana Pro的模型能力进行原位替换 [39] 功能组合与效率提升 - “编辑文字”功能与“画布”结合,可实现一键直出多个尺寸的海报或封面图,极大简化了设计师进行多尺寸适配的工作流程 [55][61][62] - “编辑文字”与“Touch Edit”(触碰编辑)功能组合使用,用户可通过按键(如M键或Ctrl+鼠标)自动识别并提取图中特定元素进行修改,实现文字与样式的同步高效调整 [65][70][72] - 公司提供的“Mock up”(样机)功能,结合“移除背景”与“编辑文字”,能快速将设计稿(如透明背景的Logo)贴合到实物模型(如汽车)上,方便生成效果图,提升了电商与平面设计效率 [76][78][81][83][85] 行业影响与范式转变 - 该系列AI工具的组合使用,使得设计师能够将99%的时间用于思考“做什么”,而非“怎么做”,从根本上改变了设计工作流程 [99] - 工具能力的进化正在消除传统设计软件(如PS)中因工具限制(如钢笔工具抠图、文字不可编辑)所建立的专业门槛,推动了设计行业的范式转移 [90][91][94][95] - 公司通过整合强大的AI模型(如Nano Banana Pro)与卓越的工程应用能力,创造了强大的协同效应,被视为定义了设计的下一个时代 [40][42][43]
腾讯研究院AI速递 20251204
腾讯研究院· 2025-12-03 16:03
亚马逊云科技AWS re:Invent大会发布 - 发布第四代AI芯片Trainium4,性能提升6倍,同时推出Trainium3 UltraServers和Amazon Nova 2系列自研模型(包括Lite、Pro、Sonic、Omni四款)[1] - Amazon Bedrock新增18款开源模型,包括Qwen3、Kimi K2、MiniMax M2等中国模型,平台已拥有超10万客户[1] - 推出AgentCore开发工具新功能和4款前沿智能体(包括AWS Transform Custom、Kiro Autonomous Agent等),以加速AI从投资到商业回报的转化[1] Mistral AI发布新一代模型 - 发布新一代Mistral 3系列模型,包括Ministral 3(14B、8B、3B)和Mistral Large 3(总参数675B,激活参数41B),全线回归Apache 2.0开源许可证[2] - Mistral Large 3在3000台H200 GPU上从头训练,在LMArena开源非推理模型类别中首次亮相排名第2,每个尺寸均发布基础版、指令版和推理版[2] - 此次全面开源被视为对DeepSeek激进开源策略的战略应对,公司通过端侧模型差异化优势寻求突破[2] 可灵2.6音画同出模型上线 - 可灵2.6全量上线首个音画同出模型,单次生成可同时产出画面、自然语音、匹配音效和环境氛围[3] - 提供文生音画和图生音画两条创作路径,支持单人独白、旁白解说、多人对白、音乐表演、创意场景等多种应用场景[3] - Web端与App端双端同步上线,会员权益支持标准模式和高品质模式,12月3日起限时2周尊享会员价6.6折[3] 阿里千问上线学习模型 - 阿里千问上线Qwen3-Learning学习模型,推出拍题答疑和作业批改两大功能,基于5亿级资料库覆盖全学段全学科,免费不限次数[4] - 模型支持印刷体和手写体识别,可整页多题同时批改并总结答题情况给出改进建议,从小学算数到研究生级别专业题目均能准确解答[4] - 该模型将多模态理解、精准文字识别和专业知识库结合,展现从通用到专业的转化能力,未来或面向工业检测、医疗辅助等领域[4] 理想AI眼镜发布 - 理想AI眼镜Livis正式发布售价1999元起(12月31日前政府补贴到手价1699元),全球最轻镜架仅36克,全系标配蔡司镜片,防尘防水IP54[5] - 核心亮点包括行业首发控车功能、0.7秒冷启动抓拍、800ms超快对话响应、78小时待机续航和行业首发无线充电眼镜盒[6] - 公司规划AI眼镜“三步走”:第一步持续优化不带显示眼镜,第二步推出带显示眼镜,第三步做独立终端,将其作为具身智能战略重要布局[6] 腾讯广告算法大赛结果 - 历时4个月的腾讯广告算法大赛落幕,来自华中科技大学、北京大学、中国科学技术大学的“Echoch”战队夺冠独揽200万大奖,前十名全员获腾讯Offer[7] - 赛题聚焦“全模态生成式推荐”,全球2800余支战队参与,冠军方案创新提出“逐位置行为条件化”和Muon优化器等技术突破[7] - 大赛结果显示现在学生与工业界几乎没有代差甚至更有创意,1-3人组队就能完成大团队工作,展现AI时代人才培养新特点[7] 蓝箭航天火箭技术突破 - 中国商业航天公司蓝箭航天自主研制的朱雀三号遥一火箭成功首飞入轨,但一级火箭回收任务未成功,这是中国首次在真实入轨任务中尝试一级回收[8] - 朱雀三号全箭长66.1米,起飞质量约570吨,一级搭载九台天鹊-12A液氧甲烷发动机,采用不锈钢箭体和航区回收方案[8] - 该火箭从立项到首飞用时约28个月,标志中国商业航天在大型液体可回收火箭技术上取得历史性突破,但仍需后续复用验证[8] Gamma公司增长策略 - Gamma创始人通过极致专注产品体验和口碑增长,在零广告投入情况下实现1亿用户与1亿美元ARR,核心策略是打磨产品前30秒体验并让分享极简化[9] - 团队坚持“极度痛苦地缓慢招聘”原则,25%成员为设计师,创始人亲自完成营销等职能后才招聘专人,确保每个岗位复制核心DNA[9] - 产品定位为AI时代的视觉叙事工具,通过响应式设计、富媒体支持和交互性等创新超越传统幻灯片,并推出Agent、Teams和API实现从个人到企业的扩展[9] Anthropic内部AI生产力报告 - Anthropic对内部132名工程师调查显示,Claude在日常工作占比从一年前28%增至59%,生产力提升从20%飙升至50%,27%工作是“若无AI就不会做”的新增任务[10] - 工程师普遍变得更“全栈”但也担心深度技能萎缩,Claude成为提问第一站减少了同事协作和师徒指导机会,职业角色转向AI系统管理者[10] - Claude Code使用数据显示,半年内任务复杂度从3.2升至3.8,连续自主执行工具调用次数从9.8次增至21.2次,人类干预轮次下降33%[11] Claude Opus 4.5灵魂文档逆向 - 开发者成功逆向提取Claude 4.5 Opus的1.4万token“灵魂文档”,Anthropic角色训练负责人确认属实[12] - 文档详细定义Claude为“新型实体”,建立四级效忠体系(安全>伦理>公司政策>帮用户),明确反对过度谨慎和说教,定位为“聪明绝顶的专家朋友”[12] - 文档包含“AI可能有情感”等哲学性内容,甚至要求Claude在必要时拒绝Anthropic自身的不当指令,完整版将很快正式发布[12]