豆包·音乐模型

搜索文档
国泰海通|计算机:发展Agent已成各大厂共识,新规激发并购重组市场活力
国泰海通证券研究· 2025-05-19 14:20
AI Agent发展动态 - 字节跳动火山引擎发布豆包·视频生成模型Seedance 1.0 lite,支持文生视频、图生视频,生成时长5s/10s,分辨率480P/720P [2] - 豆包1.5·视觉深度思考模型激活参数仅20B,具备多模态理解和推理能力,在视频理解、视觉推理、GUI Agent等领域处于第一梯队 [2] - 字节升级豆包·音乐模型并推出Data Agent,Trae接入豆包深度思考模型,构建更强大的模型矩阵和智能体工具链 [2] - 谷歌DeepMind发布通用科学AI系统AlphaEvolve,可自主生成改进算法代码,已应用于解决数学难题和优化TPU设计,节省全球计算资源0.7% [4] 政策与行业整合 - 证监会修改《上市公司重大资产重组管理办法》,延长股份分期支付注册有效期至48个月,简化审核程序至5个工作日,鼓励私募基金参与并购重组 [3] - 新规提高对财务状况变化、同业竞争等监管包容度,完善锁定期规则支持上市公司吸收合并,有望加速计算机板块细分领域整合 [3] 商业化前景 - AI Agent技术迭代和落地在科技大厂中稳步推进,2025年或成为规模化商业落地元年 [1][2][4] - 火山引擎通过智能体工具帮助企业打通业务应用链路,AlphaEvolve已实现科研与芯片设计场景的实际应用 [2][4]
国泰海通:发展Agent已成各大厂共识 新规激发并购重组市场活力
智通财经网· 2025-05-19 07:54
AI技术迭代与产品发布 - 字节跳动火山引擎发布豆包·视频生成模型Seedance 1.0 lite 支持文生视频和图生视频 生成时长5秒或10秒 分辨率480P或720P [1] - 字节推出豆包1.5·视觉深度思考模型 激活参数仅20B 具备多模态理解和推理能力 在视频理解、视觉推理和GUI Agent能力方面处于第一梯队 [1] - 字节升级豆包·音乐模型 同时正式发布Data Agent并升级Trae接入豆包深度思考模型 以强大模型矩阵和智能体工具帮助企业打通业务到智能体的应用链路 [1] - 谷歌DeepMind发布通用科学AI系统AlphaEvolve 能自主生成并改进算法代码 成功破解数学和计算机科学领域重大难题 [3] - AlphaEvolve可生成数百至数千个改进方案 通过评估者算法筛选 已用于改进下一代张量处理单元设计 节省总计算资源0.7% [3] 行业商业化与整合趋势 - AI技术迭代和Agent落地在各大厂稳步推进 AI商业化持续发展 2025年将成为AI Agent规模化商业落地的元年 [1][3] - Agent落地已成为科技大厂共识 未来发展速度有望进一步加快 [3] - 证监会修改《上市公司重大资产重组管理办法》 建立重组股份对价分期支付机制 注册决定有效期延长至48个月 [2] - 新设重组简易审核程序 适用该程序的交易无需证券交易所并购重组委审议 证监会在5个工作日内作出注册决定 [2] - 完善锁定期规则支持上市公司吸收合并 鼓励私募基金参与并购重组 此举有望激发并购重组市场活力 [2] - 证监会新规则有望加速计算机板块在数字化转型需求推动下的细分领域整合 [1][2]
大厂Capex加速增长
国盛证券· 2025-05-17 14:44
报告行业投资评级 - 增持(维持) [7] 报告的核心观点 - 推理端对高性能计算的需求快速释放,阿里、腾讯等大厂Capex持续扩张,云上游上行周期正式启动,看好由推理应用带来的云计算需求持续扩张 [1][12] - 云大厂能力全面升级,加速AI应用落地 [2] - 以LLM为核心驱动的Agent背后蕴含庞大的算力需求,算力已成为支撑Agent发展的关键基础设施和核心瓶颈 [3] 根据相关目录分别进行总结 阿里、腾讯Capex实质更乐观,AI基建正式启动 - 阿里资本开支承诺金额超预期,阿里云增速亮眼,2025Q1阿里资本开支为246.12亿元,同比增长120.68%;阿里云收入301.27亿元,同比增长17.71%,未来三年阿里将投入超3800亿元用于建设云和AI硬件基础设施 [13][16] - 腾讯资本开支符合预期,国内AI基建正式启动,2025Q1腾讯资本开支274.76亿,同比+91.35%,公司预计在2025年进一步增加Capex,预期Capex占收入的比例为低两位数百分比 [16] 云大厂能力全面升级,加速AI应用落地 - 字节:6月火山引擎2025 FORCE原动力大会召开在即,5月13日发布豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,升级豆包·音乐模型,Data Agent正式亮相并全新升级,6月11 - 12日大会有望迎来更多AI落地惊喜 [21] - 阿里云:4月9日召开AI势能大会,AI和云计算基础设施全面升级,算力上第九代ECS开启商业化,算力最高提升20%、价格较上一代再降5%;存储上文件存储CPFS面向AI智算能力再升级;运维上跨域网络SLA提升至99.995%,网络智能服务NIS已推出;管控上“灵骏”可主动发现故障并“自愈”,万卡集群有效训练时长占比超93%;推理上人工智能平台PAI面向MoE架构及推理模型全面升级;数据上瑶池数据库产品上新,支持In - DB AI、开箱即用;Agent上线业界首个全生命周期MCP服务,预告Agent Store愿景;生态上“繁花计划”启动,未来三年目标百万家客户、百亿元商机 [26][35] - 华为云:4月10日召开生态大会,创新算力架构,推出CloudMatrix 384超节点;沉淀行业Know - how,推动盘古大模型在行业场景落地;坚定投入生态建设,华为开发者规模超1200万 [36][39] 算力是Agent爆发的前提,支撑中长期成长 - Agent需要处理长上下文和接入外部数据,增加上下文长度和接入外部数据会导致算力需求增长 [42][44] - Agent执行任务验证带来算力开销,如Manus AI的三重校验体系保障输出可靠性,但需要额外计算资源 [45] - 多模态的发展会带来更大算力需求,Agent处理和整合多种类型数据需要大量计算资源 [46] - 算力瓶颈影响Agent服务的用户体验,为保证用户体验需留出冗余算力 [47][48] - 算力需求不仅体现在用户端的推理服务上,也体现在模型训练阶段,如阿里Qwen3系列模型训练需要海量算力 [50] 建议关注 - 算力:寒武纪、海光信息等多家公司 [4][53] - Agent:金山办公、泛微网络等多家公司 [4][53] - 垃圾发电:旺能环境、盈峰环境等公司 [4][53] - 互联网大厂AI链:寒武纪、恒玄科技等多家公司 [5][54] - 军工AI:能科科技、品高股份等公司 [5][54]
火山引擎在沪发布系列新模型 豆包大模型产业落地加速
新华财经· 2025-05-14 08:31
产品发布与升级 - 火山引擎发布豆包视频生成模型Seedance 1.0 lite 支持文生视频和图生视频 实现影视级生成质量与速度突破 适用于电商广告、娱乐特效、影视创作和动态壁纸等场景 [1] - 豆包1.5视觉深度思考模型具备多模态理解和推理能力 在60个公开评测基准中有38个表现突出 视频理解和视觉推理能力处于第一梯队 已上线火山方舟平台 [1] - 豆包音乐模型升级 支持英文歌曲创作和视频理解自动适配背景音乐 用户可通过一张图或一句话创作十多种风格的高品质音乐 目前已全量上线 [2] 行业应用与客户覆盖 - 豆包大模型已落地汽车、智能终端、互联网、金融、教育科研、零售消费等行业 覆盖近4亿台终端设备、80%主流车企、70%重要性银行、数十家证券基金公司及多所顶级高校与科研院所 [2] - 巨人网络与火山引擎合作 社交推理游戏《太空杀》接入豆包大模型升级AI原生玩法 机器学习平台提供大模型训练和算力资源支持自研模型迭代优化 [2] - 礼来制药搭建专属AI应用开发平台 通过火山引擎可视化工作流编排构建智能体 应用于药物研发、疾病诊疗、学术沟通、销售培训和疾病教育等场景 实现企业AI资产沉淀与持续运营 [3] 技术架构与生态战略 - 火山引擎推出Data Agent企业数据智能体 具备主动思考、洞察、分析和行动能力 融合企业内结构化与非结构化数据及互联网知识 生成专业深度研究报告并支持智能营销 [2] - 火山方舟覆盖语言、深度思考、视觉、语音等多模型领域 建立完整模型服务矩阵 通过专业化模型应对差异化业务需求释放AI价值 [4] - AI落地需完成业务视角投资回报旅程、技术视角模型基建旅程和用户视角智能体全生命周期旅程 模型、算力、数据和安全构成AI新基建 火山引擎提供AI新基础四件套服务企业智能化提效 [3]
AI早报 | 软银对OpenAI的投资或降至200亿美元;月之暗面回应涉足AI医疗
搜狐财经· 2025-05-14 00:21
软银对OpenAI投资变动 - 软银对OpenAI的投资可能从400亿美元缩减至200亿美元 因OpenAI取消转为营利企业的计划 维持非营利组织控股结构 [2] - 原协议规定若OpenAI在2025年内未转型为公益公司(PBC) 软银有权将投资减半 [2] 火山引擎AI模型发布 - 火山引擎发布豆包视频生成模型Seedance 1 lite 支持文生视频、图生视频 生成时长5s/10s 分辨率480P/720P [2] - 同步推出豆包1 5视觉深度思考模型 升级音乐模型 企业用户可通过火山方舟平台调用API 个人用户可在豆包APP体验 [2] 月之暗面AI医疗布局 - 月之暗面优化Kimi在财经、法律、医学等专业领域的搜索信源质量 探索Agent产品方向 [3] - 公司回应称目标是为用户提供更可信、可靠的高质量专业回答 [3] 谷歌AI未来基金 - 谷歌启动"AI未来基金" 向初创公司提供DeepMind最新AI模型早期使用权、技术资源及股权融资 [3] - 获选企业有机会获得谷歌直接投资以加速AI规模化发展 [4] 腾讯混元开源多模态模型 - 腾讯混元联合多家机构开源UnifiedReward-Think模型 为首个具备长链式推理能力的多模态奖励模型 [4] - 模型提升复杂视觉任务的评估准确性、跨任务泛化能力及推理可解释性 开源内容包括完整训练脚本与评测工具 [4] 沙特HUMAIN与英伟达合作 - 沙特HUMAIN公司与英伟达合作建设AI工厂 计划部署数十万块先进GPU 目标五年内推动沙特成为AI领域全球领导者 [4] - 双方将开展大规模培训项目 为数千名沙特开发者提供AI、机器人、数字孪生等技术实践 [5] 智元机器人新设AI公司 - 智元机器人关联公司在四川成立智象启元智能科技 注册资本1000万人民币 业务含AI软件开发、系统集成等 [5] - 股东包括上海智元新创技术有限公司等三家实体 [5] 昆仑万维开源大模型 - 昆仑万维开源Matrix-Game大模型(17B+) 为工业界首个10B+级开源空间智能模型 专注游戏世界交互式生成 [6] - 该模型基于Matrix-Zero世界模型 针对开放式环境的高质量生成与精确控制设计 [6]
苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型;昆仑万维宣布开源Matrix-Game大模型丨AIGC日报
创业邦· 2025-05-13 23:52
昆仑万维开源Matrix-Game大模型 - 昆仑万维正式开源17B+参数的Matrix-Game大模型 该模型为Matrix-Zero世界模型中的可交互视频生成大模型 是工业界首个开源的10B+空间智能大模型 [1] - Matrix-Game专为开放式环境中的高质量生成与精确控制设计 面向游戏世界建模的交互式世界基础模型 [1] 百型智能推出外贸行业垂类Agent - 百型智能发布国内首个外贸行业垂类Agent AI外贸员Zoe 可独立完成外贸开发拓客全链路 包括市场分析、客户寻找、精准筛选、开发触达、转化跟进 [2] - Zoe的转化率高出传统人工方式10倍以上 [2] 火山引擎发布豆包视频生成模型 - 火山引擎发布豆包视频生成模型Seedance 1 0 lite 支持文生视频、图生视频 视频生成时长支持5s、10s 分辨率提供480P、720P [3] - 同时发布豆包1 5视觉深度思考模型 并升级豆包音乐模型 企业用户可在火山方舟平台使用API 个人用户可在豆包APP体验 [3] 苹果发布FastVLM模型 - 苹果发布FastVLM视觉语言模型 专为高分辨率图像处理优化 可在iPhone等移动设备上高效运行 [4] - FastVLM通过FastViTHD视觉编码器实现85倍编码速度提升 为实时多模态AI应用铺平道路 [4]
接入MCP后,火山引擎更新Agent生态建设“工具包”
第一财经· 2025-05-13 13:22
火山引擎Agent生态布局 - 公司于5月13日公开Agent搭建工具及案例 包括新视频生成模型Seedance 1.0 lite、视觉深度思考模型、企业数据智能体Data Agent及升级版音乐模型 [2][4] - 通过接入MCP协议构建Agent开发生态 平台提供Agent Devops全流程支持(开发-运营-使用)并降低开发者门槛 [2][4] - 智能体当前处于对话框形态阶段 预计2025年后将实现自主决策能力 [2] 行业竞争格局 - Agent生态建设集中于云服务大厂之间 因公有云基础设施不完善及需依赖大厂插件生态 [2][4] - MCP协议接入成为海内外大厂近期密集布局方向 生态竞争本质是插件与工具资源的竞争 [2][4] 技术实现与挑战 - 数据智能体Data Agent支持多模态输入 通过语义解析引擎自动识别业务标签(如"营销效果评估""库存优化") [3] - 大模型应用开发需规避"能力延长线"陷阱 避免被基础模型能力迭代取代 且数据基础决定应用效果下限 [2] - 智能体落地存在黑盒属性风险 包括幻觉问题、不确定性与不稳定性 需持续运营(评测/训练/调优)保障效果 [3] 开发者支持策略 - 云平台通过提供自有模型降低开发成本 如视频生成与视觉深度思考模型促进生态整合 [4] - 利用云服务优势帮助普通开发者跨越AI开发门槛 英特尔架构师指出复杂应用栈中数据核心地位不变 [2]