Workflow
百度蒸汽机
icon
搜索文档
AI视频生成“暗战”起风
华尔街见闻· 2025-09-29 00:01
用户付费在大语言模型中尚未跑通,但正悄然在AI视频生成赛道中生根发芽。 今年6月,AI视频生成初创公司Runway的年化营收超过9000万美元(约合人民币6.4亿元);同年第二 季度,快手(1024.HK)旗下的AI视频生成应用"可灵"创收超过2.5亿元。 国内初创公司纷纷涌上牌桌。 北京生数科技有限公司(下称"生数科技")的"Vidu"、北京爱诗科技有限公司(下称"爱诗科技") 的"拍我"用户数均已突破千万;作为"杭州AI六小龙"首个IPO,Manycore Tech Inc.(下称"群核科技") 年内亦计划发布针对C端消费者的AI视频生成产品。 市场对于AI视频的商业化前景不仅是局限于个人创作者生成一段短视频,还有影视创作、具身智能等 更多领域。 但由于空间一致性、内容拼接的崩坏等问题的存在,亦让AI视频生成模型陷入"卖家秀"和"买家秀"的争 议中。 尽管属于AI视频生成行业的DeepSeek时刻尚未到来,但在各家大厂的加码下,市场有理由相信未来的 发展路径会愈发清晰。 拼时长 2024年2月,OpenAI推出了Sora 1.0,较此前Runway只能生成3-4秒的视频来说实现了突破性的进展,成 为全球首 ...
英伟达的50亿美元还不够?英特尔扭头又“求”苹果投资;北京发布薪酬数据报告,AI技术年薪中位值达31万丨AI周报
创业邦· 2025-09-28 03:12
国内AI产业发展动态 - 北京建成国内最大人形机器人训练场 占地面积上万平方米 年产数据量超600万条 推动行业标准化规模化发展[8] - 北京市人工智能工程技术人员年薪中位值达312684元 大数据工程技术人员达316388元 反映高端人才薪酬竞争力[8] - 百度萝卜快跑获迪拜001号自动驾驶测试牌照 成为当地唯一开放道路试乘Robotaxi企业[9] - 阿里云发布企业级AI智能体平台"瓴羊AgentOne" 已部署超20种企业级Agent应对数据密集等核心场景[9] - 美的集团完成全人形X系列1代机器人整机设计 预计明年应用验证 其机器人"美罗"已参与工厂巡检及物料搬运[9] - 阿里夸克发布AI创作平台"造点" 集成生图与生视频能力 率先接入通义万相Wan2.5并引入Midjourney V7模型[10][11] - 阿里开源Qwen3-VL系列视觉理解模型 包含235B参数版本 在多项评测中性能达Gemini 2.5 Pro水平[12] - 百度蒸汽机突破AI长视频生成技术 采用流式生成实现无限长度视频制作 突破此前5-10秒限制[12] - 月之暗面Kimi发布Agent模式OK Computer 通过端到端训练提升工具调用能力 支持网站开发及PPT制作等复杂任务[12] - 新石器完成1万台无人车交付 标志无人配送行业从试验迈向规模化应用[16] - 小红书上线AI办公APP"hi" 新增AI助手hibo支持信息总结及联网搜索 或进军企业级服务市场[16][17] - 宇树科技G1机器人实现"反重力"模式 任意动作下稳定性提升 摔倒后可快速起身[19] - 智元机器人披露合伙人团队 彭志辉任总裁兼CTO 团队涵盖营销服及具身业务等核心职能[25] - 腾讯元宝全量上线公众号及视频号评论区 具备用户情绪感知与回应能力[27] - 小米开源原生端到端语音大模型Xiaomi-MiMo-Audio 基于亿小时训练数据实现少样本泛化[27] - 腾讯发布一站式3D工作平台"混元3D Studio" 通过AI技术将3D资产生产周期从天级缩短至分钟级[27] - 通义万相开源动作生成模型Wan2.2-Animate 支持驱动人物及动物照片 应用于短视频创作等领域[29] - 北京完成159款大模型备案 占全国总量28.39% 全国备案大模型达560款 注册用户超32亿[29] 海外AI技术突破与战略布局 - OpenAI CEO预测超级智能或于2030年前出现 AI能力提升轨迹陡峭 几年内或实现人类无法单独完成的科学发现[29] - 英特尔寻求苹果投资以重振芯片业务 今年股价累计涨54% 此前获英伟达50亿及美国政府89亿美元投资[30] - OpenAI考虑租赁英伟达芯片 或节省10%-15%成本支出 采用GPU租赁模式避免采购筹资压力[30] - OpenAI联合甲骨文及软银在美国新增5个"星际之门"数据中心 总投资额达4000亿美元 德州站点已投入运营[31] - 台积电3纳米制程代工价格传闻上涨20% 2纳米制程或涨50% 客户包括苹果及英伟达等头部芯片企业[31] - SAP与OpenAI合作推出"德国版OpenAI" 结合企业应用与AI技术 服务于德国公共部门并确保数据主权[32] - 花旗分析指出OpenAI开发AI边缘设备或使苹果供应链企业受益 立讯精密及歌尔股份等已接触[32] - 马斯克否认xAI融资100亿美元及估值2000亿美元传闻 称目前未进行任何融资[33] - 扎克伯格表示宁愿浪费数千亿美元也不愿在AI领域落后 认为AI泡沫可能出现但更大风险是犹豫[35] - 谷歌将Gemini AI全面整合进Chrome浏览器 支持网页解释及多标签页信息整合 并与日历等应用联动[36] - 英伟达CEO称赞马斯克有望在AI领域占据领导地位 称其经常使用xAI的Grok模型[36] - 微软将在美国威斯康星州建第二座数据中心 累计投资超70亿美元 首座数据中心2026年投运[37][38] - 特斯拉Optimus AI团队负责人Ashish Kumar离职加盟Meta 其曾领导强化学习技术提升机器人灵巧度[38] - 英伟达拟向英国自动驾驶企业Wayve投资5亿美元 已签署意向书评估下一轮融资[40] AI投融资市场概况 - 全球本周披露AI融资事件35起 较上周减少1起 已披露金额事件24个 总融资规模190.84亿元人民币 平均融资金额7.95亿元[42] - 早期阶段融资19起 成长期12起 后期3起 显示资本持续关注早期创新项目[44] - 国内融资集中在江苏及广东等地 江苏披露8起融资共12.2亿元 广东4起共1.4亿元 北京3起共0.4亿元 上海3起共3.3亿元[47][50] - 国内AI领域已披露融资总额20.3亿元 智能清洁泳池机器人商星迈创新获10亿元A+轮融资 为本周最高[52] - 海外AI领域已披露融资总额170.54亿元 AI数据中心开发商Nscale获11亿美元B轮融资 使用AMD及英伟达GPU硬件[62]
AI视频进入蒸汽机时代
机器之心· 2025-09-25 23:54
技术升级与核心突破 - 推出行业首个通用AI长视频生成功能,突破5秒和10秒的时长限制,理论上支持任意长度视频生成[3] - 采用流式生成技术替代传统首尾帧续写方案,用户仅需一张图片和提示词即可实现无限时视频生成,并支持实时调整提示词[4] - 引入交互式需求表达功能,允许在生成过程中暂停并修改提示词,无需等待完整推理过程结束[3][4] 性能表现与案例展示 - 生成视频实现毫秒级人物口型、表情、动作同步,中文语音细节还原度超98%[3][19] - 成功生成连贯长视频案例:小鸭子划水上岸动作流畅,水面涟漪和羽毛细节逼真;西部牛仔一镜到底场景转换丝滑;纸船漂流轨迹真实无失真[6][8][10] - 新增首尾帧功能,通过2张图片和提示词生成5秒视频,支持定格动画、季节过渡等复杂场景[11][15][16] 行业痛点与解决方案 - 解决长视频生成两大核心挑战:时长方面通过自回归扩散模型和动态缓冲区管理保障连续性与一致性;成本方面通过阶梯独立噪声构造降低平方级计算复杂度[25][26][27] - 采用历史参考帧增强策略,通过概率扰动和注意力门控机制缓解累积误差与信息漂移问题[28][30] - 引入训练指导帧和抗偏移技术,确保生成内容不偏离初始设定并保持主体一致性[32] 商业化应用前景 - 大幅降低创作门槛与成本,可应用于广告大片制作(如耳机产品展示)、影视预演、虚拟角色对话等场景[16][19][33] - 支持多角色自然对话与大师级运镜,依托海量中文语料训练实现电影级画质输出[19][33] - 推动AI视频生成从工具级片段制作向互动视频、直播等实时交互场景演进,重塑内容创作商业模式[22][37]
华尔街见闻早餐FM-Radio | 2025年9月26日
华尔街见闻· 2025-09-25 23:08
市场表现 - 美国第二季度GDP增速上修至3.8% 创近两年新高 PCE物价指数2.6% [3][9] - 美国上周首申失业金人数大幅回落至21.8万人 为7月以来最低水平 [3][9] - 美股三大指数三连跌 标普500指数收跌0.50% 道指跌0.38% 纳指跌0.50% 回吐美联储9月会议后涨幅 [2][6] - 美债主要期限收益率齐升 2年期收益率涨4.5基点 10年期涨2.13基点 [2][6] - 美元两日连涨至三周高点 美元兑日元逼近150 [2] - 加密货币全线暴跌 比特币跌破11万美元下跌3.62% 以太坊重挫超7%至3823美元创七周新低 Solana跌7.2%连跌6天 [2][11] - 现货黄金反弹0.38% 白银突破45美元创十四年新高 原油先跌后涨美油较日低涨近2% [2][6] - 创业板再创逾三年高位 宁德时代总市值超贵州茅台达1.83万亿元 恒科指涨近1% 小米午后大涨5% [2][18] 货币政策与央行动态 - 多位前美联储主席、前财长及经济顾问致函最高法院反对解雇美联储理事库克 称将削弱公众对美联储信任 [3][9][12] - 美联储理事米兰主张每次降息50基点 通过"短暂且大幅"降息快速达到中性利率 警告当前政策利率处于"高度限制性"区间 [3][9] - 美联储副主席鲍曼称就业市场"脆弱"证明理应进一步降息 通胀率已足够接近美联储目标 [3][10] - 美联储明年票委洛根呼吁利率工具改革 建议用三方一般担保利率(TGCR)替代联邦基金利率 因TGCR每日交易量超万亿美元远超当前基准 [3][10] - 瑞士央行拒绝负利率 2024年初以来首度暂停降息 瑞士法郎兑美元升至十年高位 [19] 科技与互联网 - 小米17系列全球首发第五代骁龙8至尊版 采用第三代3nm制程工艺 起售价4499元 Pro版4999元搭载"妙享背屏" [3][13][21] - 雷军回应技术质疑 称芯片是成功必由之路 至少坚持十年投入五百亿 五十来岁正是闯的年纪 [3][13][21] - 小米汽车计划2027年进军欧洲市场 已启动实地调研筹备销售网络 长期目标跻身全球前五 [3][21] - 阿里宣布增加AI投资并与英伟达建立新合作 大摩预计阿里云每年新增容量超3GW 相当于2025年整个中国市场新增容量 每1GW约1000亿人民币资本投入 [16][17] - 快手发布"可灵AI 2.5 Turbo"模型 实现近30%成本削减 高盛称其处于全球AI视频生成领域顶尖水平 预计2025财年收入达1.54亿美元 [17] 加密货币与区块链 - 数字人民币国际运营中心正式运营 推出跨境数字支付、区块链服务及数字资产三大平台 [3][9][26] - 加密货币市场遭遇重挫 全球近25万人爆仓损失超11亿美元 17亿美元多头被强制平仓 机构资金撤离加剧抛售压力 [11] - 韩国Naver金融拟收购Upbit 推出韩元稳定币进军全球 将Web2与Web3力量结合 [4][14] - Circle研究稳定币"可逆"交易机制 旨在通过区块链Arc实现"反向支付" 吸引银行及机构客户 [22] - 永续合约加速登陆美国受监管市场 Coinbase已向零售客户推出 芝加哥期权交易所计划11月推出 [20] 新能源汽车与电池 - 比亚迪欧洲8月销量同比暴增200% 连续两个月超越特斯拉 市场份额扩大至1.3% 特斯拉销量下滑36.6% [3][14] - 宁德时代市值达1.83万亿元超越贵州茅台 成为中国第三大上市公司 电池前景良好引发投资者从电动汽车股轮动至电池股 [18] - 小米汽车进军欧洲计划2027年落地 将通过开设展厅让消费者体验电动汽车及智能生态系统 本地化生产为长期必然规划 [21] 大宗商品与资源 - 全球第二大铜矿Grasberg因重大事故停产 高盛预计未来12-15个月造成50万吨铜供应损失 铜价必须上涨 [19] - 中国有色金属工业协会提出严控铜冶炼产能扩张措施 淘汰落后产能 鼓励配套铜矿产能或利用再生资源 行业利润长期有望回归正值 [25] - 阿根廷恢复谷物出口税 70亿美元出口申报额上限仅用两天达成 农产品出口免税政策提前结束 [19] 人工智能与技术创新 - 百度发布全球首个中文音视频一体化模型蒸汽机 支持无限长度AI视频生成 定价策略下调至同类产品70% [28] - 强脑科技推出无线连接仿生手 无需植入芯片依靠超级传感器解码神经信号 实现意念操控 延迟几乎可忽略不计 [29] - 多个AI模型在几分钟内通过CFA三级考试 Gemini 2.5 Pro综合表现最佳 国产KIMI K2多选题正确率达78.3% [24] - Meta推出AI视频创作平台Vibes 集成在Meta AI应用中 允许用户创作、发现和分享短视频内容 [23] - 微软公布芯片内部蚀刻冷却液通道新技术 散热效率达传统冷板三倍 但大摩认为广泛采用仍需时日 [23] 国际贸易与政策 - 商务部对墨西哥涉华限制措施进行贸易投资壁垒调查 涉及汽车及零部件、纺织品、服装等产品类别 [15] - 美国施压韩国将投资承诺提高近2000亿美元 要求现金而非贷款 投资规模向日本5500亿美元协议靠拢 [3][10] - 白宫警告政府关门期间或永久裁员 预算僵局再升级 若10月1日前未达成协议部分联邦雇员面临永久失业风险 [3][10] 企业动态与并购 - 亚马逊与FTC达成和解 支付25亿美元解决诱导用户订阅Prime指控 包括10亿美元罚款和15亿美元用户退款 [22] - 特朗普政府同意使用马斯克旗下xAI的AI模型 联邦机构可以42美分象征性费用获得Grok 4等模型 [22] - SAP遭欧盟反垄断调查 涉软件支持服务限制竞争 可能面临巨额罚款 股价跌超2.3% [23]
百度蒸汽机迎来最新升级,支持生成无限长度的AI视频
选股宝· 2025-09-25 14:41
百度蒸汽机技术升级 - 全球首个中文音视频一体化视频生成模型百度蒸汽机升级 发布通用AI长视频生成功能 支持用户生成无限长度AI视频[1] - 采用流式生成技术突破此前AI仅能生成5秒、10秒短视频的局限 实现通用长视频"无限"生成能力[1] - 一个月前已发布蒸汽机2.0版本 涵盖Turbo、Lite、Pro及有声版多个版本 丰富产品形态和用户选择[1] 产品定价策略 - 新版蒸汽机定价策略大幅下调 刊例价对比同类产品下降至70%[1] - 定价举措降低视频生成门槛 增强产品在市场上的性价比和竞争力[1] 行业应用前景 - 通用AI长视频生成功能有望拓宽AI视频生成工具应用场景 包括电影级特效、数字内容创作等[1] - 中文音视频一体化视频生成模型将推动国产AI在视频内容创作领域高速发展[1] - 视频生成领域应用持续迭代 行业头部公司持续布局 有望提升应用渗透率[1] 相关公司业务进展 - 中文在线通过自研工具链将传统动漫短剧制作11个环节压缩至5个核心步骤 实现生产周期缩短70%、成本降低50%[2] - 零点有数深耕数据分析与决策智能 涵盖AI、云计算、物联网等领域 能力可助力AI视频生成、大模型定制训练、数据治理等多个细分环节[2]
晚报 | 9月26日主题前瞻
选股宝· 2025-09-25 14:35
明日主题前瞻 1、铜 | 据中国有色金属报,近日,中国有色金属工业协会铜业分会第三届理事会第五次会议在河北省雄安新区召开。中国有色金属工业协会高度重视铜冶 炼"内卷式"问题,提出严控铜冶炼产能扩张的具体措施建议。目前,国家有关部门正在加快研究如何加强对铜冶炼产能建设规范化管理具体措施。 点评:据悉,这款产品摆脱了传统假肢的物理控制方式,实现了真正意义上的"大脑遥控"。强脑科技专注于非侵入式脑机接口技术研发,致力于通过脑机技 术提升人类能力,其核心产品包括智能仿生手、智能仿生腿等。与侵入式方案不同,强脑科技选择的是非植入路线,通过自主研发的人工智能算法解析大脑 神经信号,使得高位截瘫患者无需外骨骼即可用意念写字,失语者能重新"发声"。 点评:天风证券认为,铜冶炼行业"反内卷"重中之重在于"产能的优化"。首先,淘汰一批落后产能;其次,现有产能降本增效,包括采用先进冶炼技术以及 智能化、绿色化;最后,新扩建产能需建设高水平冶炼厂,鼓励配套铜矿产能,或有效利用再生资源。铜行业利润长期有望回归正值,产能布局实现优化。 参考供给侧改革成果,预计通过"反内卷"矿冶之间的匹配度将提升,铜冶炼行业存在扭亏为盈的预期。 2、数字 ...
氪星晚报|我国首个国家级页岩油示范区累计产量突破500万吨;抖音直播:切勿轻信网络“挂机”教程 ,平台禁止录播挂机等违规行为;支付宝宣布小微商户降费再延长1年
36氪· 2025-09-25 10:57
大公司: 瑞银董事长力挺首席执行官Ermotti作为接班人 瑞银集团董事长Colm Kelleher盛赞让首席执行官Sergio Ermotti担任其潜在继任者的想法,此番言论将加 剧市场对该行未来数年领导层变动的猜测。Kelleher表示,若条件合适且设有"适当"的过渡期,他乐见 Ermotti接任其职位。 抖音直播:切勿轻信网络"挂机"教程 ,平台禁止录播挂机等违规行为 36氪获悉,9月25日,抖音发布《抖音直播关于治理录播挂机的公告》,在对相关违规行为进行处罚公 示的同时,重点提醒主播们切勿轻信网络"录播教程",避免个人财产损失。据了解,2025年以来,平台 依据《抖音直播行为规范》,对超过45万个涉及"录播""挂机"的直播间进行了警告、中断、封禁等不同 程度的处罚。 Lazada已与天猫完成系统打通,商家可一键卖东南亚 36氪获悉,今年双11,一批天猫品牌将在国内和东南亚同时开卖,实现生意双重增长。作为品牌战略的 升级,Lazada在今年双11之前,已与天猫进行系统打通,为天猫品牌0门槛增加马来西亚、新加坡、泰 国、越南、菲律宾5个海外市场。 支付宝宣布小微商户降费再延长1年 36氪获悉,支付宝先后实 ...
百度蒸汽机发布通用AI长视频生成功能
证券时报网· 2025-09-25 10:26
产品技术突破 - 全球首个中文音视频一体化视频生成模型百度蒸汽机升级 发布通用AI长视频生成功能[1] - 采用流式生成技术实现通用长视频"无限"生成能力 突破此前AI仅能生成5秒、10秒短视频的局限[1] - 支持用户生成无限长度AI视频 带来"流式无限生成"全新体验[1] 行业地位 - 此次升级在行业尚属首次 突破依赖首尾帧控制续写时长的技术局限[1]
可灵AI升级模型降价30%,视频大模型会卷入价格战吗?
钛媒体APP· 2025-09-23 14:32
可灵AI模型更新与定价策略 - 可灵AI推出视频生成可灵2.5 Turbo模型 新增文生视频和图生视频功能 [2] - 新模型相比2.1同档位降价近30% 突出性价比优势 [2] - 可灵AI罕见采用降价策略 此前三个版本未重点提及价格调整 [2] 视频大模型行业竞争格局 - 百度率先发起国内视频大模型价格战 蒸汽机2.0版本刊例价降至同类产品70% [2] - 百度声称其技术可将好莱坞百万级特效成本降至百元级别 [2] - 行业定价策略分化 垂直模型公司走高端专业路线 互联网大厂侧重生态赋能 [8] 视频大模型成本与盈利特征 - 视频生成大模型硬件采购和运营成本居大模型领域第一梯队 [3] - 高分辨率视频推理成本极高 多模态生成token消耗远高于文本 [3] - 可灵AI在推理算力层面实现毛利率转正 追加投入对集团利润影响可控 [3] 国内视频大模型定价体系 - 可灵AI会员分四档:黄金66元/月 铂金266元/月 钻石666元/月 黑金1314元/月 [4] - 即梦AI定价三档:基础79元/月 标准239元/月 高级649元/月 [6] - 海螺AI最高端会员月费达1399元 为国内视频大模型最高定价 [3] 互联网大厂战略定位与营收表现 - 可灵AI和即梦AI核心目标非直接盈利 通过低门槛策略反哺短视频平台生态 [8] - 百度采用激进定价旨在快速抢占企业级市场份额 [8] - 可灵AI单季度营收超2.5亿元人民币 是主流大模型中唯一公开披露营收的 [9] 技术进展与应用场景拓展 - 可灵2.5 Turbo在文本响应、动态效果、风格保持等维度大幅提升 [9] - 模型提升视频生成可控性、稳定性和一致性 适用于影视、游戏、广告等专业场景 [9] - 可灵AI亮相釜山国际电影节 与Google、Midjourney共同探讨影视领域应用前景 [9]
百度造了个“吴彦祖”
华尔街见闻· 2025-08-29 10:05
百度智能云战略转型 - 百度智能云战略从规模为王转向效能优先 旨在将AI云从成本中心转变为新型利润中心 [2] - 公司提出AI时代下半场竞争核心是智能效能而非算力规模 强调为客户利润表创造价值 [2] 百舸AI算力平台 - 百舸5.0平台通过昆仑芯超节点实现算力密度与推理效率显著提升 支持分钟级部署万亿参数开源模型 [3] - 与英特尔合作整合至强6处理器和Gaudi加速卡 构建开放硬件生态 [3] - 北京人形机器人创新中心采用百舸平台后研发效率提升2倍 [3] 千帆智能体基础设施 - 千帆4.0模型库扩容至超过150个模型 包括百度蒸汽机视频生成模型及金融/视觉行业专用模型 [4] - RFT工具链将模型精调数据需求从数千条降至数百条 降低90%数据门槛 [4] - 数据智能平台DataBuilder实现处理效率提升600% 计算成本降30% 检索存储成本降80% [4] - AI搜索MCP Server提供实时信息接入 多智能体协作模式突破单智能体能力限制 [4][5] 行业应用案例 - 三一能源工厂采用视觉大模型实现SOP检测自动化 大幅减少人工巡检时间 [6] - 秒哒平台将应用开发从数周/数万元压缩至10分钟/5元以内 已生成超25万应用且日活增长500% [6] - 文心快码工具在企业研发中贡献30%-40%代码产出 未来可解放开发者80%-90%精力 [6] 财务与市场表现 - 百度AI新业务(含智能云和自动驾驶)季度收入首次突破百亿 同比增长34% [7] - 客户覆盖65%央企、80%系统重要性银行及95%主流车企 [7] - 智联招聘案例显示推理成本降低70% 响应速度从14秒大幅缩短并提升转化率 [7]