Workflow
FLUX系列模型
icon
搜索文档
德国一家50人AI公司,逼谷歌亮出底牌!成立一年半估值飙到230亿
创业邦· 2025-12-09 03:39
公司概况与融资里程碑 - 公司Black Forest Labs (BFL) 于2024年在德国成立,是一家专注于AI图像生成的公司 [9] - 公司在成立一年半内完成B轮3亿美元融资,估值达到32.5亿美元 [6][22] - B轮融资由Salesforce Ventures和Anjney Midha (AMP) 联合领投 [6] 创始团队与技术渊源 - 联合创始人团队(罗宾·隆巴赫、安德烈亚斯·布拉特曼、帕特里克·埃塞尔)曾是Stable Diffusion核心技术的研究者与缔造者 [9] - 团队因对前公司Stability AI的管理动荡和财务困境失望而集体出走并创立BFL [10][11] - Stability AI在2024年第一季度营收不足500万美元,亏损超过3000万美元,并陷入财务危机 [10] 核心产品与技术突破 - 核心产品为FLUX系列图像生成与编辑模型,基于“流匹配”架构,取代了行业主流的扩散模型 [24] - 最新模型FLUX.2能生成高达400万像素(4K)的图像,并实现“像素级精准控制” [6] - 模型具备强大的多参考图融合能力,可同时输入多达10张参考图,实现“零样本角色迁移”,解决了角色一致性的行业痛点 [6] - FLUX.1模型拥有120亿参数,基于新型“整流流变换器”架构,在图像细节、提示词遵循、生成文字和描绘人手方面表现突出 [15][24] 商业化策略与生态合作 - 商业模式清晰划分为开源模型构建影响力与企业级API服务实现商业闭环两个维度 [24] - 通过开源FLUX.1 Schnell和FLUX.1 Dev版本吸引开发者与构建生态,同时通过闭源的FLUX.1 Pro专业版及API服务获取核心收入 [25] - 企业级API主要服务于有稳定、大批量生成需求的企业客户,并被集成到各大行业巨头的产品中 [25] - 关键生态合作包括:模型被整合进马斯克旗下xAI的聊天机器人Grok [21];被欧洲AI巨头Mistral AI的聊天机器人Le Chat采用 [21];技术被Adobe和Canva集成到产品工作流中 [34];与英伟达共同推出针对RTX GPU优化的FLUX.1 Kontext NIM微服务 [34];华为云曾发布flux适配其Ascend NPU的开源开发任务 [36][40] 市场定位与竞争格局 - 公司CEO称BFL已成为谷歌在人工智能图像领域的主要竞争对手 [7] - 公司避开与Midjourney等在消费者订阅端的直接竞争,转而深耕产业链底层与上游的企业服务 [24] - 在全球AI竞赛由美国主导、依赖巨额资本投入的背景下,BFL以仅50人的小团队,凭借技术深度和精准的生态位选择取得了成功 [41][43] - 行业对比:OpenAI在2025年上半年营收约43亿美元,但同期亏损高达135亿美元,预计2024-2029年间将产生1430亿美元的负自由现金流 [42][43]
ICCV 2025|降低扩散模型中的时空冗余,上交大EEdit实现免训练图像编辑加速
机器之心· 2025-07-05 02:46
核心观点 - 上海交通大学EPIC Lab团队提出了一种无需训练的高效缓存加速编辑框架EEdit,用于加速基于流匹配扩散模型的图像编辑任务 [6][7] - EEdit通过反演过程特征复用和区域分数奖励控制区域标记计算频率,解决了图像编辑中的时空冗余性问题 [9] - 该框架支持多种输入类型引导的编辑任务,包括参考图像引导、提示词引导和拖拽区域引导 [10] - 相比于未加速版本,EEdit实现了2.4倍推理速度提升,最快可达10倍加速 [8] 研究动机 - 基于扩散模型的图像编辑存在时间步数量多、反演过程开销大、非编辑区域计算浪费等问题 [6] - 在将猫编辑为虎的案例中发现非编辑区域存在高空间冗余,反演过程存在高时间冗余 [14] - 当前学界对图像编辑任务中时空冗余性带来的计算开销问题研究较少,是一片蓝海 [6] 方法简介 - EEdit采用输出特征复用方式压缩反演过程时间步,使用区域分数奖励控制区域标记更新频率 [7] - 设计了空间局域缓存算法(SLoC),利用编辑区域掩码作为空间知识先验来针对性更新feature tokens [20] - SLoC算法包括分数图初始化、区域分数奖励、feature tokens选择和递增补偿等步骤 [21][22][23] - 采用缓存索引预处理(TIP)技巧,将缓存更新逻辑转为离线预处理算法 [24] 实验结果 - 在FLUX-dev开源权重上进行实验,覆盖PIE-bench等四个数据集 [26] - 定量评估显示SLoC+ISS方案在PSNR(31.97)、LPIPS(1.96)、SSIM(0.94)等指标上最优 [27] - 计算开销(264.5T FLOPs)和推理时间(4.60s)显著优于其他方法 [27] - 定性实验显示EEdit在编辑区域精确度和背景一致性上表现优越 [28] - 与其他缓存算法相比,SLoC在前景保持度上效果提高50%以上 [29]