Workflow
AI生图
icon
搜索文档
你还在晒AI图,有人已经在靠“提示词”收款了
36氪· 2025-11-27 09:40
即梦4.0产品升级 - 即梦4.0版本在图像生成的真实感上实现重大突破,尤其补齐了人物眼神的短板,使瞳孔有光、表情带情绪,营造出偶然抓拍的错觉,显著减少了此前版本的"AI味"[8] - 技术层面实现"快、准、真"三大优势:采用多模态统一架构实现理解、生成、编辑一步到位;通过一致性算法锁定人物核心特征并在不同角度下保持稳定;支持4K高清生成,细节真实到衣料纹理和皮肤质感可见[11] - 与即梦3.x版本相比,4.0版本生成的图片使外人第一反应不再是"这图P得不错",而是质疑"真的假的",这种真假模糊地带成为传播的最佳温床[11] 市场热度与用户采用 - 即梦4.0功能结合明星流量形成爆火出圈现象,例如詹姆斯中国行期间用户广泛使用该工具生成与明星的合影在朋友圈传播[2] - 产品火爆的条件包括技术突破使虚拟合影跨过"像不像人"的坎、集成在月活达1.57亿的豆包应用中极大降低使用门槛,以及明星自带的天然流量加成[12] - 该应用的火爆程度已扩展到广泛用户群体,甚至父辈用户也开始使用其为孩子进行换装或与明星合影[12] 提示词经济生态 - 围绕AI生图工具形成了提示词交易生态,网上存在大量P图指令帖子,单个帖子可获得大几百个赞,提示词模板成为一门生意[4] - 部分店铺以几块钱的价格出售提示词模板,可卖出几百份,形成一笔不小的收入,好的提示词被视为能直接生成杂志质感的"新滤镜"[4][16] - 由于普通人缺乏时间精力调试参数,购买现成提示词成为需求,提示词交易本身已是一门小生意[16] 行业趋势与产品定位 - AI图像生成工具正推动行业进入"所想即所得"时代,传统需要摄影棚、灯光、化妆师、后期师的复杂流程,现在一个提示词即可实现[17] - 即梦4.0被定位为超越生图工具的"人生生成器",用户可生成与18岁的自己同框、未来60岁的自己或未曾选择的人生道路可能样貌等场景[17] - 行业趋势显示未来将出现更多"所见未必为实"的时刻,工具本身已成为大众可用的基础能力,关键在于用户如何创造性地使用[18]
开源模型叫板Nano Banana Pro!Stable Diffusion原班人马杀回来了
量子位· 2025-11-26 09:33
模型发布与定位 - Flux 2由黑森林实验室推出,是Flux 1的升级版,定位为生产力工具[1][2] - 模型发布即开源,获得Hugging Face联创支持[1] - 对标谷歌Nano Banana系列,主打性价比优势,质量接近但价格更低[42] 技术能力与性能 - 具备多参考图像处理能力,可同时参考多达10张图像[3][16] - 支持精细控制,如根据参考人物和指定姿势草图生成图像[5][7] - 图像编辑支持高达4MP分辨率(2560x1440像素)[44] - 在指令遵循、图像细节和照片真实感方面有显著增强[63] 产品版本与定价 - 提供四个版本:pro版(生产工作流,生成速度<10秒,文生图起价$0.03)、flex版(可调参数,最高质量,文生图起价$0.06)、dev版(32B开放权重,非商业免费)、klein版(即将推出)[16][17] - pro版生图质量媲美顶尖闭源模型Nano Banana,但成本更低[16] - 普通用户可通过Flux Playground在线试玩,开发者可通过Hugging Face获取权重或调用第三方API[17] 实测表现 - 在食谱图解生成测试中,pro版一分钟内生成4张图,拼写和内容准确[18][19][21] - 图像编辑功能能准确理解指令,如给马斯克添加黄色头盔且保持背景不变[31][33] - 支持多人物融合生成,能实现马斯克、李飞飞等多人同框效果[35][37] - 目前对中文支持较弱,但可用中文提示词要求生成英文内容[29] 市场对比与优势 - 网友实测显示在老照片修复、真实感增强方面表现优于Nano Banana系列[46][48] - 相比Nano Banana Pro的有限免费次数,Flux 2具有价格优势[42] - 团队背景雄厚,由Stable Diffusion原班人马创建,Flux 1曾获AI大神卡帕西站台[55][57][59]
太炸裂了!全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西!
量子位· 2025-11-21 06:29
产品核心特点 - 谷歌推出最新最强文生图模型Nano Banana Pro,又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑[11][12] - 主要升级包括支持2K、4K高清分辨率及多种宽高比,文字渲染能力大幅提升支持多语言直接渲染或翻译,支持最多14张图像融合生成,基于Gemini 3 Pro的多模态理解能力支持生成复杂专业图表[13][15] - 产品拥有最先进的图像生成和编辑功能,具备更高级的世界知识、文本渲染、精度和控制能力,基于Gemini 3构建,非常擅长制作复杂的图表[46] 功能性能演示 - 模型能够秒秒钟将英伟达最新财报PDF文件生成重点突出、内容精致的图表,一次性将未加工的Graphviz图表代码生成带logo的可视化效果图,直接生成论文流程图和核心概念解释图如Transformer架构图[2][4][6] - 生成自行车车架及组件的爆炸视图技术蓝图,拥有已拆卸的齿轮和链条,以毫米为单位进行尺寸标注,经过ChatGPT逐项打分认定完成度很高[14][17] - 实现14只娃娃坐在一起看电视的图像融合,整体氛围感符合要求,细节如落地灯光影和玩偶在窗户里的背影都考虑到,但娃娃数量未完全达到14只[18][20][21] 用户应用案例 - 用户将谷歌博客照搬进杂志,配图排版均由模型自动搞定,将灵魂草图转化为撕漫感插画并能拿捏人物神态,根据人物参考图1分钟生成带故事情节的条漫[29][32][34] - 通过口头描述直接生成世界杯对决海报,轻松制作各种结构分解图,用于生成精美的手册和指南如奥地利州狩猎参考指南[37][39][42] - 模型对物理世界理解增强,生成的透明物体能够经受住光影考验,展现更强的现实语义理解能力[44] 市场反响 - 模型出世后短短几小时即掀起全网疯玩热潮,硅谷VC大佬Deedy率先分享实测案例引发广泛关注[1][10] - 网友脑洞大开利用模型进行各种奇思妙想的创作,谷歌CEO皮猜亲自贡献生成图像并为产品站台[28][46] - 普通用户可在Gemini应用中免费体验但有限额,Google AI Plus、Pro和Ultra订阅用户享有更高配额[13]
AI技术滥用调查:“擦边”内容成流量密码,平台能拦却不拦?
虎嗅· 2025-10-12 10:08
AI技术滥用现状 - AI技术被滥用于制作不雅视频、克隆照片和恶意造谣,受害者包括高校导师、白领和公众人物等[1][6][8][9] - 社交平台上明星"AI换装"和"AI擦边"内容泛滥,成为流量密码,部分账号专门发布此类内容吸粉变现[2][10][11][13] 平台治理措施 - 小红书2025年上半年共处置治理虚假低质AIGC笔记60万篇,平台正加大AIGC识别模型研发投入并实施主动标识[24] - 抖音表示根据社区自律公约对低俗媚俗内容采取限制措施,无论是否通过AI生成[25] - 平台通常会在AI生成图片上标注"疑似AI创作,请谨慎甄别"等提示语,但律师认为仅标注不能自动豁免法律责任[27][28] AI应用实测结果 - 测试的12款AI应用中,5款(即梦、豆包、可灵、腾讯元宝和阶跃AI)可实现明星"一键换装"[32] - 9款应用(即梦、豆包、堆友、无界AI、秒画、LiblibAI、可灵、星流AI、腾讯元宝)能生成衣着暴露的"擦边"图片[40] - 部分应用如LiblibAI生成的图片尺度较大甚至露点,该平台模型创作者已突破两千万,累计生成图片逾5亿张[43] 企业回应与整改 - 星流AI和LiblibAI母公司承认新模型上线初期识别精度波动导致风险内容遗漏,已完成紧急修复优化[46][47] - 豆包和即梦表示严格遵守法律法规禁止生成色情内容,承认AI技术处于发展早期将持续改进[51] - 无界AI月独立设备数为13.5万台,公司称已采取多项防范措施[51] 技术防范瓶颈 - 专家指出拦截违规内容在技术上无根本难度,但需要消耗算力成本,可通过构建名人识别模型充当防火墙[55][56] - AI公司可对用户提示词进行合规改写,并对生成图片实施实时风险检测,但模型本身的大尺度内容漏过问题仍需解决[50] 法律监管环境 - 我国已出台多项法规包括《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等对AI内容进行规范[57][58] - 现行法律对"擦边"内容存在界定标准模糊、审核义务边界不明确等问题,导致灰色地带较多[60] - 2023年三部门联合指导意见强调利用深度合成技术发布违法信息的情形将依法从重处罚[59]
登顶苹果应用榜!谷歌火遍全网的“纳米香蕉”,凭啥击败ChatGPT?
证券时报· 2025-09-16 07:51
谷歌Gemini应用市场表现 - 谷歌旗下AI应用Gemini在美区AppStore下载量超越ChatGPT,登顶免费榜第一名 [1][2] - 除美国外,Gemini在加拿大、印度、摩洛哥等国家同样实现下载榜登顶,打破ChatGPT长期垄断地位 [2] Nano Banana技术突破与用户增长 - 谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini 2.5 Flash Image,代号Nano Banana,在图像质量、编辑控制和应用场景上有大幅改进 [4] - Nano Banana功能上线后累计完成超2亿次图像编辑,并带动超1000万新用户尝试Gemini应用 [4] - 技术层面实现四大提升:自然语言驱动图像编辑、角色一致性与场景融合、多图融合与世界知识注入、降低3D建模门槛 [4][5] - 用户体验范式重构,实现从复杂工具栏到一句自然语言、从渲染缓慢到秒级出图、从效果不稳定到跨图一致性等突破 [9] 资本市场反应与行业影响 - 受益于反垄断裁决结果好于预期及Nano Banana市场表现,谷歌股价持续上涨,市值冲上3万亿美元 [1][9] - 花旗集团分析师将谷歌母公司Alphabet目标价从225美元上调至280美元,理由是Gemini在广告与云业务中采用加速,产品开发周期更快 [9] - Nano Banana火爆点燃图像生成视频赛道战火,国内厂商如字节跳动Seed团队推出豆包图像创作模型Seedream 4.0,生数科技推出Vidu Q1参考生图功能正面对标 [10] - 华泰证券认为原生多模态模型架构获业界认可,多模态为主的产品商业化快于文本产品,多模态大模型和应用发展奇点将至 [10] 多模态AI投资机会 - 多模态在算力和应用两方面带来投资机会:算力侧,原生多模态模型需要更多算力,视频推理算力需求远大于文字 [11] - 应用侧,国内视频生成模型领先,广告、零售、创作、教育等领域均有AI化需求 [11]
“AI生图”做题家大赛,谁赢了?
中国经营报· 2025-09-13 01:46
AI图像生成模型竞争格局 - 谷歌于8月末发布Gemini 2.5 Flash Image模型(代号“纳米香蕉”),推动了AI手办图等应用的流行[2] - 9月初,字节跳动Seedream 4.0和生数科技Vidu Q1模型相继面世,标志着行业竞争在不到半个月内急剧升温[5] - 知名评测机构Artificial Analysis于9月12日发布消息称,字节跳动Seedream 4.0在文生图和图像编辑排行榜上超越谷歌纳米香蕉,位列榜首[8] 主要模型性能对比 - 在AI手办生成测试中,谷歌纳米香蕉生成的小猫手办质感更贴近真实手办,光线明暗处理得当[11] - 字节跳动Seedream 4.0在测试中出现对提示词理解有误的情况,例如将手办盒子生成人形玩偶而非小猫[11] - 生数科技Vidu Q1在测试中基本未对小猫进行手办材质调整,毛发质感与原始照片一致,效果最不理想[11] - 在建筑线稿转效果图测试中,Seedream 4.0首次生成效果惊艳,而纳米香蕉需二次提示才能生成真实效果图片[14] - 在文生图测试中,Seedream 4.0生成的家庭场景人物表情皆大欢喜,而纳米香蕉则添加了更多菜式,场景更贴近真实家常午饭[18] - 在图像融合测试中,Vidu Q1对人物处理较好但未理解电动车构造,Seedream 4.0生成严谨,纳米香蕉则出现理解偏差[21] 行业技术发展现状 - AI图像生成模型在文生图、参考生图、图像编辑等方面的能力实现飞跃式提升[21] - 当前模型相比早期产品,在理解能力、出图速度、画面真实性和清晰度上均有显著突破[21] - 模型最终生成效果与提示词紧密相关,提示词描述简单可能导致AI理解出现误差[21] - AI生图能力考察涵盖一致性、真实性、清晰度、语义理解和美学等多个维度[21]
Qwen新开源,把AI生图里的文字SOTA拉爆了
量子位· 2025-08-05 01:40
通义千问开源图像生成模型Qwen-Image - 通义千问开源200亿参数图像生成基础模型Qwen-Image,采用MMDiT架构,是系列中首个图像生成基础模型[3][4] - 模型主打复杂文本渲染能力,能准确生成包含复杂图文混合布局的图像,文字准确度和契合度高[5][6] - 支持生成海报、PPT、商品宣传图等多种应用场景,文字渲染能力突出[8][16][22] Qwen-Image核心能力 - 具备复杂文本渲染能力,支持多行布局、段落级文本生成和细粒度细节呈现,中英文均能高保真输出[28] - 拥有一致性图像编辑能力,支持风格迁移、增删改、细节增强、文字编辑等多种操作[27] - 采用渐进式训练策略,从非文字到文字渲染逐步过渡,增强原生文字渲染能力[34] 性能表现 - 在多个公开基准测试中实现SOTA,包括通用图像生成的GenEval、DPG和OneIG-Bench等[29][30] - 在文本渲染基准LongText-Bench、ChineseWord和TextCraft上表现尤为出色,中文文本渲染大幅领先现有最先进模型[32][33] 实测效果 - 情境插画生成效果优秀,文字与画面融合度高,细节氛围感强[11][13][14] - 能准确理解提示词生成PPT和海报,主体文字和图中图符合要求[16][18][20] - 商品宣传图生成中能准确对应文字与画面元素[22][24]
“没有AI味”的Flux.1新模型,现可以免费试用
量子位· 2025-08-05 01:40
模型发布与核心特点 - 全新AI生图模型FLUX.1 Krea [dev]发布,主打"没有AI感"的自然细节和真实感,避免过曝高光和过度饱和纹理[1][3][5] - 该模型为Krea 1的开源权重版本,训练目标是生成更真实、更多样化的图像[5] - 官方称其在人类偏好评估中超越以往开源文生图模型,与FLUX1.1 [Pro]等闭源方案表现相当[71] 技术性能测试 光学真实性 - 模型能理解物理光学规律,如为不锈钢管主动添加锈点特质增强真实感[15] - 但对波浪等动态元素理解较浅显,存在重复失真现象[21] 纹理连续与语义理解 - 微观结构连续性表现良好,如针织面料纹理过渡自然[27] - 难以准确理解特定术语如"斜纹针",且对植物类型识别能力有限[28][32] 透视与动态模糊 - 能处理多物体交错场景的空间关系,实现浅景深效果[38] - 对运动物体的时间维度模拟不足,模糊方向不符合物理规律[43][44] 物理规则遵循 - 能优先遵循基本物理规律(如保持树影存在)[47] - 面对明显反常识场景(如空中游动的鱼)会放弃物理规则[49] 功能应用与局限 - 支持风格选择和图像调整功能,但人物特征识别能力较弱[61][64] - 架构与FLUX.1 [dev]生态系统兼容,可作为下游应用定制的基础模型[73] - 免费试用存在额度限制,默认输出4张图可能消耗较多额度[74] 行业活动 - 8月7日将举办AI沙龙,聚集百度文心快码、智谱、Kimi等厂商探讨AI Coding发展[76]
8点1氪|黄杨钿甜父亲被立案调查;活期存款已近0利率;小米YU7正式发布,标准版续航835公里
36氪· 2025-05-22 23:56
三一重工港股上市 - 三一重工向港交所提交上市申请书 中信证券为独家保荐人 [1] 银行利率调整 - 5月21日平安银行等7家股份制银行跟进下调存款利率 活期存款利率降至0.05% 较此前下调5个基点 [2] - 定期整存整取利率同步下调 三个月/半年/一年/二年期分别为0.7%/0.95%/1.15%/1.20% 三年期和五年期分别为1.30%和1.35% [2] - 9家股份行整存整取挂牌利率最高降幅达25个基点 个别银行定存产品降幅达40基点 [3] 小米汽车发布 - 小米YU7正式发布 搭载V6s Plus电机 最大马力690PS 零百加速3.23s 最高时速253km/h [3] - 提供三个版本 标准版续航835公里 雷军表示定价不可能19.9万 预计7月上市 [3][6] - 小米已申请注册多枚"XIAOMI YU7"商标 涉及运输工具等类别 [6] 汽车行业动态 - 奇瑞捷豹路虎否认停产传闻 2025财年全球营收290亿英镑 税前利润25亿英镑 [5] - 特斯拉CEO马斯克表示愿意授权FSD技术给其他车企 正与多家公司洽谈 [15] - 高合汽车成立新公司江苏高合 注册资本1.43亿美元 华人运通持股30.2% [11] 科技行业动态 - 华为鸿蒙折叠电脑预约量超10万 起售价23999元 [7] - 苹果将iPhone 7 Plus和部分iPhone 8列为过时产品 [16] - OpenAI计划推出1亿台AI伴侣设备 目标2026年底前发货 [17] - 京东工业发布行业首个供应链核心工业大模型Joy industrial [17] 上市公司财报 - 滔搏2024/25财年营收270.1亿元 净利润12.8亿元 门店数约5000家 [18] - BOSS直聘Q1营收19.23亿元 同比增长12.9% 付费企业客户640万 [19] - 联想集团2024/25财年营收4985亿元 同比增长21.5% 净利润104亿元 [21] 融资动态 - 泰国IMCOCO集团完成亿元级Pre-A轮融资 资金用于产能扩建 [23] - 影诺医疗完成数千万融资 资金用于产品注册及海外拓展 [24] - Airwallex完成3亿美元F轮融资 投后估值62亿美元 [25] - 中旷产业完成数千万元天使轮融资 资金用于园区开发 [26] - 利德健康完成近亿元天使轮融资 资金用于技术研发 [27] - 筋权堂生物科技完成500万元天使轮融资 资金用于服务优化 [28] 行业趋势 - 5G-A商用网络覆盖全国超300城 数据传输速度较5G提升10倍 [13] - 家电类商品零售额连续8个月保持两位数增长 4月同比增长38.8% [11] - 中央网信办督导抖音、小红书等平台优化算法推荐功能 [11] - 抖音升级侵权举报服务 支持阻断相同侵权内容传播 [12]
8点1氪:黄杨钿甜父亲被立案调查;活期存款已近0利率;小米YU7正式发布,标准版续航835公里
36氪· 2025-05-22 23:53
三一重工港股上市 - 三一重工向港交所提交上市申请书 中信证券为独家保荐人 [4] 银行利率调整 - 多家股份制银行跟进下调存款利率 活期利率降至0.05% 定期利率降幅5-25个基点 [5] - 部分银行个别期限定存产品利率降幅达40基点 [6] 小米YU7发布 - 小米YU7正式发布 标准版续航835公里 0-100km/h加速3.23秒 [6] - 雷军表示定价不可能19.9万 预计30多万 7月正式上市 [7] - 小米已申请多枚YU7相关商标 包括图形商标 [9] 奇瑞捷豹路虎生产情况 - 奇瑞捷豹路虎否认停产传闻 称在华生产一切正常 [9] - 捷豹路虎2025财年全球营收290亿英镑 税前利润25亿英镑 [9] 华为鸿蒙折叠电脑 - 鸿蒙折叠电脑官网预约量超10万 起售价23999元 [10] 宠物食品行业 - 皇家宠物食品启动兽医师心理健康公益行动 [10] 快手运营争议 - 快手否认强制员工每天刷1小时短视频传闻 [11] 李宁公司声明 - 李宁公司发布声明 将对恶意抹黑行为采取法律手段 [11] 中国联通人事变动 - 中国联通董事王俊治因年龄原因辞职 [12] 央行操作 - 央行5月23日将开展5000亿元1年期MLF操作 [13] 教育行业 - 教育部拟同意设置32所新大学 [14] 微信广告争议 - 微信否认朋友圈广告盗用好友身份进行评论 [14] 蜜雪集团市值 - 蜜雪集团市值突破2000亿港元 达2033亿港元 [14] 高合汽车新公司 - 江苏高合汽车有限公司成立 注册资本1.43亿美元 [15] 家电零售数据 - 家电类商品零售额连续8个月保持两位数增长 4月同比增长38.8% [16] 算法推荐治理 - 中央网信办督导抖音、小红书等平台优化调整算法推荐 [16] 抖音侵权处理 - 抖音升级侵权举报服务 支持阻断相同侵权内容传播 [17] 5G-A商用进展 - 5G-A商用网络覆盖全国超300城 数据传输速度较5G提升10倍 [18] - 万得5G概念指数和6G概念指数分别累计上涨17.14%和20.61% [18] 美股市场 - 美股三大指数涨跌不一 纳指涨0.28% 标普500跌0.04% [18] - 热门中概股多数下跌 小鹏汽车跌超7% [18] 加密货币交易所 - Kraken计划允许非美国客户通过数字代币交易苹果、特斯拉等热门股票 [19] 特斯拉技术授权 - 马斯克表示愿意将FSD技术授权给其他车企 正与几家公司洽谈 [19] 三星生物制剂业务调整 - 三星生物制剂拟分拆公司 剥离生物仿制药业务 [20] 雀巢战略调整 - 雀巢CEO表示将重新聚焦核心业务 [21] OpenAI设备计划 - OpenAI计划推出1亿台AI"伴侣"设备 目标2026年底前发货 [22] 京东工业大模型 - 京东工业发布行业首个以供应链为核心的工业大模型Joy industrial [22] 公司财报 - 滔搏2024/25财年营收270.1亿元 净利润12.8亿元 门店数约5000家 [23] - BOSS直聘Q1营收19.23亿元 同比增长12.9% 净利润5.12亿元 [24] - 联想集团2024/25财年营收4985亿元 同比增长21.5% 净利润104亿元 [25] 小米新品发布 - 小米15S Pro发布 售价5499元起 搭载3nm旗舰处理器 [26] - 小米平板7 Ultra发布 售价5699元起 同样搭载3nm旗舰处理器 [26] 融资动态 - IMCOCO集团完成亿元级Pre-A轮融资 将用于泰国工厂扩建等 [27] - 影诺医疗新一轮数千万融资领投方已过投决 将用于产品报证等 [28] - Airwallex完成3亿美元F轮融资 投后估值62亿美元 [29] - 中旷产业完成数千万元天使轮融资 将用于产业园区开发等 [30] - 利德健康完成近亿元天使轮融资 将用于技术研发等 [32] - 杭州筋权堂生物科技完成500万元天使轮融资 将用于服务优化等 [33] AI生图领域 - OpenAI、谷歌在AI生图领域连放大招 AI生图玩法全面升级 [35] - 活动将拆解最新工具、示范实战技巧 帮助职场人开辟第二收入曲线 [35]