Workflow
AI绘图
icon
搜索文档
“黑飞”无人机蹿上8000米,天空不容法外狂飙
新京报· 2025-12-11 07:29
事件概述 - 有博主曝光在广东英德、中山和湖南资兴发生多起无人机“黑飞”事件 飞行高度达8000米甚至近万米 非常逼近民航客机航线[2] - 涉事“黑飞”人员为逃避监管 使用P图技术伪造无人机飞行高度的解禁许可证明[2] - 香港知名演员李子雄公开斥责该行为挑战航空安全 广东英德市和中山市警方已跟进调查[2] 行业监管现状 - 近年来通过对无人机等设备的精准管控 相关违法风险已得到有效遏制[2] - 2023年《无人驾驶航空器飞行管理暂行条例》出台 为无人机飞行划定了清晰的“红线” 进一步强化了全链条治理举措[2] - 该条例明确规定 真高120米以上空域即为管制空域[3] - 针对无人机“黑飞”的强化治理已成为舆论共识 相关治理体系在实践中不断健全[2] 暴露的问题与风险 - 此次事件表明无人机违法飞行问题依旧存在 且在绕过审核等层面呈现出更加隐蔽的特征[2] - 飞行高度达8000米的无人机给民航飞行安全“埋雷” 一旦影响客机后果不堪设想[3] - 伪造许可证的行为不仅暴露出涉事人员罔顾公共安全的侥幸心理 也反映出当前相关审核机制与流程可能存在短板与漏洞[3] - 在AI绘图与图像合成技术门槛降低、生成内容逼真度提升的背景下 仅靠肉眼简单识别已难以分辨证照真伪 对审核机制提出了新挑战[3] 未来治理方向 - 有必要进一步完善审核机制 为已发现的漏洞打上“补丁”[3] - 针对审核漏洞的“补丁”需具备前瞻性 有必要重新梳理相应的审核环节[3] - 在审核过程中 应考虑如何与AI生成内容在底层认证、识别逻辑上进行联动[3] - 公众期待当地相关部门及时查清事件原委并给出明确说法 以杜绝安全隐患并回应公众关切[4]
FLUX.2开源了,但是我好像也看到了小公司的无力。
数字生命卡兹克· 2025-11-26 01:20
公司产品发布 - FLUX公司发布了4款基础模型和1个VAE模型,其中Pro和Flex两款最强大的模型为闭源,另有一款蒸馏模型klein即将开源 [8][9][11] - 开源模型链接已发布在Hugging Face上,用户可通过其官网或liblibai平台使用该模型 [11][12][13] 产品性能对比:图像生成 - 在相同提示词下,FLUX.2生成的图像效果与Nano Banana Pro存在显著差距,例如在“人类考古学家发现旋转金属球”和“日常松弛感亚洲美女”等场景中,后者在真实感和细节上表现更优 [15][16][17][18][20] - 在生成具有特定风格要求的图像时,如“《龙珠Z》神龙”的彩色铅笔风格和“《天书奇谭》”中国山水画风格海报,FLUX.2的表现亦不如对手 [22][24] 产品性能对比:指令理解与编辑 - 在“用嘴改图”功能上,FLUX.2表现不佳,例如在要求“让左边人物cosplay右边角色”的指令下,其生成结果与预期偏差巨大 [28][29][31][32][34] - 在将动漫人物“变成真人照片”的指令中,FLUX.2的生成效果同样不理想 [37][38] 核心竞争差距:世界知识 - 产品性能的根本差距源于底层模型的世界知识差异,Nano Banana Pro背后是Gemini 3 Pro多模态大模型,而FLUX.2使用的是Mistral-3 24B模型 [41][42][44] - 在需要深度领域知识的任务中,如生成“海贼王战力排名信息图”,Nano Banana Pro能准确理解并呈现内容,而FLUX.2则显示出对内容的不理解 [48][49][51][52] - 在处理包含多个跨动漫、文化角色的复杂提示词时,Nano Banana Pro能几乎全对地生成集体大合照,而FLUX.2则生成乱码,显示出其在世界知识上的严重短板 [54][55][57][60][61] 行业趋势分析 - 当前AI绘图领域的竞争已从单纯的图像生成质量转向对世界模型的认知能力,这需要模型具备从海量多模态数据中学习的世界知识 [75][76][77][78][79] - 大厂凭借其在数据、算力和人才密度上的绝对资源优势,正对中小型模型公司形成“降维打击”,行业壁垒日益增高 [64][65][80][81][90] - 尽管FLUX.2等开源模型为中小企业和开发者提供了宝贵的火种和基石,具有重要价值,但其技术理想主义在绝对的资源壁垒面前显得脆弱 [82][83][84][85][86][91]
今天,好像见证了属于SD时代的消亡
虎嗅· 2025-10-13 02:37
公司战略转型 - Liblib宣布升级至2.0版本,推出新品牌、新标识、新界面和新功能 [2] - 公司转型为集成多种AI模型的一站式创作平台,集成AI绘图模型如Seedream、Midjourney、Qwen以及AI视频模型 [61][62][64] - 平台新增特效模板功能,支持一键复刻效果,类似于海外Higgsfield的模式 [66] - 此次战略转型旨在降低用户门槛,拥抱更广泛的用户群体,预计升级后用户规模可能扩大10倍,并提升公司收入和用户留存 [68][69] 行业生态演变 - Stable Diffusion开源生态在2023年初达到鼎盛,极大地推动了AI绘图技术的普及 [10][12] - 当时的技术生态具有高度自由度和创造性,但也伴随着较高的使用门槛,如复杂的参数设置和节点连接 [23][51] - 行业趋势向低门槛、易用性发展,GPT-4o、NanoBanana、Seedream等“用嘴改图”的模型更受大众市场欢迎 [53][54] - 技术迭代速度极快,两年多时间行业发生巨大变化,旧技术被新技术取代是必然趋势 [55][56][71] 历史地位与影响 - Liblib曾是中国最著名的模型开源社区和最大的Stable Diffusion生态社区 [4][31] - 在SD生态发展过程中,涌现出众多有影响力的开发者,如Dynamic Wang、Nenly同学等 [33] - 关键技术创新如ControlNet插件使AI绘画从随机生成变为可控的创作工具,EbSynth、AnimateDiff和Deforum则推动了早期AI视频技术的发展 [34][36][38] - 尽管SD时代已过去,但社区进化为新形态,优秀创作者的品味和创造力将继续驱动行业发展 [73][75][77]
Nano Banana一战封神,我总结了10种官方不会告诉你的神级技巧。
数字生命卡兹克· 2025-08-30 04:01
核心观点 - Nano Banana在AI图片编辑领域实现多项突破性应用 包括手办制作、角色扮演、动作替换等 展现卓越的图像一致性和多模态生成能力[2][3][69] - 该工具已通过Google AI Studio和Gemini平台实现便捷访问 技术整合能力显著提升[61] - 在电商、游戏、设计等领域展现商业化潜力 但文字生成(特别是中文)和多人场景处理仍存在技术短板[37][65] 功能应用 - 制作高度写实的1/7比例手办模型 能还原细节如猫脚污渍 支持ZBrush建模过程可视化[5][6][10] - 实现跨角色cosplay生成 能保持原角色服饰、妆容和道具特征的一致性[13][15] - 支持基于火柴人草图的动作迁移 并自动添加动漫特效线条增强表现力[16][19][22] - 生成8K分辨率产品爆炸视图 展现金属零件与电子元件的内部结构[23] - 提供线稿上色功能 能根据指定色卡进行色彩迁移 需5-6次抽卡达到理想效果[27][29][31] - 生成具备RPG游戏UI元素的场景 包含角色肖像、血条/法力值和迷你地图等界面组件[34][35] - 创建九格漫画分镜和视觉小说界面 支持英文对话文本框及选项菜单设计[38][39][41] - 实现专业级光影控制 支持晚霞天空替换与飞鸟合成 提升氛围感[43][45][47] - 生成商品宣传素材 包括LV老花图案植入和口红广告海报制作[48][50][52] 技术特性 - 具备视觉推理能力 可解析题目内容并生成AR标注信息[53][56][59] - 图像一致性表现突出 支持多轮迭代优化[65][69] - 支持与视频生成工具(如可灵)无缝衔接 实现静帧到视频的转化[26] 平台接入 - 正式接入Google生态体系 可通过AI Studio(https://aistudio.google.com/prompts/new_chat)和Gemini(https://gemini.google.com/)直接访问[61] - 获得第三方设计平台Lovart集成 推出Agent+banana限免服务(https://www.lovart.ai/)[63] 技术局限 - 文字生成能力较弱 特别是中文文本输出存在明显缺陷[37][65] - 多主体场景处理能力不足 无法实现多人合照编辑[65] - 输出画质存在压缩 需依赖第三方工具(如腾讯ARC)进行高清修复[67] - 缺少一键重生成功能 每次抽卡需重新上传素材[67]
人物一致性新王Nano Banana登基,AI图片编辑史诗级升级。
数字生命卡兹克· 2025-08-19 01:05
AI绘图模型Nano Banana评测 核心观点 - Nano Banana在人物一致性、背景替换、细节修改等方面表现远超其他AI绘图模型,成为当前一致性最强的AI生图工具 [1][6][82] - 该模型疑似由Google DeepMind开发,目前仅在LMArena平台通过随机盲测形式出现,尚未正式发布 [25][11][13] 模型性能对比 - **人物一致性**:Nano Banana能完美保留面部特征、表情细节和服饰元素,其他模型如GPT-4o存在泛黄滤镜、Flux Kontext擅自修改表情、即梦错误改变人脸结构 [6][37][55] - **多主体处理**:在将《罗马假日》主角替换为川普和马斯克的测试中,Nano Banana准确还原人物特征,Flux生成双胞胎,GPT-4o面部失真,即梦遗漏主体 [43][47] - **背景替换**:Nano Banana生成的末日废墟场景具有真实光影和丰富细节,Flux/GPT-4o背景糊化,即梦添加无关程序猿元素 [49][51] - **风格转换**:在赛博朋克、梵高风格、水墨画转换测试中,Nano Banana保持最高完成度和人物一致性 [72][75][77] 技术应用场景 - 视频封面制作:通过单张照片+提示词即可生成多动作版本,成功率显著高于需反复抽卡的其他模型 [80][7] - 手办设计:实现2D转3D、添加特效背景等操作,被用户用于制作梦幻联动内容 [15][18][20] 行业动态 - 当前AI绘图领域主要竞争者包括GPT-4o、Flux Kontext、即梦等,但Nano Banana的出现可能重塑竞争格局 [12][79] - Google通过匿名测试新模型的方式收集用户反馈,显示其技术储备领先行业 [10][25] 使用方式 - 需通过LMArena平台的battle模式随机触发,输入prompt和参考图后由系统盲选模型生成,用户无法主动选择Nano Banana [26][28][33]
国家网络安全通报中心:ComfyUI存在多个高危漏洞
快讯· 2025-05-27 02:37
ComfyUI安全漏洞事件 产品定位与技术特点 - ComfyUI是一款专注于图像生成的AI绘图工具 通过图形化节点设计简化深度学习模型工作流程 提升用户操作直观性 [1] 安全漏洞详情 - 系统存在5个历史高危漏洞(CVE-2024-10099至CVE-2024-21577) 涉及任意文件读取和远程代码执行风险 [1] - 攻击者可利用漏洞获取服务器权限 导致系统数据被窃取 [1] 攻击事件动态 - 境外黑客组织已利用该漏洞对中国网络资产实施攻击 目标为窃取重要敏感数据 [1] - 北京市网络与信息安全信息通报中心确认漏洞威胁并发布预警 [1]