歸藏的AI工具箱

搜索文档
Figma MCP + GPT-Codex:新的 Vibe Coding 之王
歸藏的AI工具箱· 2025-09-25 10:25
昨天刷到了新的 Figma 远程 MCP 服务,进行了一大堆升级,然后又看到 GPT-5 Codex 有 API 了。 GPT-5 Codex 的话因为有了 API 所以常见的 AI IDE 比如 Cursor 等都加上了,选择后直接用就 行。 Figam MCP 这次升级最大的一个更新就是不再需要原来复杂的添加流程和本地 Figma 客户端了。 你不需要管之前咋装,我们直接看现在就行,这里我先按 Cursor 的操作路径介绍一下。 首先我们需要找到 Cursor 的设置,在设置里面找到 MCP 这个 TAB,然后点击"New MCP Serve r"将下面的 Json 代码复制进去保存就行不需要做任何改动。 { "mcpServers": { "figmaRemoteMcp": { "url": "https://mcp.figma.com/mcp" } } } 然后回到设置页面你就会看到多了一个 Figam 的 MCP,右边还有个"Connect"按钮,我们点击, 系统会询问是不是要打开外部网站,你选择打开就行。 于是就都研究了一下,没想到这么顶啊,这个美学表现直接拉满了,下面这是直接给 GPT-5 Co ...
可灵2.5Turbo实测|顶尖AI视频模型,真能打平CG吗?
歸藏的AI工具箱· 2025-09-23 10:37
可灵正式发布了他们的 2.5 Turbo ( app.klingai.com )版本视频模型,作为超创提前试了一下, 这次的进步真的很大。 先来看个藏师傅测试视频混剪的样片: 提示词理解强了非常多,尤其是涉及到开始之后包含复杂因果和时间关系的提示词。 同时生成视频的风格稳定性更强,图生视频的时候风格保持相当稳定。 最重要的是这次可灵 2.5 Turbo 的价格非常划算,高品质模式下 5 秒视频 从 2.1 模型的 35 积分 降到了 25 积分 。 这次我们先看几个基础的测试,刚好前几天看到新一届的世界渲染大赛结束了,后面就顺手试了一 下 AI 离顶级 CG 渲染作品还差多远。 基础测试 主体角色会继续完成他向前的高速冲刺动作,整个身体带着强烈的动态模糊向前穿行。在他冲 刺的同时,镜头会向后并向右侧拉远,始终将角色的上半身保持在画面中心。在第2秒左右,角 色伸出的左手会猛烈击中一个刚刚进入画框右侧的敌人,撞击瞬间产生清晰的能量迸发或碎片 飞溅效果。画面左侧那只离镜头最近的龙形怪物会紧随其后,向着角色移动的轨迹进行凶猛的 扑咬,但差之毫厘地咬空,增加了紧张感。随着镜头持续拉远,到结束时,镜头会从特写过渡 到一个 ...
Notion 3.0 |AI转型最成功的互联网产品是怎么做的?
歸藏的AI工具箱· 2025-09-19 13:26
同时核心是你可以添加任意的上下文,上传文件也行,选择你的 Notion 指定数据库也可以,还能 添加多个 Notion 数据库。 Notion 应该是传统互联网工具产品 AI 转型最成功的一个。 昨晚,他们更新了 Notion 3.0,现在的 Notion 可以看作一个你有所有上下文的通用 Agent 产品, 而且你可以在这里用所有顶尖模型完成任务。 我早上研究了一下,发现这玩意会相当强大,所以顺便写一篇内容介绍一下现在的 Notion AI 能 力。 首先是基础的 AI 能力,你可以在Notion左侧的 Notion AI 看到一个跟其他 AI 产品差不多的页面。 支持选择所有现在的顶尖模型,比如 GPT-5 或者 Claude 4.1。 如果你觉得上面给 AI 的上下文还不够的话你还可以选择通过 Notion 链接很多其他软件获取上下 文,比如海外常用的 Gmail、开发协作的 Github 和 Linear 等。 而且现在的 Notion AI 不知可以回答问题和写作也可以帮你生成和修改你需要的数据库表格格式, 比如我这里查询了一下未打款内容,他在查完之后还问我要不要帮我创建一个逾期的视图。 比如我这里 ...
藏师傅教你用 Lovart x Seedream4.0 搞定终极自媒体神器
歸藏的AI工具箱· 2025-09-13 03:54
Lovart平台功能特点 - Lovart平台与Seedream 4.0模型结合,可将长文和文档一键转换为适合小红书等社交媒体平台的套图,支持通过文字精准控制内容生成[3] - 平台支持生成风格统一的3:4比例信息卡片,第一张卡片包含醒目标题和主题简介,后续卡片分章节展示内容,适用于学术论文、古文等多种题材[9][27][33] - 生成内容支持中英文双语输出,英文小字生成清晰度高,适合出海媒体使用[9][10] - 通过Magic Canvas功能可实现精准修改,用户可在图片上添加评论指定修改需求,如图标添加、文字调整或错误修正[16][18][19][24] 模型与活动推广 - Seedream 4.0模型在9月10日至9月20日期间免费开放使用,不扣除积分[4] - 9月20日前开通基础会员可全年不限量使用Seedream 4.0及Nano Banana模型[4] - Veo3模型全系三折优惠,Pro+会员可免费使用可灵和hailuo模型至9月20日[4] 多场景应用案例 - 学术内容转换:生成扁平化现代风格信息图,适用于论文解读,卡片包含标题、副标题及详细文字解释[9][10][14] - 古文教育应用:生成中国风水墨风格卡片,配合竖排宋体文字展示古文内容,如《爱莲说》三等分画面设计[24][27] - 人物传记生成:基于联网搜索能力自动整理信息,如生成12张苏轼生平卡片,按时间顺序展示关键节点[29][32][33] - 科普内容创新:将科学家事迹转化为仙侠小说风格,包含仙号、定场诗及科研场景仙侠化设计,如奥本海默"仙号"及爱因斯坦人像ID一致性[34][35][36] 内容生产优化 - 长文档处理建议先通过LLM总结以优化结构清晰度[9] - 支持TTS口播稿生成,结合视频模型可低成本产出完整视频内容[36][38] - 提示词可灵活调整主题、风格、文案等要素,实现多玩法混搭[38]
顶级邪修|万字教程|教你速通豆包・图像创作模型 Seedream 4.0
歸藏的AI工具箱· 2025-09-09 07:47
产品发布与市场定位 - 火山引擎上线豆包・图像创作模型Seedream 4.0 支持图片生成、连续图片编辑、多图参考的全能图像创作功能 [2] - 模型具备优秀的美学表现、世界知识、提示词遵循、一致性保持、精准编辑能力及完美中文支持 可自定义生成比例并直出4K图片 被定位为当前中文用户T0级别图像创作模型 [2] - 企业客户可通过火山引擎MaaS平台火山方舟接入Seedream 4.0 该渠道为唯一支持4K直出的版本 个人用户可通过豆包、即梦APP体验 4K版本于当晚20:00开放 [3] 核心功能与应用场景 - 模型支持精细化AI修图 可响应光影、滤镜、装造、发型等组合提示词 例如分割光、环形光、伦勃朗光等复杂打光方式 [5][9][12][18] - 支持连续图像生成与视频分镜创作 在生成6张图后仍能保持人脸ID一致性 结合Seedance首尾帧视频模型可生成转场效果 [22][23][25][26] - 具备PPT内容转视觉图像能力 通过多模态模型生成提示词 输出符合思维模型(如金字塔、垂直面板、协同环形等)的磨砂玻璃或高质感金属材质设计 [29][32][34][35][36] - 支持个性化定制功能 包括玻璃质感头像图标生成、宠物幻化山海经神兽护身符、玄学鼠标垫设计、创意头像制作及无痛Cosplay [46][51][55][58][63][67] - 可基于图像内容自动生成手帐风格日记 结合日期、天气及自拍图像生成拼贴画风格记录 [73][74] - 支持UI设计稿及海报修改 可根据配色参考图或主题指令(如星巴克主题)自动调整设计元素 [78][79][82][83] 内容创作与商业化应用 - 提供多风格知识卡片生成模板 涵盖仙侠古籍、现代信息图、游戏装备、塔罗牌、技术蓝图、博物学家手册及教科书插图等风格 适配不同受众及概念解释需求 [86][89][90][94][96][97][100][102] - 模型支持将任意生活碎片(如草图、声音、视频截帧)转化为可交付产品 通过简短提示词实现质感转换 降低内容创作门槛 [107][108][109][110] - 已有用户基于模型功能实现商业化 包括接单定制头像、制作视频分镜及开发自动化工作流 [3][27][61]
量大管饱!让藏师傅疯狂涨粉的 Nano Banana 玩法合集 02
歸藏的AI工具箱· 2025-09-05 09:12
核心观点 - Nano Banana作为多模态AI模型在图像生成、视频制作和3D建模等多个创意领域展现出强大能力 其应用范围从艺术创作扩展到实用工具开发 显示出在内容生成市场的巨大潜力[1][3][73] AI艺术创作应用 - 利用书法字帖和人物姿势生成具有中国风意境的AI舞蹈视频 通过特定提示词控制人物风格和光影效果[4] - 使用即梦图片3.1模型生成基础图像 提示词包含CG厚涂风格、精致五官、瓷白肌肤等详细视觉要求[4] - 通过可灵2.1首尾帧生成视频 配合专业转场提示词实现平滑过渡 支持A类关联性强的原地演变和B类差异巨大的运镜驱动转场策略[12][14][15] 3D建模与可视化 - 将建筑平面图转换为等距摄影级3D渲染图 使用Hyper3d工具生成GLB格式3D文件[17][24][26] - 基于3D俯视图生成指定视角的室内渲染图 如从餐桌看向卫生间的视角 并支持家具样式替换[19][20][22] - 通过Cursor和GPT-5开发前端网页 实现3D模型交互展示 点击特定位置可显示对应渲染图[28] 营销与内容创作 - 创建夸张广角镜头效果的视频封面 通过前景物品放大技术提升点击率 比平时封面效果更好[33][35] - 利用视觉推理能力实现照片位置反推和地标图像生成 基于地图标记生成对应实景照片[37][38][39] 产品设计与转换 - 车辆改装功能可指指定涂装参考图更改车辆配色、轮毂设计和拉花装饰 并生成多阶段改动图片[41] - 将饮品图像转换为柔软充气玩具设计 采用哑光织物纹理和细微缝线强调充气效果[51][52] - 建筑转换为等距3D图标风格 支持任意建筑照片转换而非仅限于地标建筑[49] 教育内容生成 - 生成多张涂鸦风格图像解释"期货"概念 采用统一的手绘风格和英文文本 适合制作知识卡片[54] - 开发专用网页工具支持3:4比例图片导出 可直接用于小红书内容发布[56] 实体产品可视化 - 将汽车渲染图转换为收藏级手办模型 包含印刷包装盒和3D打印机场景[58][59][60] - 动漫角色转真人cosplay并手持手办 保持发型、配饰和服装的高度还原[62][63] 时间序列预测 - 预测建筑100年后荒废状态的形象生成 视频形式展现更具表现力[65][66][68] 多图像融合技术 - 混合无关图像生成连贯故事分镜 保持美学表现和人物一致性 across 9张连续画面[69][71] - 支持即梦智能多帧视频生成 实现多场景串联和角色整合[73]
Nano Banana 邪修之王最强科研成果!教你自定义生图比例!
歸藏的AI工具箱· 2025-09-02 04:59
核心观点 - 通过特定提示词和垫图方法可有效控制Nano Banana生成图像的比例 解决原模型输出比例不可控的生产应用难题 [2][4][12] 技术原理 - 多图输入时输出比例会随机匹配其中一张图的特性 通过垫图方式实现比例控制 [4] - 需准备两张图片:待修改原图(首位)和比例模板图(次位) 顺序不可颠倒 [6][8][16] - 使用GLif启发的方法但扩展至图生图场景 支持对已生成图片进行二次比例调整 [4] 操作流程 - 提示词需明确指令:"Redraw the content of Figure 1 onto Figure 2, add content to Figure 1 to fit the aspect ratio of Figure 2, completely clear the content of Figure 2, and only retain the aspect ratio of Figure 2" [13][15] - 在AI Studio或Gemini APP(推荐Gemini2.5 Pro模型)中操作 后者效果更优 [15] - 若出现蓝色背景异常 通过多次抽卡可解决 [15] 资源支持 - 提供覆盖常见比例的模板图集 支持自定义比例(需通过Figma制作) [8] - 模板图集可通过网盘下载(链接:https://pan.quark.cn/s/163037f38e88 提取码:7tJV) [18]
把 Nano Banana 塞进 Lovart 能有多离谱?藏师傅周末带你免费玩
歸藏的AI工具箱· 2025-08-29 14:24
Lovart平台与Nano Banana模型集成功能 - Lovart平台在Nano Banana模型上线后迅速完成适配并推出周末免费活动 用户可免费使用该模型而不消耗积分 [1] - 平台提供模型选择功能 用户需单独勾选Nano Banana以避免调用其他付费模型 [2] Nano Banana模型的核心技术能力 - 支持通过涂鸦替代提示词的方式实现图片精确修改 与Lovart的Magic Canvas功能高度契合 [2] - 具备强大的世界知识 可识别地图和地标建筑 例如能根据谷歌地图上的箭头标记生成祈年殿图像 [3][4][6] - 支持多物品替换与生成的一致性保持 例如将7件家具按示意图精确摆放到房间指定位置并保持细节一致 [8][10] - 默认输出分辨率较低 但可通过Lovart的Upscale功能直接放大图像 [6] 多模型联动应用案例 - 汽车改造案例:从白模汽车开始 通过分步提示实现配色更改、轮毂改造、拉花添加及场景转换 生成5张高细节图像 再通过可灵2.1首尾帧模型生成连贯视频并添加配乐 [13][15][16][17] - 食谱生成案例:将冰箱食材图片输入后 自动生成包含食材标签、准备步骤图标和成品展示的极简风格食谱信息图 进一步生成餐桌展示图和完整烹饪教程视频 [19][22][23][26][28][30] 创作效率提升与行业影响 - 大幅降低设计门槛 用户无需专业设计软件即可通过涂鸦和文字输入实现复杂创意表达 [8][10] - 自动化流程实现多模态内容生成(图像、视频、音频)的端到端整合 极大提升内容创作效率 [15][28][30] - 技术应用场景扩展到家居设计、视频制作、美食教程等多个垂直领域 [10][19][30]
顶级邪修倾囊相授!藏师傅教你速通Nano Banana
歸藏的AI工具箱· 2025-08-27 07:26
产品功能与性能 - 图像编辑模型Nano Banana(官方名Gemini 2.5 Flash Image Preview)具备强大修图能力 可处理祛痘、瘦身、瘦脸、肤质修复等需求[4][15][19] - 人脸ID一致性大幅增强 小幅修改时相似度显著高于FLUX Kontext模型[19] - 支持多图片上传及连续编辑 但连续编辑4-5次后可能因上下文超限导致效果下降[7][9] - 支持通过文本提示词、标记、框选、涂鸦等多模态方式精准控制图像修改[28][31][34] 应用场景与案例 - 电商领域表现突出 可精准修改商品佩戴效果且保持细节还原 如首饰佩戴测试中商品比例问题较FLUX Kontext大幅改善[31][46] - 支持穿搭展示与移植 可生成平铺展示图或将博主穿搭还原到用户照片[22][25] - 具备古早动漫与照片修复超分能力 例如成功修复《攻壳机动队》动画截图[48] - 可生成AR介绍特效 利用内置世界知识为地标建筑(如泰姬陵、悉尼歌剧院)添加信息卡片[43][44] - 支持生成白色轮廓贴纸 用户可基于PNG文件找电商店铺打印实体贴纸[40][41] 技术实现与生态 - 通过姿势涂鸦控制可生成角色互动图像 对动画制作和精准动作控制有显著帮助[34][35] - 结合视频模型(如可灵2.1)可处理首尾帧生成视频特效 并添加讲解语音[39][45] - 除谷歌AI Studio和Gemini APP外 已通过API服务商(如FAL、Krea)上线 但需注意无独立官网[11][14] 行业影响与定位 - 被描述为"烂片拯救者" 可将普通照片修成大片级效果[5][15] - 直接冲击Adobe等传统修图软件市场 复杂修图操作可一句话完成[2] - 适用于视觉表达相关行业 包括电商图片、本地生活、教育、婚庆、影视、印刷、旅游等领域[50]
藏师傅教你用 Nano Banana 编辑图片做手办
歸藏的AI工具箱· 2025-08-23 09:24
文章核心观点 - 介绍使用Nano Banana模型在LM Arena平台进行图像编辑和手办图制作的具体方法 重点包括上传图片 输入提示词 选择最佳结果以及利用可灵2 1首尾帧模型增强视觉效果 [1][2][3][10] 操作流程 - 访问LM Arena平台并选择Image模式以触发图像模型功能 [3] - 上传需要修改的图片并输入提示词 提示词需包含具体场景描述如角色骑亚洲虎 PlayStation游戏盒 电脑显示游戏界面等元素 [3][4] - 平台每次生成两张不同模型的图片 用户需在输入框上方选择最佳结果并确认模型名称 若未出现Nano Banana模型需重复生成流程 [7] 效果增强 - 利用可灵2 1首尾帧模型将静态图片转换为视频 通过提示词实现手办从实体到CG画面的动态转化过程 包括反重力漂浮 材质变化及环境转换等特效 [10] - 通过添加原始CG画面和音乐进行剪辑 进一步提升视觉表现力和整体观感 [12][13]