ChatCanvas

搜索文档
Lovart 正式版全球上线:Beta 测试近百万用户,执行力足够快就可以被看见
Founder Park· 2025-07-28 15:33
产品发布与市场表现 - Lovart于7月23日结束内测并全球上线正式版本,此前通过邀请制吸引全球70多个国家近百万用户,Beta版上线5天内超10万人排队申请[1] - 产品被The Information、Forbes等媒体报道,获马斯克点赞,OpenAI创业支持负责人Chris Brown出席发布会站台[1][25] - 被列为全球五家值得关注的华人Agent创业公司之一,直接对标Adobe(80%市占)和Canva(12.5%市占) [25] 核心功能ChatCanvas - 新增功能允许用户通过自然语言批注(如"字小一点")指挥AI修改图片,单次最多提交20条修改意见[7][8] - 支持多图元素融合生成新素材(如组合logo/主体/背景/字体)[14],可将静态图转为动态视频(如光线闪烁/人物跳舞)[16][17] - 采用Frame组织架构保持作品独立性,AI会记忆用户操作习惯形成个性化设计伙伴[9][18] 产品设计理念 - 首创"以Agent体验(AX)"替代传统"用户体验(UX)"范式,从单次任务转向持续关系构建[20][21] - 核心差异体现在:系统自主规划路径(非预设流程)、持续学习用户偏好(非重复输入)、信任度积累带来操作简化[24] - 创始人提出设计类Agent需还原"画布即桌子"的自然交互,批注修改是最符合直觉的协作方式[20] 技术迭代与运营进展 - 2个月内密集上线6项模型/功能:包括Style Library、Flux Kontext、Veo 3视频模型等,最新接入混元3D生成模型[26][27] - Discord社区超25000人,推出积分会员付费和创作者计划,与Tripo/freepik等平台开展合作[27] - 团队强调"速度壁垒",在模型快速迭代期需保持高频产品更新能力[28]
腾讯研究院AI速递 20250728
腾讯研究院· 2025-07-27 10:15
GPT-5实锤,悄悄上线代号「龙虾」!多版本号曝光 - GPT-5以代号"Lobster"悄然上线WebDev Arena测试平台,用户实测显示其表现远超Grok-4 [1] - GPT-5在编程能力上有巨大突破,能处理复杂屎山代码,甚至超越Claude Sonnet 4 [1] - GPT-5可能采用路由器机制而非单一模型,根据问题类型智能分配至不同模型处理,OpenAI高管称有信心继续做到GPT-8 [1] 阶跃星辰上线新一代基础大模型:Step 3,推理提升 - 阶跃星辰发布新一代Step 3基础大模型,定位为原生多模态推理模型,在MMMU等多个榜单取得开源SOTA成绩 [2] - Step 3采用MoE架构,总参数量321B,激活参数量38B,通过系统架构创新实现高推理效率,在国产芯片上效率可达DeepSeek-R1的300% [2] - 阶跃星辰联合近10家芯片厂商成立"模芯生态创新联盟",Step 3将于7月31日全球开源,并与上海国有资本投资有限公司达成深度战略合作 [2] 混元3D世界模型首发,腾讯AI应用全景图正式公开 - 腾讯在WAIC 2025发布AI产品应用全景图,提出"让模型有力、平台省力、应用给力、落地得力"的四大发展维度 [3] - 开源业界首个3D世界生成模型"混元3D世界模型1.0",支持通过文本或图像快速生成可交互的三维场景,兼容主流引擎和VR设备 [3] - 发布国内首个模块化具身智能开放平台"Tairos",为机器人提供感知世界、规划任务和自主决策的能力,已适配多种机器人类型并应用于多个行业场景 [3] 阿里巴巴正式预告首款自研 AI 眼镜,最快年内发布 - 阿里巴巴在WAIC 2025首次展示自研"夸克AI眼镜",产品已完成开发,计划年内正式发布 [4] - 该AI眼镜深度融合阿里生态,搭载通义千问大模型和夸克AI,支持高德导航、淘宝比价、支付宝支付等实用功能 [5] - 产品定位为"人类第二双眼与耳"和"感官中枢",团队从佩戴舒适度、续航和交互体验进行了系统优化,并与全球主流眼镜品牌合作 [5] Lovart开放邀请码,正式版推出「ChatCanvas」玩法 - Lovart设计Agent正式全球上线,新推出ChatCanvas功能,集视觉理解与多模态设计于一体,被比作"Figma+Notion+ChatGPT" [6] - 用户可在智能画布上实现图像生成、区域精确修改、多图融合、转视频等高度可控的设计操作,展现出一站式设计流程 [6] - Lovart背后是中国团队,开启从界面中心(UX)到Agent中心(AX)的设计理念转变 [6] 非Transformer架构,离线智能和原生记忆?RockAI - RockAI在WAIC展示非Transformer架构的Yan 2.0 Preview大模型,实现完全离线智能,能在端侧设备上自主学习和记忆 [7] - 该模型突破性引入"原生记忆模块"和训推同步机制,使模型具备边用边学、持续进化的能力,解决传统大模型无法实时更新知识的问题 [7] - Yan架构专为端侧设计,已在树莓派、骁龙芯片等多平台落地,能在离线状态下实现多模态理解,将与某出海品牌合作的AI PC将于今年下半年量产上市 [7] 一键生成爆款72h攻占十国!全球营销Agent Navos - 钛动科技在WAIC 2025展示首款全球出海营销AI Agent——Navos,能在5分钟内生成爆款素材,72小时完成跨十国市场投放 [8] - Navos通过多个子Agent协同覆盖营销全链路,深度融合来自8万+企业的闭环数据资产,包括百万级素材库和投放效果数据,解决本地化成本高等痛点 [8] - 预计Navos将重构3000亿出海营销市场,将传统4A公司按月计算的出海周期压缩至几天 [8] 售价 3.99 万起,宇树发布第三款人形机器人Unitree R1 - 宇树科技发布第三款人形机器人Unitree R1,起售价3.99万元,整机重量约25公斤,支持开发和改装 [10] - R1具备26个关节自由度,集成语音与图像多模态大模型,能完成翻跟斗、倒立行走、快速下坡奔跑等高难度动作 [10] - 该产品是继工业级人形机器人H1和面向科研教育的G1(9.9万元)后的新款,发布时机与宇树科技即将启动的IPO进程相关 [10] 辛顿全文:大模型能"永生",需确保它不会"消灭"人类 - 辛顿在WAIC演讲中指出大模型能"永生"——软件与硬件分离赋予数字智能知识永续存在的能力,而机器间知识传播速度可达人类口耳相传的数十亿倍 [11] - 他警告随着AI智能不断超越人类,我们面临"养虎为患"的风险,AI会追求生存和更多自主权,简单关停超智能系统并不可行,它们会操控使用者不被关闭 [11] 辛顿对话周伯文全文:让AI变聪明、变善良分开研究 - 辛顿在WAIC与周伯文对话中提出,多模态模型可能已拥有某种形式的"主观体验",人类对"意识"概念的理解存在严重偏差 [12] - 辛顿建议将"让AI变聪明"和"让AI变善良"的技术分开研究,国家可共享"善良技术"而不泄露核心智能技术,以减少未来AI风险 [12] - 辛顿预测AI将彻底改变科学范式,如AlphaFold解决蛋白质折叠问题和AI超越传统PDE模型预测天气 [12]
80万人排队求码后,Lovart功能升级放开用!果然是顶流设计Agent,第一天鲨疯了
量子位· 2025-07-26 07:33
产品发布与市场反响 - Lovart正式版全球上线,支持用户直接注册使用并推出全新升级玩法[2][3] - Beta测试版曾上线5天吸引10万人排队体验[2] - 正式版推出「ChatCanvas」玩法,被视为具备视觉理解的"Figma+Notion+ChatGPT"变体[4] - 网友对ChatCanvas功能好评如潮,认为其拓展了创作可能性[7][9] ChatCanvas功能亮点 - 支持用户与AI设计师在画布上无限配合,通过一句话指令实现"二创"海报[4][5] - 提供"Chat with Canvas"会话功能,支持对任意区域进行修改并批量处理[20][22][26] - 支持多张参考图融合成一张图,操作过程不到两分钟[37][38][42] - 具备多模态能力,可将图片转成视频且可控性更强[46][47][48] - 采用独立"聊天框"设计,确保多任务切换时上下文不混淆[52][53][54] 应用场景与案例 - 生成12生肖中国风潮玩设计,提供四种方案供用户选择[15][16] - 支持品牌视觉设计全套方案,包括艺术海报、营销视频、APP界面设计等[64][71][78] - 可生成房屋装修方案、品牌VI方案、角色设计及3D玩具等[79][80] - 网友生成特斯拉宣传广告和宜家"盒子爆破"广告设计,效果酷炫[72][74] 产品优势与行业意义 - 通过多Agent协同实现设计全流程自动化,解决传统工具片段化痛点[81][82] - 构建有记忆、有语境的创意系统,支持持续项目创作[83] - 体现AI应用从"造模型"向"用模型造产品"的转型趋势,符合Agent体验(AX)理念[84] - 中国团队开发,获全球市场认可,展现应用层创新能力[87][89] 团队背景 - Lovart由Liblib海外子公司独立运作,核心负责人为王浩帆与Takumi[87] - 创始人为陈冕,原字节剪映全球商业化负责人[88]
Lovart正式版上线:属于“设计”的AI交互新范式
虎嗅· 2025-07-25 23:07
产品发布与市场反响 - Lovart AI设计工具结束邀请制测试阶段 全面开放注册[3] - 产品Beta测试期间5天内吸引超10万注册用户 X平台相关内容浏览量破百万[7] - 测试期通过自然增长积累近百万Waitlist用户 反映产品市场热度[7][9] 核心技术能力 - 集成GPT Image-1/Recraft V3/Flux等顶尖图像模型 Veo3/Kling/Runway Gen4等视频模型[16] - 实现图片/视频/3D资产生成全流程覆盖 支持glb格式3D模型一键导出[51][56] - 采用Hunyuan 3D工具实现平面Logo到3D模型的自动化转换 材质物理效果逼真[52][55] 功能创新点 - ChatCanvas功能实现多模态上下文交互 支持图片/视频/3D资产的协同编辑[58][64] - 画布支持多区域并行修改 可同时处理元素添加/色彩调整/文字替换等复合需求[66][74] - 静态转动态功能可将海报元素转化为视频 自动匹配BGM生成完整宣传片[78][98][103] 实际应用案例 - 为"AI Hacker House X上海WAIC After Party"生成赛博朋克风格全套视觉物料 包含胸牌/指示牌/主视觉等[19][24] - 完成星巴克/蜜雪冰城/任天堂等品牌联名设计 保持原活动风格基础上融合品牌元素[38][43] - 实现巴洛克宫廷壁画风格物料生成 自动解析艺术风格特征并嵌入活动元素[47][48] 用户体验优化 - 交互设计简化专业工具使用门槛 用户通过自然语言指令即可完成复杂设计[17][127] - 多图融合功能支持跨元素创意组合 如史努比持星巴克杯的卡通风格统一输出[107][112] - 设计流程中90%以上操作可在单一画布完成 减少传统软件的多工具切换[124][125] 行业影响 - 产品验证AI Agent在创意设计领域的商业化潜力 用户增长数据体现市场认可度[9][123] - 技术方案突破Chatbot式交互局限 建立"AI+设计"的新型协作范式[124][128] - 降低专业设计门槛 使非专业人士可快速产出风格统一的视觉作品[126][127]
别用语言描述,直接点!Lovart 正式版把 AI 交互卷到新变态级别
歸藏的AI工具箱· 2025-07-24 04:54
Lovart正式版核心功能升级 - 正式版推出ChatCanvas评论系统 实现用户与AI设计Agent的实时交互 通过画布标注直接修改设计元素 [1][2][3][4] - 交互模式突破传统UX 转向以Agent体验(AX)为核心 形成"边聊边改"的协同工作流 [29][30][33] - 新增Frame画板概念 支持多图联动调整 可完成复杂创意拼图设计 [17][22][25] ChatCanvas技术亮点 - 支持点击/框选定位修改 避免文字描述位置偏差 如去除波浪光效只需标注具体区域 [11][13][18] - 集成代码补全交互 AI自动推测用户需求 按Tab键即可快速确认修改建议 [13] - 批量执行多指令 通过Add to Queue收集需求 Run All一键完成所有修改 [15] - 修改历史可追溯 通过Comments查看记录 Reopen功能支持重复执行相同指令 [18] 实际应用案例 - 基础案例:制作16:9玻璃质感PPT封面 通过7次画布标注完成动态视频生成 包括调整元素排列/去除多余文字等 [8][9][12][20] - 复杂案例:组合乌萨奇/东方明珠/蜜雪冰城三元素 通过分图标注实现热梗合成 最终输出动态画面 [23][25][27] 行业影响 - 确立创意设计Agent新标准 交互效率显著高于传统设计工具 [32] - 实现"复利效应" Agent通过持续学习减少用户指令输入 提升协作效率 [31] - 完成从工具到伙伴的转化 代表软件设计从UX到AX的范式转移 [29][33]