Workflow
AvatarFX
icon
搜索文档
腾讯研究院AI速递 20250604
腾讯研究院· 2025-06-03 14:49
微软Bing Video Creator - 微软发布由OpenAI Sora技术支持的Bing Video Creator,可通过自然语言生成多种类型视频 [1] - 该服务免费提供快速和标准两种生成模式,初始有10次快速生成机会,生成视频长度为5秒 [1] - 系统内置安全保障措施并为视频添加内容凭证和溯源信息,目前国区未开放 [1] Manus幻灯片功能 - Manus新幻灯片功能可在10分钟内生成8页专业PPT,支持导出为Google Slides [2] - 实测显示功能支持自动搜索资料、规划结构、生成内容,但存在页面显示不完全问题 [2] - 与Genspark对比速度更快(10分钟vs20分钟),被网友评为当前PPT制作最佳工具 [2] Character.ai AvatarFX - Character.ai推出AvatarFX功能,使静态图片人物能说话唱歌并支持多轮对话 [3] - 基于DiT架构实现高保真度和强时间一致性,复杂场景中表现稳定 [3] - 同步推出沉浸式叙事体验Scenes、动画聊天Imagine Animated Chat等新功能 [3] Fellou 2.0智能体 - Fellou 2.0作为Agentic Browser实现AI任务7x24小时批量化生产 [4] - 新版本速度提升1.2-1.5倍,成功率从31%升至80%,支持多任务并行处理 [5] - 基于Eko 2.0架构,未来将推出Windows版本并取消邀请码 [5] YouWare氛围编程平台 - YouWare让非程序员通过AI将创意转化为网页并一键上线分享 [6] - 平台实现"所想即所见"体验,由自研AI Agent和Sandbox技术支撑 [6] - 建立类似Instagram的创作社区,设计"Knot"奖励机制鼓励优质内容 [6] 智源Video-XL-2模型 - 智源开源轻量级Video-XL-2模型,单卡可处理长达万帧视频 [7] - 模型采用四阶段渐进式训练方法,编码2048帧视频仅需12秒 [7] - 在主流评测中超越所有轻量级开源模型,适用于影视分析和异常监测 [7] Salesforce收购Moonhub - Salesforce收购AI Agent平台Moonhub,团队将开发Agentforce平台 [8] - 目标2025年底通过Agentforce开发十亿个智能体,现有3000家企业客户 [8] - Moonhub招聘智能体功能将与Salesforce HR智能体形成互补 [8] 李飞飞Forge渲染器 - World Labs开源Forge渲染器,可在普通设备流畅渲染AI生成3D世界 [10] - 作为Web端3D高斯泼溅渲染器,支持多摄像头及实时动画编辑 [10] - 关键技术包括高效画家算法和可编程数据流水线 [10] ChatGPT模型选择 - 卡帕西建议简单问题用GPT-4o,复杂任务用o3,代码完善用GPT-4.1 [11] - 使用场景分配:40%日常问题用4o,40%重要问题用o3 [11] - 选择原则基于任务重要性和响应速度需求 [11] ChatGPT记忆机制 - 记忆系统由保存记忆和聊天历史(含会话历史/对话历史/用户洞察)构成 [12] - 技术实现涉及向量空间索引和聚类优化算法,用户洞察贡献占比或超80% [12] - 机制使模型从被动应答转向主动理解,显著提升智能感 [12]
AI陪伴Top 1应用上线视频生成!图片人物能说话唱歌,多轮对话场景依然稳定
量子位· 2025-06-03 06:21
产品功能更新 - CharacterAI推出视频生成功能AvatarFX 让静态图片中的人物可以"开口说话" 并支持多角色、长序列等复杂场景[1][2][3] - AvatarFX基于DiT架构 自称达到SOTA水准 技术亮点在于高保真度和强时间一致性[3] - 该功能支持人类和非人类面孔 但对真人图片会进行面部特征修改以防止滥用[7] - 用户每天可生成5个视频 网页版已上线 APP端即将推出[8] - 公司同时推出Scenes功能 提供沉浸式叙事体验 用户可与角色进入预设故事情节[9] - Imagine Animated Chat功能可将用户与角色互动变成动画 目前仅限订阅用户[10] - Stream功能即将上线 可自动生成两个角色间的互动故事[10] 公司动态 - 谷歌去年8月以25亿美元估值收购CharacterAI 高于此前10亿美元估值但低于早期谈判的50亿美元[11] - 美国对此次收购展开反垄断调查 质疑谷歌通过"技术授权"方式规避监管[12][13] - 收购后公司保持独立运营 但核心创始人及团队成员回归谷歌[13] - 类似"雇佣式收购"案例还包括微软收购Inflection和亚马逊收购Adept[14] 技术展示 - AvatarFX可生成不同风格的动漫形象 包括外星人等非人类角色[4][6] - 功能展示视频显示生成效果惟妙惟肖 建议配合声音观看[6]
传媒行业周报:4月127款版号发放,关注五一档票房表现
国元证券· 2025-04-27 03:23
报告行业投资评级 - 推荐(维持)[8] 报告的核心观点 - 2025.4.19 - 2025.4.25 传媒行业(申万)下跌 0.11%,排名行业第 25 名,同期沪深 300 等指数上涨,传媒各子板块除游戏 II 外普跌,游戏 II 板块涨 0.78% [2][11] - 国家新闻出版署等 10 部门发布计划利好传媒行业,AI 应用有新进展,游戏和影视行业有新动态 [3] 根据相关目录分别进行总结 行情回顾 - 周度涨跌(2025.4.19 - 2025.4.25)传媒行业(申万)下跌 0.11%,排名第 25 名,同期沪深 300 涨 0.38%等,细分行业除游戏 II 外普跌,游戏 II 涨 0.78% [2][11] - 个股方面,传媒(申万)行业生意宝等表现较优,返利科技等跌幅居前,恒生科技成分股中阿里巴巴 - W 等表现较好 [18] 行业重点数据 AI 应用数据 - Deepseek、豆包、夸克和元宝成 AI 应用流量第一梯队,4.18 - 4.24 七麦预估 iphone 端 Deepseek 等下载量有不同变化 [22] 游戏数据 - 截至 4.24,《王者荣耀》等成畅销榜前 3 名,周内上线《七日世界》等在免费榜排名靠前 [4][24] - 4 月发放 118 款国产和 9 款进口游戏版号,腾讯等头部厂商有储备产品获批,今年累计发放国产 480 款和进口 30 款 [25] - 未来一周(2025.4.26 - 2025.5.2)有 10 款游戏将上线,如腾讯《暗区突围:无限》PC 版 4 月 29 日上线 [31] 电影数据 - 2025.4.18 - 2025.4.24 国内总票房 2.47 亿元,《哪吒之魔童闹海》等为周度票房前三 [34] - 未来一周有 15 部影片待映,13 部为五一档影片,《水饺皇后》等猫眼想看人数多,有望拉动院线票房 [35] 行业重点事件及公告 - 国家新闻出版署等十部门印发《网络出版科技创新引领计划》,提升企业创新能力等 [37] - 字节推出全新文本生成图像模型 Seedream 3.0,性能出色 [37] - 百度上线“心响”app,字节“扣子空间”上线内测 [37] - 昆仑万维开源 SkyReels - V2 模型,智元发布具身智能一站式开发平台 Genie Studio [37] - 腾讯举行“Spark 2025 腾讯游戏发布会”,公布 46 款海内外游戏动态 [38] - Character.AI 推出 AvatarFX 模型,OpenAl 推出最新图像生成模型 GPT - image - 1 [39][40]
AI早报 | 马斯克为“擎天柱”大倒苦水;Deepseek将于年内“上车”宝马
搜狐财经· 2025-04-24 00:24
特斯拉机器人生产与稀土供应 - 特斯拉人形机器人Optimus生产受中国稀土出口管制影响 公司正与中国方面合作争取出口许可以获取稀土磁铁[1] - 特斯拉预计今年生产数千台Optimus机器人[1] 腾讯混元3D模型升级 - 腾讯混元3D生成模型发布2.5版本 建模精细度大幅提升 有效几何分辨率达到1024 从标清升级到高清画质[1] - 模型总参数量从1B提升至10B 有效面片数增加超10倍[1] - 免费生成额度翻倍至每天20次 混元3D生成API已正式上线腾讯云面向企业和开发者开放[1] 自动驾驶技术进展 - 小马智行发布第七代车规级自动驾驶软硬件系统 自动驾驶套件总成本较前代下降70%[3] - 实现100%车规级零部件搭载 L4级Robotaxi车队已实现50万小时全场景全天候全无人运营[3] 人工智能产品发布 - 爱奇艺发布个人智能助手"桃豆" 基于用户娱乐需求提供搜片荐片客服问答等智能交互服务[3] - Character.AI推出视频生成模型AvatarFX 基于SOTA DiT-based diffusion video generation model 能让静态图片中的人物说话[3][4] - 宝马宣布Deepseek将于年内"上车"多款在售新车 推出中国专属AI智能体"用车专家"和"出行伴侣"[5] 企业组织架构调整 - 字节AI产品部门Flow进行调整 社交陪伴类AI产品猫箱原负责人离职 由原星绘产品负责人接任[5] - 星绘团队计划并入豆包 将由豆包App端负责人一起管理[5]
出海速递|小米汽车在欧洲设研发和设计中心/几千家新能源小厂涌进非洲:毛利30%,两个月冲垮赞比亚
36氪· 2025-04-23 10:50
中国汽车产业全球化布局 - 小米汽车在欧洲设立研发和设计中心以提升高性能调校能力并突破全球市场 [3] - 上汽集团计划未来三年推出17款全新海外车型覆盖SUV、轿车、MPV和皮卡 [12] - 比亚迪2025年海外销量目标为80万辆占总销量目标550万辆的14.5% [12] - 蔚来萤火虫车型2025年进入全球5大洲16个国家并首次亮相国际车展 [12] - 零跑汽车计划2026年在欧洲实现本地生产以深化区域布局 [13] - 特斯拉谨慎进入印度市场因面临70%关税和30%奢侈品税导致售价翻倍 [14] - 中国汽车产业年产量有望达4000万辆占全球份额超40% [13] 新能源与储能产业海外拓展 - 东南亚光伏双反关税落地推动中国光伏企业加速本土化产能布局 [5] - 数千家中国新能源小厂进入非洲市场部分企业毛利达30%并在赞比亚快速占据市场 [5] - 中国储能小厂在非洲开展业务挖掘市场机会 [6] 科技与硬件出海动态 - 全球94%消费级3D打印机由中国生产追觅孵化项目获数千万融资优先布局欧美市场 [9] - 小鹏汇天飞行汽车"陆地航母"2026年上市并启动大规模交付 [14] - 小马智行第七代Robotaxi自动驾驶套件成本下降70%实现全无人运营50万小时 [11] - 割草机器人企业如九号公司和科沃斯加速深耕欧洲市场应对关税壁垒 [15] - 美团无人机获全国首张低空物流全境覆盖运营合格证开启全国常态化商业运营 [14] 跨境电商与金融支持 - 深圳推出全国首单"跨境电商保"保证保险支持跨境电商境内采买和资金链疏通 [11] - 上海发布跨境金融服务便利化行动方案从结算效率、汇率避险、融资服务、保险保障和综合金融五方面支持企业出海 [10] - 阿治曼自由区在深圳举办交流会助力中国企业出海中东市场 [17] 企业海外业务表现与合作 - 泡泡玛特2025年第一季度海外收益同比增长475%-480%其中美洲增长895%-900%欧洲增长600%-605% [15] - 腾讯云与日本Tabelog合作上线微信小程序覆盖87万家餐厅每年服务近700万赴日游客 [4][15] - 日本Tabelog平台与腾讯云达成战略合作通过微信小程序拓展中国用户市场 [4] 人工智能与数字基础设施 - Character.AI推出视频生成模型AvatarFX使静态图片人物可开口说话 [16] - 阿联酋电信公司du与微软合作投资5.45亿美元建设超大规模数据中心 [16] - Instagram推出视频剪辑应用Edits对标TikTok的CapCut工具 [16] 游戏与内容产业出海 - 中国政策鼓励游戏出海布局从IP打造到海外运营的全产业链 [17] - 海外红人营销存在约束力弱和信息不透明问题类似"租账号搏流量"概率游戏 [8] 区域市场机会与挑战 - 印尼市场被描述为"掺着沙子的黄金"蕴含机会但存在运营挑战 [7] - 美国六大汽车行业组织联名反对加征汽车零部件关税因可能导致售价上涨和供应链紊乱 [12]
Character.AI推出AvatarFX模型:让静态图片人物“开口说话”
环球网· 2025-04-23 06:07
核心技术突破 - 推出革命性视频生成模型AvatarFX 首次实现静态图片转化为可说话、可互动的动态视频角色 [1] - 基于SOTA DiT-based diffusion video generation model 通过深度学习算法融合静态图像与音频条件化技术 [3] - 采用创新蒸馏与推理策略 精准捕捉音频特征并同步生成唇部运动、表情变化及自然肢体动作 [3] 技术性能特点 - 具备超实时生成能力 支持长序列叙事与多角色对话场景 [3] - 用户仅需上传一张角色图片及对应音频 即可在短时间内生成流畅视频 [3] - 内置男声、女声及多风格语音库 支持自由组合角色形象与声音特征 [3] 应用场景拓展 - 教育领域实现虚拟形象生动化教学 娱乐行业支持虚拟偶像实时互动 [4] - 社交媒体支持快速生成动态头像与短视频内容 [4] - 可应用于影视制作、历史人物复原及文化遗产数字化领域 [4] 平台运营保障 - 内置多层级内容审核机制 通过实时监控与过滤技术确保内容安全 [3] - 用户可通过官方网站直接体验该技术 [5]