Workflow
全日程公布|谷歌Veo 3惊艳发布后,这场CVPR分享会值得每个AI人「听个声」
机器之心·2025-05-27 06:38

AI视频生成技术进展 - 谷歌发布新一代AI视频生成模型Veo 3,实现了高质量视频生成与音画同步功能,被评价为不亚于OpenAI Sora的跨时代产品,标志着AI视频进入"有声时代"[1] - AI社区通过架构创新和算力投入持续推动技术进步,视频生成领域从无声进化到有声,多模态领域向理解与生成大一统方向演进[2] 学术会议规模与质量 - CVPR 2025作为计算机视觉领域最重要国际会议之一,共收到13008份论文投稿,最终接收2878篇论文,整体接收率为22.1%[2] 技术研究专题与演讲嘉宾 - 中国科学院大学教授高林将分享基于混合表达与生成模型的可视媒体合成与编辑方法,介绍高斯泼溅技术的最新进展及其在数字人实时重光照等应用[8][10] - 北京航空航天大学副教授黄雷将从表征和学习视角探讨多模态大模型的统一之路,分析条件概率模型在建模任意问题的可行性[12] - 论文分享环节涵盖多模态驱动的人类动画、大规模人形角色自动绑定、通用机器人操作、长时视频理解、3D分割和视觉语言理解等多个前沿研究方向[4] 行业人才计划与资源投入 - 腾讯青云计划聚焦AI大模型等十大技术领域,提供不设上限的职级薪酬和定制化培养方案,开放核心业务机会和解锁前瞻性技术课题[17] - 京东TGT计划面向全球高校技术人才,依托京东丰富的产业布局,研究涵盖多模态大模型与应用、机器学习、具身智能等方向,提供充足算力资源和三导师培养机制[18] 行业交流平台与合作机会 - 黄大年茶思屋科技网站作为开放平台汇聚全球科学家和研究人员,推动科技创新交流[16] - 机器之心成功举办多场学术活动,为企业提供人才吸纳和品牌影响力提升的合作机会[20]