腾讯研究院AI速递 20251124

生成式AI模型与应用 - 谷歌发布Nano Banana Pro模型，基于Gemini 3 Pro，在文字-图像测试中领先第一代84分，在图像编辑中高出41分，可通过坐标生成特定地点历史事件 [1] - 谷歌AI笔记工具NotebookLM推出“一键生成幻灯片”功能，用户上传资料即可在几分钟内生成逻辑清晰的演示文稿，提供详细版和演讲版两种核心模式 [2] - Meta发布WorldGen系统，通过文本提示生成50×50米可导航、可交互的完整3D世界，基于程序化推理和扩散模型3D生成，输出几何一致且渲染高效的3D世界 [3] - 前OpenAI联合创始人Karpathy组建LLM议会项目，让GPT-5.1、Gemini 3 Pro、Claude Sonnet 4.5和Grok-4组成智囊团，问题分发给所有模型并进行审阅排名 [4] - 腾讯混元开源HunyuanVideo 1.5视频生成模型，参数8.3B支持生成5-10秒高清视频，可在14G显存消费级显卡上运行，支持中英文文生视频与图生视频 [5] - 腾讯混元视频模型通过创新SSTA稀疏注意力机制和多阶段渐进式训练策略，可原生生成480p和720p视频，通过超分模型提升至1080p电影级画质 [6] AI基础设施与资源管理 - 华为发布Flex:ai AI容器技术，能将智算资源利用率提升30%，无生态限制支持英伟达GPU和华为昇腾NPU，核心能力包括算力资源切分和多级智能调度 [7] - 当前AI浪潮面临算力供不应求的产能危机，瓶颈在于电力、涡轮机和增强型外壳供应，与90年代互联网基础设施过剩的情况不同 [11] 行业动态与融资 - OpenAI前CTO Mira Murati创立的Thinking Machines Lab计划筹集40-50亿美元，估值或达500亿美元（约3500亿人民币），公司此前已筹集20亿美元估值100亿美元 [8] - 马斯克与黄仁勋在美国-沙特投资论坛对谈，官宣xAI将与沙特企业Humain合作建500兆瓦数据中心，英伟达将与AWS合作构建目标1000兆瓦规模数据中心 [10] AI在科研与企业中的应用 - OpenAI与范德堡大学等多所高校合作，GPT-5帮助研究人员综合已知结果、加速艰难计算甚至生成新证明，在生物学案例中几分钟内从未发表图表识别出可能机制 [9] - 企业AI的核心在于构建自己的“AI工厂”和数据层，未来企业护城河是将隐性知识转化为私有模型权重，这种“公司主权”将以LoRA权重形式存在 [11] 行业观点与战略思考 - 马斯克认为AI发展到一定阶段货币将不再具有实际意义，并称人形机器人将成为有史以来规模最大的行业，AI与机器人能实现消除贫困目标 [10] - AI时代即使范式正确，具体架构选择和商业模式仍决定成败，90年代微软虽看准互联网方向但押错交互式电视路径被开放网络超越的案例值得深思 [11]