Imagen 4图像模型

搜索文档
Google I/O 2025:谷歌杀疯了,把 AI 塞进了每一个缝隙
36氪· 2025-05-21 10:53
谷歌AI生态系统升级 - 公司从搜索业务转型为全栈AI生态系统,涵盖模型、硬件、平台等多维度创新 [1][3] - 推出"AI Mode"重构传统搜索功能,具备自然语言对话、多模态识别和上下文理解能力 [6][7] - 搜索场景可结合用户历史数据(Gmail/日历)实现个性化推荐,例如餐饮推荐自动整合价格/评分/外卖选项 [8][12] Gemini模型技术突破 - 模型月活用户达4亿,年增长50倍至480万亿token处理量,开发者数量同比增长5倍至700万 [5] - 推出三大新模型: - **2.5 Pro Deep Think**:在USAMO数学竞赛得分40.4%,超越GPT-4 Turbo [13] - **2.5 Flash**:token消耗降低30%,输入成本$0.15/百万token,输出$0.6/百万token [14][15] - **Diffusion**:文本生成速度提升5倍达10,000 token/秒,新增方言/语调保留的音频生成功能 [18] - 模型集成至Chrome/Docs/Gmail等全线产品,覆盖工作生活全场景 [19] XR硬件与空间计算 - 发布Android XR平台及两款硬件: - **Project Aura**:轻量AR眼镜,集成Gemini实时感知与语音交互 [22] - **Project Moohan**:对标Vision Pro的沉浸式头显 [23] - 硬件支持实时物体识别(如自行车组装指导)和任务中断续接能力 [25] 内容生成技术进展 - **Veo 3**视频模型实现原生音频输出,支持对白/背景音同步生成 [26][28] - **Imagen 4**支持2K分辨率图像生成,结合Flow平台可完成从脚本到成片的AI影视创作 [30] 开发者工具革新 - **Jules**编程智能体支持异步代码重构/测试编写,运行于私有云实例保障安全 [31] - **Code Assist**支持200万token上下文,集成团队协作规范工具 [33] - **Stitch**实现自然语言生成UI界面,支持Figma/HTML导出 [33] 订阅服务体系 - 推出**AI Ultra**订阅($249.99/月),包含Veo 3/Imagen 4/30TB存储及多任务智能体Mariner [34][36] - **AI Pro**订阅维持$19.99/月价格,覆盖Gemini 2.5 Pro和深度搜索功能 [37] - 教育优惠扩展至日本/巴西等地区,大学生可享1年Pro版免费 [37] 行业影响 - 公司通过产品矩阵实现AI技术从工具到"数字延伸"的范式转变 [38][40] - 技术覆盖搜索/创作/开发/硬件全链条,形成生态级竞争壁垒 [3][19][40]