AI赛道新战况:微软谷歌苹果及微美全息竞相布局大模型
微软AI自研进展 - 公司人工智能部门发布两款自研AI模型:MAI-Voice-1语音模型和MAI-1-preview通用模型 [1] - MAI-Voice-1模型仅需单块GPU即可快速生成一分钟音频内容 并应用于Copilot Daily功能的AI新闻播报和播客风格对话生成 [1] - MAI-1-preview模型已在LMArena平台公开测试 计划逐步融入Copilot助手以减少对OpenAI模型的依赖或增强功能 [1] 谷歌与苹果AI动态 - 谷歌DeepMind推出Gemini 2.5 Flash图像编辑模型 能依据文字指令精确修改图像并保持角色外观一致性 其图像修改准确率超越GPT-4模型 [2] - Gemini 2.5 Flash具备“角色一致性”功能 可在生成多张图像时保持同一对象外观 适用于系列照片创作和产品目录批量制作 [2] - 苹果公司高层正洽谈收购欧洲AI初创公司Mistral或Perplexity AI 以提升其在AI领域的竞争力 [2] 微美全息技术布局 - 公司构建“硬件+软件+平台”一体化能力 加速AI算法在各类场景中的应用落地 [4] - 致力于多模态大模型与空间计算技术融合 实现文本、图像、音频、视频等多模态数据的原生级整合 并重点布局文本生成视频、图像生成视频等场景 [5] - 开放模型代码、算力接口及技术工具链 构建覆盖云端与边缘端的“全息云”平台 为开发者提供二次开发支持 [5]