巨头竞逐AI新赛道：微软首推大模型，谷歌苹果微美全息紧随其后

微软AI模型发布 - 推出MAI-Voice-1语音模型仅需单块GPU即可在短时间内生成长达一分钟的音频内容[1] - MAI-Voice-1应用于Copilot Daily功能 AI主持人实时播报热点新闻并生成播客风格对话[1] - 推出MAI-1-preview通用模型在AI基准测试平台LMArena公开测试计划逐步应用于Copilot助手特定文本场景以替代或增强对OpenAI模型的依赖[1] 谷歌DeepMind图像模型进展 - 推出Gemini 2.5 Flash图像编辑模型根据文字指令精准修改图像并保持人物与动物外观一致性[2] - Gemini 2.5 Flash图像修改准确率显著提升在多项任务中超越ChatGPT所用的GPT-4模型[2] - 具备"角色一致性"功能生成多张图像时保持同一对象外观一致性适用于系列照片创作和产品多角度展示[4] 苹果AI战略动向 - 高管正商讨收购欧洲最大AI初创公司Mistral或Perplexity AI[4] - Mistral AI通过多轮融资筹集巨额资金若收购成功将极大增强苹果在AI领域的实力和创新力[4] 微美全息技术布局 - 通过"硬件+软件+平台"一体化能力构建竞争壁垒加速AI算法场景化落地[6] - 推动多模态大模型与空间计算技术结合实现文本/图像/音频/视频等多模态数据的原生级融合[6] - 重点布局文本生成视频和图像生成视频场景为剧情创作和短视频生成提供应用空间[6] - 开放模型代码/算力接口及技术工具链构建覆盖云端与边缘端的"全息云"平台支持开发者二次开发[6] - 凭借多模态处理能力与跨行业场景落地经验成为大模型变革背后的关键力量[6]