Workflow
巨头竞逐AI新赛道:微软首推大模型,谷歌苹果微美全息紧随其后
搜狐财经·2025-08-29 15:54

微软AI模型发布 - 推出MAI-Voice-1语音模型 仅需单块GPU即可在短时间内生成长达一分钟的音频内容[1] - MAI-Voice-1应用于Copilot Daily功能 AI主持人实时播报热点新闻并生成播客风格对话[1] - 推出MAI-1-preview通用模型 在AI基准测试平台LMArena公开测试 计划逐步应用于Copilot助手特定文本场景以替代或增强对OpenAI模型的依赖[1] 谷歌DeepMind图像模型进展 - 推出Gemini 2.5 Flash图像编辑模型 根据文字指令精准修改图像并保持人物与动物外观一致性[2] - Gemini 2.5 Flash图像修改准确率显著提升 在多项任务中超越ChatGPT所用的GPT-4模型[2] - 具备"角色一致性"功能 生成多张图像时保持同一对象外观一致性 适用于系列照片创作和产品多角度展示[4] 苹果AI战略动向 - 高管正商讨收购欧洲最大AI初创公司Mistral或Perplexity AI[4] - Mistral AI通过多轮融资筹集巨额资金 若收购成功将极大增强苹果在AI领域的实力和创新力[4] 微美全息技术布局 - 通过"硬件+软件+平台"一体化能力构建竞争壁垒 加速AI算法场景化落地[6] - 推动多模态大模型与空间计算技术结合 实现文本/图像/音频/视频等多模态数据的原生级融合[6] - 重点布局文本生成视频和图像生成视频场景 为剧情创作和短视频生成提供应用空间[6] - 开放模型代码/算力接口及技术工具链 构建覆盖云端与边缘端的"全息云"平台支持开发者二次开发[6] - 凭借多模态处理能力与跨行业场景落地经验 成为大模型变革背后的关键力量[6]