Workflow
AI产业跟踪:x-AI发布Grok-4Fast,持续关注大模型迭代与AI应用商业化进展
长江证券·2025-09-18 05:42

行业投资评级 - 看好 维持[8] 核心观点 - xAI于2025年9月15日推出Grok-4 Fast高速推理版本 生成速度达每秒75 tokens 比标准版快10倍 响应速度最高达标准版的10倍 当前向Super Grok和X Premium+付费订阅用户提供早期访问版[2][5] - 模型通过牺牲部分精度换取极低延迟 推理延迟从前代模型200ms降至20ms以内 接近人类日常水平(10-30ms) 用户反馈显示输出速度近170 tokens/秒[11] - 速度优先设计适用于追求即时效果的场景 如快速代码生成和即时查询处理 显著提升交互效率与用户体验 有望进一步集成到开发工具和移动端 缩短AI应用商业化落地周期[2][11] - 产品分层策略进一步完善 用户可根据场景选择"速度优先"或"质量优先" 新增后台思考功能(测试中)允许用户在助手思考时继续聊天 未来结合更多模式可能实现AI助手实用性突破[11] - 推理效率优先成为行业新竞争要素 OpenAI于2025年8月发布GPT-5 mini轻量高速版本 Google于2025年6月发布Gemini 2.5 Flash-Lite追求极速超低延迟高性价比 头部厂商均布局压低推理成本和延迟以实现规模化商用[11] - 模型竞争从"极限性能"转向"推理效率优先" 交互范式从"单轮对话"转向"实时交互与多轮Agent" 随着AI货币化开启 Q4国内模型与应用侧将迎来核心拐点 模型能力持续提升且成本下降 Coding等垂直场景Agent落地周期有望提前[11] 投资建议关注领域 - AI Infra:AI应用落地加速使AI Infra核心受益 重点推荐阿里巴巴[11] - AI Agent相关厂商[11] - 中国推理算力产业链[11] - 云服务厂商:关注推理需求带来的推动[11] - IDC:重点关注与腾讯 阿里 字节等大厂合作的IDC[11]