产品发布与市场表现 - 蚂蚁集团于11月19日正式推出全新AI应用“灵光”,定位为“全代码生成多模态内容”AI助手,其回复可交付为可交互的网页,包含图文、3D模型、动画、地图、表格、音视频等全模态内容[1] - 阿里于11月18日将旗下AI To C应用翻新整合,以“千问”App形式重新推出,与“灵光”的发布仅相隔一天,标志着公司在AI To C市场开始快速“补课”并全力出击[4] - “灵光”上线后至发稿时下载量已超100万,位列App Store总榜第6位,其破百万下载量的速度已超越近期现象级AI应用Sora2(后者用时5天)[4] 产品定位与核心功能差异 - “千问”基于阿里旗舰模型Qwen构建,定位为展现模型实力的出口,擅长处理通用知识问答、长文本写作和复杂逻辑推理任务[6] - “灵光”更侧重移动端交互创新,核心差异在于信息展现形式,其目标不是通用助手入口或陪伴功能,而是定位为效率工具[6] - “灵光”核心功能包括“灵光对话”(生成多模态内容)、“灵光闪应用”(用户输入自然语言可在30秒内生成可编辑、可交互的小应用)和“灵光开眼”(通过图片识别理解内容并提供信息或执行操作)[1][4] 技术路径与工程挑战 - 相比纯文本输出,生成代码的膨胀率约为5-6倍,例如对一个15字指令生成可交互组件,所需代码量可达几十甚至上百字符,这对计算资源、性能稳定性和工程实现提出高要求[10] - 技术难度体现在需要代码生成、精准推理、工具调用、数学能力及深度理解用户意图等多方面综合能力,公司内部将“灵光”定义为在技术最不稳定边界上建立的产品[11] - 产品特色在于可直接在移动端生成并运行应用成品,工程难度更高,公司选择聚焦可长期积累、可复用的模块化迭代,以便在基础模型升级时优化能叠加而非推倒重来[11][14][15] 公司战略与行业背景 - 公司采取多方向押注策略,不将资源集中于单一方向,以应对模型能力快速变换的不确定性,如同在沙漠中多路找水[5] - DeepSeek R1的发布是公司决定全力投入AGI的转折点,其以较小资源投入实现AGI给予公司极大信心,促使公司反思并整合技术积累以直接向用户传递价值[12] - 公司战略不意在争夺AI通用助手入口,而是聚焦细分方向:强化编码能力与全模态内容生成,定位效率工具,旨在做AGI时代的“二维码”,以最小成本找到新技术与市场的契合点[13][15]
阿里AI猛补课,蚂蚁的“灵光”灵不灵?
36氪·2025-11-24 10:20