Workflow
模型开源
icon
搜索文档
通义万相全新动作生成模型Wan2.2-Animate正式开源
智通财经· 2025-09-19 08:35
9月19日,阿里云宣布,通义万相全新动作生成模型Wan2.2-Animate正式开源。该模型支持驱动人物、 动漫形象和动物照片,可应用于短视频创作、舞蹈模板生成、动漫制作等领域。即日起,用户可在 Github、HuggingFace和魔搭社区下载模型和代码,也可以在阿里云百炼平台调用API,或通义万相官网 直接体验。 Wan2.2-Animate模型基于此前通义万相开源的Animate Anyone模型全面升级,不仅在人物一致性、生成 质量等指标上大幅提升,还同时支持动作模仿和角色扮演两种模式。 自今年2月以来,通义万相已连续开源20多款模型,在开源社区和三方平台的下载量已超3000万,是开 源社区最受欢迎的视频生成模型之一。通义万相模型家族已支持文生图、文生视频、图生视频、人声生 视频和动作生成等10多种视觉创作能力。 ...
通义首个深度研究Agent模型DeepResearch正式开源
每日经济新闻· 2025-09-18 04:27
(文章来源:每日经济新闻) 每经AI快讯,据阿里云公众号消息,近日,通义首个深度研究Agent模型DeepResearch正式开源。该模 型参数仅30B(激活3B),在多个权威评测集上取得SOTA成绩。目前,通义DeepResearch的模型、框 架和方案均已全面开源,用户可在Github、Hugging Face和魔搭社区下载模型和代码。 ...
全文|Meta Q2业绩会实录:预计明年员工薪酬支出将增长
新浪财经· 2025-07-31 11:47
财务表现 - 2025财年第二季度营收475 16亿美元 同比增长22% 不计汇率影响同样增长22% [1] - 净利润183 37亿美元 同比增长36% [1] 人工智能战略 - 公司内部团队正尝试用Llama 4大模型打造自主AI智能体以改进Facebook算法和用户参与度 [2] - 超级智能被视为未来几年重塑所有系统和底层逻辑的关键 公司将持续投入资源 [2][5] - 人工智能技术发展速度超预期 公司需确保拥有顶尖人才团队和行业领先算力能力 [3] - 研发超级智能需小型人才密集型团队 与传统大规模团队模式不同 [6] 资本支出与预算 - 2026年基础设施预算将成为最大支出 包括服务器 数据中心和云服务扩容 [4][9] - 员工薪酬支出是第二大驱动因素 主要来自人工智能领域人才招聘 [4][9] - 2026年资本支出可能超1000亿美元 部分资金将通过合作伙伴关系解决 [10][12] 技术研发方向 - 超级智能研发重点在于"自我改进"能力 使技术具备自身迭代功能 [5] - 核心推荐引擎短期优化包括内容精准匹配 小创作者曝光和用户兴趣探索 [7] - 长期计划开发跨服务基础推荐模型 并将大语言模型深度整合至推荐系统 [7] 开源策略 - 公司坚持部分模型开源原则 不会将所有技术开源 [8][11] - 开源模型体积过大可能带来实用性和安全问题 需权衡利弊 [9][11] 产品发展 - Meta AI模型迭代将显著提升用户参与度 从Llama 4到4 1版本持续优化 [19] - 智能眼镜被视为AI技术理想物理形态 与雷朋合作产品取得积极进展 [20][21] - 智能眼镜可实现多模态AI交互 未来可能成为基础认知工具 [22][23] 投资回报 - 核心AI业务投资回报率强劲 生成式AI仍处早期阶段 [15] - 基础设施投资注重灵活性 服务器将成为最大资金支出项 [15] - 公司通过股票回购抵消股权稀释 维持股东回报 [24]
应激的Llama,开源的困局
36氪· 2025-04-24 11:38
Llama 4 发布表现与问题 - Llama 4 在实测中表现不佳 包括10M token上下文长度出错、小球测试失败、9.11>9.9比大小错误等基础能力缺陷 [1] - 模型发布24小时内被内部员工曝光基准测试造假 领导层将多个测试集混合在后期训练中以制造"看似合格"的结果 [3] - 代码能力严重不足 Maverick版本在Polyglot编程测试中正确率仅15.6%~16% 402B参数规模反而被32B参数的Qwen-QwQ等模型超越 [3] - 多模态能力未达预期 图像理解能力不如谷歌去年开源的Gemma 2 长上下文任务性能随token增加显著下降 [7] Meta 面临竞争压力与战略失误 - 面临GPT-4o、Claude-3.7等闭源模型在多模态和代码能力上的领先优势 同时受到DeepSeek V3等开源后起之秀的冲击 [6] - 扎克伯格设定4月截止日期强迫研发团队仓促发布 导致测试周期压缩和模型未达预期即上线 [6] - 技术路线依赖传统DPO方法和参数堆叠 缺乏对多模态底层架构的创新探索 [6] - 前期建立的AI生态面临开发者流失风险 可能影响与微软Azure等云计算合作伙伴关系 [13] 开源商业模式分析 - 开源模型通过免费基础服务吸引开发者 通过高性能API服务收费 DeepSeek-R1 API定价为每百万输入Token 1元 输出Token 16元 [8] - 私有化部署服务面向政企客户 大模型底座建设费用基本千万起步 某厂商最新模型部署起价2000万 [9] - 采用开源与闭源双轨并行策略 开源基础版建立生态 闭源高级版服务付费市场 如智谱开源ChatGLM-6B同时推出收费的GLM-130B [10] - 通过开源构建开发者生态 衍生云服务、广告、配套AI产品等盈利渠道 [12] 行业发展趋势与战略建议 - 国内大模型公司加速开源进程 百度宣布2025年6月全面开源文心4.5系列 [16] - 突破性能依赖架构创新 DeepSeek通过MoE架构降低成本提升效率 而非单纯参数堆叠 [17] - 企业需结合自身基因制定变现策略 阿里通过全模态开源推动云服务 智谱采用开源闭源双轨策略 [18] - 开源模型存在许可证限制 Meta Llama2禁止月活超7亿公司使用 且部署需要昂贵计算资源 [19]