Llama 4系列 - 财报，业绩电话会，研报，新闻

Llama 4系列

搜索文档

智通财经网· 2025-05-23 02:05

模型发布 - Anthropic推出下一代Claude模型Claude Opus 4和Claude Sonnet 4，专注于编码、高级推理和AI代理功能 [1] - Claude Opus 4被公司称为世界上最好的编码模型，在复杂任务和代理工作流程中表现持续优异 [1] - Claude Sonnet 4是Sonnet 3.7的重大升级版本，提供更卓越的编码和推理能力，同时指令响应更精确 [1] 功能更新 - 扩展思考与工具使用（测试版）：两种模型可在推理过程中切换使用网络搜索等工具以提升回答质量 [1] - 模型支持并行使用工具，更精准遵循指令，并在允许访问本地文件时展现更强内存能力 [1] - Claude Code全面开放，同时Anthropic API新增四项功能（代码执行工具、MCP连接器、Files API、缓存提示一小时）以强化AI代理开发 [2] 定价与竞争 - Opus 4定价为每百万代币15美元（输入）/75美元（输出），Sonnet 4为3美元/15美元，与旧版保持一致 [2] - 行业竞争对手包括谷歌（Gemini 2.5 Pro）、OpenAI（GPT-4.5）、Meta（Llama 4）及中国企业百度、阿里巴巴、DeepSeek [2]

AI日报丨对等关税下，英伟达显卡价格疯涨！50系显卡被炒高身价，翻倍涨破3万元

新浪财经· 2025-04-15 11:33

AI技术进展与产品发布 - 可灵AI发布可灵2.0视频生成模型和可图2.0图像生成模型，在动态质量、语义响应、画面美学等维度保持全球领先[3] - 苹果公司计划通过分析用户设备上的数据来改进其AI平台，新系统将在iOS、iPadOS 18.5和macOS 15.5测试版中推出[4] - 马斯克表示将出现全面的通用人工智能解决方案来实现完全自动驾驶，仅需摄像头和特斯拉AI芯片及软件[5] - Meta宣布扩大AI模型训练，将利用来自欧盟用户的公开内容，但私人消息和18岁以下用户数据不会被使用[8][9] 公司动态与市场趋势 - AI大模型独角兽智谱于2025年4月14日在北京证监局办理辅导备案，成为第一家正式启动IPO流程的“大模型六小龙”[3] - AMD计划扩大在美国的AI芯片和服务器生产，将利用台积电正在扩建的亚利桑那工厂[3] - 苹果公司宣布将分析用户设备上数据的消息后，其股价在午盘交易中上涨3.5%[6][7] - 显卡市场出现价格上涨，5090显卡在二级市场价格翻倍涨至约3万元，相比16499元的建议零售价大幅提升[5] 行业环境与供应链 - 天风国际分析师郭明錤指出，美国关税政策不稳定可能导致2025年下半年商业活动预期明显放缓，营收可能没有明显成长甚至衰退[6] - AI服务器、一般服务器与网通产品因订单能见度高且毛利率较好，在2025年第二季度的提前生产与备货现象中表现显著优于消费电子[6] - Meta表示其AI模型训练方法效仿了谷歌和OpenAI等公司，并声称比许多业内同行更加透明[9]

关税刷屏的一周，AI圈也暗流涌动：Llama 4来了，O3和O4-mini也要来了，DeepSeek R2和GPT-5也不远了？

硬AI· 2025-04-06 14:12

文章核心观点本周科技界聚焦AI领域，Meta发布Llama 4系列，OpenAI确认O3和O4 - mini上线及GPT - 5推迟发布，DeepSeek与清华联合发布新论文推动AI技术发展 [3][4] 各公司动态总结 Meta推出Llama 4系列 - Meta周六发布Llama 4系列，全系采用混合专家架构，实现原生多模态训练，告别纯文本模型时代 [6] - 发布模型包括开源的Llama 4 Scout和Llama 4 Maverick，以及Llama 4 Behemoth预览版，新许可证对使用有一定限制 [6] - Llama 4 Scout速度快，原生支持多模态，有1000万 + Token多模态上下文窗口，可在单张H100 GPU上运行 [9] - Llama 4 Maverick在主流基准测试中击败GPT - 4o和Gemini 2.0 Flash，推理和编码能力与DeepSeek v3相当，激活参数量不到后者一半 [9] - Llama 4 Behemoth仍在训练，定位为“世界上最智能的LLM之一”，展现Meta雄厚实力，有网友指出其训练性能潜力 [10] - Meta计划今年投入高达650亿美元扩展AI基础设施 [14] OpenAI模型发布动态 - OpenAI首席执行官确认O3和O4 - mini未来几周发布，GPT - 5未来几个月发布 [16] - GPT - 5将整合多项功能，成为集成多种工具和功能的综合系统，实现自主使用工具，胜任复杂任务 [20] - GPT - 5将对免费用户开放无限使用权限，付费用户体验更高智力水平版本，因DeepSeek影响考虑免费策略 [20] DeepSeek与清华合作成果 - DeepSeek与清华研究团队联合发布推理时Scaling新论文，提出SPCT学习方法，构建DeepSeek - GRM系列模型 [25] - SPCT方法包括拒绝式微调冷启动和基于规则的在线强化学习优化生成内容，提升奖励质量和推理扩展性 [27] - 引入元奖励模型过滤低质量样本，提升最终输出准确性和可靠性 [28] - DeepSeek - GRM - 27B在多个RM基准测试中表现出色，为AI模型应用提供新技术路径，可能在DeepSeek R2展示成果 [30]

Meta Platforms(US:META)

Artificial Intelligence

Self-Principled Critique Tuning（SPCT）

通用奖励建模（RM）

Artificial Intelligence

Llama 4系列

GPT-5

Artificial Intelligence

Self-Principled Critique Tuning（SPCT）

通用奖励建模（RM）

Artificial Intelligence

Llama 4系列

GPT-5