Llama 1

搜索文档
「纳米香蕉」LMArena两周500万投票,引爆10倍流量,谷歌、OpenAI扎堆打擂台
36氪· 2025-09-04 10:10
LMArena平台表现 - 8月平台流量暴增10倍 月活跃用户超过300万[1][9] - 两周内吸引超过500万次总投票 其中纳米香蕉单独赢得250万+直接投票 创历史最高参与度[1][3] - 平台前身Chatbot Arena起源于2023年伯克利研究项目 采用匿名众包成对比较机制评估大模型[12] 纳米香蕉模型表现 - 8月登顶Image Edit Arena榜首 同时获得Text-to-Image榜单第一名 成为双料冠军[1][17] - 以匿名盲测方式登场 用户需在Battle功能中随机遇到该模型[17] - 实际为谷歌Gemini 2.5 Flash Image模型 在社区引发广泛猜测后由谷歌官方认领[4] 平台运营机制 - 采用Elo计分系统 通过匿名随机配对投票减少品牌光环效应[20] - 累计投票达数百万次 科技媒体频繁引用其数据[20] - 提供跨厂商模型同台竞技 包含开源和闭源模型[22] 行业影响 - 成为谷歌 OpenAI等AI大厂模型评测的核心竞技场[1][9] - 被科技公司视为AI技术风向标 厂商密切关注榜单变化[16] - 为模型厂商提供真实用户反馈报告 帮助迭代改进模型[25] 模型排名数据 - Gemini 2.5 Flash Image以1362分位居Image Edit Arena榜首[18] - 在Text-to-Image榜单中 Gemini 2.5 Flash Image以1147分领先第二名Imagen 4.0 Ultra的1135分[18] - 编码领域Claude表现最佳 创意领域Gemini位居前列[19] 平台发展方向 - 推出WebDev等基于真实使用场景的基准测试[27] - 计划扩展到更多行业 弥合技术与实用场景的鸿沟[28] - 保持数据研究流程透明 发布数据推动社区建设[29]
基模“驱虎”,阿里“吞狼”
36氪· 2025-09-04 01:50
人工智能技术路线与行业格局 - 全球基模形成以OpenAI为代表的闭源和以Meta为代表的开源两条技术路径 [10] - Meta在2023年2月发布首个开源大模型Llama 1 参数规模包括7B/13B/33B/65B [9][10] - 阿里在2023年8月继承开源路线 发布两款开源大模型QWen-7B和QWen-7B-Chat [11] 中国人工智能发展进程 - 2023年国内掀起百模大战 百度于3月16日发布文心一言 自称全球大厂首个大模型 [13] - 行业普遍认为国内大模型技术较ChatGPT落后1-2年 [15] - 2024年成为大模型发展最快且烧钱最快的一年 阿里四个季度AI投入超1000亿元 [21] 阿里云AI战略与成果 - 阿里云2023年确立"AI驱动、公共云优先"战略 向AI云转型 [21] - 2024年云栖大会发布Qwen2.5 72B开源模型 部分性能超越Meta的Llama 3.1 405B [21] - 截至2025年4月 通义开源模型超300个 全球下载量超3亿次 衍生模型超10万个 [23] 成本优化与商业表现 - 2024年大模型经历多轮降价 调用成本下降99% 百万Token成本降至不足1元 [27] - 阿里云AI相关产品收入连续七个季度三位数增长 2025财年实现双位数增长 [27] - 2025年财报发布后阿里股价飙升19% 港股市值增长超4000亿港元(约3600亿元) [32] 基础设施与生态建设 - 阿里云构建全栈AI体系 涵盖芯片/算力集群/平台工具/基模等关键环节 [25] - 国内人工智能产业分为数据/算法/应用三层 数据集团于2025年7月成立 [30] - 通用基础模型已支撑首波商业化应用 进入小参数模型驱动智能硬件阶段 [32]
Meta taps former Google DeepMind director to lead its AI research lab
TechCrunch· 2025-05-08 18:39
人事变动 - Meta任命Robert Fergus担任基础人工智能研究(FAIR)实验室负责人 其此前在Google DeepMind担任研究总监近五年 更早曾在Meta担任研究科学家 [1] - Meta前AI研究副总裁Joelle Pineau于4月宣布离职 [2] FAIR实验室现状 - FAIR实验室成立于2013年 主导开发了Llama 1和Llama 2等早期AI模型 [2] - 近年面临人才流失问题 大量研究人员转投初创公司、其他企业或Meta内部新成立的GenAI团队(负责Llama 4开发) [2]