Llama 3

搜索文档
国内首个大模型“体检”结果发布,这样问AI很危险
36氪· 2025-09-22 23:27
近日,国内首次针对AI大模型的实网众测结果正式公布,一场大型"安全体检"透露出不容忽视的信号:本次活动累计发现安全漏洞281个,其中大模型特 有漏洞高达177个,占比超过六成,这组数据表明,AI正面临着超出传统安全范畴的新型威胁。 如今,很多人习惯把大模型当作"超级搜索引擎",事无巨细地向AI提问。但这种毫无防备的信任,很可能正悄悄推开隐私泄露的大门…… 国产大模型漏洞较少 你是否习惯把AI当作"全能顾问"——问健康、问情感、问决策?OpenAI联合杜克大学、哈佛大学9月16日发布的最新研究显示,截至今年7月,ChatGPT每 周活跃用户超7亿,发送信息量高达180亿条。其中近一半属于"询问"类,是最主流的使用方式。 "这恰恰是隐私泄露的'重灾区'。"安全专家、网络尖刀创始人曲子龙对《IT时报》记者表示,很多用户向AI咨询疾病、情感、财务等高度私密的问题,却 没有定期清理聊天记录的习惯。一旦模型或服务器被攻破,这些敏感数据极易泄露。 上述漏洞众测活动还公布了五大典型漏洞风险:一是部分产品存在不当输出类漏洞且危害严重;二是信息泄露类漏洞多发,存在较大安全隐患;三是提示 注入类漏洞普遍,是大模型最常见的漏洞风险; ...
朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
虎嗅· 2025-09-20 14:15
开源AI模型趋势 - DeepSeek等中国开源模型显著影响行业 保证AI技术不被少数私有化公司控制 开源成为AI领域主流趋势[3] - Hugging Face平台中国开源模型下载量已超过美国 开源模型与闭源模型能力差距正迅速缩小 预计半年到一年内可齐头并进[4] - 形成"中国开源vs美国闭源"竞争格局 美国开发者也在采用开源模型 开源生态一旦建立将形成长期壁垒[5][6][7][9] AI应用核心壁垒 - Manus案例显示Go-to-Market能力是关键壁垒 中国创业者技术能力不逊色但市场进入策略存在短板[10] - AI应用公司首要壁垒是发展速度 需要让竞争对手感到绝望的快速增长 其次才是用户留存能力[11] - 中美市场存在Token消耗差异 中国更关注Token消耗量作为"含AI量"指标 日均消耗达百亿级别 大厂提供补贴使性价比显著提升[12][13][14] AI编程赛道分析 - AI编程是大厂主导领域 中美都在进行补贴 美国补贴AI Coding 中国补贴外卖 几乎都是负毛利运营[15] - Cursor从月费改为按流量收费 显示ARR难以维持 负毛利达300%-500% 收入增长越快VC补贴压力越大[16] - 程序员群体忠诚度低 对价格和性能高度敏感 切换成本极低 OpenAI的API调用量曾因Gemini新版本发布而急剧下降[18] 机器人投资策略 - 重点关注能实际干活的"牛马型机器人" 如洗船机器人和按摩机器人 虽然外观不讨巧但能创造真实商业价值[21] - 按摩机器人不仅能按摩理疗 还能实现卖卡功能 转化率甚至高于人工 真正取代整个岗位而非"半个人"[22][23] - 机器人ROI计算必须完整取代岗位 很多创业公司陷入只能取代"半个人"的陷阱 导致ROI测算不真实[22] AI硬件发展逻辑 - AI硬件成功关键是做减法而非加法 优先保证大批量发货能力 许多公司因添加花哨功能无法交货而失败[28] - Plaud案例显示应选择小切入点 使用成熟技术实现商业化 FuzozoAI玩具本质是游戏玩法创新 AI只是噱头[28] - AI时代独有新硬件物种尚未出现 取代手机非常困难 电池 存储 联网等技术瓶颈可能需要10-20年突破[29][30] 全球化战略 - 中国C端App在全球市场具有绝对优势 过去十年超过百亿美金的C端App几乎全是中国创业者开发 美国VC已基本不投Consumer领域[37] - To B应用面临Go-to-Market挑战 PLG模式可做到2000-3000万美金ARR 但要突破5000万美金必须转型SLG模式[38][39] - 出海市场选择取决于团队背景 F-35级别打美国市场 F-20级别打日本市场 F-16级别打东南亚市场[39] 估值与资本环境 - 高估值会压缩犯错空间 移动互联网时代很多大厂高管创业即获5000万美金估值 但产品上线后第二轮融资就失败[43] - 中国美元基金资金量减少 因大量LP资金被锁在字节 小红书 蚂蚁等未上市公司 总市值约1.5-2万亿美金[45] - 香港成为主要IPO目的地 中国企业应选择在香港上市 全球投资人都认可香港市场的资产购买价值[47] AI创业投资策略 - 投资回报期指现金回收时间 希望市场投放资金在3-6个月内回笼 最佳情况是首月投1元收回0.8元 六个月后能收回2元[50] - 早期投资更关注用户参与度指标 如日活率 周活率 留存率 使用时长等 而非仅看收入数据[51] - AI时代演化速度是移动互联网的三倍速 创业者需在离大厂三条马路之外寻找机会 并以三倍速发展[53]
GPT-5能啃下多少行业硬骨头
21世纪经济报道· 2025-08-08 05:11
GPT-5技术突破 - GPT-5是融合模型,能根据问题复杂度自动调整思考深度,在速度与准确性间取得平衡[2][7] - 在数学推理(AIME 2025测试94.6%)、多模态理解(MMMU 84.2%)、医疗健康(HealthBench Hard 46.2%)等基准测试创下新高[4] - 编程能力显著提升:SWE-bench Verified测试74.9%,Aider polyglot测试88%,可生成数百行可运行代码且无需调试[4] 行业应用深化 - 医疗领域表现突出,被描述为"最准确的医疗问题解答模型",能结合患者个人情况提供细致建议[6] - 编程场景落地成熟,Meta预计明年50%代码由AI编写,微软当前20%-30%代码为AI生成[5] - 在40多种职业任务中表现优于人类专家,覆盖法律、物流、销售等高附加值领域[10] 商业化战略调整 - 年化经常性收入从6月100亿美元跃升至130亿美元,预计年底突破200亿美元[8] - 推出1美元政府服务计划,与美国国防部签署2亿美元合同,重点拓展企业及政府市场[8][9] - 当前75%收入依赖消费者订阅,企业市场份额25%落后于Anthropic(32%)[10] 市场竞争格局 - 面临谷歌Genie 3、Meta Llama 3及中国Qwen 3等竞品压力[8] - Anthropic凭借安全性占据金融/医疗市场,谷歌依靠云基础设施提供一站式方案[10] - 公司计划2026年在华盛顿设立办事处,强化政府关系[9]
美国启动“ATOM计划”,对抗中国“千问”开源领先地位
观察者网· 2025-08-06 09:14
中国开源AI发展现状 - 阿里巴巴通义千问系列大模型成为全球开发者偏好的免费模型 因其是当前性能最强大的免费开源模型[1] - 全球性能最强的15个AI大模型中仅有5个开源模型且全部由中国AI企业开发[1] - 中国企业在开源AI领域取得显著突破 仅2023年7月阿里巴巴就发布四个领先的开源AI模型[1] 美国开源AI竞争态势 - 美国同期未发布任何具有全球影响力的新一代开源大模型 凸显其在开源生态建设上的明显短板[1][2] - Meta公司自4月发布Llama 3后更新令人失望 且首席执行官宣布未来在开源问题上将更加谨慎[2] - 美国科技界和政策制定者对中国开源AI发展保持高度警觉[1] 美国ATOM计划战略部署 - 计划建立总部位于美国的非营利性AI实验室 专注于开发真正开放的AI模型[2] - 核心算力配置将超过10,000块最先进GPU芯片 相当于大型科技公司AI项目的算力规模[2] - 需要至少1亿美元资金投入用于获取顶级GPU算力支持[3] 行业支持与影响 - 获得十余位行业领袖联署支持 包括Hugging Face首席执行官、斯坦福大学教授、英伟达总监及OpenAI高管等[2] - 分析人士警告若计划失败 美国可能丧失对全球AI技术发展方向的影响力[3] - 开源AI竞争已超越技术层面 成为生态、理念与全球话语权的博弈[3]
Meta's AI spending spree is Wall Street's focus in second-quarter earnings
CNBC· 2025-07-29 12:00
公司财务表现 - 第二季度收入增长放缓至15% 低于去年同期的22% 为2023年初以来最慢扩张速度[1] - 2025年总支出预计介于1130亿至1180亿美元之间 AI人才招聘可能使支出超过区间低端[2] - 公司将投入"数百亿美元"建设AI计算基础设施[19] AI战略转型 - 公司决定模仿中国初创企业DeepSeek的技术 但Llama 4版本令第三方开发者失望[6] - 因AI模型表现不佳 公司斥资数十亿美元重组AI部门并考虑进一步战略调整[6] - 从竞争对手招聘多名顶级研究人员 包括ChatGPT联合创始人Shengjia Zhao担任AI实验室首席科学家[3] 人才招聘与组织架构 - 6月投资14.3亿美元于Scale AI 使其CEO Alexandr Wang加入并负责核心AI单元[4] - 新成立Meta Superintelligence实验室由Wang和前GitHub CEO Nat Friedman共同领导[4] - 未能成功收购AI初创企业Safe Superintelligence 但聘请了其联合创始人Daniel Gross[3][4] 技术路线调整 - DeepSeek开源R1模型采用混合专家(MoE)架构 相比密集模型训练和运行成本更低[12][14] - 公司原计划保持密集模型架构以支持语音识别功能改进 但最终转向MoE方法[15][16] - Llama 4未能实现相对于中国开源模型的显著领先 开发者仍偏好Llama 3[10][17] 开源策略重新评估 - 高管和新聘人才质疑当前开源AI策略 考虑跳过"Behemoth"版本发布转向开发专有模型[18] - 公司表示开源立场未变 计划继续发布领先开源模型 同时训练开放和封闭混合模型[18] - 类似PyTorch工具 Llama系列遵循开源许可条款向社区免费提供[9] 市场竞争态势 - OpenAI和Anthropic等实验室积极推动MoE模型开发 但设计细节对外保密[13] - AI人才争夺战类似2017年自动驾驶狂热 企业提供"疯狂薪酬方案"争夺顶尖人才[22] - 所有主要AI公司均在招聘人才并投入数十亿美元开发各自AI模型[23] 投资者反应与行业前景 - 投资者对AI支出和战略转变接受度提高 与几年前推元宇宙时形成对比[23] - 美国银行分析师认为公司对计算资源的投入显示对收入轨迹的信心[20] - 行业整体对AI投入热情高涨 形成"赢家通吃"市场动态[22][24]
一觉醒来,硅谷被他挖空了
36氪· 2025-07-18 12:41
核心观点 - Meta通过巨额资金投入和挖角顶尖人才加速AI领域布局,但"钞能力"可能面临企业文化整合和长期成效的挑战 [6][11][35] 算力基础设施 - Meta宣布建设全球首个1吉瓦能耗超级计算机机群,并筹备5吉瓦算力集群 [4] - 对比马斯克90亿美元打造的30万张英伟达B200集群(能耗200-300兆瓦),Meta算力投入规模显著更大 [5] 人才争夺战 - 一个月内从OpenAI、谷歌DeepMind和苹果挖走十几人,包括: - 前苹果基础研究团队负责人庞若鸣获2亿美元薪酬 [7] - 4名前OpenAI顶级研究员获4年3亿美元薪酬 [7] - 为部分OpenAI员工开出1亿美元签约奖金 [23] - 成立超级智能实验室,以143亿美元收购Scale AI 49%股权换取其CEO汪滔加盟 [16] - 挖角策略注重心理战,趁OpenAI放假期间快速行动 [24][26] 技术布局 - AI团队架构: - 汪滔领导基础研究、产品团队和FAIR实验室 [16] - 苏黎世"三人组"(含华人科学家翟晓华)主攻多模态大模型 [31] - 特拉皮特·班萨尔强化推理与强化学习能力 [31] - 4位华人专家提升Llama 5模型能力 [31] - 当前能力评估: - 数据与模型训练、多模态达顶级水准 [32] - 模型推理与规划、强化学习和LLM架构属第二梯队 [32] - AI安全与伦理、开发者生态与开源处于第三梯队 [32] 潜在问题 - 内部文化混乱:近2000人AI部门存在目标不清晰、恐惧文化盛行、部门割裂问题 [38][39] - 历史案例警示:迪士尼、雅虎、美林银行等大规模高薪挖角曾导致失败 [40][42] - 体育行业类比:巴黎圣日尔曼高价引进内马尔(2.22亿欧元)和梅西最终未达预期 [44]
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
量子位· 2025-06-26 03:43
核心观点 - 美国法院首次裁定AI公司可在未经作者许可情况下使用合法购买的已出版书籍训练AI 依据合理使用原则认定AI训练属于转化性使用 未取代原作市场且有利于技术创新[2][3][17] - 法院明确区分数据来源合法性 盗版书籍训练不构成合理使用 需承担侵权责任 但合法采购书籍的扫描副本可用于训练[15][16][33] - 裁决显著降低AI行业训练数据的版权风险 为LLMs发展提供法律支持 可能影响OpenAI和Meta等同类案件审理[3][32][34] 案件背景 - Anthropic被指控在2021-2022年通过盗版网站LibGen等非法下载超700万份受版权保护书籍建立数字图书馆 2023年使用子集训练Claude模型[7][8][10] - 2024年转向合法采购 雇佣前Google图书扫描项目负责人Turvey采购数百万本纸质书 但未持续跟进出版商授权沟通[11][12] - 2024年8月三位作家起诉其非法复制作品训练AI 法院最终支持合法来源数据的使用权[6][13] 法律依据 - 援引美国版权法"合理使用"原则 认定AI训练具有高度转化性 输出内容未侵犯原作且未形成市场替代[2][14] - 参考历史判例:2015年Google Books案确立数字化检索属合理使用 2022年GitHub Copilot案确认代码训练转化性[24][25][29] - 法院强调技术中立性 类比人类阅读学习过程 认为AI消化书籍信息应获同等权利[4][18] 行业影响 - 加速AI公司数据获取合规化进程 Anthropic等企业需建立正版采购渠道 避免盗版资源[11][15] - 技术解决方案受推动 GitHub Copilot已部署代码来源标注功能 防范许可证冲突[29][30] - 创作者权益保护机制待完善 需探索新型授权模式应对AI训练需求[19] 争议焦点 - 法律界对"转化性使用"标准存在分歧 部分观点认为AI大规模复制不同于人类学习[19] - 开源社区担忧商业公司滥用合理使用条款 将免费资源转化为付费服务[28][29] - 出版商面临正版采购与盗版监控的双重成本压力[12][31]
人工智能周报(25年第23周):OpenAI 公布 GPT-5 路线图,腾讯升级企业大模型知识库-20250613
国信证券· 2025-06-13 09:11
报告行业投资评级 - 优于大市 [1][4] 报告的核心观点 - 互联网一季报业绩整体稳健,电商行业竞争激烈,各平台向商家让利或在外卖即时零售领域加大投入寻找新增量;AI 方面巨头业务场景持续受益,但短期 ai agent 等方面仍需打磨;当前恒生科技指数处于震荡期,推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2][32] 相关目录总结 AI 相关网站流量数据 - 展示了 2025 年 5 月 28 日至 6 月 3 日期间部分 AI 相关网站周平均访问量、访问量环比增长和平均访问停留时间等数据,如 ChatGPT 周平均访问量 1248.00M,环比增长 -0.24% [10] 公司动态 - OpenAI 公开 GPT - 5 路线图,预计 7 月发布,还更新 ChatGPT 商业计划,新增功能并引入灵活定价机制面向商业客户开放 [17] - 谷歌测试新 AI 搜索展示方式,将 AI 生成摘要折叠,平衡生成式搜索与网页导流利益关系 [19] - Meta 开放 Llama 3 商业化接入,与 AWS 深度集成抢占企业市场 [20] - 英伟达举办 GTC 大会,重申 AI 基建主导地位,强调边缘侧推理作用,携手企业展示应用场景并加快本土化节奏 [21] - 亚马逊广告业务加码生成式 AI,推出 AI Studio 广告内容自动生成平台,试点核心市场 [22] - 腾讯云升级企业大模型知识库为智能体开发平台,接入相关模型和联网搜索,还计划推出和开源部分模型 [23] - 字节跳动旗下 Seed 团队开源统一多模态理解和生成模型 BAGEL,在多模态领域表现出色 [25] 底层技术 - 微软 Azure Foundry 新增“安全性”维度对约 1900 款模型进行内容风险量化评估,安全评分融入工具链 [26] - 谷歌更新 Gemini 2.5 Pro 预览版模型,评分上升,优化风格与结构,放宽请求限制 [27] - 智源研究院发布“悟界”系列大模型,体现 AI 发展新趋势 [28] - 阿里巴巴开源全新向量模型系列 Qwen3 - Embedding,性能较上一版本提升 40% [29] 行业政策 - 工信部研究推动人工智能产业发展和赋能新型工业化思路举措,推动大模型落地,统筹推进标准工作等 [30] - 工信部审议《工业和信息化部信息化和工业化融合 2025 年工作要点》,要求实施“人工智能 + 制造”行动 [31] - 成都市就促进人工智能产业高质量发展政策措施征求意见,涵盖多方面举措 [31] 重点事件预告 - 6 月 9 日 - 13 日举办 Apple WWDC 2025 开发者大会 [34] - 6 月 9 日 - 11 日举办 AIM - 2025 国际人工智能与机器学习大会 [34] - 6 月 11 日 - 12 日举办火山引擎原动力大会 [34] - 6 月 14 日 - 15 日举办第四届智能决策论坛 [34] 投资建议 - 推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易 [2][32] 重点公司盈利预测及投资评级 | 公司代码 | 公司名称 | 投资评级 | 昨收盘(港元/美元) | 总市值(百万港元/美元) | EPS(2025E) | EPS(2026E) | PE(2025E) | PE(2026E) | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 0700.HK | 腾讯控股 | 优于大市 | 505.0 | 4,640,972 | 23.29 | 26.33 | 17.4 | 15.7 | | 9999.HK | 网易 - S | 优于大市 | 197.3 | 625,038 | 10.76 | 11.54 | 15.5 | 14.7 | | 3690.HK | 美团 - W | 优于大市 | 136.6 | 834,603 | 6.04 | 7.96 | 17.9 | 13.9 | | 9888.HK | 百度集团 - SW | 优于大市 | 82.1 | 225,789 | 7.83 | 8.42 | 8.8 | 8.0 | | 1024.HK | 快手 - W | 优于大市 | 51.2 | 219,726 | 4.06 | 4.96 | 10.2 | 8.7 | | 9988.HK | 阿里巴巴 - SW | 优于大市 | 113.9 | 2,174,122 | 6.89 | 7.64 | 12.5 | 11.4 | [3]
Meta makes major investment in Scale AI, takes in CEO
TechXplore· 2025-06-13 08:10
投资交易 - Meta对Scale AI进行重大投资 估值超过290亿美元 [3] - Meta投资金额超过100亿美元 同时获得Scale AI创始人兼CEO Alexandr Wang加入 [4] - Meta将持有Scale AI少数股权 具体比例未披露 [9] - 交易完成后 Uber Eats联合创始人Jason Droege将接任Scale AI CEO [9] 公司战略 - Scale AI专注于为商业、政府和实验室提供人工智能解决方案 [5] - 公司将利用新资金加速创新 加强合作伙伴关系 并向股东分配收益 [9] - Scale AI已发展到1500多名员工规模 [5] - 公司部分员工将随创始人一起加入Meta参与AI项目 [6] 技术合作 - Scale AI与Meta合作开发基于Llama 3模型的国防AI系统"Defense Llama" [7] - 该模型专门用于美国国家安全任务 包括军事行动规划和敌方弱点分析 [7] - 系统具备评估场景和回答战术问题的能力 如敌方攻击方式和有效应对措施 [8] - Scale AI承诺持续与国防部门合作 确保模型可靠性 [8] 行业动态 - Meta首席Mark Zuckerberg透露其生成式AI助手每月有10亿用户使用 [10] - 该交易发生在Meta与OpenAI、Google和微软等公司的激烈AI竞争中 [4] - Scale AI创始人表示AI发展前景无限 公司致力于连接人类价值与技术潜力 [5]
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
量子位· 2025-06-10 04:05
DeepSeek-R1性能表现 - 最新优化版R1-0528在编程榜单aider上取得60分 超过Claude 4 Sonnet的56.4分以及1月满血版R1 [1] - R1-0528满血版在aider得分71.4分 超过不开启思考的Claude 4 Opus [5] - aider榜单侧重现实软件工程任务评估 非单纯解题能力 [2] 量化技术突破 - 1.93bit量化版文件大小比8bit原始版降低70%以上 [3][9] - 最小1.66bit版本文件仅162GB 比8bit版缩减80% [9] - Unsloth工作室推出9种量化版本 涵盖1.66bit至5.5bit [7][8] - 推荐2.4bit和2.7bit版本 实现精度与体积最佳平衡 [14] 硬件适配性 - 1.78bit版本搭配64GB内存可实现每秒1token生成 [10] - 24GB显存显卡(如3090)配128GB内存可达每秒5token [11] - 建议180GB以上统一内存或显存+RAM组合以突破5token/秒 [12] Unsloth工作室技术能力 - 微调模型覆盖DeepSeek、Qwen、Phi、Mistral、Llama等主流模型 [16] - 优化后模型内存占用减少50%-80% 速度提升50%-2.2倍 [17] - GitHub仓库获4万星标 推出蒸馏版Qwen3-8B性能对标235B大模型 [16][19] 游戏场景表现 - R1-0528在Lmgame Bench六款游戏中表现突出 俄罗斯方块成绩超越o4-mini [22][25] - 糖果传奇得分548分 领先o4-mini约20分 [32] - 推箱子、2048等游戏表现较1月版本有显著提升 [28]