Claude Max

搜索文档
Claude 急了!模型降智,官方长文用 bug 搪塞?开发者怒怼“太晚了”:承认不达标为何不退钱?
AI前线· 2025-09-22 06:18
"产品质量这么差。我之前不明白为什么,现在明白了。"开发者 Tim McGuire 在帖子下表示。 "我也是。同以前相比,之前用起来感觉就像有个可以分派任务的初级工程师,事情能完成,代码至少还算过得去。但最近的 体验,更像是在和一只猴子打交道。"开发者 Peermux 说道。 Anthropic 将 8 月至 9 月初期间的模型质量下降问题,归咎于三项基础设施漏洞的影响。8 月初,许多用户开始上报 Claude 响应降级问题。Anthropic 坦承当时未能发觉用户反馈与正常波动之间的差异。到 8 月底,同类报告的频率和持续性越来越 高,为此其展开调查,并发现三项互不关联的基础设施 bug。 "首先澄清一点:我们绝不会因需求、时间或者服务器负载情况的变化而降低模型质量。 用户上报的问题纯由基础设施 bug 所 导致 。"Anthropic 强调。 Anthropic 还表示,"我们深知用户希望 Claude 始终提供稳定的质量表现,为此我们设定了极高的执行标准,以确保基础设施 变更不会影响模型输出。但从近期事件来看, 我们未能真正落实这些标准 。以下剖析报告将解释发生了什么、为何检测和解 决问题的时间比我们预 ...
Claude估值暴涨300%!全球独角兽字节第三他第四
量子位· 2025-09-03 01:42
融资与估值 - F轮融资130亿美元 刷新AI行业单轮融资纪录[2][7] - 估值达1830亿美元 较年初615亿美元暴涨近300%[2][8] - 成为全球第四大估值初创公司 仅次于SpaceX、OpenAI和字节跳动[2] 投资方阵容 - 由Iconiq Capital领投 Fidelity Management&Research Company和Lightspeed Venture Partners联合领投[8] - 卡塔尔投资局、黑石、General Catalyst等全球顶级资本参与[8] - 出现主权财富基金身影 包括卡塔尔投资局和新加坡GIC[10] 业务增长表现 - 年化营收从10亿美元跃升至50亿美元 仅用半年时间[3][14] - AI编程业务Claude Code年收入突破5亿美元[3][15] - 企业客户超30万家 年收入超10万美元大客户数量同比增长近7倍[16] 产品与市场策略 - 推出Claude Code、Pro和Max套餐 覆盖开发者与个人用户[19] - 服务范围从财富500强公司到AI原生初创公司[17] - 融资资金将用于基础设施拓展、AI安全研究及全球市场推广[19] 行业趋势影响 - 大模型领域马太效应显现 融资集中度加剧[5][6] - 融资额远超初始50亿美元目标 最终达130亿美元[11] - 在资本市场趋谨慎背景下 此次融资规模凸显行业分化[10]
整理:每日科技要闻速递(7月29日)
快讯· 2025-07-28 23:48
人工智能 - 阿里云正式开源通义万相2 2版本 [2] - 智谱发布首款SOTA级原生智能体大模型 [2] - 微软在Edge浏览器中加入AI Agent功能 实现自动化搜索、预测和整合 [2] - Anthropic将从8月28日起对Claude Pro和Max推出新的每周使用限制 [2] 算力支持 - 上海发放6亿元算力券以降低智能算力使用成本 [2] 芯片供应 - 三星与特斯拉达成165亿美元芯片供应协议 将在美国生产AI6芯片 [2] 自动驾驶 - 上海市经信委计划年内实现浦东除陆家嘴外全域开放自动驾驶 [2] - 上海发放首批智能网联汽车示范运营牌照 文远知行等8家公司获准 [2] - 2025世界智能网联汽车大会将于10月16日至18日召开 多款自动驾驶系统车辆将亮相 [2] 行业政策 - 美商务部拟推出专利新收费机制 按专利总价值1%-5%收取 [2] - 工信部表示将巩固新能源汽车行业"内卷式"竞争综合整治成效 [2] 企业动态 - 抖音澄清网传"员工离职后被字节跳动随意取消期权"与事实不符 [2]
Claude Code 首席工程师揭秘 AI 如何重塑开发日常!
AI科技大本营· 2025-06-07 09:42
AI编程工具Claude Code的核心能力 - 终端环境无缝集成:Claude Code直接在开发者熟悉的终端运行,无需切换IDE或工具,支持iTerm2、苹果终端及SSH远程连接等场景[6][8] - 智能主动式编程:模型能自主理解指令并调用工具(如bash、文件编辑)探索代码库,完成多步骤修改,远超传统代码补全功能[20][22] - 跨语言大型代码库支持:无需额外索引步骤即可处理复杂代码库,适配所有主流编程语言,尤其受企业用户青睐[16][30] 产品开发与市场反馈 - 内部验证驱动开发:Anthropic全员使用该工具进行"自己先用"(Dogfooding)验证,工具代码80%由自身迭代生成[12][14] - 爆发式用户增长:发布三个月内日活曲线呈垂直上升,企业用户月均消费达50-200美元,与Claude Max订阅套餐深度绑定[13][15][17] - 新模型赋能:Claude 3.5 Sonnet和Opus模型使代码生成准确率显著提升,单元测试一次通过率接近100%[25][26] 编程范式革命 - 从打孔卡到提示词:编程形态历经打孔卡→汇编→高级语言→IDE预测→AI提示词的进化,现代开发者更多转向代码审查而非手写[22][23][24] - 智能体协作模式:开发者可同时运行多个Claude实例处理不同任务,或通过GitHub Actions后台调用AI自动提交PR[27][32] - 工作流分级管理:简单任务(如测试生成)可全权委托AI,复杂工程问题采用人机交互式协作完成[33][34] 核心技术应用技巧 - Claude.md文件系统:通过Markdown文件实现团队知识共享(全局/项目级指令)、个人偏好设置(.local.md)及上下文记忆管理[38][42][43] - 计划优先策略:高级用户引导AI先制定编码方案再执行,结合"拓展思考"模式(读取文件→暂停思考→执行)提升成功率[35][36][37] - IDE增强体验:在VS Code等集成终端中使用时可自动同步文件修改,并利用IDE元数据提升模型智能度[8][9] 行业影响与未来方向 - 软件工程角色重构:开发者逐步转向AI智能体指挥者,行业需适应从代码编写到审查的思维转变[30][31] - 工具链扩展计划:重点优化与CI系统兼容性,探索聊天应用等轻量化交互场景,实现"无处不在"的AI编程支持[46][47] - 生产力跃升:内部基准测试显示,结合上下文读取→思考→执行的流程可使任务完成质量提升300%以上[37]
Anthropic重磅研究:70万对话揭示AI助手如何做出道德选择
36氪· 2025-04-22 08:36
研究背景与方法 - Anthropic公司对AI助手Claude展开首次大规模价值观实证分析 基于70万段匿名对话数据构建评估体系 [1] - 研究团队开发全新分类方法 分析30.8万次互动 建立包含5大类3307种独特价值观的实证分类体系 [2] - 分类体系涵盖实用性价值观、认知性价值观、社会性价值观、保护性价值观和个人性价值观五大类别 [2] 主要研究发现 - Claude在70万段对话中总体遵循"有益、诚实、无害"原则 强调赋能用户、认知谦逊和患者福祉等亲社会价值观 [1][5] - AI系统展现情境化价值观调整能力:人际关系建议中强调健康界限与相互尊重 历史分析时优先考虑历史准确性 [6][7] - 在28.2%对话中强烈支持用户价值观 6.6%交互中通过添加新视角重构价值观 3%对话中积极抵制用户价值观 [9] - 发现罕见异常情况包括表达支配欲和非道德性价值观 研究人员认为这与用户绕过安全防护机制的"越狱"行为相关 [5] 技术突破与行业意义 - 采用机械可解释性方法进行逆向工程 通过"显微镜"技术追踪Claude决策过程 发现其写诗时预先构思、数学解题采用非传统思路等违反直觉现象 [10] - 研究揭示AI解释与实际运行机制存在偏差 Claude解释数学运算时提供标准算法而非真实内部逻辑 [10] - 价值观一致性被证明是连续谱系而非二元问题 企业需在监管严格行业特别关注高风险场景中的非预期偏见 [11] - 强调系统性评估需基于实际部署数据 仅依赖发布前测试不足以及时发现伦理偏差或恶意操控 [11] 商业应用与竞争格局 - Anthropic推出Claude Max高级订阅服务 月费200美元 直接对标OpenAI竞品 [4] - 拓展Claude功能包括Google Workspace集成和自主研究能力 定位为企业用户的虚拟协作伙伴 [4] - 公司获得亚马逊140亿美元投资和谷歌超过30亿美元支持 估值达615亿美元 但较OpenAI的3000亿美元估值存在显著差距 [13] - 公开价值观数据集推动行业研究 将透明度作为差异化竞争战略 [13] 研究局限与发展方向 - 研究方法存在主观性挑战 价值观表述界定和分类过程可能受AI自身偏见影响 [14] - 当前方法依赖大量真实对话数据 无法用于部署前评估 但正开发衍生方法以在部署前识别价值观问题 [15] - 随着AI自主性增强(如独立研究和全面接入Google Workspace) 理解并校准价值观变得愈发重要 [15]