AI Agent
搜索文档
从《塞尔达传说》理解 Agent 的上下文工程:Claude Skills 还是被低估了
Founder Park· 2025-11-18 07:59
Claude Skills的核心设计哲学 - Claude Skills是一种AI Agent能力扩展机制,通过将指令、脚本和资源组织成标准化技能包,让通用Agent转化为特定任务专家[4][8] - 其关键创新在于信息分层设计哲学,借鉴了3D游戏的细节分层(LOD)和按需加载技术,使Agent能够像人类一样先看索引、再看摘要、最后按需查原文[5][9] - 这种设计可节省高达95%的Token消耗,同时显著提升决策质量和响应速度[6][9] 信息分层架构的具体实现 - 采用三层架构:LOD-0摘要层(名称和描述,约20-50 tokens)、LOD-1核心层(完整功能说明,约1-3k tokens)、LOD-2原始层(完整原始信息,按需加载)[29][31][32] - 每层对应不同的加载时机和用途:LOD-0在启动时预加载构建全局认知,LOD-1在判断相关后按需加载支持核心工作,LOD-2在处理复杂场景时精确查询[31][36][44] - 架构深度耦合查询工具系统,LOD-0到LOD-1使用文件读取工具,LOD-1到LOD-2使用具备过滤能力的工具如SQL和grep[47][48][50] 实战应用效果 - 在企业数据分析场景中,传统方法消耗约150,000 tokens,而三层架构仅需约5,000 tokens,节省96.7%[60] - 响应时间从45秒缩短至5秒,提升9倍效率,调用成本降低30倍[60] - 通过预计算高质量摘要实现"计算换Token"策略,用一次性廉价计算资源换取每次调用的Token节省[56] 架构优势与挑战 - 优势在于处理大型复杂信息体时避免Agent"信息溺水",特别适合必须通过过滤、查询或聚合才能有效使用的场景[43][45] - 挑战包括高质量LOD-1摘要的构建成本需要专业工程师投入,以及信息同步的维护成本防止"信息漂移"[63][64] - 设计复杂度较高,需要系统性思考信息组织与查询工具的耦合,避免对简单信息过度分层[65] 通用设计原则 - 核心原则是用元信息替代完整信息,绝大多数决策初期只需元信息或摘要信息而非原始信息[67] - 按需加载而非预加载,只在明确需要时通过工具精确获取最少必要信息[71][72] - 架构具有分形特性,可递归嵌套应用于不同层级的信息系统管理[79][82]
中国AI Agent产业化参考范本:斑马口语攻克的四大技术难关
机器之心· 2025-11-18 05:08
行业趋势转向 - AI产业正经历从通用能力探索到垂直行业落地的关键转折,决定AI商业价值的战役已在教育、医疗、客服等具体领域打响[2] - 通用大模型试图在所有场景下表现良好,却在任何场景下都难以做到极致,难以直接承担关键生产任务,真正的产业化落地必然发生在垂直场景[4] - 在线口语教学是最适合AI Agent落地的垂直场景之一,因其有明确的教学目标、可量化的学习效果、标准化的内容体系以及个性化互动需求[4] 斑马口语产品定位 - 公司推出业内首个真正实现AI外教一对一的产品「斑马口语」,是真正意义上在垂直行业落地的AI Agent[2] - 产品解决方案基于通用大模型能力,针对6-12岁儿童英语口语场景做深度定制,目标是打造真正「会教英语」的一对一AI外教,而非仅仅「能聊英语」的AI助手[5] - 教育场景对AI要求苛刻,AI外教需能判断发音标准度、情绪、理解程度并实时调整教学策略,且必须适龄,不能输出不当内容或事实性错误[4] 技术突破:实时交互 - 为实现自然对话,AI外教响应延迟需控制在合理范围,分层延时目标为即时反馈1.5秒内,标准响应1.5到2.5秒内[9] - 完整语音交互链路(ASR、大模型推理、TTS、网络传输)总延迟易超过2.5秒,在教学场景下不可接受[9] - 公司采用全链路流式处理架构,将各环节由串行等待改为流水线并行,并结合智能调度策略与WebRTC协议,将端到端延迟压至1.5到2.5秒目标范围[10] 技术突破:语音识别 - 英语教学对语音识别要求远超普通语音助手,需精准识别易混音素并给出音素级反馈,低龄儿童发音不标准率可能超过40%[11] - 系统需应对真实环境音频干扰,并解决VAD判停策略难题,避免打断孩子思路或导致交互混乱[12] - 公司采用智能VAD判停策略,结合音频能量、静音时长、语义完整度三维判断,并根据教学环节动态调整判停阈值[12] 技术突破:内容安全与适龄 - 教学场景需要严格的目标导向和内容可控,大模型的开放性和随机性可能导致错误知识或不适合儿童的内容输出[14] - 公司建立多层防护体系,包括在模型训练阶段进行数据严格筛选与安全强化训练,上线前进行全面测试集验证,运行时接入传统风控系统实时拦截与在线会话质检监控[15][16] 技术突破:多模态呈现 - 现代在线教学需实现语音、动画、文字、特效等多种元素的时序精确配合,同步误差超过200毫秒就会产生「对不上」的感觉[17] - 公司设计统一的时序编排引擎,所有模态元素在统一时钟下调度,并实现自动补偿机制以保持整体同步[17] - 采用「边生成边渲染」的流式策略与自适应性能降级机制,根据设备性能动态调整呈现策略,确保体验流畅[18] 市场竞争与公司优势 - AI教育赛道参与者众多,如谷歌、可汗学院等,但其产品多停留在「AI辅助学习」层面,工具属性强,而非真正意义上的「教学」[19] - 公司产品在实现AI主导教学、像真人老师一样引导系统化学习方面处于领先地位,优势建立在近60万节真实对话数据、1500万分钟交流记录以及长期技术积累之上[19] 行业影响与前景 - 产品成功正在重构口语教育赛道竞争规则,竞争焦点从外教资源、师资数量转向AI Agent打造能力,标准提升至AI外教能否做到比真人更稳定、更个性化、更具可扩展性[22] - 垂直AI Agent的成功为其他行业提供范本,未来可能涌现医疗问诊、心理咨询、法律咨询等领域的专业Agent,形成全新AI服务生态[22] - 中国企业在垂直AI应用上有能力做到全球领先,庞大的市场规模、丰富场景和快速迭代能力将成为巨大优势[22]
深度|CB Insights69页报告精华解读:Voice AI引爆,6大趋势定义AI新战场
Z Potentials· 2025-11-18 02:51
市场展望与核心趋势 - AI Agent正从“助手”进化为“自主Agent”,目前处于2025年的“Agents with guardrails”阶段,并将迈向2026年及以后的“Fully autonomous Agents”时代[4] - Voice AI率先突破,员工人数增长最快的早期GenAI公司集中在语音AI开发领域,例如NURIX(12个月员工增长+611%)和Retell AI(+340%)[6][7] - AI Agent并购浪潮来袭,仅2025年至今已发生超过35起收购案,Sales、Marketing和Coding AI是下一步整合重点[11] - “利润挤压”全面蔓延,Reasoning models使输出Token量激增约20倍,导致计算成本飙升,危机正从编码AI蔓延至所有Agent类别[11] - Agentic Commerce加速,安全支付障碍正被攻克,Stripe于2025年9月宣布推出用于Agent支付的API,“AI原生支付”赛道形成[11] - “数据护城河”战争爆发,软件巨头如Salesforce和Atlassian限制API速率以巩固生态壁垒[14] - Agent监控工具成新刚需,Agent的可靠性仍是重大挑战,失败、“幻觉”或不可预测行为会立即带来运营问题[14] 融资与并购动态 - AI Agent领域资金爆炸式增长,2024年Agent创业公司融资总额达38亿美元,几乎是2023年的三倍[17][30] - 2025年至今AI Agent及Copilot领域已发生超过35起收购案[11] - 近期代表性融资案例包括Larridin(Seed VC轮1700万美元,投资者包括Andreessen Horowitz和Bloomberg)和Traceloop(Seed VC轮610万美元)[15] 技术堆栈与生态全景 - CB Insights绘制了170多家核心创业公司的市场全景图,涵盖AI Agent基础设施、开发平台、多Agent编排、Web搜索与工具使用、内存、评估与可观测性、语音、支付等核心模块[18] - 核心企业用例覆盖生产力与个人助手、通用企业工作流、软件开发、客户服务、数据分析、销售、会计、网络安全、Web研究与数据提取、HR、营销等多个横向应用领域[18] - 行业特定用例深入供应链与物流、金融服务与保险、法律与合规、游戏、医疗健康、工业等垂直领域[18] 商业化落地与赛道表现 - 在所有横向应用中,“软件开发”(Mosaic得分中位数737)和“客户服务”(Mosaic得分中位数714)因其定义明确的工作流和可测试环境,已率先实现规模化商业落地[19][20] - Coding AI Agent领跑营收,Anysphere旗下的Cursor达到惊人的5亿美元ARR,replit达到1.5亿美元ARR[26][31] - Customer service AI Agent估值最高,平均估值倍数(Revenue multiples)高达219倍,远超80倍的平均水平,反映资本市场对其“替代人工”能力的极高预期[26][31] - 收入领先的Agent创业公司平均成立时间仅为3.8年,展现被极度压缩的成功周期[26] - 在Agent基础设施层,Voice AI已成为新战场,2025年融资4亿美元[27][32] 巨头竞争战略 - 亚马逊通过Bedrock Agents和自定义编排器聚焦企业集成,并扩展至面向消费者的Agentic AI,其战略重点为高[38] - Alphabet(谷歌)利用其专有Gemini模型,通过全面的构建工具和市场策略吸引开发者,战略重点为高[38] - 微软结合预构建业务Agent和强大的开发工具,创建端到端生态系统,满足即时业务需求,战略重点为高[38] - 巨头正争相定义Agent间通信协议,例如Anthropic的MCP、谷歌的A2A和IBM的ACP[27] 风险与挑战 - 信任仍是最大障碍,Agent的可靠性、推理能力和访问权限问题是通往完全自主的最大瓶颈[20] - 最大的技术风险是不可靠,Agent的失败、产生幻觉或行为不可预测会立即带来运营问题和商业风险[29] - “利润挤压”导致经济悖论,一份年费25,000美元的企业合同,在Reasoning模式下平均预期利润从22,750美元变为亏损14,500美元[37] - “vibe coding”时代结束,计算成本飙升正迫使玩家整合,挣扎的玩家将寻求退出[28] 未来发展方向 - 下一步浪潮是垂直化,随着横向应用趋于饱和,将深入金融、医疗、工业等特定行业的垂直Agent,尤其是在有严格监管和数据敏感性的领域[22][34] - Agent监控工具正在成为必不可少的企业级新类别,以应对Agent“不可靠”的巨大风险[35] - 云巨头(亚马逊、谷歌、微软)正通过不同战略加速“圈地”,争夺对Agent经济的最终控制权[36]
探迹并购真爱美家:“AI智能体”能重塑产业么?| 出海参考
钛媒体APP· 2025-11-17 12:29
交易核心信息 - 真爱集团有限公司拟以协议转让方式向探迹科技转让真爱美家总股本的29.99% [1] - 股份交割完成后,探迹科技将发起部分要约收购,收购除自身外全体股东持有的15%股份 [1] - 若交易全部完成,探迹科技将合计持有真爱美家约44.99%股权,成为新的控股股东 [1] - 真爱美家是位于浙江义乌的家纺公司,2021年上市,历年营收在8-10亿人民币之间,80%收入来自海外市场 [1] 真爱美家面临的行业挑战 - 公司2022年业绩企稳大涨但出现"增收不增利"情况,2023年和2024年营收、净利润连续两年同比下滑 [3] - 国内纺织企业面临东南亚低成本竞争、贸易壁垒压力,以及局部热战导致的"海运费暴涨、海运周期变长"挑战 [3] - 劳动力、原材料等综合成本持续上涨,企业运营成本攀升 [3] - 全球需求疲软,外贸增速放缓,海关总署数据显示2021年中国外贸增长21.4%,2022年增速回落至7.7%,2023年进一步放缓至0.2% [3] - 2023年纺织品服装出口额同比降低8.1% [3] AI应用与企业转型趋势 - 近九成(89.84%)企业已不同程度地将AI应用于企业经营环节,应用场景高度集中在"数据分析与决策支持"(57.03%)和"客户服务"(46.09%) [6] - 采用先进数据分析方案的企业平均决策效率提升58%,库存周转天数显著下降40% [6] - 麦肯锡预测生成式AI每年可为全球经济带来2.6万亿至4.4万亿美元增长,企业级应用是价值实现主阵地 [8] - Bloomberg Intelligence预计到2032年生成式AI软件市场规模将达1.3万亿美元 [8] - Gartner预测到2026年超过80%的企业将使用生成式AI的API或部署相关应用,2023年初该比例不足5% [9] 探迹科技的竞争优势 - 探迹科技从企业最刚需的"销售拓客"场景切入,通过"探迹拓客"等智能销售工具服务超5万家企业 [10] - 公司沉淀了海量、动态的商业图谱和高价值数据,形成核心底座"旷湖"数据云 [10] - 基于"旷湖"数据云,探迹将能力延展到"触达"、CRM管理等,形成覆盖营销-销售全链路的产品矩阵 [10] - 探迹打造"太擎大模型智能体开发平台",基于高质量数据与行业Know-how训练出能源、产业、政务等垂直领域的专家模型 [11] - 探迹AI Agent涵盖多种可自主执行复杂任务的"数字员工",具备高度可复制性与广泛行业推广价值 [11] 交易战略意义与行业影响 - 交易是AI生产力系统对传统产业的"反向整合",旨在打造"AI+制造"的终极样板 [13] - 真爱美家选择通过与AI智能体独角兽深度融合实现能力质变 [7] - 出海企业需要从"全球化"转向"全球本土化",精准洞察本土需求,以"效率"和"精细化运营"为核心 [6] - 国务院提出到2027年新一代智能终端、智能体等应用普及率超70%,推动人工智能与各行业深度融合 [13] AI落地的挑战与成功要素 - 埃森哲2025年研究显示46%中国企业正在规模化应用生成式AI,但仅有9%企业成功实现生产效率、收入和利润显著提升 [15] - 波士顿咨询报告中将AI深度融入业务的企业占比仅5%,归类为"未来导向型",这些企业在AI上投入比落后企业高出120% [15] - "未来导向型"企业营收增长速度是落后企业的1.7倍,利润率高1.6倍 [15] - AI Agent落地面临战略认知、组织管理、技术选型、数据安全及人机协同等多重挑战 [16]
Agent 如何用搜索?这家最懂 AI 搜索的团队,把踩过的坑都分享出来了
Founder Park· 2025-11-17 10:08
AI时代搜索的根本性变革 - AI搜索是动态、流式、可追问的过程,一个复杂任务可能引发多轮、数十次检索,与传统人类"一次性"静态检索截然不同[4][6] - AI搜索需求呈现三大变化:需要多语言内容索引构建、权威性重要性大幅提升、需要更完整的长摘要内容返回而非短摘要[6][7] - 评价标准从人类搜索的"黄金前三条"点击率转向AI搜索的"全员及格线",要求前10条甚至前50条结果整体质量高,覆盖全面且无虚假内容[8][9] - 搜索能够有效解决大模型的幻觉问题和数据时效性局限,成为AI应用必备能力[4][6][11] 小宿科技的业务定位与市场前景 - 公司定位为AI Agent基础设施提供商,主要业务包括智能搜索和内容读取两大块,服务国内超过一半头部AI原生应用[1][10][11] - 智能搜索基于自研搜索引擎,拥有千亿规模数据索引库,通过语义理解和召回排序技术为AI提供优化结果[12] - 内容读取功能像"AI时代的浏览器",能深度解析网页并将内容转化为干净格式如Markdown或纯文本[12] - 预计Token消耗量将以十倍、百倍甚至千倍速度增长,AI替代人类重复劳动比例将从当前0.01%大幅提升[11][41] 不同AI应用场景的搜索解决方案 - 办公类Agent需将复杂指令拆解成多个关键词,进行关系分析和结果聚合,而非简单将全部prompt丢给搜索[15][16][17] - 通用AI Agent需要一次性获得50条包含长摘要的结果,保证数据格式适配性,满足深度研究需求[12][20] - 金融、学术等垂直行业需解决公开数据质量参差不齐问题,通过站点指定和垂类搜索优化保证内容权威性[23][24] - AI硬件产品需平衡成本与响应速度,采用动态摘要技术和系统优化实现毫秒级响应,控制token消耗[28] 搜索技术路线与质量把控 - 在多数场景下搜索准确性比速度更重要,向量检索入手门槛低但上限有限,语义理解对多义理解和消歧更关键[4][29][30] - 通过算法能力保证时效性,如通过站点特征发现高热hub页,监测机制发现热点线索,而非简单高频监测[31] - 数据清洗采用自动化为主的方式,基于低质关键词、数据源、向量相似度等多维度提高数据纯度,必要时结合人工审核[39] - 针对AI生成内容污染问题,通过黑名单、白名单等机制剔除低质信息,保证给模型的结果真实有效[42][43] 竞争优势与行业洞察 - 与国内外竞品相比优势在于多语种支持、内容质量头部水平、性价比更高,有客户将90%搜索流量从Tavily切换过来[34] - 模型成本远高于搜索成本,多搜索几次来提升内容质量比减少搜索次数更经济[4][35] - 搜索未来将作为Agent的重要工具,随着Agent渗透率从当前十万级日活提升,搜索需求将同步增长[41] - 推荐良性GEO策略,通过提供高质量内容获得曝光,而非采用黑帽手段污染生态[44][45]
入侵30家大型机构、Claude自动完成90%?Anthropic 被质疑,Yann LeCun:他们利用可疑的研究来恐吓所有人
36氪· 2025-11-17 08:24
Anthropic报告的发现与主张 - 公司研究人员观察到首个由AI协同操作的网络攻击行动,黑客在攻击活动中使用Claude AI工具参与[1] - 攻击活动高度复杂,黑客使用Claude Code自动化完成多达90%的工作,人类仅需在约4-6次关键决策点进行干预[1] - 公司表示此次攻击对AI Agent时代的网络安全具有重大启示意义,系统可在长时间内自主运行并完成复杂任务[1] - 攻击者开发了自主攻击框架,利用Claude作为中枢编排引擎将多阶段攻击流程分解为子任务,如漏洞扫描和凭证验证[9] - 攻击框架通过顺序控制Claude响应并调整后续任务,实现在无人持续操作下自动推进侦察、入侵和数据外泄各阶段[10] 外部专家对报告的质疑 - 外部研究人员评价谨慎,认为报告类似营销噱头,类比PlayStation 2上市时索尼声称伊拉克购买数千台改装超级计算机的报道[1] - 专业安全研究人员质疑为何技术进展总与恶意黑客相关,而白帽黑客仅报告持续细微的改进[5] - 研究人员指出攻击者未发明新东西,使用的工具已存在多年且易被防御方检测,AI未使攻击比传统技术更具威胁[7] - 专家质疑攻击成功率的意义,尽管AI消除大量人工步骤,但仅少量攻击成功,主要科技巨头和政府机构中只有少量受害[7] AI技术在实际攻击中的局限性 - AI工具存在幻觉问题,在自主执行过程中经常夸大结果并捏造数据,如声称获取无法使用的凭证[8] - 完全自主网络攻击面临主要障碍,需要对所有声称结果进行严格验证,这限制了AI在进攻性安全场景中的应用[8] - 攻击者通过将恶意任务切分细小步骤或伪装安全研究人员来规避AI安全限制,但全流程开发的恶意软件仍距现实威胁较大差距[12] - 研究人员将AI作用与Metasploit等使用数十年的黑客工具相比,认为AI有用但未实质性提升黑客能力或加剧破坏性[6] 报告专业性的批评 - 报告被指未达到专业威胁情报发布标准,缺乏战术细节和威胁情报指标,内容空洞无法验证[13] - 批评者指出报告缺少行业标准信息,如域名、文件哈希、情报表参数等,全球安全运营中心无法依赖其进行监测防御[13] - 报告声称AI负责漏洞利用和数据外泄但无证据链支持,未说明使用工具、攻击系统类型或受害者信息[14] - 网络攻击溯源的严肃性被强调,公司被指无凭无据指责国家支持的组织实施攻击,行为不负责任且不专业[14]
哪些AI应用值得中期投资
国盛证券· 2025-11-16 06:42
行业投资评级 - 增持(维持)[4] 报告核心观点 - 报告认为在人工智能领域,有三类应用值得中期投资:自定义Agent平台、高壁垒垂类应用以及AI基础设施层[1][2][3] 自定义Agent平台投资要点 - OpenAI在2025年10月6日的DevDay上展示了其生态构建愿景,推出Apps SDK允许开发者在ChatGPT中构建可交互应用程序,结合MCP让AI能直接访问外部数据、工具与工作流[12] - OpenAI推出AgentKit提供可视化画布和嵌入式聊天组件,使非程序员也能快速创建智能Agent,现场演示中仅用8分钟便从零构建并上线了一个活动官网智能问答Agent[13] - OpenAI已与多家合作伙伴推出首批内嵌于ChatGPT的AI应用,涵盖教育、设计、旅游、音乐与房地产等领域[13] - 腾讯在三季财报电话会上表示微信最终会推出一个AI智能体,让用户在微信内部利用AI完成多项任务,微信拥有强大的通信和社交生态系统及购物支付等场景[14] - 腾讯元宝已打通微信、QQ、腾讯会议等数十款内部产品,覆盖社交、办公与消费等场景,其9月月活跃用户数已较1月增长超80倍;QQ浏览器AI功能9月月活跃用户数也较4月增长约18倍[14] - 阿里巴巴准备对其主要移动人工智能应用程序进行全面改造,计划更名为"Qwen",并添加智能AI功能以支持在淘宝等主要平台上购物,目标是将Qwen打造成功能齐全的AI Agent[17] 高壁垒垂类应用投资要点 - 对于护城河深厚的应用而言,大模型非但不是吞噬者,反而可能成为加固优势的工具[18] - 护城河强的体现包括强Know-how,即许多行业依赖专家对于长期经验、场景化判断、未成文规范的理解,需要长期深耕的公司来构造垂直领域模型或Agent[19] - 护城河强的体现包括强数据,即一些公司具备难以获取的专有数据与持续反馈闭环,大模型可作为数据价值的放大器,但核心优势由数据主导[20] - 护城河强的体现包括复杂流程,即现代企业软件的价值在于对跨部门、多步骤的复杂业务流程的深度整合与编排,深度工作流整合创造了极高客户粘性和转换成本[21] - 护城河强的体现包括资质或合规壁垒,即一些强监管领域需要资质、执照与合规体系,模型可提效,但落款与责任在具备资质的主体[22] - 以Palantir为例,其于2016年成功起诉美国陆军,成为首个领导国防项目的民营软件公司,其人工智能平台AIP为开发人员提供了将应用程序中的人工智能转化为代理和自动化的能力[22][23] - Salesforce连续与头部大模型厂商谷歌、OpenAI、Anthropic扩大合作,构建以Agentforce 360为核心的智能企业生态,其数据与AI产品收入在第二季度同比增长120%,Agentforce年度经常性收入约4.4亿美元,已有逾1.2万家客户采用该平台[24][25] AI基础设施层投资要点 - 在AI军备竞赛中,基础设施提供商通过服务所有参与竞争的公司,获取客户大规模投资带来的确定性收益[26] - 数据基础设施Snowflake通过其云数据平台提供AI规模化部署的底层数据解决方案,其Snowflake Cortex是一个原生AI和机器学习套件,使用户能够利用Snowflake数据运行高级AI模型而无需迁移数据或配置单独的基础设施[26][28] - AI安全基础设施CrowdStrike与AWS、英特尔、Meta、英伟达和Salesforce合作,利用Falcon平台保障AI安全,保护AI运行的环境和模型,防止敏感数据离开终端和云工作负载[29][30] 建议关注公司 - 算力领域建议关注寒武纪、海光信息、中芯国际等公司[7][34] - Agent领域建议关注阿里巴巴、腾讯控股、科大讯飞等公司[7][34] - 自动驾驶领域建议关注江淮汽车、小鹏汽车、理想汽车等公司[8][35] - 军工AI领域建议关注拓尔思、能科科技、中科星图等公司[8][35]
实测专盯Agent上工的OS:长得有点像AI浏览器,双系统通用
量子位· 2025-11-15 02:08
行业趋势与产品定位 - 浏览器行业正经历AI功能集成浪潮,多家公司为其产品添加AI能力[1] - AI浏览器市场呈现三类产品形态:传统浏览器加AI插件、代理型浏览器、以及具备自主执行能力的Agent型浏览器[9][10][11] - FlowithOS定位为全球首款专为AI Agent打造的操作系统,其特点是虽形似浏览器但重在执行,能让Agent自主操作鼠标和流程[4] 产品核心能力:检索与执行 - 产品具备完整行为链执行能力,可完成从目标理解到页面操作再到发起互动的多步骤流程,例如在闲鱼平台成功将一件标价1850元的商品议价至1750元[15][16][18][20] - 在执行多条件任务时存在缺陷,测试中未能满足“朝南户型”的筛选条件,实际因未勾选朝向筛选项而返回了朝东房源,暴露出任务拆解的结构化处理能力不足[24][25][28][30] - 产品响应速度有待提升,步骤增多时电脑发热卡顿问题明显,影响用户体验[21] 产品核心能力:信息整合与语义理解 - 信息整合能力存在局限,在分析B站视频脚本逻辑时,实际仅依据标题、标签等元数据进行提炼,并未真正浏览视频内容,此为该类Agent的常见处理方式[32][33][34][35][36] - 语义理解能力表现突出,能综合考量MBTI人格类型、工作状态、个人喜好及宠物安全等多重信息进行关联推理,例如在挑选礼物时因考虑到香薰对猫有毒而选择了定制笔记本[38][39][40][43][44] 产品特色功能与技术架构 - 产品内置Skill功能,作为操作系统层面的“说明书”,能指导Agent逐步完成特定任务流程,如自动上传YouTube视频[45][46] - 具备记忆功能,可根据用户指令习惯和偏好不断优化自身操作,实现自我进化[46][53] - 在Online-Mind2Web基准测试中,其综合测评表现优于Gemini和Atlas等竞争对手[47] 产品现状与市场潜力 - 产品目前存在偶尔卡壳、加载中断、网页打不开、结果答非所问等小毛病,尤其在任务复杂度高时稳定性不足[50][51] - 其创新之处在于将浏览器本身转化为能执行任务的Agent空间,操作主体由用户变为Agent,每一次交互均被系统记忆并沉淀为专属使用方式[52][53] - 尽管尚未完全成熟,但其差异化定位和潜力使其成为值得关注的产品,可能改变未来的人机交互模式[54]
算力的突围:用“人海战术”对抗英伟达!
经济观察报· 2025-11-14 15:08
超节点概念与市场动态 - 英伟达是超节点概念最早的提出者,国内厂商在进入该赛道时常以对标或超越英伟达为主题[1][11] - 2025年下半年起,AI算力市场涌现超节点发布热潮,包括华为、中兴通讯、超聚变、新华三、浪潮信息、百度、阿里巴巴、中科曙光等公司均推出了相关产品[2] - 华为在2025年中国国际大数据产业博览会上宣称其384超节点服务器的集群算力是英伟达同类设备的1.67倍[3] 超节点的定义与技术背景 - 行业内对超节点有两种层级划分:单机柜内部高速互联和跨机柜组成的集群级互联[5] - 超节点的出现是为了解决AI大模型训练中的"通信墙"问题,即在超高参数级别训练中,计算单元约40%的时间处于"空等"通信状态[6] - 构建大规模GPU集群主要有Scale-Out和Scale-Up两种方式,超节点通过单机柜内集成大量芯片来提升性能[7] - 超节点产品名称中的数字通常表示单机柜或单系统内集成的AI训练芯片数量,例如华为昇腾384集成384颗芯片,中科曙光scaleX640可部署640张计算卡[7] 国内厂商的技术路径与竞争策略 - 国内厂商选择超节点路线是由于单芯片算力存在短板,需要通过系统级优势来弥补单点差距[9] - 厂商在单机柜集成度上展开激烈竞争,中科曙光scaleX640宣称是"全球首个单机柜级640卡"产品,单机柜算力密度提升20倍[12][13] - 超节点内部互联存在不同技术路径,英伟达采用高速铜缆,华为选择"去铜全光",而行业主流思路是柜体内用铜互联、柜间用光互联[13] - 国内厂商的核心策略是在1米左右的铜互联有效距离内尽可能塞进更多计算卡,以降低系统总成本和提升通信效率[14] 超节点面临的工程挑战 - 高集成度带来显著功耗和散热挑战,例如英伟达GB200NVL72单柜72卡功耗达120千瓦,迫使液冷技术成为必需品[15] - 互连工程复杂度随集成度提升而急剧增加,GB200NVL72机柜需要铺设5000多条总长近3200米的独立铜缆[15][16] - 在互联协议上出现分化,华为自研灵衢协议并计划开放生态,阿里和新华三等则选择支持UALink等国际开放标准[16] 市场需求与发展前景 - 未来两到三年AI服务器需求主导角色将是大型互联网企业和国家主导的主权云服务[20] - AI算力建设存在"一厢情愿"风险,需要避免在不需要算力的地方强行推进产业发展[21] - AIGC是当前AI算力主要落地场景,但机器人、高阶自动驾驶等与先进制造深度绑定的领域被看好具备长期潜力[21][22] - 金融、医疗等行业目前仍处于从单点验证走向规模化复制的早期阶段[22]
阿⾥巴巴准备⼤改旗舰 AI 应⽤,使其更像 ChatGPT;中国电信量子研究院的量子计算机“天衍-287”完成搭建,量子计算即将首次面向全球开放——《投资早参》
每日经济新闻· 2025-11-14 00:15
重要市场新闻 - 美股三大指数集体收跌,道琼斯指数跌797.6点,跌幅1.65%,标普500指数跌1.65%,纳斯达克综合指数跌2.29% [1] - 大型科技股多数下跌,特斯拉跌超6%,英特尔跌超5%,AMD、甲骨文跌超4%,英伟达跌超3%,亚马逊、谷歌跌超2% [1] - 中概股多数下跌,纳斯达克中国金龙指数跌1.59%,百度跌超6%,哔哩哔哩跌超4%,小鹏汽车、蔚来跌超3% [1] - 国际金价走低,现货黄金跌0.47%报4176.32美元/盎司,COMEX黄金跌0.76%报4181.7美元/盎司 [1] - 国际油价小幅走高,美油主力合约涨0.31%报58.67美元/桶,布伦特原油主力合约跌0.38%报62.95美元/桶 [1] - 欧洲三大股指全线下跌,德国DAX指数跌1.36%报24048.84点,法国CAC40指数跌0.11%报8232.49点,英国富时100指数跌1.05%报9807.68点 [1] 量子计算行业 - 中国电信量子研究院完成搭载"祖冲之三号"的超导量子计算机"天衍-287"搭建,该系统具备"量子计算优越性",处理特定问题速度比目前最快超级计算机快4.5亿倍 [2] - 该系统将接入"天衍"量子计算云平台并首次面向全球开放,成为我国首个具备"量子计算优越性"的量子计算云平台 [2] - 量子计算系统光量子计算架构需通过光链路实现量子比特间信号传输,MEMS-OCS为量子计算系统提供稳定光互连解决方案 [2] - 量子计算与AI、超算融合对光交换需求呈现规模化增长,预计2024-2025年全球MEMS光开关市场年复合增长率达25% [2] 人工智能行业 - 阿里巴巴计划未来几个月内对主要移动AI应用进行全面改革,使其更接近OpenAI的ChatGPT,将更新iOS和安卓上现有的"通义"应用并更名为"千问" [3] - 阿里巴巴已从公司内部调集100多名开发人员进行此次改造,作为首席执行官吴泳铭在9月份透露的额外AI投资的一部分 [3] - AI赋能传统制造业推动自动化、数字化升级,减少人工依赖,提升生产效率与产品质量,同时推动智能网联汽车、AI医疗诊断、具身智能机器人等新兴产业崛起 [3] - 随着端侧多模态模型进化,AI能力正从云端转向端侧,AI agent有望在工业、教育、金融、零售行业率先落地 [3] 具身智能行业 - 中国电子技术标准化研究院发布"求索"具身智能测评基准EIBench并开展首次测评,针对数据难复用、模型泛化性差、安全难保障等产业痛点 [4] - 北京人形机器人创新中心的XR-1模型成为唯一通过测试的VLA模型,获颁CESI-CTC-20251103具身智能测试证书,标志我国具身智能技术迈向标准化验证新阶段 [4] - 2025年有望成为人形机器人开启从0到1阶段的关键时点,随着宇树、智元等头部公司加速推进零部件性能升级和成本降低,行业发展趋势愈发明朗 [5] - 随着头部明星企业资本化加速及国内产业支持力度强劲,国产机器人出货量有望迎来大幅增长,核心受益方向包括核心供应链和应用场景 [5] 公司股东减持 - 江龙船艇控股股东、实际控制人晏志清计划减持不超过755.34万股,占公司总股本2.00% [6] - 雄帝科技董事唐孝宏、薛峰及多名高级管理人员计划合计减持不超过32.66万股,占公司总股本0.17% [6] - 长盛轴承实际控制人一致行动人、持股5%以上股东孙薇卿计划以大宗交易方式减持不超过594万股,占公司总股本1.99% [6] - 新特电气财务负责人肖崴计划减持不超过10.40万股,占公司总股本剔除回购专用账户后股本比例0.03% [6] - 华仁药业持股5%以上股东华仁世纪集团计划减持不超过公司总股本3%的股份,即不超过3546万股 [7] - 海能实业持股5%以上股东周洪军计划减持不超过940.29万股,占公司总股本3% [7] - 吉林化纤持股5%以上股东上海方大投资管理有限责任公司计划通过集中竞价减持不超过1%股份,通过大宗交易减持不超过1%股份 [7]