Data Agent
搜索文档
评测也很酷,Data Agent 自动化评测的三层框架与实战
AI前线· 2025-12-16 09:40
文章核心观点 - 在大模型驱动的数据应用Agent领域,科学、准确地评估应用效果是行业面临的关键挑战,公司通过构建覆盖技术选型、研发迭代和业务效果的三层评测框架,并创新性地采用基于语义等价的自动化评测方法以及“用Agent评测Agent”等技术,以解决传统评测方法的局限,提升评估效率和准确性,最终驱动产品迭代与优化 [2][5][17][37] 大模型应用评测的通用挑战与方法 - 大模型评测复杂度高,核心挑战在于如何贴切评价应用实际效果以及如何在传统技术不足处进行创新 [5] - 评测需关注三个核心维度:效果(包括事实性、有用性、有害性)、性能与推理性能(如首Token时延、生成速度、资源消耗)、以及稳健性(容错、抗攻击能力) [8] - 当前常见评测方法包括人工评测、自动化评测(如客观题匹配、文本相似度比较、基于排序的评估)以及人机协同评测 [9] - 通用评测的痛点包括:静态评测与线上实际效果脱节、针对模型单一能力的评测无法反映综合业务能力、以及评测集难以跟上业务和用户行为的快速变化 [10] 数据应用Agent领域的垂直评测难点 - 领域特殊性带来挑战,例如早期大模型训练语料中SQL占比低,导致其SQL生成能力较弱,而数据领域的“正确性”要求极其关键 [14][15] - 数据Agent产品形态复杂,如“深度研究”涉及多维度分析,评估需从单一能力扩展到覆盖数据源差异、数据异构性等复杂因素 [15] - “效率”与“研发并发”非常关键,评测效率直接影响研发周期,快速判断方案优劣能带来显著差异 [16] 三层评测框架体系 - 公司为构建大模型Agent应用设计了三层评测体系:最下层是技术选型评测,用于筛选达标模型;中间层是研发迭代中的组件(子Agent)评测,类似“单元测试”;最上层是端到端的业务效果评测 [17][18] - 在基础能力评测层面,针对数据领域关注工具调用、数值计算、表格理解、数据幻觉控制、复杂指令遵循及Text-to-SQL等能力,并接入如ComplexFuncBench、HumanEval、SWE-Bench等开源Benchmark [20] - 在组件评测层面,将Agent工作流程拆解为召回、理解与规划、洞察分析与执行、结果总结等阶段进行独立评估,以定位问题根源 [20] - 在端到端效果评测层面,针对特定业务场景构建评测集,并设有“数据与飞轮”模块对接线上日志,用于案例研究、回归测试集沉淀和人工标注 [21] Data Agent评测技术创新与实践:Text-to-SQL - Text-to-SQL是数据Agent的核心任务,传统评测方法(如Spider、WikiSQL、BIRD-SQL数据集)在真实业务环境中存在适配性与可扩展性问题 [25][26] - 传统“执行正确性”比对易产生误判,因测试数据分布不完备可能导致“非等价SQL执行结果相同”;而基于文本相似度的比较则难以准确反映语义逻辑等价 [26][27] - 公司提出基于语义等价的评测方法,将SQL转化为抽象语法树(AST),并借助Apache Calcite下推为执行层语法表示(RelNode),以抹平写法差异,判断逻辑含义是否相同 [29] - 进一步采用图匹配网络(Graph-Matching Network, GMN)在语法树上进行局部匹配(RelPM),计算SQL相似度,该方法在效果上显著优于传统基于执行正确性、文本相似度或BERT模型的方法 [30] Data Agent评测技术创新与实践:深度研究 - “深度研究”类Data Agent的评测更为复杂,需评估报告对业务的有用性、推理思路的合理性、内容的完整性以及建议的有效性等多维度 [31][32] - 公司为此定义了一套评测体系,从分析与洞察的深度与准确性、报告展示的可读性与易读性、执行过程的稳定性与成功率等角度设定分层评估维度和关键指标 [33][34] - 在自动化评估技术上,创新性地采用“用Agent来评测Agent”的方法,其可行性基于三个前提:挑错比做对容易、可以复盘过程进行逐步审阅、以及能做定向优化 [37] - 实现技术包括自我反思(模型打分后检查逻辑完整性)和多Agent协作架构,让多个Agent从不同角度打分,并由“裁判长”统一审阅,同时结合ReAct让评测侧能写代码复算关键数据 [38][39] - 自动化评测在事实性错误上展现出高召回率与准确性,在案例中,机评对事实性错误的召回率超过88%,准确性达到86%,能有效用于研发迭代中的版本比较 [44] - 机评在定位数据错误(如SQL缺少GROUP BY导致结论无来源)和分析意图完成度评估(如自动计算完成比例并标注缺失项)等具体场景中效果显著 [41][44] 评测平台与工具支撑 - 公司搭建了面向数据评估的统一平台,覆盖数据集管理、自动化与人工评测、指标分析、结果归因等完整流程,并提供“数据飞轮”机制持续沉淀线上案例为评测集 [45] - 平台提供一系列常用评测算子(基于规则或大模型),业务方可自行编排这些“原子算子”实现自定义分析逻辑 [45] - 平台设计了“评估工作流”模块,支持以可视化方式快速搭建评估流程,高效复用算子,提升了评测效率 [45][46] 自动化评测的未来展望 - 未来需进一步完善评测维度和体系,加强多模态能力利用,优化数据集,并通过有效采样、时效性校验等手段解决线上与线下评测的一致性问题 [48] - 倡导“评估驱动开发”(EDD),将评估更好地分解到Agent架构的各个环节,建立最终业务指标与过程性指标的有效关联 [49] - 探索用自动化评测反向驱动模型训练流程(如SFT、强化学习),并与人类判断对齐 [49] - 目标是让自动化评估结果能更快、更高效地生成对应用改进的建议,直接服务于产品迭代,帮助业务方判断需求满足度,并支持开发者进行更高效的技术方案探索 [49]
Is HubSpot, Inc. (HUBS) One of the Best Falling Stocks to Buy, According to Wall Street Analysts?
Yahoo Finance· 2025-12-04 04:31
华尔街分析师共识 - 华尔街分析师给予公司“强力买入”评级 共有27位分析师参与评级 其中23位给出“买入”评级 4位给出“持有”评级 无“卖出”评级 [1] - 分析师平均目标价为589.08美元 目标价区间为450美元至800美元 相较于当前股价368.84美元 隐含上涨空间达59.71% [1] 公司业务与战略 - 公司是一家软件公司 提供集营销、销售和客户服务于一体的客户平台 其核心产品是基于云的客户关系管理工具 [5] - 公司拥有超过28万客户 并计划利用这些客户数据来提升其产品效能 [3] - 公司重申其混合货币化战略 专注于让人工智能技术惠及中小型企业 [2] - 公司计划将人工智能技术嵌入所有产品线 包括客户代理和数据代理 [3] 近期动态与市场观点 - 在富国银行第九届年度TMT峰会上 公司首席执行官重申了其人工智能战略 [2] - 此前 Rothschild Redburn将公司评级从“买入”下调至“中性” 并将目标价从610美元大幅下调至450美元 [4] - 该研究机构质疑公司在面临人工智能颠覆潜力时的韧性 并指出市场预期其净客户增长将放缓 [4]
环球问策:如何突破AI时代的“数据悖论”
环球网资讯· 2025-12-01 05:24
文章核心观点 - 在人工智能热潮中,数据工程是AI规模化落地的关键瓶颈,公司专注于通过"NoETL"理念和构建数据语义层来解决数据供给与AI需求之间的根本性矛盾[1][4][5] 行业背景与问题诊断 - 2025年人工智能与大数据是行业焦点,但数据领域的"脏活累活"被忽视[1] - AI时代存在"数据悖论":企业拥有海量数据且AI能力强大,但传统数据架构是为人类设计而非AI,导致"大模型不懂大数据"[5] - 数据需求呈指数级增长,但数据供给方式仍依赖ETL工程师手工劳作,需求增长百分之几百而人力无法同步跟上[4] - 大模型在企业环境中面临数据找不到、找到不敢用、口径不一致、权限复杂以及"幻觉"问题,可信是AI在企业中规模化的基线[5] 公司解决方案与技术路径 - 公司提出"NoETL"创新理念,旨在重构数据生产力,将传统依赖人力的ETL流程转变为由AI与算法驱动的自动化数据工程体系[4] - 采用NL2MQL2SQL技术路径,在自然语言与SQL之间加入"指标查询语言"层,作为企业数据的"罗塞塔石碑"以沉淀业务知识[6] - 构建以"数据语义层"为核心的三大引擎:语义引擎负责业务语义管理,物化加速引擎解决查询性能瓶颈,数据虚拟化引擎实现跨云跨域数据连接[6] - 目标是让企业的数据资产能无缝转变为AI资产,构建对AI友好的数据土壤[7] 实践案例与验证 - 麦当劳中国案例:近7000家门店和百亿级订单数据,通过"双引擎支持"与"智能租户隔离"技术验证NoETL架构在超大规模场景下的可行性[8][9] - 中交一公局案例:在高严谨场景下,公司Data Agent实现90%以上准确率,验证了AI落地的可靠性[9] - 两个案例分别代表超大规模下的工程能力与高严谨场景下的AI落地能力[9] 公司竞争优势与市场定位 - NoETL是对过去30年ETL体系的重构,原有体系中的公司有历史包袱难以快速转向[10] - 核心团队来自蚂蚁集团等公司,对大数据和AI结合有深刻理解,具备四年先发优势积累的技术和客户壁垒[10] - 与云厂商是合作大于竞争的关系,专注于数据语义编织,并积极构建合作伙伴生态[10] 未来展望与公司规划 - 能建设好AI友好数据土壤的企业未来3-5年将获得5-10倍的成长加速度[10] - "数字白领"普及的细分场景会涌现新型公司,商业模式可能从软件订阅转向按服务收费[10] - 公司重点方向是帮助企业"一键将数据资产转为AI资产"以及布局出海服务,正从"技术驱动"转向"技术+商业双驱动"[10][11]
HubSpot (NYSE:HUBS) FY Conference Transcript
2025-11-19 22:32
**HubSpot (NYSE: HUBS) 富国银行TMT大会电话会议纪要关键要点** **涉及的行业与公司** * 公司为HubSpot (NYSE: HUBS) 一家专注于中小型企业(SMB)的客户关系管理(CRM)平台提供商[8] * 行业涉及软件即服务(SaaS)客户关系管理(CRM)和人工智能(AI)应用[7] **核心观点与论据:AI战略与差异化** * AI战略核心是将强大AI技术应用于中小型企业市场 通过嵌入式AI和智能体(Agents)帮助客户增长[8] * AI产品差异化基于两点:对中小企业的深刻理解以及平台拥有的丰富上下文数据[9][10] * 公司拥有280,000客户 这些客户在营销、销售、服务旅程中产生的数据为AI提供了独特的上下文优势[11] * 平台已转型为智能体平台 能够处理非结构化数据(如邮件、Zoom转录)并具备协调层( orchestration layer)用于评估、反馈和记忆[23] * 与原生AI公司竞争具备平台优势、规模优势和生态系统优势 因为构建完整的智能体平台需要CRM基础、上下文数据和大量客户反馈迭代[70][71][72][73] **AI产品与功能** * 在9月的年度会议上发布了三大核心智能体:客户智能体(Customer Agent)、潜在客户挖掘智能体(Prospecting Agent)和数据智能体(Data Agent)[9] * 推出了世界级的Breeze Assistant 作为每个市场部门员工的副驾驶(copilot)[9] * 客户智能体已有超过6,000家客户使用 帮助解决了超过60%的服务工单[49] * 潜在客户挖掘智能体被强调为一个极具潜力的用例 能利用意向信号(intent signals)自动化筛选高价值潜在客户[32][49] **商业化模式** * AI商业化采用混合模式:通过席位(seats)和积分(credits)共同 monetize[48] * 嵌入式AI功能(如内容生成、总结邮件)包含在席位费用中 而完成工作的智能体(如解决工单、研究客户)消耗积分[48][52] * 积分消耗目前以客户智能体为首 其次是潜在客户挖掘智能体和数据意向信号[49][50] **客户采用与关键驱动因素** * AI采用的关键驱动因素并非公司规模 而是公司内部是否有高层管理者自上而下地推动AI优先战略[58] * 发现“AI运营”(AI Ops)或“市场营收运营”(RevOps)角色对于培训数据、管理AI功能和质量至关重要 是推动内部采用的关键力量[59][60] * 客户仍处于建立对数据安全和隐私信任的阶段 强调数据保留在公司内部而非用于外部LLM训练的重要性[58][102] **数据中枢(Data Hub)战略** * 数据中枢(前身为OpsHub)是AI战略的基础 负责从外部源整合数据、提高数据质量并提供数据工作室(data studio)来构建工作流[64][65][66] * 高质量的数据对于AI的准确性至关重要 数据中枢通过提示LLM等方式来完善数据质量(如完善客户资金数据)[65] * 数据中枢是多中心(multi-hub)战略的一部分 成为营销中心和销售中心客户实施AI的基础[67] **市场格局与竞争定位** * 认为平台解决方案最终将胜过单点解决方案(point solutions) 因为客户不希望管理多个分散的智能体而失去对增长的整体可见性[82][83] * 对于中小型企业而言 购买现成的AI解决方案远比自定义开发更具吸引力 因为后者需要显著的AI工程人才投资和持续迭代[85][87][88] * AI正在创造巨大的营销优化机遇 尽管搜索引擎优化(SEO)受到干扰 但通过渠道多元化可以获取更好的回报[99][100] **营销与获客策略演变** * 传统的基于内容引导(content leads)的获客模式因AI概述(AI overviews)和LLM的兴起而受到重大干扰[92][93] * 公司自2022年起推行渠道多元化战略 包括发展10个YouTube频道(潜在客户年增长80-90%)、收购播客网络(超过100个播客)和电子邮件通讯[94][95] * 推出了新的营销策略“Loop” 帮助客户多元化潜在客户来源并利用AI实现个性化[96] * 答案引擎优化(AEO)渠道产生的潜在客户数量仍处于早期阶段(个位数) 但转化率是传统渠道的3倍[96] **AI采用前景** * 技术目前领先于客户的采用能力 采用曲线取决于建立信任、确保数据质量和降低使用摩擦[102][103] * AI发展周期是迭代的 依赖于大量客户反馈来改进功能 这为拥有庞大客户基础的公司带来了优势[72][101] * 当前阶段类似于过去的技术周期(如云计算初期) 虽然变革性价值明显 但广泛采用需要时间[103]
HubSpot(HUBS) - 2025 Q3 - Earnings Call Transcript
2025-11-05 22:30
财务数据和关键指标变化 - 第三季度收入达到8.1亿美元,按固定汇率计算同比增长18.4%,按报告基准计算增长21% [4][17] - 订阅收入同比增长21%,服务及其他收入按报告基准增长19% [18] - 第三季度国内收入同比增长17%,国际收入按固定汇率计算增长20%,按报告基准增长25%,占总收入的49% [18] - 第三季度净新增客户10,900名,总客户数达到279,000名,同比增长17% [18] - 第三季度平均每客户订阅收入为11,600美元,按固定汇率计算同比增长1个百分点,按报告基准增长3个百分点 [18] - 客户美元留存率保持在80%高位,净收入留存率环比持平在103% [18] - 第三季度计算账单额为8.04亿美元,按固定汇率计算同比增长19%,按报告基准增长18% [19] - 第三季度非GAAP营业利润率为20%,同比上升1个百分点,环比上升3个百分点 [19] - 第三季度非GAAP净利润为1.4亿美元,每股完全稀释收益为2.66美元 [19] - 第三季度自由现金流为1.47亿美元,占收入的18% [19] - 期末现金及有价证券总额为17亿美元,第三季度回购了78万股普通股,价值3.75亿美元 [19] 各条业务线数据和关键指标变化 - 平台整合、多中心采用和向上市场拓展是核心增长驱动力 [4][5] - Pro Plus安装基数中43%的客户(按年度经常性收入计算)订阅了三个核心中心,同比增长4个百分点;39%的客户拥有四个或更多中心,同比增长6个百分点 [5] - 月度经常性收入超过5,000美元的大额交易同比增长35% [6] - 嵌入式AI功能在营销中心带来超过50%的潜在客户转化率提升,销售中心的AI功能带来近10%的交易胜率提升 [9] - 客户代理拥有超过6,200名客户,环比增长48%,平均解决率在60%以上;潜在客户代理被6,400名客户激活,环比增长94%,已用于接触超过100万潜在客户;数据代理是新推出的,但已有1,700名客户激活 [9] - Brief Assistant的周活跃使用量在过去六个月内增长了56% [10] - ChatGPT连接器已被超过47,000名客户激活,其中55%是Pro Plus客户;Claude连接器已被超过6,000名客户使用 [10] 各个市场数据和关键指标变化 - 国际收入增长强劲,按固定汇率计算增长20%,按报告基准增长25%,占总收入的49% [18] - 需求趋势在不同地区、行业或细分市场没有显著变化,表现与之前几个季度一致 [65] 公司战略和发展方向和行业竞争 - 公司战略聚焦于将AI嵌入日常使用的中心、构建能完成工作的代理、以及通过Brief Assistant和连接器将数据转化为洞察 [8][49] - 推出了Data Hub,帮助客户将数据集中在一处以从AI获取更多价值 [8][13] - 推出了Loop,这是在AI时代新的增长手册,指导客户如何结合人类创造力和AI效率来驱动增长 [12] - 宣布收购XFunnel,这是一个用于跟踪和提升品牌在大型语言模型中可见性的平台,将原生集成到HubSpot中 [14][15] - 核心席位和积分是新兴的增长杠杆,核心席位通过添加AI和数据能力(如Brief Assistant、Smart Starts、项目和富集数据)来提升价值,积分是覆盖AI代理操作和Data Hub同步的通用基于用量的定价系统 [15][16][38] - 公司正在向代理化客户平台转型,并以AI速度高效运营 [16] 管理层对经营环境和未来前景的评论 - 营销格局正在快速变化,搜索引擎流量因AI概述提供答案而下降,客户将注意力分散到多个渠道,访问的网站减少,但同时AI通过大型语言模型创造了全新的机会,如答案引擎优化 [12] - AI是一个多年的顺风因素,目前仍处于整个创新周期的早期阶段 [24] - 公司对在AI时代引领潮流并驱动持久的长期增长充满信心 [16] - 预计第四季度净收入留存率将有所提升,带动2025年全年净收入留存率改善几个百分点 [19][56] - 预计2025年全年资本支出占收入的比例为6%,自由现金流仍预计约为5.8亿美元 [21] 其他重要信息 - 年度Inbound会议吸引了13,000名现场参与者和550,000名在线参与者,发布了200多项新更新和产品 [7] - 公司预计第四季度净新增客户数在9,000-10,000之间,平均每客户订阅收入按固定汇率计算预计增长约1个百分点 [18] - 第四季度总收入(按报告基准)预计在8.28亿至8.3亿美元之间,按固定汇率计算同比增长16%,按报告基准增长18%;非GAAP营业利润预计在1.83亿至1.84亿美元之间,营业利润率为22%;非GAAP每股完全稀释净收益预计在2.97至2.99美元之间 [20] - 2025年全年总收入(按报告基准)预计在31.13亿至31.15亿美元之间,按固定汇率计算同比增长18%,按报告基准增长19%;非GAAP营业利润预计在5.74亿至5.75亿美元之间,营业利润率为18%;非GAAP每股完全稀释净收益预计在9.60至9.62美元之间 [21] 总结问答环节所有的提问和回答 问题: 关于重回20%增长路径的看法 [22] - 公司相信能够比当前增长更快,并专注于以持久、自律的方式实现,核心增长驱动力强劲,新兴增长驱动力(如定价变化、AI、核心席位、积分)进一步加强了前景,对向上市场的势头感到兴奋 [23][24][25] 问题: AI概述是否推动了对HubSpot的额外兴趣 [26] - 营销趋势是客户和HubSpot的巨大机会,AI概述导致网站访问量下降,需要新的手册来多元化渠道,包括答案引擎优化,Inbound发布的Loop手册反响超出预期,客户对渠道多元化、使用AI进行深度细分和个性化、以及通过答案引擎优化在大型语言模型中建立可见性等方面反响积极 [27][28][29] 问题: 平台整合的驱动因素是否从成本节约转向拥抱AI代理 [29] - 客户整合平台的原因包括总拥有成本、获取统一的客户数据和上下文、以及采用AI的愿望,这三个原因大致平分秋色 [30] 问题: 第三季度业绩表现和净新增年度经常性收入趋势 [31][32] - 第三季度执行良好,表现优异得益于市场的持续强劲、多中心采用和席位扩张,以及额外的外汇顺风,强劲的净新增年度经常性收入增长需要时间才能转化为收入增长的拐点,考虑到安装基础的规模和大小 [32][33] 问题: 账单增长约束因素和净新增年度经常性收入转化为收入增长的时间 [34][35] - 账单增长受到外汇、净新增年度经常性收入组合和合同期限的影响,第三季度出现了向安装基础销售的组合转变(预付款月份较少)以及期限扩张的益处较第二季度减少,预计账单和收入增长将紧密关联,净新增年度经常性收入是领先指标,收入是滞后指标,需要净新增年度经常性收入连续多个季度高于收入增长,收入才会出现拐点,安装基础年度经常性收入已开始拐头向上,收入将跟随核心安装基础的拐点,但这需要时间 [35][36][37] 问题: 积分使用情况和信用消费趋势 [37] - 积分是通用的基于用量的定价系统,目前涵盖代理操作和Data Hub同步,未来将扩展到整个平台,公司有清晰的货币化框架:先聚焦产品和功能激活,然后驱动重复使用、持续的客户价值,最后货币化,客户代理是积分增长的主要驱动力,Data Hub同步和潜在客户代理也开始显现信用消费趋势,积分只是AI货币化的一种方式,嵌入式AI的价值体现在附加率和席位升级上,核心席位也将驱动AI价值货币化 [38][39][40][41] 问题: 第三季度净新增年度经常性收入增长趋势和LLM连接器的使用情况 [41] - 第三季度净新增年度经常性收入增长仍高于固定汇率计算的收入增长,LLM连接器的构建是因为客户和潜在客户花费大量时间在大型语言模型上,公司希望将HubSpot关于其业务和增长机会的洞察带入其中,大型语言模型是新的AI操作系统,将成为公司的AI推荐来源,ChatGPT连接器是五年来增长最快的应用,安装量达47,000次,使用模式包括会议准备、管道趋势分析、深度研究以及在HubSpot内采取行动 [42][43][44] 问题: 平均售价增长前景和升级趋势 [44] - 平均每客户订阅收入受到客户数量和组合、新客户平均售价以及升级的影响,持续面临新Starter客户增加和2024年定价变化后新客户平均售价较低的不利因素,但大额交易、多中心采用、席位升级和积分带来有利因素,第三季度平均每客户订阅收入按固定汇率计算增长1%,出现拐点,预计第四季度将继续这一趋势 [45] 问题: 新AI产品的成功衡量和客户采用 [46][47] - AI战略是嵌入AI到所有中心和平台、构建完成工作的代理、提供将数据转化为洞察的Brief Assistant和连接器,嵌入式AI策略正在发挥作用,改善了营销中心的转化率、销售中心的胜率、服务中心的工单解决率和客户满意度,从而带来更好的附加率和席位采用,代理方面,客户代理最为成熟,拥有6,200名客户,解决率超过62%,信用消费符合预期,客户处于AI采用旅程的不同阶段,公司通过合作伙伴和客户成功经理帮助他们制定路线图 [48][49][50][51] 问题: 客户数据资产状况和数据质量 [52] - 客户的数据成熟度取决于其技术栈的成熟度,如果已经采用了所有中心,数据质量往往更高,Data Hub有助于提高数据质量,平台能够整合整个客户旅程的数据并构建上下文层,这对于AI应用至关重要,HubSpot的优势在于能够整合高质量数据、跨客户旅程的数据以及结构化和非结构化数据 [53][54][55] 问题: 净收入留存率展望和驱动因素 [56] - 预计2025年净收入留存率将比去年提升几个百分点,这意味着第四季度将显著上升,驱动因素包括健康的客户美元留存率、稳定的降级、强劲的销售和服务席位升级以及核心席位升级,以及定价模型变化后客户续订带来的益处 [57][58] 问题: 2026年净留存率前景 [59] - 对2026年不做具体评论,但认为长期来看净收入留存率有进一步提升的路径,驱动因素包括健康的客户美元留存率、稳定的取消和降级、定价模型变化带来的席位升级动力以及剩余50%安装基础在2025年底后续订带来的持续顺风,核心席位和积分作为新兴驱动力将在2026年开始做出更大贡献 [60] 问题: 销售能力扩张和执行策略 [61] - 一直在两个层面投资:一是在看到明确机会的地区和细分市场持续招聘销售人员,二是在利用AI转型自身上市策略方面进行投资,利用意图数据驱动潜在客户开发、在交易过程中使用数据(引导式销售)提高了销售生产率,销售能力和销售生产率都表现良好,预计2026年将继续 [62][63] 问题: 各地区需求趋势 [64] - 没有看到地区、行业或细分市场的需求趋势发生重大变化,与之前几个季度一致,渠道势头积极,客户对Loop和Data Hub反响热烈,对客户代理和潜在客户代理感兴趣,多中心采用和向上市场势头持续,大额交易势头今年一直持续且复合增长,Clearbit遗留业务对2025年国内增长造成约1个百分点的阻力 [65][66] 问题: 第四季度季节性因素和大客户定价续订 [66] - 第四季度是每年最重要的净新增年度经常性收入季度,11月和12月尤为关键,许多迁移客户在年底续订,这将影响第四季度,截至目前,它们的表现与过去几个季度的报告一致 [67]
Data Agent 落地挑战:忽略技术框架、语义能力和运营体系,投入可能打水漂
AI前线· 2025-08-24 03:03
Data Agent落地挑战 - Data Agent看似容易上手但实际落地存在显著困难 90%的难点源于软件工程问题 统一语义层建设是成功关键[2] - 企业若忽略场景聚焦 技术框架可迭代能力或语义模型和运营体系 即使投入数月也可能无法监控评估或修改 最终停留在原型阶段[2] - 掌握统一语义层 完善技术框架和运营体系 才能使AI代理真正理解数据 快速迭代并落地应用 显著提升企业数据智能化效率[2] 技术支撑体系 - Agent交互形态是数据分析的新"head" 需要两方面技术革新:数据语义工程平台化能力和完善Agent Ops平台基础[6] - 数据工程交付将升级为Data engineering + Data Context Engineering 目标是提供data+ai一体化数据智能底座[6] - 多模态一体化高性能存算引擎支撑统一语义层的元数据和统一数据访问能力 对Agent快速响应至关重要[7] 语义层架构 - 数据语义包含四个维度:概念描述业务意义 数据表关联关系 指标计算口径 维度观测角度[8] - 语义层核心能力包括统一访问接口 MetaRAG语义元数据知识库 强大语义建模能力 自适应加速能力[8] - 统一语义层是对数据治理的更高要求 传统数据治理能力是其基础支撑 重点在于业务建模后提供统一数据知识接口[13] 实施难点与解决方案 - 从原型到成熟产品的最大落差是低估场景落地难度 存在"邓宁-克鲁格"效应 实践中90%工作量解决行为一致性 仅10%做prompt和模型调优[9] - 企业接入面临两大挑战:数据杂乱缺乏唯一真相 以及Agent效果评估体系不统一[14] - 解决方案是场景聚焦 针对特定场景构建统一语义层和评估体系[15] 行业影响与人才变革 - Agent不会替代数据工程师和科学家 但会取代部分执行工作 推动数据工作角色融合[10] - 劳动细分模式将改变 复合型人才将脱颖而出 各行业在大模型时代呈现劳动角色融合趋势[10] - 每个人都应了解Agent和LLM基本原理以更好运用大模型技术[11] 实施建议 - 企业构建统一语义层应首先聚焦场景进行语义抽象 重点构建指标和维度体系[16] - 建议以指标平台为载体构建指标语义层 该场景已被验证可行并能大幅提升数据分析效率[17] - 技术建议包括:场景聚焦搭建可迭代技术框架 强化语义模型能力建设 配套监控标注评估体系[18] 战略价值 - 掌握企业数据语义数字孪生意味着掌握下游所有AI代理行为的主动权[12] - 腾讯云通过统一数据资产平台纳管企业结构化和非结构化数据 提供统一语义建模平台进行Data Context Engineering[12] - 语义模型是对物理世界环境 关系 知识的结构化定义 是数据分析领域人与AI的共同context[12]
romptPilot全模型兼容,数据产品能力上新!
财富在线· 2025-08-14 01:36
火山引擎产品升级 - 火山引擎在8月13日 FORCE Link AI 创新巡展·青岛站活动中升级提示词工具 PromptPilot 并全面开放 同时 Data Agent 上线一客一策功能 AI 数据湖服务 LAS 上线 AI 算子广场 [1] - 山东大学和青岛港分享了基于豆包大模型和火山引擎数据产品搭建 AI 应用的实践经验 [1] PromptPilot 升级 - PromptPilot 升级后支持任意模型的提示词优化 包括公有云模型 私有化部署模型和自主训练的定制模型 [2][3] - PromptPilot 与火山引擎知识库深度融合 在文本理解任务的生成 调试和批量数据集构建环节中精准调用专业内容 提升模型在垂直领域的理解与输出能力 [3] - PromptPilot 通过自然语言交互理解用户需求 自动提炼评估标准并生成更好的提示词 上线后能采样在线流量 自动抓取分析 badcase 并进行新一轮提示词优化 [2] Data Agent 升级 - Data Agent 上线一客一策功能 该功能是智能营销 Agent 的核心能力 可整合分析客户多维度信息 企业内部知识库和公域联网数据 生成针对性营销方案 [5] - 一客一策支持通过 Data Agent 在全域数据中挖掘需求 依托大模型自主调用工具 并能快速嵌入企业 APP 和流量运营体系等多元场景 [6] - 一客一策推动 MQL 向 SQL 转化效率最高提升达300% 数据利用率从10%提升至95% 单个客户分析耗时从30分钟缩短至2分钟 [6] AI 数据湖服务升级 - AI 数据湖服务上线 AI 算子广场 提供100余种即插即用的标准化算子 集成主流开源算子库 并支持用户封装自定义算子 覆盖文本 图像 音视频等多模态数据处理场景 [7][8] - AI 算子广场将文档解析 OCR 识别 视频合成等复杂 AI 能力封装 用户可通过可视化拖拽快速编排模块化工作流 实现知识资产的自动化流通与增值 [8][9] - 数据处理任务从单一模态转向多模态 数据基础设施价值从支持 BI 迈向支持 AI 火山引擎通过升级多模态数据湖和 Data Agent 帮助企业构建智能化数据体系 [4]
火山引擎全面开放PromptPilot,数据产品能力上新
南方都市报· 2025-08-13 06:13
火山引擎产品升级 - 火山引擎升级提示词工具PromptPilot 支持任意模型的提示词优化并全面开放所有用户 [1] - Data Agent上线"一客一策"功能 AI数据湖服务LAS上线"AI算子广场" [1] - 山东大学和青岛港分享基于豆包大模型和火山引擎数据产品搭建AI应用的实践经验 [1] PromptPilot升级详情 - PromptPilot通过自然语言交互理解用户需求 自动提炼评估标准并生成更好的提示词 [2] - 支持采样在线流量 自动抓取分析badcase并自发进行新一轮提示词优化 [2] - 升级后支持全模型兼容和全链路知识库融合 包括任意公有云模型、私有化模型或定制模型 [2][3] - 与火山引擎知识库深度融合 在文本理解任务中精准调用专业内容解决垂直领域专业难题 [3] Data Agent功能增强 - 智能营销Agent推出"一客一策"核心能力 整合分析客户多维信息、企业知识库和公域联网数据 [4] - 通过深度分析与智能推理生成精准用户侧写和针对性营销方案 相当于为每位客户配备虚拟销售 [4] - 支持全域数据挖掘需求 依托大模型自主调用工具 快速嵌入企业APP和流量运营体系等多元场景 [5] - 推动MQL向SQL转化效率最高提升300% 数据利用率从10%提升至95% 单个客户分析耗时从30分钟缩短至2分钟 [5] AI数据湖服务升级 - 多模态数据湖能力升级 AI数据湖服务上线"AI算子广场" 实现对文本、图像、音视频等多模态数据整合管理 [5] - 提供100余种即插即用标准化算子 集成主流开源算子库 支持用户封装自定义算子 [6] - 通过可视化拖拽快速编排模块化工作流 将分散数据转化为知识资产 实现自动化流通与增值 [7]
喝点VC|BV百度风投:数据治理即生产力,现在是Data Agent的时刻
Z Potentials· 2025-07-30 03:37
行业趋势 - 生成式AI推动数据从静态资产转向实时决策前台,数据成为可被语义标注、即时调用的数字化资源 [3] - 全球数据量2024年达149ZB,2025年将突破181ZB,其中80%为非结构化内容,需即时结构化才能参与推理链路 [5] - 生成式AI每年可贡献2.6–4.4万亿美元新增价值,75%收益源自研发、软件工程等高度依赖结构化数据的职能 [5] - Data Agent赛道终局想象空间远超传统ETL或BI,早期落地者已验证≥60%生产力提升或数百万美元年度节省 [7] Data Agent定义与价值 - Data Agent是围绕数据生命周期全栈自动化的AI智能体,能按自然语言意图自主规划、执行与校验 [7] - 传统数据栈分为"搜索—管理—分析"三段,Data Agent将表格操作对话化,Coding Agent处理定制化查询 [8] - Gartner预测2027年AI Agents将完成50%业务决策,首波落地点为数据流密集的报表、监控与预算场景 [9] - Data Agent接管"找数+清洗"环节,人类分析师转向假设验证与策略设计,形成多Agent协同生态 [9] 技术拐点与市场成熟度 - LLM推理成本三年内从每百万token 60美元降至0.06美元,年化下降1000倍 [10] - AI搜索占美国桌面端查询5.6%(一年翻倍),用户接受"自然语言直连结构化答案"模式 [13] - Databricks以13亿美元收购MosaicML,Snowflake收购Neeva,资本聚焦"模型原生数据平台"叙事 [13] - 开源框架LangChain、Llama-Index等一年内Star总量翻番,为Data Agent提供即插即用运行时 [13] 应用场景与效率提升 - 全球11亿办公人群每日使用Excel,但60–80%工时耗在"找数+清洗"环节 [15] - 开源项目Teable将企业CRM搭建周期从3~5天压缩至7分钟,效率提升约600倍 [17] - Snowflake Cortex使营销机构洞察速度提高30倍,数百次查询节约三周净工时 [18] - 法国Dust为银行部署私域Data Agent,一年节省50,000人工小时及数百万欧元成本 [18] 产品创新与交互变革 - 飞书多维表格通过自然语言实现数据查询、公式生成与自动化工作流,降低操作门槛 [28] - Airtable Omni Agent可秒级完成「找数—分析—决策」链路,支持数万条记录的模式识别 [33] - Perplexity月活1500万,估值180亿美元,其企业API与三星、苹果洽谈预装合作 [27] - Exa提供语义搜索API,支持网页抓取与摘要生成,加速市场调研与竞争分析 [27] 发展阶段与商业模式 - 阶段1(人类主导):Data Agent让自然语言成为操作界面,摩根士丹利理财顾问使用率达98% [36] - 阶段2(场景驱动):Data Agent自动生成完整应用系统,MIT研究显示实时响应企业营收增长率高62% [40] - 阶段3(自治智能):Data Agent演化为"数字COO",东京酒店动态定价系统提升每房收益6–10% [41] 市场机会与竞争格局 - 75%知识工作者已使用生成式AI,但53%企业缺乏组织级效率转化方法论 [42] - 2024年AI Agent赛道融资38亿美元(同比增3倍),超六成流向"数据—洞察—行动"闭环项目 [45] - 头部玩家稀缺,仅Glean、Dust等少数项目月活破百万或ARR过千万,技术栈仍处开荒阶段 [46] - 67%企业2025年将新增Gen AI预算投入数据管线自动化,开源框架距企业级需求仍有差距 [46]
Data Agent如何帮助企业打造懂你的“电子牛马”?|数势xSelectDB
量子位· 2025-07-05 04:03
核心观点 - Agent产品正在从通用型转向垂直企业级,强调"懂业务"的能力,需理解业务概念、逻辑并提出实际操作建议[7][8][11] - 数据Agent通过语义层连接自然语言与业务数据,解决传统BI灵活性不足问题,实现个性化、主动式和强大执行力的数据分析[14][20][21] - 企业智能化发展需结合强模型与优质私域数据,通过Data Agent激活沉睡数据,提升决策效率[24][41][42] 行业趋势 - 数据分析从"User-facing"转向"Agent-facing",未来Agent数量可能是人员10-100倍,要求数据库具备高并发、实时性和多数据类型支持[16][17] - 垂直场景中Data Agent价值更显著,如零售督导巡店、营销反欺诈等需灵活及时决策的领域[27][30][31] - AI Agent将重构企业组织结构,催生"超级个体"和新型角色如"电子牛马饲养员",增强而非完全替代人力[38][39] 技术路径 - 有效路径为NLP-to-Semantic而非Text-to-SQL,需构建企业私域知识体系实现语义映射[15] - 数据库需支持细粒度权限控制(RBAC),应对AI时代数据安全挑战,精确到行列级访问权限[35][36] - 分析型数据库需优化索引、实时查询和多源数据整合能力,如与COS对象存储打通处理非结构化数据[17][26] 应用场景 - 零售行业典型案例:通过Agent实时分析门店销售/员工离职率等数据,支持督导精益化运营决策[27][28] - 封闭场景可实现规则化自动决策,开放场景则提供结构化分析报告辅助人工判断[32][33] - 传统BI模式下被压抑的业务需求得以释放,数据消费频率提升10-100倍[25][26] 实施关键 - 企业需重点治理私域数据和语义系统,建立分析范式并沉淀为Agent模板[39][43] - 业务与平台联合共建至关重要,需持续探索适合落地的use case[44] - 评估标准分两类:封闭场景看规则执行准确率,开放场景看信息呈现完备度[32][34]