Data Agent

搜索文档
Data Agent 落地挑战:忽略技术框架、语义能力和运营体系,投入可能打水漂
AI前线· 2025-08-24 03:03
Data Agent落地挑战 - Data Agent看似容易上手但实际落地存在显著困难 90%的难点源于软件工程问题 统一语义层建设是成功关键[2] - 企业若忽略场景聚焦 技术框架可迭代能力或语义模型和运营体系 即使投入数月也可能无法监控评估或修改 最终停留在原型阶段[2] - 掌握统一语义层 完善技术框架和运营体系 才能使AI代理真正理解数据 快速迭代并落地应用 显著提升企业数据智能化效率[2] 技术支撑体系 - Agent交互形态是数据分析的新"head" 需要两方面技术革新:数据语义工程平台化能力和完善Agent Ops平台基础[6] - 数据工程交付将升级为Data engineering + Data Context Engineering 目标是提供data+ai一体化数据智能底座[6] - 多模态一体化高性能存算引擎支撑统一语义层的元数据和统一数据访问能力 对Agent快速响应至关重要[7] 语义层架构 - 数据语义包含四个维度:概念描述业务意义 数据表关联关系 指标计算口径 维度观测角度[8] - 语义层核心能力包括统一访问接口 MetaRAG语义元数据知识库 强大语义建模能力 自适应加速能力[8] - 统一语义层是对数据治理的更高要求 传统数据治理能力是其基础支撑 重点在于业务建模后提供统一数据知识接口[13] 实施难点与解决方案 - 从原型到成熟产品的最大落差是低估场景落地难度 存在"邓宁-克鲁格"效应 实践中90%工作量解决行为一致性 仅10%做prompt和模型调优[9] - 企业接入面临两大挑战:数据杂乱缺乏唯一真相 以及Agent效果评估体系不统一[14] - 解决方案是场景聚焦 针对特定场景构建统一语义层和评估体系[15] 行业影响与人才变革 - Agent不会替代数据工程师和科学家 但会取代部分执行工作 推动数据工作角色融合[10] - 劳动细分模式将改变 复合型人才将脱颖而出 各行业在大模型时代呈现劳动角色融合趋势[10] - 每个人都应了解Agent和LLM基本原理以更好运用大模型技术[11] 实施建议 - 企业构建统一语义层应首先聚焦场景进行语义抽象 重点构建指标和维度体系[16] - 建议以指标平台为载体构建指标语义层 该场景已被验证可行并能大幅提升数据分析效率[17] - 技术建议包括:场景聚焦搭建可迭代技术框架 强化语义模型能力建设 配套监控标注评估体系[18] 战略价值 - 掌握企业数据语义数字孪生意味着掌握下游所有AI代理行为的主动权[12] - 腾讯云通过统一数据资产平台纳管企业结构化和非结构化数据 提供统一语义建模平台进行Data Context Engineering[12] - 语义模型是对物理世界环境 关系 知识的结构化定义 是数据分析领域人与AI的共同context[12]
romptPilot全模型兼容,数据产品能力上新!
财富在线· 2025-08-14 01:36
火山引擎产品升级 - 火山引擎在8月13日 FORCE Link AI 创新巡展·青岛站活动中升级提示词工具 PromptPilot 并全面开放 同时 Data Agent 上线一客一策功能 AI 数据湖服务 LAS 上线 AI 算子广场 [1] - 山东大学和青岛港分享了基于豆包大模型和火山引擎数据产品搭建 AI 应用的实践经验 [1] PromptPilot 升级 - PromptPilot 升级后支持任意模型的提示词优化 包括公有云模型 私有化部署模型和自主训练的定制模型 [2][3] - PromptPilot 与火山引擎知识库深度融合 在文本理解任务的生成 调试和批量数据集构建环节中精准调用专业内容 提升模型在垂直领域的理解与输出能力 [3] - PromptPilot 通过自然语言交互理解用户需求 自动提炼评估标准并生成更好的提示词 上线后能采样在线流量 自动抓取分析 badcase 并进行新一轮提示词优化 [2] Data Agent 升级 - Data Agent 上线一客一策功能 该功能是智能营销 Agent 的核心能力 可整合分析客户多维度信息 企业内部知识库和公域联网数据 生成针对性营销方案 [5] - 一客一策支持通过 Data Agent 在全域数据中挖掘需求 依托大模型自主调用工具 并能快速嵌入企业 APP 和流量运营体系等多元场景 [6] - 一客一策推动 MQL 向 SQL 转化效率最高提升达300% 数据利用率从10%提升至95% 单个客户分析耗时从30分钟缩短至2分钟 [6] AI 数据湖服务升级 - AI 数据湖服务上线 AI 算子广场 提供100余种即插即用的标准化算子 集成主流开源算子库 并支持用户封装自定义算子 覆盖文本 图像 音视频等多模态数据处理场景 [7][8] - AI 算子广场将文档解析 OCR 识别 视频合成等复杂 AI 能力封装 用户可通过可视化拖拽快速编排模块化工作流 实现知识资产的自动化流通与增值 [8][9] - 数据处理任务从单一模态转向多模态 数据基础设施价值从支持 BI 迈向支持 AI 火山引擎通过升级多模态数据湖和 Data Agent 帮助企业构建智能化数据体系 [4]
火山引擎全面开放PromptPilot,数据产品能力上新
南方都市报· 2025-08-13 06:13
火山引擎产品升级 - 火山引擎升级提示词工具PromptPilot 支持任意模型的提示词优化并全面开放所有用户 [1] - Data Agent上线"一客一策"功能 AI数据湖服务LAS上线"AI算子广场" [1] - 山东大学和青岛港分享基于豆包大模型和火山引擎数据产品搭建AI应用的实践经验 [1] PromptPilot升级详情 - PromptPilot通过自然语言交互理解用户需求 自动提炼评估标准并生成更好的提示词 [2] - 支持采样在线流量 自动抓取分析badcase并自发进行新一轮提示词优化 [2] - 升级后支持全模型兼容和全链路知识库融合 包括任意公有云模型、私有化模型或定制模型 [2][3] - 与火山引擎知识库深度融合 在文本理解任务中精准调用专业内容解决垂直领域专业难题 [3] Data Agent功能增强 - 智能营销Agent推出"一客一策"核心能力 整合分析客户多维信息、企业知识库和公域联网数据 [4] - 通过深度分析与智能推理生成精准用户侧写和针对性营销方案 相当于为每位客户配备虚拟销售 [4] - 支持全域数据挖掘需求 依托大模型自主调用工具 快速嵌入企业APP和流量运营体系等多元场景 [5] - 推动MQL向SQL转化效率最高提升300% 数据利用率从10%提升至95% 单个客户分析耗时从30分钟缩短至2分钟 [5] AI数据湖服务升级 - 多模态数据湖能力升级 AI数据湖服务上线"AI算子广场" 实现对文本、图像、音视频等多模态数据整合管理 [5] - 提供100余种即插即用标准化算子 集成主流开源算子库 支持用户封装自定义算子 [6] - 通过可视化拖拽快速编排模块化工作流 将分散数据转化为知识资产 实现自动化流通与增值 [7]
喝点VC|BV百度风投:数据治理即生产力,现在是Data Agent的时刻
Z Potentials· 2025-07-30 03:37
行业趋势 - 生成式AI推动数据从静态资产转向实时决策前台,数据成为可被语义标注、即时调用的数字化资源 [3] - 全球数据量2024年达149ZB,2025年将突破181ZB,其中80%为非结构化内容,需即时结构化才能参与推理链路 [5] - 生成式AI每年可贡献2.6–4.4万亿美元新增价值,75%收益源自研发、软件工程等高度依赖结构化数据的职能 [5] - Data Agent赛道终局想象空间远超传统ETL或BI,早期落地者已验证≥60%生产力提升或数百万美元年度节省 [7] Data Agent定义与价值 - Data Agent是围绕数据生命周期全栈自动化的AI智能体,能按自然语言意图自主规划、执行与校验 [7] - 传统数据栈分为"搜索—管理—分析"三段,Data Agent将表格操作对话化,Coding Agent处理定制化查询 [8] - Gartner预测2027年AI Agents将完成50%业务决策,首波落地点为数据流密集的报表、监控与预算场景 [9] - Data Agent接管"找数+清洗"环节,人类分析师转向假设验证与策略设计,形成多Agent协同生态 [9] 技术拐点与市场成熟度 - LLM推理成本三年内从每百万token 60美元降至0.06美元,年化下降1000倍 [10] - AI搜索占美国桌面端查询5.6%(一年翻倍),用户接受"自然语言直连结构化答案"模式 [13] - Databricks以13亿美元收购MosaicML,Snowflake收购Neeva,资本聚焦"模型原生数据平台"叙事 [13] - 开源框架LangChain、Llama-Index等一年内Star总量翻番,为Data Agent提供即插即用运行时 [13] 应用场景与效率提升 - 全球11亿办公人群每日使用Excel,但60–80%工时耗在"找数+清洗"环节 [15] - 开源项目Teable将企业CRM搭建周期从3~5天压缩至7分钟,效率提升约600倍 [17] - Snowflake Cortex使营销机构洞察速度提高30倍,数百次查询节约三周净工时 [18] - 法国Dust为银行部署私域Data Agent,一年节省50,000人工小时及数百万欧元成本 [18] 产品创新与交互变革 - 飞书多维表格通过自然语言实现数据查询、公式生成与自动化工作流,降低操作门槛 [28] - Airtable Omni Agent可秒级完成「找数—分析—决策」链路,支持数万条记录的模式识别 [33] - Perplexity月活1500万,估值180亿美元,其企业API与三星、苹果洽谈预装合作 [27] - Exa提供语义搜索API,支持网页抓取与摘要生成,加速市场调研与竞争分析 [27] 发展阶段与商业模式 - 阶段1(人类主导):Data Agent让自然语言成为操作界面,摩根士丹利理财顾问使用率达98% [36] - 阶段2(场景驱动):Data Agent自动生成完整应用系统,MIT研究显示实时响应企业营收增长率高62% [40] - 阶段3(自治智能):Data Agent演化为"数字COO",东京酒店动态定价系统提升每房收益6–10% [41] 市场机会与竞争格局 - 75%知识工作者已使用生成式AI,但53%企业缺乏组织级效率转化方法论 [42] - 2024年AI Agent赛道融资38亿美元(同比增3倍),超六成流向"数据—洞察—行动"闭环项目 [45] - 头部玩家稀缺,仅Glean、Dust等少数项目月活破百万或ARR过千万,技术栈仍处开荒阶段 [46] - 67%企业2025年将新增Gen AI预算投入数据管线自动化,开源框架距企业级需求仍有差距 [46]
Data Agent如何帮助企业打造懂你的“电子牛马”?|数势xSelectDB
量子位· 2025-07-05 04:03
核心观点 - Agent产品正在从通用型转向垂直企业级,强调"懂业务"的能力,需理解业务概念、逻辑并提出实际操作建议[7][8][11] - 数据Agent通过语义层连接自然语言与业务数据,解决传统BI灵活性不足问题,实现个性化、主动式和强大执行力的数据分析[14][20][21] - 企业智能化发展需结合强模型与优质私域数据,通过Data Agent激活沉睡数据,提升决策效率[24][41][42] 行业趋势 - 数据分析从"User-facing"转向"Agent-facing",未来Agent数量可能是人员10-100倍,要求数据库具备高并发、实时性和多数据类型支持[16][17] - 垂直场景中Data Agent价值更显著,如零售督导巡店、营销反欺诈等需灵活及时决策的领域[27][30][31] - AI Agent将重构企业组织结构,催生"超级个体"和新型角色如"电子牛马饲养员",增强而非完全替代人力[38][39] 技术路径 - 有效路径为NLP-to-Semantic而非Text-to-SQL,需构建企业私域知识体系实现语义映射[15] - 数据库需支持细粒度权限控制(RBAC),应对AI时代数据安全挑战,精确到行列级访问权限[35][36] - 分析型数据库需优化索引、实时查询和多源数据整合能力,如与COS对象存储打通处理非结构化数据[17][26] 应用场景 - 零售行业典型案例:通过Agent实时分析门店销售/员工离职率等数据,支持督导精益化运营决策[27][28] - 封闭场景可实现规则化自动决策,开放场景则提供结构化分析报告辅助人工判断[32][33] - 传统BI模式下被压抑的业务需求得以释放,数据消费频率提升10-100倍[25][26] 实施关键 - 企业需重点治理私域数据和语义系统,建立分析范式并沉淀为Agent模板[39][43] - 业务与平台联合共建至关重要,需持续探索适合落地的use case[44] - 评估标准分两类:封闭场景看规则执行准确率,开放场景看信息呈现完备度[32][34]
国泰海通:发展Agent已成各大厂共识 新规激发并购重组市场活力
智通财经网· 2025-05-19 07:54
AI技术迭代与产品发布 - 字节跳动火山引擎发布豆包·视频生成模型Seedance 1.0 lite 支持文生视频和图生视频 生成时长5秒或10秒 分辨率480P或720P [1] - 字节推出豆包1.5·视觉深度思考模型 激活参数仅20B 具备多模态理解和推理能力 在视频理解、视觉推理和GUI Agent能力方面处于第一梯队 [1] - 字节升级豆包·音乐模型 同时正式发布Data Agent并升级Trae接入豆包深度思考模型 以强大模型矩阵和智能体工具帮助企业打通业务到智能体的应用链路 [1] - 谷歌DeepMind发布通用科学AI系统AlphaEvolve 能自主生成并改进算法代码 成功破解数学和计算机科学领域重大难题 [3] - AlphaEvolve可生成数百至数千个改进方案 通过评估者算法筛选 已用于改进下一代张量处理单元设计 节省总计算资源0.7% [3] 行业商业化与整合趋势 - AI技术迭代和Agent落地在各大厂稳步推进 AI商业化持续发展 2025年将成为AI Agent规模化商业落地的元年 [1][3] - Agent落地已成为科技大厂共识 未来发展速度有望进一步加快 [3] - 证监会修改《上市公司重大资产重组管理办法》 建立重组股份对价分期支付机制 注册决定有效期延长至48个月 [2] - 新设重组简易审核程序 适用该程序的交易无需证券交易所并购重组委审议 证监会在5个工作日内作出注册决定 [2] - 完善锁定期规则支持上市公司吸收合并 鼓励私募基金参与并购重组 此举有望激发并购重组市场活力 [2] - 证监会新规则有望加速计算机板块在数字化转型需求推动下的细分领域整合 [1][2]
大厂Capex加速增长
国盛证券· 2025-05-17 14:44
报告行业投资评级 - 增持(维持) [7] 报告的核心观点 - 推理端对高性能计算的需求快速释放,阿里、腾讯等大厂Capex持续扩张,云上游上行周期正式启动,看好由推理应用带来的云计算需求持续扩张 [1][12] - 云大厂能力全面升级,加速AI应用落地 [2] - 以LLM为核心驱动的Agent背后蕴含庞大的算力需求,算力已成为支撑Agent发展的关键基础设施和核心瓶颈 [3] 根据相关目录分别进行总结 阿里、腾讯Capex实质更乐观,AI基建正式启动 - 阿里资本开支承诺金额超预期,阿里云增速亮眼,2025Q1阿里资本开支为246.12亿元,同比增长120.68%;阿里云收入301.27亿元,同比增长17.71%,未来三年阿里将投入超3800亿元用于建设云和AI硬件基础设施 [13][16] - 腾讯资本开支符合预期,国内AI基建正式启动,2025Q1腾讯资本开支274.76亿,同比+91.35%,公司预计在2025年进一步增加Capex,预期Capex占收入的比例为低两位数百分比 [16] 云大厂能力全面升级,加速AI应用落地 - 字节:6月火山引擎2025 FORCE原动力大会召开在即,5月13日发布豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,升级豆包·音乐模型,Data Agent正式亮相并全新升级,6月11 - 12日大会有望迎来更多AI落地惊喜 [21] - 阿里云:4月9日召开AI势能大会,AI和云计算基础设施全面升级,算力上第九代ECS开启商业化,算力最高提升20%、价格较上一代再降5%;存储上文件存储CPFS面向AI智算能力再升级;运维上跨域网络SLA提升至99.995%,网络智能服务NIS已推出;管控上“灵骏”可主动发现故障并“自愈”,万卡集群有效训练时长占比超93%;推理上人工智能平台PAI面向MoE架构及推理模型全面升级;数据上瑶池数据库产品上新,支持In - DB AI、开箱即用;Agent上线业界首个全生命周期MCP服务,预告Agent Store愿景;生态上“繁花计划”启动,未来三年目标百万家客户、百亿元商机 [26][35] - 华为云:4月10日召开生态大会,创新算力架构,推出CloudMatrix 384超节点;沉淀行业Know - how,推动盘古大模型在行业场景落地;坚定投入生态建设,华为开发者规模超1200万 [36][39] 算力是Agent爆发的前提,支撑中长期成长 - Agent需要处理长上下文和接入外部数据,增加上下文长度和接入外部数据会导致算力需求增长 [42][44] - Agent执行任务验证带来算力开销,如Manus AI的三重校验体系保障输出可靠性,但需要额外计算资源 [45] - 多模态的发展会带来更大算力需求,Agent处理和整合多种类型数据需要大量计算资源 [46] - 算力瓶颈影响Agent服务的用户体验,为保证用户体验需留出冗余算力 [47][48] - 算力需求不仅体现在用户端的推理服务上,也体现在模型训练阶段,如阿里Qwen3系列模型训练需要海量算力 [50] 建议关注 - 算力:寒武纪、海光信息等多家公司 [4][53] - Agent:金山办公、泛微网络等多家公司 [4][53] - 垃圾发电:旺能环境、盈峰环境等公司 [4][53] - 互联网大厂AI链:寒武纪、恒玄科技等多家公司 [5][54] - 军工AI:能科科技、品高股份等公司 [5][54]
火山引擎在沪发布系列新模型 豆包大模型产业落地加速
新华财经· 2025-05-14 08:31
产品发布与升级 - 火山引擎发布豆包视频生成模型Seedance 1.0 lite 支持文生视频和图生视频 实现影视级生成质量与速度突破 适用于电商广告、娱乐特效、影视创作和动态壁纸等场景 [1] - 豆包1.5视觉深度思考模型具备多模态理解和推理能力 在60个公开评测基准中有38个表现突出 视频理解和视觉推理能力处于第一梯队 已上线火山方舟平台 [1] - 豆包音乐模型升级 支持英文歌曲创作和视频理解自动适配背景音乐 用户可通过一张图或一句话创作十多种风格的高品质音乐 目前已全量上线 [2] 行业应用与客户覆盖 - 豆包大模型已落地汽车、智能终端、互联网、金融、教育科研、零售消费等行业 覆盖近4亿台终端设备、80%主流车企、70%重要性银行、数十家证券基金公司及多所顶级高校与科研院所 [2] - 巨人网络与火山引擎合作 社交推理游戏《太空杀》接入豆包大模型升级AI原生玩法 机器学习平台提供大模型训练和算力资源支持自研模型迭代优化 [2] - 礼来制药搭建专属AI应用开发平台 通过火山引擎可视化工作流编排构建智能体 应用于药物研发、疾病诊疗、学术沟通、销售培训和疾病教育等场景 实现企业AI资产沉淀与持续运营 [3] 技术架构与生态战略 - 火山引擎推出Data Agent企业数据智能体 具备主动思考、洞察、分析和行动能力 融合企业内结构化与非结构化数据及互联网知识 生成专业深度研究报告并支持智能营销 [2] - 火山方舟覆盖语言、深度思考、视觉、语音等多模型领域 建立完整模型服务矩阵 通过专业化模型应对差异化业务需求释放AI价值 [4] - AI落地需完成业务视角投资回报旅程、技术视角模型基建旅程和用户视角智能体全生命周期旅程 模型、算力、数据和安全构成AI新基建 火山引擎提供AI新基础四件套服务企业智能化提效 [3]
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
机器之心· 2025-05-14 04:36
多模态大模型Seed1.5-VL发布 - 火山引擎发布5款AI模型和产品,包括豆包・视频生成模型Seedance 1.0 lite、升级后的豆包1.5・视觉深度思考模型(Seed1.5-VL)、新版豆包・音乐模型等 [1] - Seed1.5-VL具备更强的通用多模态理解和推理能力,新增视频理解、多模态智能体能力 [3] - 模型仅需一张图和提示词就能精准识别多种元素并分类给出坐标 [4] - 在60个公开评测基准中,有38个取得SOTA表现,性能与Gemini2.5 Pro相当 [6] 模型性能表现 - 推理输入价格仅为每千tokens 0.003元,输出价格为每千tokens 0.009元 [7] - 在视觉定位测试中,10秒内精准识别货架商品并完成价格计算 [14] - 能准确识别5只"生气"的小猫并给出坐标 [17] - 10秒内解决公务员图形推理题目,展示强大视觉推理能力 [20] 技术架构创新 - 由视觉编码模块SeedViT(532M参数)、MLP适配器和基于MoE架构的Seed1.5-LLM(20B激活参数)组成 [27] - 训练分为三个阶段:初期对齐视觉语言表征、中期强化知识积累、后期加入视频等新领域数据 [29] - 采用监督微调与强化学习组合策略,整合RLHF/RLVR等先进技术 [30] - 采用多模态并行框架和局部贪心负载均衡算法优化计算效率 [31] 应用场景 - 可用于构建AI视觉助手、巡检系统、交互Agent或智能摄像头 [7] - 多模态智能体能力可识别并点击"点赞"按钮,模拟用户行为 [22] - 正在重塑与视觉世界交互的方式,拓宽通用视觉系统应用路径 [31]
布局AI生态 字节系大模型“实用至上”
上海证券报· 2025-05-13 18:45
大模型产品迭代策略 - 公司发布小而专、聚焦实用的大模型产品,强调"实用至上"和"小步快跑"的迭代思路 [1] - 相比追求"一鸣惊人"的大招,公司更注重多线程并进和可靠的商业场景落地 [1] - 新发布的豆包视频生成模型Seedance 1.0 lite参数规模小但实现影视级质量,支持文生视频、图生视频,生成时长5s/10s,分辨率480P/720P [1] 视频生成模型优化 - 通过优化语义理解能力提升指令遵循精度,增强对人物表情、衣着服装的精确控制 [2] - 模型针对电商广告、娱乐特效、影视创作等场景优化,帮助客户降低制作成本与周期 [2] - 视频生成速度大幅提升,兼顾效果、速度与性价比 [1] 视觉深度思考模型 - 豆包1.5·视觉深度思考模型激活参数仅20B,在60个公开评测基准中38个取得业内最佳表现 [3] - 模型具备强大多模态理解和推理能力,在视频理解、视觉推理、GUI Agent能力等方面处于第一梯队 [3] - 新增GUI Agent能力,可跨PC端/手机端完成复杂交互任务,如自动化检测App功能 [3] AI生态布局 - 公司AI生态已覆盖汽车、智能终端、互联网、金融等行业,服务4亿终端设备、80%主流车企、70%系统重要性银行 [4] - 推出Data Agent智能体,具备主动思考和分析能力,覆盖数据分析、智能营销等企业数据应用场景 [4] - 国内首款AI原生IDE产品Trae升级,支持通过MCP协议让AI主动调用外部工具 [4][6] 技术协议战略 - 公司积极布局MCP协议(模型上下文协议),称其为AI领域的"万能插座",可降低开发成本 [5][6] - 专注于企业端垂类智能体开发,同时为开发者提供便利工具,推动行业标准化 [6] - 通过技术和资源复用实现内外服务统一,提升性价比 [4][6]