Workflow
工业数据管理平台(IDMP)
icon
搜索文档
【金猿人物展】涛思数据创始人、CEO陶建辉:实现AI时代时序数据库向“数据平台”的转型
搜狐财经· 2025-12-10 10:55
公司发展历程与里程碑 - 公司于2016年入局时序数据库赛道,创始人耗时两个月完成核心产品TDengine首个版本的开发,创新性地提出了“一个数据采集点一张表”与“超级表”概念,在写入速度、查询效率与压缩率上展现显著优势,成功验证技术路线并获得首批融资 [3] - 2018年底,公司发布首个可商用版本TDengine,成功签下首批客户合同,性能与稳定性满足企业级需求 [4] - 2019年7月将TDengine单机版开源,2020年8月开源集群版,2022年推出并开源云原生版本 [4] - 核心产品TDengine从最初1.8万行C代码,已成长为全球安装量超94万套的成熟产品 [3] - 近两年公司推出并开源TDgpt框架,专注时序数据预测、异常检测与补全,支持自定义Python算法接入,使产品从存储查询工具升级为具备高级分析能力的平台型产品 [4] - 2024年7月底,公司发布工业数据管理平台(IDMP),标志着其从单一时序数据库供应商向“数据采集-存储-分析-价值挖掘”全链路解决方案提供商转型 [4] - 公司已获得红杉、GGV、经纬、明势资本等多家机构近7000万美元的投资 [12] 市场机遇与赛道选择 - 公司选择时序数据库赛道的首要驱动力来自新兴场景的爆发式数据需求,例如2016年AlphaGo掀起的AI热潮使自动驾驶成为核心应用场景,车辆传感器产生的高频、连续时序数据传统数据库难以高效处理 [3] - 能源革命推动电网向分布式转型,风电、光伏等新能源的普及让能源流动实时记录与调度需求激增,数据量呈指数级增长,对存储与处理效率提出极高要求 [3] - 时序数据库已在IT运维领域应用,例如滴滴、字节跳动等企业面临数百万台服务器的监测数据处理难题,而工业物联网、零售智能化等场景的数字化转型进一步扩大了时序数据的应用范围 [3] - 当时市场缺乏成熟的时序数据库解决方案,早期入局者InfluxDB产品表现未达预期,凸显了技术空白与市场潜力 [3] 核心竞争优势与战略 - 开源战略是获取市场信任的关键,TDengine核心代码完全开源,公司提供完整的性能测试代码与文档,使产品性能“透明可见”,开源模式降低了试用成本并吸引全球开发者参与社区建设,成为有效的“获客渠道” [5] - 产品标准化是高效扩张的核心优势,TDengine支持标准SQL,能满足不同行业通用需求,避免了应用类产品常见的大量定制化开发,使公司可集中资源投入核心技术迭代,实现“标准化产品规模化销售” [5] - 技术创新是持续领先的根本保障,从“超级表”模型到开源架构、云原生适配,再到TDgpt与工业数据管理平台的推出,公司始终聚焦时序数据处理核心痛点 [5] - 独特的数据模型让产品性能远超同类,工业数据管理平台则实现了从“工具”到“解决方案”的升级 [5] AI时代的产品演进与核心技术 - AI技术的普及给传统时序数据库带来挑战,也催生了其核心能力在三个维度的迭代升级:数据交互模式从“冰冷表格”向“语义化输出”变革;数据消费逻辑从“主动查询(Pull)”向“智能推送(Push)”转型;产品定位从“单一数据库”向“全链路数据平台”升级 [6][7] - 时序数据库的发展趋势是整合“采集-存储-实时计算-分析-可视化-报警”多环节能力,成为一站式数据平台,实现从“数据存储”到“价值输出”的闭环 [7][8] - 公司提出的“无问智推”技术旨在实现数据消费从“Pull”到“Push”的根本性转变,其核心逻辑是基于TDengine的“一个数据采集点一张表”、“超级表”、“虚拟表”三大概念,结合场景化大模型,自动识别数据场景,判断用户应关注的核心指标、报表类型与可视化面板,并主动推送分析结果 [8] - IDMP平台实现的“自动生成可视化面板”解决了Text-to-SQL落地难、查询不准确的行业痛点,依托“超级表”、“虚拟表”等核心概念,TDengine几乎无需关联查询(Join操作),虚拟表可将多个设备、多个采集点的数据整合为一张“大宽表”,大幅降低了SQL查询复杂度 [9] - 公司的流式计算引擎基于SQL构建,能够高效处理实时时序数据,让面板所需的实时分析结果快速生成 [10] - 在自动生成可视化面板时,不同于直接让AI生成SQL语句,TDengine先通过AI生成面板与报表模板,再利用自研规则引擎将模板转化为100%准确的SQL语句,确保数据查询精准无误 [10] 行业未来趋势 - 未来10年,时序数据库的发展将紧扣技术融合与价值升级,核心趋势集中在两大方向:一方面是与AI深度融合,借助AI技术实现数据的智能分析与价值挖掘;另一方面是进一步整合“采集-存储-计算-分析-可视化”全链路能力,打造端到端解决方案,让用户无需依赖第三方工具即可直接从海量时序数据中提炼价值 [11] - 云计算与时序数据库的结合已成为行业基础配置,而AI将成为下一个核心融合点 [11]