Workflow
DataPelago Nucleus Outperforms cuDF, Nvidia's Data Processing Library, Raising The Roofline of GPU-Accelerated Data Processing
英伟达英伟达(US:NVDA) GlobeNewswire News Room·2025-08-22 10:00

公司产品性能表现 - DataPelago Nucleus在Nvidia GPU上执行计算密集型操作时显著超越Nvidia cuDF [1] - 在复杂表达式处理中Nucleus比cuDF快达10.5倍(投影操作)、10.1倍(过滤操作)和4.3倍(聚合操作)[8] - 处理变长字符串时哈希连接操作快达38.6倍(小字符串)和4倍(大字符串),哈希聚合操作快达3.8倍,Top-K操作快达5.9倍[8] 技术架构优势 - Nucleus采用GPU优化执行层,具备更好的并行算法、快速通用工作流、多列优化支持和内核融合技术[4] - 通过零拷贝共享内存管理实现端到端字符串优化,突破GPU性能天花板[4] - 通用数据处理引擎可跨异构硬件(从CPU到GPU)无缝执行任务,无需代码或基础设施变更[1] 行业需求背景 - 企业处理ETL、商业智能和生成式AI工作负载时面临复杂数据量增长压力[2] - CPU数据处理已无法满足需求,Nvidia GPU提供大规模并行性和吞吐量优势[2] - GPU存在I/O瓶颈和内存限制问题,需要专门设计的数据处理引擎克服这些限制[2] 公司战略定位 - 致力于为加速计算时代创建新的数据处理标准,解决性能、成本和可扩展性限制[5] - 公司定位为全球首个通用数据处理引擎,支持任何数据类型、硬件和查询引擎[7] - 通过突破性思维改变数据处理经济性,推动AI驱动革命的下一波发展[6] 性能提升场景 - 多列键处理时Top-K操作性能比cuDF快达8.2倍[8] - 在多键和变长字符串排序等复杂实际工作负载中表现出比简单固定长度数据操作更高的增益[3] - 充分利用云环境中日益普及的加速硬件资源,需要非线性思维和新方法[5]