智慧芽查新检索AI Agent

搜索文档
权威评测显示:智慧芽AIAgent查新检索能力远超通用大模型
齐鲁晚报· 2025-08-21 11:58
研究背景与方法 - 智慧芽发布AI工具查新检索基准测试研究报告 针对专利工作场景设计"PatentBench-查新检索"评测基准 对智慧芽查新检索AI Agent、ChatGPT-o3联网搜索版和DeepSeek-R1联网搜索版进行能力测试 [1] - 研究基于跨受理局并行审查的国际同族专利构建高质量数据集 通过自研权利要求一致性比对模型进行语义对齐与技术相似度评估 消除语言表述差异影响 [2] - 测试样本共89个 其中中文文本占比38.2% 英文文本占比61.8% IPC分类号实现均匀分布 真实模拟查新检索场景 [2][3] 评估指标体系 - 采用X检出率和X查全率两大核心指标 X检出率衡量AI工具检索到X文献的能力 在专利审查阶段尤为关键 [3] - X查全率衡量AI工具检索到尽可能多X文献的能力 在研发立项和专利申请前阶段至关重要 [6] - 评测以各受理局审查员判断新颖性与创造性时实际引用的关键X、Y类对比文献作为基准答案 经过去重与标引规范化整合形成一致可复用的参考标准 [2] 性能测试结果 - 智慧芽查新检索AI Agent在核心评估指标上显著优于通用AI工具 X检出率达到76% 是通用AI工具的2-3倍 [1][9] - ChatGPT-o3联网搜索版X检出率为32% DeepSeek-R1联网搜索版X检出率仅为9% [9] - 智慧芽工具在四分之三测试样本中都找到了至少1个X文献 [9] 应用价值分析 - 智慧芽查新检索AI Agent能在保持准确性同时成倍提高新颖性检索效率 将传统需要数小时的工作缩短至几分钟完成 [9] - 专业人士可实现从"3天重复性检索工作"到"3小时高质量分析工作"的效率跃升 将精力集中在更高价值分析和决策上 [9] - 对企业研发团队而言 该工具可在早期阶段进行高效查新检索 显著降低缺乏新颖性风险 减少研发资源潜在浪费 [9]