Workflow
神经 - 符号主义
icon
搜索文档
高阶程序,让AI从技术可行到商业可信的最后一公里
机器之心· 2025-09-16 11:57
AI发展阶段的转折 - 行业进入从模型竞赛转向工程竞赛的AI下半场 核心命题从AI能做什么转变为如何让AI做得对做得好不出错 [4] - 当前大模型在常见任务中可靠性仅达70%-85% 与金融医疗等领域99%以上的及格线存在巨大鸿沟 [14] - 实现AI广泛应用需要可靠性保障 涉及准确度速度确定性及幻觉问题等多个细分指标 [4] 数据与可靠性的核心地位 - 数据决定AI应用能力上限 但数据本身不会自动创造价值需要可靠加工引擎 [3] - 幻觉是当前AI范式下的固有系统性问题 源于训练评估程序奖励猜测而非承认不确定性 [8] - 行业需要将不确定的智能与确定的工程逻辑深度融合的新范式 [14] 现有技术方案的局限性 - RAG能降低幻觉但带来向量库集中化权限与陈旧数据风险 在合规敏感场景需谨慎设计 [9] - 智能体编排方便灵活但缺乏内部细粒度核验会导致错误放大 [9] - 神经-符号方法提升可解释性与判定性 但各方案对输出不确定性缺乏强约束 [4][9] 高阶程序(HOP)的工程化解决方案 - HOP是神经-符号主义思想的深度工程实践 为AI智力引擎构建可靠控制系统 [17][22] - 通过编程语言表达业务逻辑构建符号骨架 自然语言调用大模型处理神经任务 [23][25] - 核心机制HopLogic执行框架利用核验复杂性塌缩原理 实现99%以上可靠性 [28][29] - 建立完成率与正确率两大指标 使AI能力边界和可靠性可度量可管理 [34] HOP的实际应用效果 - 在金融风控建模中将可靠性从不足10%提升至99%以上 开发时长从数天缩短至1天以内 [42][43] - 通过内置精确业务规则确保每个关键节点行为受控 弥补传统AI框架短板 [46][47] - 提供比SFT更敏捷经济的迭代方式 通过优化程序逻辑等轻量级方法提升应用表现 [52] 行业标准化与生态发展 - 蚂蚁集团联合十余家机构起草大模型金融领域可信应用参考框架 核心思想与HOP一致 [48][50] - HOP开源推动开放生态建设 结合HopCorpus场景语料集构建提升能力上限 [64] - AI下半场始于数据成于工程 需要可靠框架与高质量数据双核心驱动 [55][64]