大模型幻觉问题

搜索文档
百亿向量,毫秒响应:清华研发团队向量数据库 VexDB 首发,攻克模型幻觉难题
AI前线· 2025-09-25 08:04
作者 | 棱镜 AI 浪潮席卷之下,企业技术领袖们无不摩拳擦掌,渴望将这些颠覆性技术融入自身的业务核心,抢占智能时代的制高点,不料却被现实狠狠地甩下一记 耳光。 PoC 时的惊艳还历历在目——自动报告生成、智能应答客服、代码辅助开发,一切都看起来那么完美。然而,当试图将这些能力嵌入核心业务系统时, 医疗团队发现,AI 助手会面不改色地编造根本不存在的药物方案;金融机构意识到,风控模型可能依据过时的条款做出百万级的误判;连最简单的客服 场景中,AI 都能把用户引导向一个早已下架的产品。这并非由于某个技术事故,而是生成式 AI 存在已久的幻觉问题。 清华大学计算机系教授指出,大模型在垂直领域知识与实时更新上是有局限的,特别是幻觉问题,已经成为大模型深入企业级应用的掣肘。因此,行业 迫切需要一种既保留大模型生成能力,又能对其输出进行确定性约束的方案。 9 月 25 日,由李国良教授作为技术顾问的数智引航团队,正式发布向量数据库 VexDB,能够支持百亿千维向量数据毫秒级查询,召回准确度高达 99% 以上,从数据基础设施层面为 AI 应用构建一个可信的知识基石。近日,在国际权威的 DABSTEP 非结构化数据分析测试 ...
医疗影像大模型,还需“闯三关”
36氪· 2025-05-18 23:14
医疗大模型应用现状 - 医学影像大模型已在影像科医生工作全流程中实现常态化应用,从辅助工具进化为诊疗生态核心驱动力[1] - 数坤科技发布"数坤坤多模态医疗健康大模型",探索多模态精准诊断、个性化治疗决策等方向[1][2] - 透彻未来研发全球首个临床应用级病理大模型"透彻洞察",基于亿级参数和海量高精度病理数据训练[2] 技术突破与解决方案 - 病理大模型通过通用特征底座方案解决病灶分割、细胞检测等多任务泛化性挑战,简化传统数十个小模型部署流程[3] - 采用RAG技术动态更新知识库内容,结合生成式与判别式AI协同验证,降低医疗大模型幻觉风险[8][9] - 通过统一多模态架构整合影像/文本数据,采用医学思维链训练增强推理能力,实现分步验证[9] 模型泛化能力提升路径 - 数据维度:扩大样本多样性,模拟不同设备/体位/病变阶段特征,覆盖长尾病例[4][6] - 模型维度:增加参数量至亿级,改进训练策略如临床指标加权损失函数,防止过拟合[6] - 部署维度:建立三级医院与基层医院的多场景反馈闭环,明确AI能力边界并由医生把关[7] 医院部署模式演进 - 医疗一体机成为主流选择,集成硬件/软件/大模型满足数据本地化与合规性要求[10] - 纯图像大模型可适配家用GPU,通用大模型需本地数据微调,一体机实现专科与通用场景覆盖[10] - 公有云部署在远程会诊中展现弹性算力优势,但面临数据隐私合规风险[11] 未来发展趋势 - 性能层面:医疗大模型敏感度达100%基础上提升特异性,应用医院数量从三四千家扩展至超万家[12] - 多模态融合:打破影像/文本独立发展局面,整合多维数据提升诊断准确性与个性化治疗支持[12] - 全科化演变:大模型向数字化"全科医生"发展,综合检查检验/影像/病理等多维度诊疗信息[12][13]