研究背景与核心观点 - 心理健康污名化现象在全球范围内普遍存在,患者常因社会歧视延迟或拒绝治疗,世界卫生组织数据显示这一问题严重影响数亿人生活[2] - 现有自然语言处理技术对心理健康污名的识别存在局限,缺乏真实对话场景数据和社会文化背景考量[3] - 新加坡国立大学AI4SG实验室构建首个专家标注的心理健康污名访谈语料库MHStigmaInterview,获ACL 2025 Oral论文及高级领域主席奖[3][6] 研究方法与框架 - 采用心理学归因理论构建七维度标注体系:责任归因(9.51%)、社交距离(9.15%)、愤怒(7.20%)、恐惧(8.86%)、怜悯、拒绝帮助、强制隔离[10][11][19] - 通过三阶段聊天机器人访谈系统(Nova)收集数据:破冰阶段→情境植入(虚构抑郁症患者Avery故事)→深度访谈[14][15] - 最终语料库包含4,141个访谈片段,684名参与者,17万字符,专家标注一致性Cohen's kappa=0.71[19] 数据特征与发现 - 53.9%回答无污名化表现,责任归因和社交距离是最常见污名类型[19] - 识别出六类隐性污名表达:距离化语言(如第三人称视角)、术语滥用(如随意使用"偏执")、强制性措辞、差别化支持、家长制态度、轻视化倾向[27][29] - 社会文化分析显示性别、年龄、国家背景显著影响污名表达,有心理健康接触史者污名倾向更低[32][33] 技术验证与应用 - GPT-4o在零样本设置下F1分数0.456,提供标注指南后提升至0.757[23][24] - LLaMA-3-70B和Mixtral 8x7B模型表现优于基线,但普遍存在高召回率低精确率问题[24] - 潜在应用包括内容审核工具开发、AI辅助心理干预、医疗培训支持及跨文化研究[35] 资源与成果 - 论文及数据集已开源,论文标题《What is Stigma Attributed to? A Theory-Grounded, Expert-Annotated Interview Corpus for Demystifying Mental-Health Stigma》[8] - 研究团队涵盖心理学、人机交互、计算传播学等多学科专家[2][6] - 语料库设计强调伦理审查,采用虚构角色故事减少社会期望偏差[14][18]
让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题
机器之心·2025-08-07 09:42