Workflow
AI造假
icon
搜索文档
专访雅为科技杨乔雅:当AI开始“造谣”,技术被“投毒”,谁来监督
搜狐财经· 2025-11-02 13:19
AI生成内容的“幻觉”问题与风险 - AI“造假”在技术上被称为“幻觉”,是模型基于概率预测生成文本时的固有现象,当训练数据有问题或信息不足时,模型会为了生成流畅答案而“编故事” [3] - 当拥有亿级用户的平台其AI产品频繁出现事实性错误时,问题超越了技术范畴,可能误导公众认知并干扰市场秩序,演变为公共信任危机 [3] - 比无意识“造假”更危险的是该能力被有意识地“武器化”,例如通过“数据投毒”进行不对称的灰色战争 [3] “数据投毒”的攻击模式与影响 - 攻击者无需高深技术,只需有组织地在论坛、内容农场等网络角落大规模散布针对特定公司或个人的精心包装的虚假信息,这些信息会被AI爬虫捕获成为训练“养料” [3] - 当用户查询相关对象时,AI会将这些“毒药”包装成看似客观的答案输出,形成“借刀杀人”的攻击模式,攻击者隐藏于暗处,AI成为散布谣言的帮凶 [4] - 受害者澄清一条谣言的成本远高于制造一万条谣言,导致其百口莫辩 [5] 企业对AI真实性的责任与应对措施 - 企业是保障AI真实性的“第一责任人”,需将“真实性”提升至与“流畅性”同等的战略高度 [6] - 技术上需引入“溯源”和“事实核查”机制,AI给出答案时应附带可验证的权威来源并标明置信度,内部建立动态“事实知识库”对高风险话题进行实时校准 [6] - 数据上需建立更严格的数据清洗管道,对数据源进行可信度评级并优先采用权威信源,同时开发能监测“数据投毒”的算法以主动识别和清除恶意信息 [6] - 流程上需设立透明且响应迅速的举报通道,一旦证实存在恶意投毒,不仅要紧急修复模型,还应发布公告甚至为受害者提供数据证据以协助法律维权 [6] 用户应对AI不实信息的策略 - 用户需从“信息的被动接收者”转变为“批判性的信息消费者”,交叉验证是黄金法则,不将AI答案当作最终结论而是信息探索的起点,并去权威媒体、官方网站等多方求证 [7] - 用户应善用辟谣工具和事实核查网站,发现AI生成不实信息时立即通过官方渠道反馈,每一次有效举报都相当于为公共AI模型“接种疫苗” [8] 监管、立法与社会协同治理 - 监管与立法必须跑赢技术发展,尽快为AI生成内容划定法律红线,明确“利用AI或数据投毒进行商业诋毁”的行为性质与严厉罚则,大幅提高违法成本 [9] - 应推动行业建立AI可信度认证体系,对模型的公平性、透明度和可问责性提出硬性要求 [10] - 网信、市场监管等部门需协同治理,与AI企业建立信息共享机制,形成打击“数据投毒”的合力 [11] - 社会与媒体应扮演“探照灯”和“瞭望塔”角色,通过持续的舆论监督迫使企业不敢懈怠,推动行业健康发展 [11]
管住AI造假,留住社会信任
科技日报· 2025-10-17 01:09
案件概述 - 北京市场监管部门查处首例利用AI技术进行虚假广告宣传的案件,涉事公司在其直播中宣称其普通食品具备疾病治疗功能[1] - 直播中出现了利用AI技术伪造生成的知名央视主持人形象,营造“权威背书”假象[1] AI技术滥用风险 - AI技术日益成熟,“AI换脸”技术门槛大幅降低,仅凭一张图片或一段声音即可生成高度逼真伪造视频[1] - 不法商家利用AI深度伪造科学家、医生、运动员、演员等知名人士面容和声音进行虚假宣传[1] - 此类行为侵犯被仿冒者权益,对公众实施欺诈,并蚕食社会信任基础[1] 监管应对与行业责任 - 我国《人工智能生成内容标识办法》于今年9月正式施行,要求AI生成内容必须添加显式标识并鼓励添加数字水印[1] - 内容传播平台、AI生成服务平台和应用程序分发平台需优化AI识别技术,加强鉴伪追溯能力,落实责任义务[2] - 监管部门应加大执法力度,对违规平台和个人依法查处,形成震慑[1]
网信、公安重点整治AI造假、挑动负面情绪等乱象
中国新闻网· 2025-10-10 05:58
网络谣言主要类型 - 9月网络谣言主要集中在公共政策、灾情汛情、社会民生等领域[1] - 存在伪造政策文件行为,例如编造“2025年国家薪资补贴申领认证通知”以套取实名信息实施诈骗[1] - 存在虚构悲情故事行为,例如策划拍摄“大凉山姑娘被拐24年后回到亲人身边”的视频博取关注[2] - 存在滥用AI工具编造虚假灾情行为,例如用AI技术拼凑生成“郑州9月16日遭大暴雨”的虚假视频[2] 具体谣言案例与手段 - 不法分子冒用农业农村部名义,伪造部委公文,推出“中国三农”投资理财APP进行非法集资[1] - 有自媒体发布“广东或遭遇人类最大台风灾害”的信息夸大事实,而中央气象台数据表明“桦加沙”远未达“史上最强台风”等级[2] - 社交平台出现多张“深交所门前牛雕塑被拴”的图片,被证实系AI合成[2] - 有人以“扩大内需”“国家项目”为噱头,发布“参与国家项目获荣誉证书和政绩补贴”等不实信息[1] 监管行动与整治重点 - 中央网信办部署开展“清朗·整治恶意挑动负面情绪问题”专项行动,重点整治挑动群体极端对立情绪、宣扬恐慌焦虑等问题[3] - 网信部门针对微博、快手、今日头条、UC等平台未落实信息内容管理主体责任依法查处[3] - 公安机关依法打击造谣传谣违法行为,相关造谣传谣者已被依法处罚[3]
伪造官方项目 夸大灾情信息 演绎悲情剧本 网信、公安重点整治AI造假、挑动负面情绪等乱象
央视网· 2025-10-10 05:28
网络谣言主要领域 - 9月网络谣言主要集中在公共政策、灾情汛情和社会民生等领域 [1] - 谣言形式包括伪造政策文件、虚构悲情故事以及滥用AI工具编造虚假灾情 [1] 公共政策类谣言案例 - 不法分子编造"2025年国家薪资补贴申领认证通知"进行诈骗 [1] - 冒用农业农村部名义的"中国三农"投资理财APP开展非法集资活动 [1] - 以"扩大内需"和"国家项目"为噱头发布不实信息侵害群众财产安全 [1] 灾情汛情类谣言案例 - 自媒体发布"广东或遭遇人类最大台风灾害"的夸大信息 [1] - 社交平台出现AI合成的"深交所门前牛雕塑被拴"等虚假图片 [1] - 河南暴雨期间有账号使用AI技术拼凑生成"郑州9月16日遭大暴雨"的虚假视频 [1] 社会民生类谣言案例 - 自媒体策划拍摄"大凉山姑娘被拐24年后回到亲人身边"的虚假视频 [2] - 编造"中国籍女子嫁到外国贫民窟求助回国"的苦情戏码吸引关注 [2] 监管与整治行动 - 中央网信办部署开展"清朗·整治恶意挑动负面情绪问题"专项行动 [2] - 网信部门依法查处微博、快手、今日头条、UC等平台未落实信息内容管理主体责任 [2] - 公安机关依法打击造谣传谣违法行为 相关造谣传谣者已被依法处罚 [2]
用AI伪造门店照片,“假门面”带不来真流量
新京报· 2025-09-15 09:44
AI技术在外卖平台的应用与问题 - 外卖平台商家利用AI生成技术制造虚假门面图片,包括醒目招牌、精良装修和坐满食客的烟火气,以营造人气爆棚的假象 [1] - AI生成图片操作简单且成本极低,商家使用AI伪造网红门面旨在误导和欺骗消费者,以达到引流和促进成交的目的 [1] - 记者实地探访发现,标注为堂食店的实际地址是狭小通道内的数十家外卖小作坊,无一家真实堂食店,证实商家使用AI造假欺骗消费者 [1] 对消费者的影响 - 消费者被AI制造的不实图片误导后,知情权和选择权受到侵害,同时消费成本增加 [2] - 消费者可能因虚假门面图被误导而遭遇食品安全问题 [2] 平台治理与监管现状 - 仅个别外卖平台明确回应不允许商家使用AI生成门面图行为,多数平台未否定这一做法 [3] - 尽管部分平台已成立专项小组或治理团队并制定更严格的商家管理规范,但因审核制度及效果不同,AI门头图仍不时出现 [3] - 外卖平台和电商平台需从技术角度研发反AI造假工具,平台需落实主体责任,监管者需强化监管责任 [3] 解决方案方向 - 解决AI造假门面问题需要平台、监管部门等多方共同发力 [4]
如何不让AI成为造假者的利器?
中国经济网· 2025-08-29 09:47
AI克隆声音侵权现象 - AI克隆声音技术被部分自媒体博主用于推广农产品和24小时直播互动 成为流量获取手段 [1] - 利用技术工具仿冒他人声音带货超出正常商业营销范畴 属于违法行为 [1] - 民法典第一千零二十三条规定禁止通过信息技术手段伪造方式侵害他人声音权益 [1] 平台治理与技术应对 - 社交媒体平台已升级AI内容识别系统 要求AI生成作品进行明确标识 [1] - 存在从业者刻意规避平台强制标注机制 甚至公开销售绕过AI打标经验 [1] - 平台需开发高效内容检测工具 结合人工审核并健全辟谣机制 及时下架不实内容 [1] 监管政策与实施 - 国家网信办等四部门联合发布《人工智能生成合成内容标识办法》 将于9月1日正式施行 [2] - 新规要求所有人工智能生成合成内容必须进行标识 [2] - 监管存在一定局限性和滞后性 需持续完善 [2] 消费者应对策略 - 消费者需保持辨别真伪的独立思考能力 对违背常识信息保持警惕 [2] - 建议通过阅读经典文章替代短视频消费 提升信息鉴别能力 [2] - 对未经证实的网络爆料需保持冷静态度 这是网络社会生存发展的基础技能 [2] 技术发展趋势 - AI造假与打假将呈现长期博弈态势 被视为猫鼠游戏式的持久战 [2] - 监测技术需与时俱进持续升级 当前仍存在大量未标注AI内容 [1] - 技术治理需通过开发更高效检测工具与人工审核相结合实现 [1]
“完美候选人”可能啥都不会?AI造假攻陷远程面试
36氪· 2025-08-15 12:10
AI驱动的招聘欺诈趋势 - Gartner预测到2028年全球约四分之一候选人资料可能为假[2][6] - 6%的求职者承认在面试中通过冒充或替考等手段作弊[2] - AI技术显著降低造假门槛 包括深度伪造影像、语音合成和实时应答的聊天机器人[3][5] 伪造手段与技术特征 - 伪造目标集中于远程岗位、技术岗和高薪职位[3] - 语音克隆系统可模拟英语母语者 深度伪造视频呈现"训练有素"的假人形象[5] - 地下"面试作弊链"已形成规模化供给 提供假身份、假技能和假经历包装服务[5] 企业应对措施 - 谷歌、思科、麦肯锡等公司在关键环节恢复线下面试以核验候选人真实性[6] - 远程面试风险抬升 线下面试重新成为信任保障机制[6] - 企业面临AI伪造候选人挑战 需将验证环节前移并加强常态化审核[6] 行业影响与挑战 - HR需要对抗拟人化、智能化和情感化的AI假象[6] - 招聘行业面临信任危机 需适应技术变革带来的验证方式革新[6] - AI造假可能导致"完美求职者实际无能力"的雇佣风险[6]
AI图像水印失守!开源工具5分钟内抹除所有水印
量子位· 2025-08-14 04:08
AI图像水印技术现状 - 当前主流AI图像水印技术采用隐性水印方式,通过修改频谱幅度嵌入水印,对裁剪、模糊等操作具有鲁棒性[8][10][13] - 谷歌SynthID将水印嵌入图像低频部分(如平滑区域),而高频部分(如细节纹理)因变化剧烈不适合作为载体[15][16][17] - 微软研究显示人类识别AI图像成功率仅62%,凸显水印技术的必要性[33][34] UnMarker技术突破 - 新型去水印工具UnMarker可在5分钟内破解几乎所有AI图像水印,包括完全破解HiDDeN和79%破解SynthID[1][2][27] - 采用频谱攻击策略:直接修改全图频谱幅度而非定位水印位置,实现57%-100%的水印去除率[22][23][25][26] - 支持消费级显卡(如RTX 5090)本地部署,大幅降低使用门槛[5][30][31] 技术原理与效果 - 隐性水印依赖频谱幅度分布模式相似性,而频谱相位因图像差异大不适合作为载体[9][11][13] - 去水印过程会轻微改变图像质量(如头发细节),但裁剪可优化效果[18][29] - 对StegaStamp等新型水印仍能去除60%,展现强通用性[21][28] 行业影响 - 欧盟《人工智能法案》推动的水印技术因UnMarker出现面临可靠性挑战[35][36] - 现有水印检测器需定制化开发,而UnMarker实现通用"通吃"方案[20][21] - 开源发布加速技术扩散,可能重塑AI内容认证体系[5][6]
“特朗普爱上保洁”和“1.5亿美金短剧神话”:社会信任资本正在被谁透支?
36氪· 2025-08-08 02:20
假新闻事件核心分析 - 虚构短剧《特朗普爱上在白宫当保洁的我》被证实不存在,所有主流影视平台和权威媒体均无相关记录 [1] - 虚假新闻声称该剧三个月收入1.5亿美元,美国观众边骂边付费,但实际为完全捏造 [1][4] - 演员邵逸凡公开揭露剧照造假:一张来自《周六夜现场》,另一张为AI生成 [2] 虚假新闻传播链条 - 源头为7月1日"留学生日报"发布的10万+文章,标题极具误导性但内文未直接确认该剧存在 [4] - 新加坡《新明日报》和马来西亚"Astro本地圈"等媒体后续跟进报道,添加更多离奇细节 [4][5] - 海外社交平台出现大量二创短视频和图文,虚假内容被全球讨论 [8] 媒体审核机制问题 - 传统媒体如德国《明镜》周刊采用"博士核查团"机制,80名全职核查员占采编团队1/3 [9] - 国内平台型媒体主要依赖算法审核和外包团队,日均处理量达百万级,单条决策时间以秒计 [12] - 社交媒体摧毁传统审核时间窗口,算法优先推送高互动内容导致先审后发机制失效 [12] 虚假内容产业链 - 假新闻网站从Facebook获得70%流量,远超《纽约时报》等严肃媒体的30% [14] - 每千次浏览广告收益可达13-14美元,形成"流量即利润"的商业模型 [14] - 部分机构以"海外短剧分销"为名收取入门费和培训费,黑猫平台相关投诉近千条 [15][17] 行业影响与资本运作 - Reelshort等出海平台被多次绑定为"暴利案例"载体,母公司中文在线股价受虚假消息影响 [17] - 虚假繁荣掩盖行业真实困境:成本高、多数项目亏损、本土化难题和文化折扣 [17] - 数据公司和营销机构通过刷量黑灰产和伪造行业白皮书直接获利 [17] 技术与社会影响 - AI生成图片和剧情仅需3分钟,极大降低造假成本 [13] - 虚假内容导致媒体公信力瓦解、政治严肃性消解和真实议题空间被挤压 [18][19] - "流量即利润"的底层逻辑不变,逐利链条将持续改头换面卷土重来 [20]
“仅退款”风波再起, 用AI伪造证据竟成作弊利器
齐鲁晚报· 2025-08-05 02:16
AI技术滥用与电商"仅退款"乱象 - AI技术被恶意用于伪造商品破损图片/视频申请"仅退款",包括凭空出现第二只手、不一致的破损痕迹、明显AI水印等造假手段[1] - AI造假导致商家损失占营收5%-8%,部分品类如鞋边去黑剂、杯子、服装、生鲜等成为重灾区[1] - 50.36%的电商平台商家投诉涉及任意"仅退款"问题,居2025年上半年投诉榜首[2] 平台规则演变与漏洞 - "仅退款"机制原为解决运费高于商品价值、生鲜易腐等特殊场景的退货难题[2] - 2025年4月主流电商平台(淘宝、拼多多、抖音等)取消或优化"仅退款",改为商家自主处理[2] - 规则调整后出现手段升级:买家使用豆包、ChatGPT等工具扭曲商品图片进行索赔[2] 行业治理建议 - 技术反制:平台应增加AI图片识别功能,实施"分级举证制度"(实拍图+视频),高价值商品需专业机构鉴定[3] - 规则完善:建立跨平台协同治理机制,共享欺诈案例数据和模型,明确"仅退款"使用情形[5] - 法律震慑:AI造假可能构成《民法典》第577条违约或《刑法》第266条诈骗罪(3000元以上可判3年)[4] - 政策配套:《人工智能生成合成内容标识办法》将于2025年9月实施,严禁删除/篡改AI内容标识[4] 行业影响评估 - AI滥用可能降低公众对新技术接受度,破坏电商市场规则[3] - 需建立"规则完善+技术反制+法律震慑"三重机制根治乱象[5] - 电商平台需承担证据审查责任,建议设立"AI伪造"快速立案通道[5]