Workflow
爬虫技术
icon
搜索文档
有判头!3 人非法爬取知名平台 8 亿条核心数据
程序员的那些事· 2025-11-18 00:44
案件核心事实与数据 - 某知名地图软件公司发现其地理坐标类数据被持续非法爬取,单日窃取量高达100万至400万条,数据涵盖商家信息、服务介绍、用户点评、排行及地理位置等核心内容[1] - 非法爬取行为涉及两家互联网平台公司,总计非法爬取餐饮商超数据8亿余行,调用地图软件公司地理坐标类数据超过300万次[1][7] - 案件造成两家公司的经济损失经检察机关认定共计5万余元,其中一家公司的损失参照其有偿批量数据查询服务的公允市场价计算,另一家则根据其因非法数据调用而消耗的服务器流量成本进行测算[8][10][12] 非法爬取的操作模式 - 主犯李某某、吴某某就职于一家科技公司,因嫌正常浏览方式获取数据效率过低,遂企图通过编写接口直接爬取数据[6] - 因自身技术能力不足,李、吴二人通过网络找到技术“外援”陈某某,双方约定以每100万次数据爬取支付400元的价格,由陈某某提供可规避平台验证机制的专用爬虫接口[6][7] - 陈某某提供的爬虫接口能够高度模拟真实用户行为,成功绕过平台的风控拦截机制[4][7] 司法认定与判决 - 法院最终判决陈某某犯提供侵入计算机信息系统程序罪,李某某、吴某某犯非法获取计算机信息系统数据罪,分别判处有期徒刑三年至六个月不等,同时适用缓刑,并处罚金三万元至一万元不等[1][3][16] - 检察机关认定,陈某某与李、吴二人形成了上下游协作关系,其提供专门用于规避系统验证机制的有偿爬虫程序及接口,行为符合提供侵入计算机信息系统程序罪的构成要件,且属情节特别严重[13][14][16] - 到案后,三名被告人均表示认识到错误,自愿认罪认罚,并同意积极赔偿公司损失[16]
个人信息被“开盒”用于营销
新华日报· 2025-10-20 04:20
案件概况与判决 - 南通市海门区人民检察院对魏某某等6人涉嫌提供侵入计算机信息系统程序罪提起公诉,海门区人民法院判决魏某某等3人有期徒刑3年6个月至3年1个月不等,并处5万元至3万元不等的罚金,另3人适用缓刑并被禁止在缓刑考验期内从事互联网相关经营活动 [1] 非法产业链运作模式 - 魏某某向谭某某支付1000元定金,以2000元总费用定制开发针对短视频平台的数据抓取软件,谭某某用一两周时间完成开发 [3] - 软件通过破解平台验证程序这一“阀门”,实现账户UID、签名、手机号码、所在城市、粉丝数量等数据信息的快速抓取 [3] - 不法分子将3款软件按“周卡”和“月卡”分级售卖,周卡售价40至80元,月卡售价80至140元 [4] - 软件购买者主要为互联网营销从业者、电商商家及黑灰产人员,后者用于涉黄、涉诈等犯罪活动 [4] - 魏某某建立起以谭某某为技术核心、洪某某等4人为代理的“研发、销售”体系,通过百度贴吧、QQ群等渠道发隐晦广告进行推广 [4] - 2024年3月至8月的5个月内,软件销量超过1万份 [4] 软件危害与影响 - 软件导致用户遭遇“精准推销”,部分数据被用于犯罪活动,购买者还可成为下级代理,形成“销售—再分销”扩散模式,放大危害 [5] - 软件被用于直播间“截流”和精准推送广告,挤压合法经营商家生存空间,破坏互联网商业生态 [5] 案件侦办难点与突破 - 案件侦办难点在于证据固定、链条追溯和技术认定,因数据抓取具有瞬时性,且犯罪环节多、人员分布广、沟通匿名 [5] - 办案团队通过锁定异常软件进行技术分析,追踪开发源头和传播路径,再通过资金流向、聊天记录等线索确定涉案人员,最终通过跨省协作将被告人全部抓获 [5] 法律认定焦点 - 庭审争议焦点为软件是否属于专门用于侵入、控制计算机信息系统的程序、工具,被告人辩称软件仅用于数据抓取且未破坏系统 [6] - 案件承办法官认定,关键在于获取方式是否合法,涉案软件是专门为“突破平台验证、批量获取信息”设计的程序,与手动查询有本质区别 [6] 行业挑战与平台防护 - 平台面临“爬虫”技术更新快、监测难度大、用户数量庞大导致难以区分正常访问与非法获取等挑战,升级防护网需要大量资金和专业人员投入 [7] - 检察机关建议平台从技术层面升级监测机制,从管理层面完善内控机制和岗位责任制,目前涉案平台的非法“爬虫”检测屏蔽率已超过90% [7] - 部分网络平台存在数据收集“越界”问题,过度收集用户地理位置、通话记录等远超业务需求的隐私数据 [8] - 建议平台遵循“最小必要”原则,只收集与核心业务相关的最少数据,以从源头降低信息泄露风险 [8]