本篇文章1491字,读完约4分钟
最近,一些知名的大数据风险控制公司陷入了丑闻。他们使用“爬虫”技术侵犯用户隐私,滥用数据,并被怀疑帮助贷款和收款。这是另一种传统业务,披着科技创新的外衣,做“吊羊头卖狗肉”,值得多方警惕。
我们不否认大数据在产业升级和提高决策效率方面发挥着巨大作用。特别是,大数据风险控制日益成为金融决策的数字化大脑,广泛用于银行贷款审批和反欺诈。
可以说,大数据风险控制公司的业务逻辑应该是判断数据规则、降低风险和控制损失。但是真相呢?他们在搜集数据并出售流量。常见的情况是,一些公司使用爬虫技术获取用户信息,如购物流程、通讯录中的联系人、银行卡账单、支付宝和微信交易记录,以及公积金和社保等数据,然后打包出售。在买家中,很多都是贷款公司,他们甚至有这样一个“控风把戏”,购买大数据公司攀升的其他贷款公司的数据,按照“我会把他的家庭放多少放多少”来发放贷款,直接忽略了控风环节。事实上,第三方大数据公司提供的风险控制报告几乎都是个人信息披露报告的汇总,基本上没有大数据分析。
从用户或同行那里抓取数据成本低、速度快,这使得大数据风险控制公司走上了快速赚钱的道路,背离了风险控制的初衷。这反过来提醒我们,大数据的真正积累及其风险控制是一项缓慢的任务,数据的研究和应用甚至更加困难。
在概念包装和神秘化的情况下,我们需要认识到大数据产业在现实中的发展,大数据产业总体上还处于刀耕火种的阶段。在金融风险控制方面,从大多数银行的实际情况来看,“智能风险控制”或“智能风险控制”实际上只是以电子化和在线化的人工操作流程和各种统计报表。此外,大数据风险控制的基本功能之一是预测风险。不幸的是,频繁发生的银行卡盗窃和刷卡事件表明,目前的风险控制水平远远不能识别欺诈交易并拦截和处置它们。例如,在金融机构的“反洗钱”风险控制中,希望系统通过设定某些参数和规则来判断交易是否涉嫌洗钱,但从时间角度来看,预警是“事后”的,到发现时,损失已经发生。
更荒谬的是,打着科技旗号的大数据风险控制严重依赖人力。在日常业务场景中,即使许多企业建立了风险控制平台,他们也可能因为需要而适应用户体验和业务流畅,这使得机器的自动判断受到人为干预。特别是在现金贷款方面,许多企业都是在利益驱动和员工绩效共享机制下以风险控制的形式进行的。
可以看出,大数据风险控制在错误的方向上疯狂增长,并且在必要的路径上发展不够。也可以说,可以看到的风险可以在没有大数据的情况下完成;真正的风险是,目前的大数据风险控制水平也难以确定。
爬虫技术起源的一个客观原因是第三方公司没有足够的独立数据源,如电子商务平台或商业银行。大数据风险控制的先决条件之一是应有足够的数据。多维数据越多,用户的描述就越清晰,风险源也就越清晰。目前,数据分散在各个角落。更不用说工商、税务、征信、司法、社保等信息是相互分离的,即所有企业和企业内部各部门都“各走各的路”。这是一个常见的情况,如果一家银行不能申请消费贷款,它可以腾空后,另一家银行转身。由于数据碎片化,跨行交易监管一直是一个盲点。因此,所谓的“大”数据实际上在规模和维度上是有限的,这制约了行业的发展和风险控制的效果。打破“信息孤岛”势在必行。
爬虫技术的起源和“效益”是由于长期缺乏监管,这充分暴露了我们在保护用户隐私和安全方面明显缺乏意识和力量。虽然技术本身是无辜的,但人们会拥有它。江湖骗子杀人是可恶的,窃取和出售信息的人同样可恶。本轮行业清理和“寒冬”的到来是一次彻底的改革。冬天越冷,越多的蛾子会冻死。爬虫技术窃取数据的方式注定是不可持续的。提高数据处理能力,服务社会,实现普遍利益是未来的意义。
来源:搜狐微门户
标题:央视网评:“爬虫”滥觞 窃取数据的行径该整肃了!
地址:http://www.shwmhw.com/shxw/15360.html