大数据时代最大的阴影

大数据一直是近几年很热的一个话题,很多人鼓吹大数据是人工智能时代的一把钥匙,很多企业也因为能和大数据扯上关系,而在短时间内获得了很高的估值。大数据有价值这件事情,辣妈也很赞同,通过对数据的处理,分析,和挖掘,企业有时候确实能够提升业务效率,改善用户体验。

前几天不小心瞄了一眼“315”晚会,就完全忍不住了。关于辣条,土鸡蛋和电子烟,想必比我有研究的朋友很多,但是利用大数据打骚扰电话这个事情,辣妈还有一些了解的。

过去,金融圈有很多老鼠仓和操纵股价的案子,都是通过下单IP地址显示交易者在同一个地址才被“侦破”的。原先,有些股票操纵者觉得自己很聪明,去农村买些身份证来,动用多人的股票交易账户来操作,但在大数据技术侦查手段面前,却未必神不知鬼不觉。

大家都知道,大数据一直是近几年很热的一个话题,很多人鼓吹大数据是人工智能时代的一把钥匙,很多企业也因为能和大数据扯上关系,而在短时间内获得了很高的估值。大数据有价值这件事情,辣妈也很赞同,通过对数据的处理,分析,和挖掘,企业有时候确实能够提升业务效率,改善用户体验。

但需要注意的是,大数据是一把双刃剑,在涉及到个人用户隐私数据的时候,如果不加以约束,造成的后果很可能是灾难性的。辣妈之前写过几篇关于这个专题相关的文章:《要不是为了人脸识别,我早就把前置摄像头封上了》、《最了解你的人绝对不是你自己》、《发生了一件据说可能导致上万家庭破裂的事情》。

令人遗憾的是,首先,大部分企业在谈及大数据的时候,往往只谈大数据的好处,对隐私问题避而不谈。甚至某个互联网圈的大佬还说过:

“中国人对隐私问题的态度更加开放,相对来说也没那么敏感。如果他们可以用隐私换取便利、安全或者效率,在很多情况下他们就愿意这么做。”

连大佬们都觉得个人隐私问题不是大事,那就更别指望普通从业者有什么更高的觉悟了。

其次,对于很多大数据应用在隐私方面存在的重大问题,业内的人都知道,只是心照不宣而已。对于很多企业来说,如果真的把这些数据采集和使用上的隐私问题都规避了,那他们和投资人讲的故事也就都不存在了。

这次“315”晚会中曝光的利用大数据打骚扰电话的事情,主要有几个环节:获取大量的“手机号码和MAC地址”的对应关系,通过探针获取周边用户的手机MAC地址,通过机器人自动打骚扰电话。在这几个环节中,后两个看起来更加高科技。但事实上,最关键,难度最大,数据风险最高的是第一个环节。如果没有第一个环节准备的数据,第二个环节就没有办法做“从MAC地址到手机号”的匹配,更别说第三个环节的打骚扰电话了。

什么是MAC地址?简单来说,MAC是用于网络通信的一个识别码。就好像现实生活中,你需要有地址才能收快递,在网络中,你的设备必须有一个MAC地址,才能进行网络通信。这个MAC地址是和网络硬件设备绑定的,在硬件设备出厂时就已经设置好了。MAC地址是全网唯一的,这样不同设备之间才能正常通信(想一想如果两个人的地址一样,快递该怎么送?)。

在Windows系统中查看MAC地址的方法

所以,对于每一台手机来说,MAC地址是设备决定的,手机号是SIM卡决定的。那么这两者是怎么关联上的呢?在“315”晚会中提到了一个关键点,这些数据都是从“手机APP”中获得的。可以这么说,那些用户量大的APP,都累积了大量的手机号和MAC地址的关联关系。

当你安装APP,并且授权APP获取手机硬件标识时,APP就获取了你的MAC地址;当你注册APP,通过验证码验证时,APP就获取了你的手机号。于是,bingo,APP取得了你的手机中,MAC地址和手机号的对应关系,虽然你的MAC地址对于绝大多数APP的业务来说没有任何用处。

事实上,APP采集的用户手机信息不止这些,还包括APP安装列表,当前正在运行的app列表,手机剪贴板内容等等(见辣妈的旧文《要不是为了人脸识别,我早就把前置摄像头封上了》)。这些基本都是互联网行业公开的秘密。

可能有的朋友会说,只有小公司敢这么干吧,大公司也会做这种事情吗?很遗憾,几乎所有的公司都会这么干,大公司和小公司的区别在于:大公司考虑到舆论因素,可能不会在他们的主APP里干,只会在他们的小APP中做这样的事情。另外,大公司的数据安全相对可靠一些,数据泄露的风险较小。小公司不仅有数据泄露的风险,甚至“数据交易”就是他们商业模式的一部分。想想看“315”中曝光的机器人营销公司是怎么获得海量手机号和MAC地址对应关系的,我相信肯定不是BAT卖给他们的。

不过,并不是所有的公司都不在乎用户隐私。 苹果公司在保护用户隐私方面,一向是比较领先的。早在几年之前,苹果手机的iOS系统已经禁止开发者调用用于获取设备MAC地址的接口,也就是说,苹果的应用无法得到苹果手机的MAC地址。这样,上面提到的三个环节中,第一个环节中的手机号和MAC地址的对应关系就无法建立了;后来iOS系统又针对“探针”做了更新, 能避免“探针”系统获取真实的设备MAC地址,也就是在上面所说的第二个环节也被打破了。虽然,安卓系统后来也跟随苹果系统做出了相应的更新,但由于安卓系统的开放性,有太多厂商定制的版本,具体你的安卓手机上用的是什么版本就不好说了。

无论如何,辣妈之前就建议过大家,无论用的是安卓手机还是苹果手机,尽量把操作系统升级到最新稳定版本。这对保护自己的隐私是有好处的。辣妈不是什么铁杆果粉,但苹果至少在保护用户隐私方面态度端正,辣妈还是愿意使用苹果手机。

另一方面,细心的朋友们可能已经注意到了,MAC地址是和具体设备相关联的,只要你更换了手机,那么之前被APP收集到的“MAC地址和手机号”的对应关系就失效了。智能手机用户平均更换手机的周期是18个月左右,所以APP采集的数据是有时效性的。假设你之前并不是太在意个人隐私数据,导致个人数据已经有泄露,只要在换了新手机后能够更加关注个人隐私,不随便对APP进行非必要授权,及时更新操作系统版本,不安装可疑的APP,那么你的隐私信息至少不会泄露得更多。

有不少大数据创业公司,宣称自己有海量数据,但如果你问他们数据是从哪里来的,他们八成说不出来。因为这些公司要么没有他们宣称的数据,要么就是数据来源不正,根本没法公开。这些数据在时效性过了之后,风险还是可控的。倒是那些我们经常使用的,占据我们时间最多的互联网巨头的产品。对他们来说,你换不换手机,甚至换不换手机号都无所谓,他们还是能有办法能知道和你相关的信息。现在真的还不知道怎么样才能有效地制约他们不滥用我们的这些隐私数据。

个人隐私问题,这是大数据时代最大的阴影。

本文来自信息化观察者网,转载请注明出处。

 

注:除标明原创外,均为网友或机构投稿分享,如有宣发需求请联系dongxizhiku@163.com。