大数据时代的隐私
自2008年提出“大数据”概念以来,这项技术迅速“颠覆”了各个行业。然而,数据在赋能产业、改变生活的同时,也频频引发乱象:大数据杀熟、侵犯隐私、黑数据生产等问题考验着各国政府管理者,甚至影响着大数据产业的发展。
前段时间,美国知名社交媒体平台脸书的用户数据被泄露。三天时间,5.33亿用户个人数据被曝光,涉及106个国家和地区。泄露的信息包括用户在脸书上的账户名称、位置、生日和电子邮件地址,非常详细。还包括很多名人和公众人物。
可能很多人对数据对我们的影响没有明显的感知。我们用一些例子来说明数据的或大或小的影响。
2013年,电商开始根据用户的喜好、购物类型、搜索记录、浏览记录、相似推荐等数据,为每个消费者量身定制自己的购物清单。这一年,余额宝诞生了。基于淘宝和支付宝的数据平台,余额宝可以及时掌握申购赎回的变动信息,同时还可以利用历史数据掌握客户的行为规律。不到半年,余额宝规模突破6543.8+000亿,用户近3000万,相当于当年国内全部78只货币基金总规模的近20%。互联网和大数据相结合的威慑力让传统银行刮目相看。
2015年,基于大数据的个性化推荐首次在双11大放异彩:平台跳转率首次达到个位数,用户仅访问一页后离开的次数降至历史新低,而个性化推荐系统引导人数和人均页面数均为上年的2 3倍。在交通、教育、医疗、智慧城市等领域,大数据也在快速渗透。
至此,英国数据科学家、数学家克莱夫·亨比(Clive Humby)在2006年提出的“数据是新时代的石油”的口号得到了充分的认可。在科技公司口中,成了另一种表述:得数据者得天下。
数据时代:得数据者得天下。
英国皇家工程院院士郭毅可曾在节目中讲过一个故事:一家著名的制药公司用一百多万英镑的巨款买下了一位罕见癌症患者的数据。这家公司之所以愿意花这么多钱,是因为这个病人有六种癌症,他的数据几乎是全世界独一无二的。
互联网巨头的数据之争
2065438+2007年6月,顺丰关闭蜂巢盒自提柜和淘宝平台物流数据信息回传,阿里巴巴物流平台菜鸟和顺丰在网上隔空“上架”,显示了二者在客户数据信息掌控上的深度较量;两个月后,华为Magic手机尝试人工智能应用,欲调用微信数据时被腾讯拒绝,引发纠纷。企业之间的竞争变成了“数据”的竞争。
无数被诟病的“大数据杀熟”。
2018,一些经常出差的网友发现,在携程预订机票或酒店时,平台为老用户展示的相同产品或服务的价格高于新用户。随后,携程被曝利用大数据“杀人”。随后,携程回应称,内部调查未发现使用同一账号,用同一酒店、同一房型预订不同手机的差异化定价。
然而,“大数据杀熟”的质疑不仅没有止步于此,还蔓延到了互联网打车、电商、外卖等领域,几乎成为了互联网行业的“潜规则”。背后的“驱动力”源于互联网平台的盈利压力——为了填补前期烧钱造成的巨额亏损,只能不断提价,而老用户对平台的粘性大于新用户,因此相对更能承受更高的价格。
个人隐私与“数据启蒙”
第一批注册各种app的人绝对不会想到,这些app会背叛他们,出卖自己的个人隐私。因为互联网时代是免费的,开放的,是早期使用者的天堂。互联网时代也是快节奏的,它可以快速淘汰弱者,快速推翻之前的巨人。
当这些互联网公司喋喋不休时,他们都是无知的理想主义者:扎克伯格不想在脸书上放广告,拉里·佩奇只想做一个简单的网络搜索,杨致远想把雅虎变成一个互联网门户,史蒂夫·陈只想把YouTube变成一个人们可以分享小视频的广场。
脸书、谷歌和雅虎起初都不是广告公司,但他们想不出更好的赚钱方式。于是创业者发明了一个完美的无模型模型。用户注册是免费的,但个人数据会被网站追踪,并用于推送广告。因为注册是免费的,像脸书和谷歌这样的公司的用户数量将急剧增加,他们可以很快成为霸主。个人资料是无穷无尽的,只要你仔细挖掘,一定能卖个好价钱。
在免费模式下,你我都不是这些app的客户,而是这些app的产品。我们的私人数据将被提取、优化、处理、打包并出售给出价最高者。但是如果用户的增长达到饱和怎么办?然后从现有用户中挖掘更多的数据,用更先进的工具做更细致的分析,卖给更多的广告主。
2018,360创始人周对“免费模式”大加赞赏,360快手视频窃取大量账号和视频,可以说是“免费模式”的极致。互联网公司像挤牛奶一样从用户身上“压榨”数据。
然后,数据工程师用Kafka、Storm、Hadoop、Spark等外行人闻所未闻的工具,对用户数据进行细致的整理和分类,然后呈现给广告主。谷歌的一位前部门经理曾经说过,谷歌的核心竞争力不是搜索或安卓,也不是地图或日历。它的竞争力就是把用户数据变成钱。“把用户数据变成钱”是免费模式背后的逻辑。
但是随着脸书隐私丑闻的爆发,人们越来越意识到泄露个人网络隐私的危险性。这种个人隐私的觉醒将带来一场“数据启蒙运动”,数字经济的崛起及其在GDP中的比重越来越重要。
这推动了各国的数据隐私立法,数据不仅是互联网公司争夺的对象,而且已经上升到国家战略的层面。数据安全已经是国家安全的一部分。
全球数据立法竞赛
世界上较早对数据进行立法的是欧盟。2065438+2008年5月25日,欧盟通用数据保护条例(GDPR)在成员国生效。
该规定的适用范围极其广泛,如:用户自己的资料必须随时自行查看、修改、删除和下载;任何公司在收集用户数据前都必须要求用户签署协议;要收集16以下儿童的数据,必须得到父母的同意。简而言之,就是用户的数据,控制权必须在用户手里。
其实GDPR是欧盟在2016年颁布的隐私法,但是他们给了辖区内各大互联网公司两年的时间准备,直到2018年5月25日才开始实施。从执行日起,任何公司如被发现违规,将被处以2000欧元或违规公司营业额的4%的罚款,以罚款金额较多者为准。
在GDPR生效的第一天,脸书和谷歌因强迫用户同意* * *享有个人数据而被起诉。2065438+2009年65438+10月,法国因谷歌违反欧盟GDPR隐私法,对其罚款5000万欧元(约合5700万美元)。
大洋彼岸的美国也没闲着。2018年6月28日,美国加州颁布了《加州消费者隐私法2018》(简称CCPA),以保护消费者的隐私和数据安全。CCPA被认为是美国最严格的隐私立法,于2020年6月5438+10月1日生效。
此外,新加坡颁布实施了《个人数据保护条例》,印度也颁布了2019个人数据保护法草案。
在全球立法冲动的背后,大家逐渐意识到,谁在立法上落后,谁就会在数字时代处于被动地位。
虽然我国早在2017年就实施了网络安全法,但是在数据领域并没有专属的法律规范。2018年9月,全国人大常委会颁布了《中华人民共和国数据安全法》立法规划。20265438年6月1日,《中华人民共和国数据安全法》正式颁布,并将于20265438年9月1日起实施。至此,中国也有了第一部关于数据安全的法律。
法律在确认数据权的同时,也需要操作层面的技术支持。目前,建立个人数据账户没有技术难度。一个可能的想法是为个人提供一个类似于身份证系统的个人数据授权账户系统。有了这样的系统,个人可以对数据进行授权,进而拥有个人数据的主动权。