财新传媒
观点网 > 聚焦 > 正文

中投张一清:大数据与社会公平

2017年09月15日 11:36 来源于 财新网
可以听文章啦!
在新的数据时代,这些少数的平台作为必需品,成为了大部分数据的产生渠道,开始具备垄断的特征,能够对社会发展和每个人的切身利益产生重要影响。因此,相应的监管也应该跟上,掌握大量数据的渠道也应该被近似看作公共事业
在互联网领域,我们已经见证了多家“大数据”平台的崛起。图/视觉中国

  文|张一清

  中投董事总经理

  数据时代下没有隐私

  数据被称为数据时代下的“新能源”,在新的商业竞争环境下对各公司的发展有举足轻重的作用。在互联网领域,我们已经见证了多家“大数据”平台的崛起,在海外有Google、Amazon、Facebook、Apple、Microsoft等,在国内有腾讯阿里巴巴百度等。这些公司不断搜集积累海量用户数据,并通过对数据的挖掘提高运营效率,为消费者提供了跨领域的、定制化的产品,吸引消费者在其平台上停留更长时间,进而积累更多的数据。通过这样的过程,打造了一套用户、产品、数据的循环生态,不断强化平台在市场上的影响力,提高竞争壁垒,在一些领域几乎形成了自然垄断,并在整个国家的经济中占据重要位置,有极大的影响力。

  与此同时,对每个消费者而言,在各大平台垄断的领域内基本只能遵照各平台的规则,在消费和享受服务的同时把自己的数据留在平台上。早些年,很多公司并不知道如何利用这些数据,只能从中提取简单的信息。但今天,随着数据算法、机器学习算法等的进步,数据公司已经能够从海量的数据中提取越来越多的有用信息,并对每一个消费者进行尽可能全面的理解,进行所谓的“用户画像”:小到你的家庭和工作地址、起床时间、出行习惯,大到你的消费产品、账户存款、朋友圈子甚至是你的个人健康状况、潜在疾病等。如果这些信息是分散的,任何人依据单个信息或许很难进行画像,但现实情况是,这些信息大都掌握在几个大平台上,这些平台已经有能力对用户进行全方位的画像。基于当下的数据分析能力,大平台对每个人的了解应该已经远远超过了政府对个人的了解(如果不调用平台的分析数据,政府恐怕只有你登记的几页信息无非就是你的地址、年龄、银行账户等),甚至超过你的家人,乃至超过你对自己的了解。可以说,数据时代下每个人都是透明的。

  大数据可能带来不公平

  必须承认,大数据的使用在很多方面提升我们社会的运作效率。但任何一个社会发展过程中,效率和公平往往都是一个硬币的两面,是需要平衡的,过分的追求效率导致的不公平反过来也可能使单纯追求高效付出代价。当下,对于大数据,整个社会似乎更多地都在关注如何用其提升效率,而没有注意到大数据可能带来的不公平。

  大数据是一门统计学问,需要通过对历史数据的搜集整理,并通过统计模型得到一个结果,而这个结果一般来说是在一定的概率下成立的,可能是60%,也可能是90%或者更高。在商业领域,保持大概率判断正确对应的期望回报,高于小概率判断错误带来的期望亏损,即可通过大数定律实现稳定回报。但是,如果把这个统计概率应用到对人的评价中,就可能带来小概率错误导致的不公平,而整个社会提倡和保障的正是少部分群体免于被歧视和遭遇不公平。比如,为盲人建立盲道,在马路边沿为轮椅专门开的缺口都是为了保障少数群体的利益,其实际使用者占总人群的比例可能连0.01%都不到,但我们仍然有必要提供上面的设施保障少数全体的利益。更不用说在大数据判断的上亿人中,即使有不到1%的判断失误,被误判的人数也是数以十万计的。因此,大数据误判造成的不公平带来的社会伤害不能用简单的商业逻辑来衡量。

  举例来说,一家旅游或者餐饮平台通过分析客户过往的消费数据可以很快判断客户的消费水平,在推荐关联产品时就有可能基于客户画像对于同一款产品推送不同的价格,因信息不透明产生价格歧视,这对消费者是否公平?在这种情况下,不再是少数人利益受损,大多数人利益都会受损,只有少部分平台获益。

  再者,如果把大数据应用到应聘层面,公司能够了解到每位员工的家庭背景、过往经历和朋友圈等,是否可能会因此拒绝一些过往家境贫寒、朋友圈小的应聘者从而限制了其未来发展空间?再如当下流行的 “信用评级”:当一个孩子出生在富裕家庭,进行过大量的高消费,是否就应该获得比出生在一个贫困家庭没有消费记录的孩子更高的“信用评级分”呢?统计学给出的答案:是的。但这个信用评级体系公平吗?

  进一步地,如果未来我们的基因数据能够被精确测量和理解,或者通过其它对生活习惯数据的监督能够预测一个人患某种疾病的概率,保险公司是否就应该因人设定保费,对那些有遗传疾病基因、大概率得病的人设定高额保费甚至不给予投保机会呢?这一天也许离我们并不远,已经有保险公司提供买保险提供基因检测服务(目前大多保险公司还是承诺不会因为基因测序结果作为定价依据,长期看几乎是不可能的,否则会造成消费者和保险公司的信息不对称而给保险公司造成损失),也有保险公司与手环公司合作以获得投保者的部分生活行为数据(每天运动的人患病率按多数人理解是低于每天不运动的人)。

  大数据是机器的产物,机器在对人进行评判时是基于算法的,是机械的。而人类哪怕是动物不同与机器的地方就在于,人类是有同情心、怜悯和宽容的,而机器使用的优化算法追求的是效率最大化,这个过程很可能造成不平等的结果。当我们沾沾自喜地宣称用大数据“精确地”抓取欺诈事件时,是否想到同样的方法如果被应用在保险行业就可能“精确地”抓取社会上的“弱者”,为追求经济利益违背保险行业的初衷?

  数据成为能源,具有公共事业的特征,需要被监管

  当一种资源成为社会发展的必需品,容易具有垄断特性,就应该成为一种公共事业,需要被监管。因为这种必需品深刻影响着整个社会的发展,并关系到每位公民的利益,如果没有监管就可能出现漫天定价,挤压其它行业利润,甚至影响整个经济发展的情况。历史上来看,每种有垄断属性的必需品都被严格监管,且大都成为了公共事业:19世纪末石油是必需品,标准石油垄断了石油市场因而被监管和分拆;电力革命带来的必需品是电,所以电力公司要被监管,电力成为公共事业;信息革命时代,电话和网络讯号是必需品,AT&T因为垄断而被监管和分拆,通信也成为公共事业。

  今天,我们可能需要对公共事业有一个新的理解:在信息和数据时代下,又有新的产品成为了生活中的必需品,例如电商、社交、搜索、云计算、分享经济等都成为了当下人必不可少的工作和生活工具,也可以算是新的公共事业。为什么现在这些平台公司没有被政府严厉监管呢?很重要的一个原因是在互联网时代大多公司利用互联网这个免费的渠道(如果不免费,互联网必须被监管并成为公共事业)提供服务。但在新的数据时代,这些少数的平台作为必需品,成为了大部分数据的产生渠道,开始具备垄断的特征,能够对社会发展和每个人的切身利益产生重要影响。因此,相应的监管也应该跟上,掌握大量数据的渠道也应该被近似看作公共事业。

  那么如何进行监管?

  划定数据的获得、搜集和使用的边界

  数据时代的监管应该关注在数据资源的获取和使用边界,在这个边界外对个人的隐私需要有立法保护。

  举例来说,当消费者在共享平台进行打车时,平台会实时获取用户的地址信息,但这个信息在使用后是否应该被平台留存甚至进一步开发?实际上,这个信息就包含用户潜在住址、工作地址、消费地址等信息,进一步挖掘可能会了解用户的消费能力,收入水平等,对于提供打车服务的公司是否应该挖掘数据并获取以上这些信息?再比如,在社交网络上留存的聊天信息,每个人的朋友圈子和连接关系是否应该被挖掘进而判断一个人的工作、朋友圈子乃至一个人的信用?保险公司可以搜集人的哪些健康数据?进一步,整合的用户画像是否可以共享,在涉及教育、招聘、婚姻、医疗、金融等场景下是否可以使用?

  每个消费者在平台面前都是弱势方:如果你不接受平台获取你的信息就没办法使用产品,因没有其它选择而被迫接受自己信息被无限制获取和使用。这时候,就需要平衡效率和公平的监管方介入,对信息获取方进行监管,可能包括以下几个方面:

  对哪些信息是与服务相关的进行界定,判断哪些信息可以被搜集;

  哪些信息可以在平台内甚至跨平台、跨公司流通,哪些信息不能够进行分享;

  哪些信息不能被二次挖掘;

  在数据挖掘过程中的算法是否可能造成不公平的结果,需要企业公开并透明化;

  在什么场景下,是否可以获取或使用某些数据信息。

  大数据的使用对于提升社会效率有巨大贡献,但大数据的滥用和没有边界的使用带来的社会不平等和个人隐私被严重侵犯的问题应该引起关注和重视。在追求效率的同时要时刻警醒不公平结果的出现,需要通过监管,把大数据的使用圈定在一个特定的范围内,既有利于大数据使用的规范化进而促进其发展,也能兼顾社会公平和对个人的保护。

  任重道远,砥砺前行。

责任编辑:张帆 | 版面编辑:张翔宇
文章很值,赞赏激励一下
赞 赏
5人已赞赏
赞赏是一种态度
  • 1
  • 3
  • 6
  • 12
  • 50
  • 108
其他金额
其他金额(元):
赞 赏
财新传媒版权所有。
如需刊登转载请点击右侧按钮,提交相关信息。经确认即可刊登转载。
推广

财新私房课
好课推荐

2017年10月22日    17:01
【私有化回归A股途中 光伏巨头天合光能遭减持15%】在私有化回归A股的途中,光伏组件老大——天合光能遭遇国资股东大幅减持。10月22日,自福建省产权交易中心获悉,天合光能合计15%股权已经被两家国资股东挂牌转让,挂牌价格合计23亿元。其中上海兴璟投资管理有限公司持有天合光能的10.01%股权被挂牌转让,兴银成长资本管理有限公司拟转让5%股权。(新京报)
2017年10月22日    13:04
【人社部部长:明年划拨国有资产充实社保基金】在今天上午的十九大新闻中心记者会上,人力资源社会保障部党组书记、部长尹蔚民表示,明年要实施划拨国有资产充实社保基金,使社保基金蓄水池越来越大。(中国之声) ​​​​
2017年10月21日    09:58
【上海自由贸易港初步方案成形】多位知情人士透露,上海相关部门已形成了探索自由贸易港区建设的初步方案,并已上报。今年3月底,国务院印发的《全面深化中国(上海)自由贸易试验区改革开放方案》提出,上海将在洋山保税港区和上海浦东机场综合保税区等海关特殊监管区域内,设立自由贸易港区。(上海证券报)
2017年10月21日    09:36
【耶伦重申通胀走低出乎意料】美联储主席耶伦(Janet Yellen)称,近期美国通胀低迷“是我们紧密关注的令人吃惊的现象”。有人认为这主要源于暂时因素,“但我不认为全部是短期原因”。她称仍然相信通胀预期“较好锚定”,未来几年内美国会实现2%的通胀目标。
2017年10月21日    07:45
【耶伦称缩表对市场影响较温和】美联储主席耶伦(Janet Yellen)称,美国经济在接近就业最大化的水平上运行,未来几年预计通胀会达到2%的目标。同时,退出支持性货币政策的进展良好。“我们并不预计资产负债表的期现溢价出现跳升,”缩表将会花费数年时间。虽然证据显示,资产购买计划对资产的长期收益率有较强影响,而缩表后收益率却会表现“温和”。
2017年10月21日    07:41
【耶伦:非常规货币政策工具应准备就绪】美联储主席耶伦(Janet Yellen)称,“在短期利率降到实际下限的背景下,我们必须为使用非常规货币政策工具做好准备。”在一般情况下,影响短期利率仍然是货币政策的主要工具,但伴随着“中性”联邦基金利率在过去几十年里显著降低,即便在没有发生主要金融和经济危机的条件下,短期利率也有可能降至接近于实际下限,这是就仍需动用非传统工具。
2017年10月21日    05:45
【摩根士丹利:多数新兴市场能经受住美国加息冲击】摩根士丹利经济学家Chetan Ahya等在报告中写道,新兴市场对于美国利率上升的整体曝险近期下降,但有一部分新兴市场由于依赖外部融资的原因,更容易受到利率急剧上升的影响。和“减码风暴”时期相比,现在新兴市场的形势要更好。实际利率缓冲以及经常帐收支改善;到2018年底较美国的实际利率利差有200个基点之多。
2017年10月21日    05:44
【美银美林:对新兴市场而言政治隐忧超过全球因素】美银美林表示,投资者在短期内更担忧新兴市场的国内政治,而不是全球因素。策略师Claudio Irigoyen在报告中写道:鉴于仍然有充裕的现金在观望中,已有的获利了结和逢低买入策略似乎或将持续。投资者对新兴市场持建设性看法,但对估值偏紧感到担忧,所以投资者比以往任何时候都更加重视多元化的特质。
2017年10月21日    05:43
【调查显示鲍威尔最有可能成为下任美联储主席】Evercore ISI投资者调查显示,现任美联储理事鲍威尔(Jerome Powell)被认为最有希望成为美联储主席。Evercore ISI10月19日对144名投资者的调查结果显示,鲍威尔成为下任主席的概率约为29%、沃尔什(Kevin Warsh)22%、泰勒(John Taylor)20%、孔恩(Gary Cohn)9%。美联储现任主席耶伦(Janet Yellen)被认为只有20%的几率连任。
2017年10月21日    05:40
明晟MSCI将在10月23日(下周一)将发布纳入A股的MSCI指数
财新微信

热词推荐
大家谈 e租宝登记平台 博客 农地改革试点总结 信用卡提现 做市商 中央军委 中科招商 司法改革 吴英 中央政治局 宋卫平 马家辉 政治局 会议