世界银行报告 :让数据创造更好生活

导语

本报告旨在回答两个基本问题。首先,如何通过数据来更好地推进发展目标?其次,需要做出何种数据治理安排来支持以安全、道德和可靠的方式生成和使用数据,同时让数据公平地造福于所有人?

本报告要传递的一个重要信息。仅仅收集更多数据并不能解决问题。严重的数据缺口确实存在,而且在贫困国家尤为突出,但本报告的讨论重点是如何更有效地使用数据以改善发展成果,尤其是要为贫困国家的贫困人口改善发展成果。

 

  前言

数据治理是一个在发达经济体引发激烈辩论的议题,而新兴市场大国对它的关注也日益上升。许多政策问题有待解答。针对这种情况,《2021 年世界发展报告 :让数据创造更好生活》对最新形势进行了分析,并为决策者提供了一个用来思考相关问题、机会和取舍的框架。很清楚的一点是 :迄今为止,关于数据治理的全球辩论基本上没有包括收入较低国家的视角,因此各方迫切需要倾听他们的观点。

 数据是一把双刃剑一方面,数据有助于改进政策与规划、推动经济发展和增强公民权能,具有创造价值的巨大潜力。另一方面,数据积累可能导致经济和政治权力集中,扩大数据被滥用、给公民造成危害的可能性。数据是一种可以反复使用、创造更多价值的资源,但这也带来一个问题 ——数据再利用越多,数据被滥用的风险就越高。

新冠大流行可能是展示这类机会和风险的最佳例子。在疫情防控过程中,不少国家迅速行动,将移动电话记录用于疫情监测,但同时他们也需要保护公民隐私,防范数据滥用。如何保持这两方面的平衡是一个棘手问题。

各国生产和有效使用核心经济与社会数据的统计能力是有限的,无论是疫情还是非疫情状况下都是如此。很多贫困国家不能准确追踪公共财政情况、报告外债状况或对发展目标的实施进展加以监测。如果没有相关数据,就很难对政府进行问责,也无法对各方面进展加以追踪。

良好的数据治理需要在扩大数据使用的同时防止数据滥用,而这种治理安排目前仍处于起步阶段收入水平较低的国家往往缺乏必要的数据法律与监管框架,在数据安全保障措施和数据共享措施两方面都存在缺口。这些国家没有实现互操作性、使数据可供更多用户使用的完善数据系统和基础设施 ;中低收入国家中只有不到 20% 拥有现代化的数据基础设施 ——如托管数据中心和使用云端计算设施的直接通道。即使是那些数据系统和治理框架已初具雏形的国家,由于缺乏具备必要行政能力、决策自主权和财务资源的相关机构,这些系统和框架也无法得到有效的贯彻实施。

针对这些问题,《2021 年世界发展报告》呼吁建立新的数据社会契约 ——这种社会契约将推动数据的使用和再利用,创造经济和社会价值 ;同时确保所有人享有从数据中受益的公平机会 ;还要增强公民的信任,使他们相信自己不会受到数据滥用的伤害。在寻求建立这种社会契约的过程中,收入较低的国家往往处于不利地位,因为它们通常在以下几方面都比较欠缺 :获取数据并将其转化为价值的基础设施和技能 ;公平参与全球数据市场及其治理的规模和渠道 ;有助于增强人们对数据系统信任的制度与监管框架。

建立新的数据社会契约是一个紧迫的国内政策重点事项,各国需要强化国家数据系统并在国家层面与所有利益相关方合作。与此同时,由于数据的全球规模,数据社会契约中最具挑战性的一些领域也要求开展国际合作,在双边、地区和全球层面加强法规和政策协调。国际合作的重点领域包括数据驱动型商业的国际征税权改革、世界贸易组织关于数据促成型服务贸易的安排、数据基础设施区域合作、互操作性技术标准的国际协调以及关于执法和反托拉斯监管的双边协作。

世界银行已经做好了围绕这项重要而具有挑战性的议程向客户国提供支持的准备。本《世界发展报告》指出了对此议程最为关键的公共和私营部门投资领域,提出了丰富的政策改革和技术援助方案,并重点指出了可通过全球性倡议发挥召集力、促进跨境合作的领域,因此将在很大程度上指导我们对客户国的支持。

充分实现数据的价值有赖于各方做出实质性承诺和努力。这是一项艰巨的任务,但不行动的代价将是一个错失发展机会和更加不平等的世界。

  戴维·马尔帕斯

  世界银行集团行长

  概述

有些数据可能不提供信息,但所有信息都依靠数据。

  —Daniel Keys Moran,计算机编程人员,科幻作家

  数据日益成为世界各地大多数人日常生活中不可或缺的一部分,数据的数量也在以前所未有的速度增长。但这对生活在赤贫中的 7 亿多人口意味着什么?新数据类型和数据用途的爆炸式增长是否也在改善他们的生活?还是说穷人和穷国会被抛在后面,导致那些从数据驱动的世界中受益与不受益的人之间差距越来越大?

通过创造性使用新数据而产生的创新可能是当代对人们生活影响最深远的重大事件之一。像蒸汽机的发明、电力的发现等通用技术一样,数据革命带来的变革涉及社会与经济的方方面面。但这种全面改变并不会自动发生。蒸汽机和电力促进生产率提高是在相关技术出现数十年以后的事。之所以有这种延迟,不是人们没有意识到这些创新的重要价值(每个人或早或晚都会认识到),而是因为将这些创新付诸使用、实现其经济潜力所需的生产体系不可能一夜之间形成。电力本身并不能带来经济发展,同样,数据本身也无法改善人们的生活。数据可以带来社会和经济领域各方面改善,但前提是对数据加以系统性使用,从而创建有用的信息,形成有助于改善人们生活的洞识和见解。

本报告旨在回答两个基本问题。首先,如何通过数据来更好地推进发展目标?其次,需要做出何种数据治理安排来支持以安全、道德和可靠的方式生成和使用数据,同时让数据公平地造福于所有人?

本报告要传递的一个重要信息是,仅仅收集更多数据并不能解决问题。严重的数据缺口确实存在,而且在贫困国家尤为突出,但本报告的讨论重点是如何更有效地使用数据以改善发展成果,尤其是要为贫困国家的贫困人口改善发展成果。

通过数据推进发展目标

本报告第一部分建立了将数据与发展相联系的概念框架,二者之间的联系通过三个组织途径产生(图 O.1)。第一个途径是政府和国际组织使用数据来支持循证决策改善服务提供。第二个途径是公民社会使用数据来监测政府政策实施效果、个人利用数据来监督和获取公共服务和商业服务。第三个途径是私营企业在生产过程中使用数据来促进企业自身发展以及更广泛的经济增长。这样一个概念框架意味着仅靠数据本身无法解决发展问题 :人(社会、政府和企业中的人)是将数据转换为有用信息并进而改善生产生活的核心主体。与资本、土地和劳动力一样,数据也是上述三个途径实现发展目标的要素 ;但与三者不同的是,用过不会降低数据的价值。为某一特定目的而收集的数据可被再次用于其他完全不同的目的(第 1 章)。

  

  通过数据的传播、交换与分享加强数据再利用

数据的使用潜力可以说是无限的,因此,要想通过数据实现更美好的生活,就需要重视数据的再利用和多用途使用。这是本报告概念框架的一个核心内容。图 O.1 使用双向箭头来描述这种过程。私人企业和政府之间的双向箭头表示最初出于商业目的收集的数据也可被用于公共政策制定,反之亦然。同样,个人 / 公民社会 / 学术界与政府 / 国际组织之间的双向箭头表示它们之间也可以进行数据交流和再利用。最后一个双向箭头反映的是个人 / 公民社会 / 学术界可以利用私营部门数据以及由数据驱动的应用程序,而企业也可以利用个人 / 公民社会 / 学术界的数据及相关分析。但实践中数据持有者可能不愿交换数据。他们可能担心数据保护和安全问题,或者收集数据的投资需要有所回报。也可能他们希望通过积累数据来实现规模经济,从而获得支配市场的能力;或是希望通过囤积数据来获得其他形式的政治优势或竞争优势。

在本报告中,数据的“共享与再利用”是一个概括性说法,包括使数据得以再利用的各种交易和交换,从旨在推动数据共享的政府开放数据计划到私营企业数据的市场化交易都包括在内。从理论上讲,为数据确定明确的经济产权可以使数据在市场上广泛交易。但在实践中,除广告市场以外,数据交易的范围受到多种因素限制,如多方声称拥有数据所有权、广泛传播数据与出于私人商业利益而囤积数据相互矛盾、数据的质量和准确性难以评估等。

图 O.1 中所示的三个途径每个都显示了数据如何有助于改善人们的生活,但这些途径同样也可能被用来对人造成伤害。通过政府途径,数据可能因政治目的而被滥用,例如出于政治动机的监控或基于种族、宗教、种族、性别、残疾状况或性取向而对公民区别对待。在连接个人的途径中,网络犯罪分子可能通过窃取和操纵个人敏感信息而造成重大伤害。“暗网”是一个庞大的隐蔽网站网络,为各种犯罪活动提供了一个地下数字平台,协助开展毒品、假币、赃物、信用卡号码、伪造文件、枪支和人体器官等各种非法贸易。同样,通过私营部门途径也可能造成伤害,例如利用对消费者偏好和行为的了解进行精确瞄准、开展过度营销或操纵性营销,或是通过算法来协助市场主体之间开展串通等。

解锁数据造福公众的潜力,防范数据不当使用 :来自新冠疫情防控的实例

许多国家都将数据用于新冠疫情防控,包括通过跟踪定位来更好了解封锁期间人们的活动规律以及开展感染者接触追踪等。冈比亚利用 2020 年 3 月至 5 月的移动电话呼叫详细记录(CDR)汇总数据(个人层面数据已被掩盖),绘制显示人员跨行政区流动情况的地图(地图 O.1)。通过这些地图,政策制定者得以了解封锁措施在多大程度上减少了人员流动,找出导致人们遵守或违反封锁措施的因素并采取相应行动。以色列政府于 2020 年 3 月批准了一项紧急法规,允许将通过手机收集的个人数据用于对感染者接触人员追踪,控制疫情传播。

建立 CDR 的目的本来不是为了协助公共政策制定或是让政府跟踪个人活动,但上述两个就是数据被再利用、改变用途的例子(即图 O.1 所示的纵向数据流动)。在以色列,这些数据在新冠疫情爆发之前也有收集,但政府只有出于国家安全目的才能访问。

这些通过 CDR 跟踪感染人员的早期做法目前来看似乎发挥了正面作用。在冈比亚,地图显示封锁措施对贫困地区影响更大,表明需要针对这些地区提供救济和复苏支持。在以色列,有关分析表明,疫情爆发后最初几周的所有感染病例中,通过手机数据追踪识别出了三分之一以上感染者(16200 例中的 5500 例),这在一定程度上为这个阶段以色列实现极低的感染率和死亡率做出了贡献。

将 CDR 数据用于对以色列全国大部分人口进行跟踪的做法引发了关于政府可能滥用数据的担忧和抵制。很多议员表达了对隐私问题的关切,后来最高法院下令停止了这项行动。法院在 4 月下旬裁定,政府必须就使用手机的跟踪功能进行立法,并且“必须找到一个符合隐私原则的恰当替代方法。”

  

  本报告涵盖的很多主题在这个例子中均有体现。私营部门搜集的 CDR 数据与公共机构共享并加以再利用,支持新冠疫情防控,挽救生命,因此创造了社会价值。但与此同时,这种数据共享引起了人们对信任问题的极大关注,公民担心自己的 CDR 数据以后可能会被政府官员用于公共健康以外的其他用途并造成伤害。公平也是一个重要问题。像以色列这样一个高收入国家,智能手机普及率为 93% ;而在冈比亚这个低收入国家,智能手机普及率只有 75%。不管哪个国家都有一些没有智能手机的人无法生成 CDR 数据,也就未必会直接受益于接触追踪措施提供的公共卫生保护。

上述例子也说明了一个关键难题。随着更多数据(尤其是个人数据)被共享和再利用,通过政策和服务交付改进带来的好处会大幅增加,但是数据被滥用的风险也会上升。实现这些好处要求分享或交换数据,但有关各方必须信任这种数据交流所依赖的系统、法规和制度,这样他们才会自愿参与进来。

怎样才能使人们相信他们的数据将受到保护而且他们可以从数据所创造的价值中获益?这些关切日益上升,表明我们需要围绕数据建立新的社会契约——即数据创建、再利用和共享过程中的所有参与者之间达成一种共识,从而可以增进信任,让人们相信他们不会因为数据交换而受到伤害,而且可以公平地获得由数据所创造的价值(图 O.2)。社会需要达成这类共识(即“社会契约”)的理念已有数百年历史,通常可追溯到托马斯 • 霍布斯、约翰 • 洛克和让 • 雅克 • 卢梭等哲学家的著作。

法律体系以及更广泛的治理体系可被视为建立、促进和执行社会契约的工具。说服各方遵守社会契约的规则并非易事,这要求确保使用数据所产生的收益能得到公平分享——也就是说,每个人都能从中受益。在这方面低收入国家往往处于不利地位,因为它们通常在以下几方面都比较缺乏 :获取数据并将其转化为价值的基础设施和技能 ;有助于增强人们对数据系统信任的制度与监管框架;公平参与全球数据市场及其治理的规模和渠道。

数据正在重塑我们的生活、社会乃至整个世界。在这种形势下,尤其考虑到数据交易和数据流动的跨境性质,我们不仅需要国家层面的数据社会契约,也需要国际性社会契约。第 8 章的“焦点 8.1”将社会契约的概念延伸到国际领域,呼吁达成全球共识,以确保将数据作为一种全球公共产品和实现公平、可持续发展的资源加以保护。

有待开发的数据潜力,不断演变的关于数据生成、利用和再利用的法律、法规和治理框架,具体国情(历史、文化、治理模式和政治经济情况)对建立适当相关框架的重要性,技术能力对安全地充分利用数据的作用,如何增进信任、促进对数据所产生价值的公平分享——这些都是本《世界发展报告》的核心议题。

  

  报告第一部分详细描述了以下几方面的潜在发展影响 :为公共目的而收集的数据(即公共意图数据)(第 2 章);私营部门日常业务中收集的数据(私人意图数据)(第 3 章);综合使用不同类型数据而产生的协同作用(第 4 章)。这里对数据的区分是基于它是出于公共意图还是私人意图,而不管信息由谁收集或使用何种方法收集(如客户调查、会计记录或数字交易等)。

公共意图数据可改善服务提供、服务瞄准、问责和赋权

公共意图数据在设计、执行和评估公共项目和政策方面具有巨大潜力(第 2 章)。公众意图数据是行使诸多政府职能的先决条件,因此这类数据主要由政府机构生成,数据获取手段包括普查、行政数据收集等。另外,公民、公民社会组织、非政府组织、学术机构和国际组织也通过抽样调查、众包平台和其他方式为公共意图数据的生成做出重要贡献。

这些数据可通过三个主要途径改善人们的生活 :一是改善政策制定和服务提供 ;二是对稀缺资源的使用进行优先排序,重点瞄准边缘化人口和地区 ;第三,加强对政府的问责,使个人可在拥有更多信息和知识的基础上做出更好选择,提高权能。

来自尼日利亚的一个例子可以说明公共意图数据在改善服务提供和瞄准服务对象方面的作用。2015年,尼日利亚政府委托有关机构进行了《全国供水与卫生情况调查》,收集来自居民家庭、供水点、供水计划和包括学校与医疗机构在内的公共设施等方面的数据。数据表明,有 1.3 亿尼日利亚人(占当时全国人口的三分之二以上)未达到联合国“千年发展目标”确立的卫生标准,而贫困家庭以及某些地区(地图 O.2)无法获得充足洁净水的问题尤为严重。总统穆罕默德 • 布哈里看到基于这些数据做出的报告后,宣布供水和卫生设施部门处于紧急状态,并启动了“振兴尼日利亚供水与卫生设施和卫生条件全国行动计划”。

 数据的质量越高(包括及时性、准确性和分辨率等维度),为发展事业创造价值的潜力就越大。然而多种因素会阻碍各国(尤其是低收入国家)利用数据创造公共利益价值,包括缺乏资源、技术能力和数据治理体系以及人们对基于数据的决策需求不足等。世界银行“统计绩效指标”作为本报告的一部分与报告一同发布,它重点围绕数据的及时性、颗粒度、互操作性和可访问性等特点,指出了 166 个国家公共意图数据的可得性、质量和可用性等方面存在的不足。

要想全面释放公共意图数据的潜力,就需要在制定政策过程中将数据工作置于优先地位。然后,政府可以把生产高质量数据以及公开透明地将数据用于决策作为一个工作重点。官方统计数据的透明可靠有助于建立各方对政府行动的信任。如果缺乏透明度(例如不公开国家的债务负担),可能会危害经济后果并损害公众对政府的信任(参见“焦点 1.2”)。要发挥数据的潜力,就需要为数据工作提供长期、稳定的资金支持,需要增加投入以提高统计工作能力和技术能力,还需要制定实施有助于数据安全生成和再利用的法律。其他一些需要解决的问题包括 :数据素养低导致对数据的需求较低,政策制定者缺乏使用数据的激励与兴趣,人们对公共意图数据的质量缺乏信心,访问和使用数据的基础设施较为缺乏。这些领域的投资与计划相互依赖,如果在一个领域不能取得成功,则可能损害数据促进发展的总体价值。有效使用数据可以激发对数据的更大需求,从而有理由增加数据工作投入,以生产更多、更高质量的数据。

  

  私人意图数据可推动增长、促进发展私营部门出于商业目的收集整理的数据也有促进发展的巨大潜力(第 3 章)。企业在数据使用和应用方面的创新可以强化数据驱动型决策,降低交易成本,从而创造巨大经济价值。2011 年一项对美国 179 家大公司的研究表明,采用数据驱动型决策相对于公司的其他投资和信息技术举措相比,可使生产率提高 5% 至 6%。

从很多方面来说,数据是公司生产过程的投入品,但近年新型数据的爆炸式增长主要是经济活动的副产品,如公司业务数字化、个人使用手机增多、数字交易以及社交媒体互动等。这类数据收集频率很高,可以提供关于个人、企业、经济表现和现象的详细信息。它们不仅可以提高公司自身的经济效率,而且可被用于如疫情跟踪之类的公共政策事项。例如,金融服务机构越来越多地采用另类信用评分方法来解决由来已久的潜在借款人数据缺乏问题(更具体地说是信息不对称问题)。这些方法利用用户的数字足迹对缺乏正规文件者进行信用评估。在菲律宾运营的 Lenddo 公司和在非洲、亚洲和拉美运营的 Cignifi 公司就是该领域的两个突出例子。

但新的风险也随之而来,必须加以妥善处理才能确保数据驱动型经济将促进社会福利的改善。人们越来越担心数据收集过多、私营企业对其持有的数据缺乏管理、对个人数据保护不足等问题。这些担忧中有许多与个人数据的不当使用有关,例如企业未能适当保护客户的财务信息、使他们面临资金或身份被盗风险 ;或者企业未经授权擅自使用个人的保密健康数据或定位数据,或未能对这类数据加以保护。

企业利用数据创造价值的很多过程是由算法和机器学习所驱动。在这些商业模式中,算法发挥着很大作用,与其他因素共同确定一个人会接触到哪些信息、产品或服务以及以何种价格获得这些信息、产品和服务 ;他们可得到哪些保险套餐 ;他们的贷款申请是否获得批准 ;他们有资格从事哪些工作;他们收到什么医疗建议,等等。

所有这类活动都有大幅提高经济效率的潜力。例如,机器学习可以使用更多数据类型并从看似无关的模式中提取相关信息,从而为更多人生成更准确的信用评分。但是,如果输入到机器学习中的数据包含歧视性假设,那么机器学习会将这种歧视放大,这意味着不仅会导致有害结果,而且会放大这种危害。这让人想到数据科学领域存在了几十年的格言——“垃圾进,垃圾出”,意思是机器学习之类的数据处理系统是否有用可靠,取决于输入系统的数据。但还有一个更深层问题值得担忧 :机器学习的输出通常不透明,而且会随着新数据的输入而频繁更改。可以说机器学习从设计上就是要创建一种不透明的规则,因此,识别算法中的歧视性元素从技术上来说可能颇具挑战性。

通常,由数据驱动的市场会表现出正面的网络外部性,导致规模收益上升,少数大公司占主导地位。这样可能导致小企业或传统企业被排除在外,损害地方企业发展,也给消费者利益造成风险。在发展中国家这些危害会更加严重,因为新进入市场的企业很难筹集启动资金,而且数据科学人才有限。为解决这个问题,决策者需要解决制约市场规模的因素,例如地域封锁(根据用户所在地理位置限制对互联网内容的访问)或不同国家间缺乏统一的数据政策。他们还应努力确保行业法规和政府支持计划为所有公司提供公平的竞争环境。

数据结合使用和再利用可深化其发展影响

将不同类型的数据结合起来使用,将已有数据重新利用于其他目的,这些都可以增强数据的发展影响(第 4 章)。发展问题十分复杂,涉及经济、文化、环境、人口结构和其他诸多因素。以单因素数据为基础进行政策设计将缺乏全面性,有时甚至会很不明智。将不同类型的数据结合起来使用可以填补数据缺口,并为发展问题提供新的视角。

举例来说,公共意图的住户调查是大多数国家估算贫困率的基础,这种调查会收集关于居民生活水平、消费、收入和支出的大量数据。由于调查内容多、耗费时间长,因此样本往往相对较小。这样得出的贫困率估算通常在国家层面或较广泛的地区层面具有统计意义上的有效性,但无法提供能使减贫政策瞄准村庄或更低层级的具体贫困信息。近几十年来,研究人员通过住户调查数据估算贫困模型,然后将该模型映射到人口普查数据上,绘制高分辨率贫困地图,这样就可以对普查数据中每个家庭的贫困状况进行估算。但这种方法的一个问题是,人口普查通常每十年才进行一次(很多贫困国家的普查频率甚至更低)。

现在,研究人员已经对这种方法进行调整,使用CDR 数据或各种类型的遥感数据(通常来自卫星,也有的来自无人机)代替人口普查数据。利用 CDR 数据或卫星数据可以提供分辨率更高、时效性更强的贫困地图。例如在坦桑尼亚,如果只使用住户调查数据,政府只能了解全国 20 个大区的贫困状况 ;而如果将住户调查数据与卫星图像数据相结合,就可以估算出全国所有169个县的贫困状况(地图 O.3)。将两个数据源结合使用使贫困绘图的分辨率提高了八倍,而精确度几乎没有任何损失。世界上其他一些数据最匮乏的地方,如阿富汗和卢旺达,也采用了这类创新分析方法,为解决严重的数据空白提供了解决方案。

  

  其他一些对数据进行再利用的例子有 :使用网上媒体和用户生成的内容来绘制实时水文 / 洪水地图,用于改善水资源管理、保障粮食安全 ;结合公共和私营部门的卫星图像数据来监测农作物收成,对营养不良情况做出预测。本报告中还有很多例子展示了数据再利用在诸多领域改善规划、政策和结果的作用,包括监测公共卫生事件(包括疾病传播)、管理危机响应和资源分配、确保道路交通运输安全、监控非法捕鱼和森林砍伐等。

新的数据创建和使用方法也使公民社会能更好地对政府问责和监控腐败。例如,社交媒体的讨论区利用众包数据和网络数据抓取(web scraping),日益成为地方领导人打击腐败官员并就反腐政策实施效果获得实时反馈的工具。印度“Janaagraha 公民与民主中心”于 2011 年建立的“我行贿了”网站现已成为全球最大的众包反腐平台之一。该网站收集市民报告的腐败信息并将其与地理空间数据相结合,从而可以凸显问题最严重的区域。这种方法增强了个人、公民社会和政府打击腐败的能力。

为鼓励各方在数据再利用和不同来源数据结合使用方面做出更多努力,本报告介绍了捐助方、政府和企业应如何在人员、伙伴关系及研究领域开展投资,从而使各种新数据源充分服务于公共利益。低收入国家应尤其重视以下方面的政策与投资 :提高分析人员和决策者的数据技能;在高等教育中扩大数据科学和数据分析专业;促进与收入更高国家的大学和私营企业建立伙伴关系 ;加强政府高层领导的数据素养 ;建立一种鼓励在决策过程中使用复杂数据与证据的制度环境 ;改革国家统计机构,利用私人意图数据开展非传统分析。

数据治理与社会契约

一个设计良好的数据治理框架可使各国充分利用公共意图和私人意图数据并发挥两者的协同作用,全面实现其经济和社会价值。这包括建立对数据系统稳健性的信任,同时确保数据带来的好处得到公平分享。这样的数据治理框架是一个国家数据社会契约的具体体现。

本报告第二部分介绍了数据治理的基本要素,它们有助于实现数据的潜在益处,同时防范有害后果的产生(图 O.3)。这些基本要素包括 :数据基础设施政策(第 5 章);数据政策、法律和法规(第 6 章);相关经济政策(第 7 章);数据治理机构(第 8 章)。

尽管数据治理主要以国内为重点,但很多数据治理挑战只有通过国际合作才能得到高效、公平的解决。管理反托拉斯措施的跨境溢出效应和打击网络犯罪需要双边合作,而多边合作对解决全球搭便车问题(例如数据保护主义或由数据促成的服务业的逃税问题)和通过协调数据保护与互操作性法律和技术标准来降低交易成本至关重要。另外,区域合作可以帮助中低收入国家扩大在全球数据治理谈判中的发言权,也有助于在数据基础设施的建设中实现规模经济。

改善数据基础设施有助于确保贫困国家的贫困人口可公平受益

现代数据的数字化特征要求建立良好的数字基础设施,这是数据收集、交换、存储、处理和传播的先决条件(第 5 章)。然而,无论是国家内部还是不同国家之间,数字基础设施状况都很不均衡。由于数据基础设施的社会和经济价值将随着上网人口的增加而大幅上升,因此普及互联网服务已是国际社会确立已久的政策目标。联合国宽带委员会认识到宽带连接给个人和国家带来的变革机遇,承诺国际社会到 2025 年将宽带互联网用户普及率提高到 75%。

尽管如此,互联网的普及仍面临重大挑战。首先,由于移动技术日新月异,扩大服务覆盖率的目标也不断变化。2018 年,全球 92% 的人口生活在 3G 信号范围内(每秒 40MB),而随着 4G 技术的推广,覆盖率下降到 80%。4G 网络的速度为每秒 400MB,使用那些有益于推动发展的复杂智能手机应用程序需要这样的速度。最近有些领先市场已经推出了商用 5G 技术(每秒 1000MB),低收入国家则有可能被越甩越远。决策者可以为私营部门投资于光纤网络创造支持环境,同时改善对关键频谱资源的管理,从而加快技术升级。

  

  通过数字基础设施共享可以大大降低升级成本。不过,一方面要尽可能促进宽带服务商之间的竞争,同时要鼓励不同服务商在需求有限、无法支撑多个网络基础设施的市场中开展合作,必须谨慎保持这两方面之间的平衡。第二个挑战是,全球不使用数据服务的 40% 人口,其中大多数实际上生活在宽带信号范围内。在一项调查中,中低收入国家不使用互联网的人有超过三分之二表示他们不知道互联网是什么或不知道怎样使用,这表明人口的数字素养是很大问题。在中低收入国家,可负担性也是一个重要因素——对收入属于最低 20% 的家庭来说,一部入门级智能手机的费用约相当于家庭月收入的 80%。而较高的关税和国内税则进一步推高了相关费用。技术创新、市场竞争和政府政策的改善会促使成本降低,使用互联网的人数可能随之上升。然而,即使在那些已使用互联网的人当中,数据服务消费量目前只有人均每月 0.2 GB,远远达不到本报告估计的在线完成基本社会和经济功能所需的数据消费水平。

扩大互联网接入面临的第三个挑战是其对全球变暖的潜在影响。扩大互联网服务对气候的影响包含多项复杂因素。2018 年,用于支持数据基础设施的电力约占全球电力消费的 1%,对环境有巨大影响。但由于数据基础设施大量使用可再生能源且能效不断提高,其温室气体排放量大大低于其他行业。此外,对数据基础设施的使用可能产生重大的积极气候影响——新冠疫情期间出行的大量减少和视频会议的增加就说明了这一点(见“焦点 5.2”)。

  

  要想充分参与数据驱动型经济,不仅要让公民个人上网,还需要在国家层面建立适当的数据基础设施。大多数中低收入国家缺乏能对本地生成的数据进行交换(通过互联网交换中心,IXP)、存储(托管数据中心)和处理(通过云平台)的国内设施——参见地图 O.4。很多国家仍旧依赖海外设施,这意味着它们需要将大量数据传入和传出本国,为此承受速度慢和价格高的重大代价。

政策制定者在逐步改善数据基础设施可及性方面大有可为。首先要鼓励创建国内 IXP,然后为托管数据中心的建设营造良好投资环境。在这类中心,常用的互联网内容可以存储在本地,同时通过云匝道来使访问海外云端基础设施更便捷。此类设施可以在地区层面共享,地区内不同国家之间由光纤连接并在监管方面充分协调。由于数据基础设施对可靠性要求很高,还要考虑数据的碳足迹问题,因此私营部门投资环境最好有助于可靠、清洁、低成本的电力提供,促进自然冷却的使用,同时灾害风险极低。很多中低收入国家可能无法轻易满足这些条件。

健全的数据法规有助于建立信任环境

通过建立包括保障和使能两方面内容的健全法律法规框架,可以促进人们对数据交易的信任(第 6 章)。对各种收入水平的所有国家来说,这种框架的建设都还是正在进行的一项工作(图 O.4)。

保障措施有助于避免或限制数据滥用的损害,从而增强人们对数据交易的信任。让人们信任数据系统的一个基本前提是网络安全。要想充分实现网络安全,就需要建立必要的法律框架,规定数据控制方和处理方必须采用必要的技术体系来保护数据。迄今为止,中低收入国家中只有极少数确立了恰当的网络安全法律框架。肯尼亚新出台的《数据保护法》是综合性网络安全法规的一个范例。

就数据保护建立充分法律框架也十分重要。这种框架应对个人数据(识别个人的数据)和非个人数据(不包含个人身份信息的数据)做出明确区分。在中等收入国家中,毛里求斯的个人数据保护措施较为完善。实际上,它是撒哈拉以南非洲地区首批签署欧洲委员会《关于个人数据处理过程中的个人保护公约》(《第 108 号公约 +》)的国家之一。

对个人数据的保护植根于国际人权法,它要求在允许进行任何类型的数据交易之前充分保护数据主体的利益。通常这种保护的实现是要求数据主体必须以某种形式明确同意其数据被使用。但在当前形势下这种同意还有什么意义呢?有分析显示,一个普通人要想完整阅读他 / 她所访问的网站和应用程序中征求其同意的各种信息披露文件,每年要花上 76 天的时间!这种情况意味着需要加强数据服务提供商的法律义务,使其行为符合数据被使用的客户的最大利益。

非个人数据由于敏感性较低,主要可以通过知识产权法规提供充分保护,从而在数据保护和数据再利用之间实现一定平衡。不过本报告发现,我们的调查所涵盖的大多数低收入国家并未确立对私人意图数据知识产权的保护。

使事情更加复杂化的是,个人数据和非个人数据之间的区别正变得越来越模糊。这是由于现在可以使用复杂的算法对不同来源的数据进行混合和处理,从而对非个人数据(例如来自移动电话的数据)做出个人识别,或至少可以识别出数据主体所属的特定社会群体。

使能措施推动利益相关方群体内部和不同群体之间的数据访问和再利用,确保数据的社会和经济价值得以充分实现。旨在支持数据共享的法律条款,其性质和程度因数据种类(公共意图数据还是私人意图数据)而明显不同。各国已做出很多努力,通过开放数据政策(鼓励主动发布政府数据)安全地公开公共意图数据,同时通过信息公开立法赋予公民迫使政府公开信息的法律权利。但是,要使开放数据政策真正发挥作用,就必须具备关于敏感数据如何划分的统一标准,还需要数据互操作性技术标准、机器可读格式和有助于数据后续再利用的开放式许可协议。

相比之下,政府在披露私人意图数据方面的影响力要小得多。共享此类数据可以成为对市场势力过于集中的一种补救。例如在埃及,政府批准了两个主要叫车应用程序之间的合并,条件是它们要与规模更小的竞争对手共享司机和乘客信息。在另外一些情况下,私人意图数据可能对解决重大公共政策挑战发挥重要作用,例如使用移动电话记录开展新冠感染者接触追踪,控制疫情扩散。但到目前为止,各方对通过开放式许可协议、数据可携权和各类数据合作伙伴关系等措施来激励私人意图数据交换的可能性还没有太多关注。不过,还是有一些国家(如法国)已颁布法规,要求在被认定符合公共利益的情况下分享私人部门数据。

  

  确保数据监管与经济政策目标相一致可促进价值创建

以平台为基础的商业模式正在迅速扩展,而数据在其中发挥着核心作用。例如,搜索引擎收集用户的网站访问数据,然后出售给营销公司,使后者可以更精确地投放广告。这类基于平台的商业模式在中低收入国家正变得日益重要。数据法规监管框架的设计对数据驱动型企业的活力会产生实实在在的影响,需要做出困难的政策权衡。例如,要求重要市场数据源开放数据访问,对促进平台企业之间的竞争至关重要,但同时也可能影响人们对数据驱动型商业的投资和创新意愿。同样,旨在保护个人数据的法规可能会限制数据跨境流动,严重影响国家在蓬勃发展的数据促成服务业贸易中的竞争力(第 7 章)。

竞争和反托拉斯政策。竞争政策在确保平台式商业创造的价值在生产者和消费者之间公平分享方面起着关键作用。数据收集存在规模经济外部性,随着平台参与者增加,网络价值也越高,进而可能导致市场势力的迅速积累。解决由此带来的市场由少数企业主导的状况需要两种策略的相互配合。

首先,在有能力执行反托拉斯法规的国家中,应进行事后反托拉斯执法,不过可能需要针对数据驱动型商业带来的挑战做出必要调整。例如,对市场主导地位的标准测试(居主导地位者定价过高)在平台通常向消费者提供免费服务的行业可能就没有什么意义。中等收入国家(如埃及、印度和墨西哥等)已经出现了若干涉及平台商业的里程碑式反托拉斯案件,但本报告发现还没有任何低收入国家审理完成此类案件——尽管那些居全球主导地位的公司也存在于这些国家。

其次,在采取反托拉斯措施的同时,也需要认真考虑采取事前监管措施,使相互竞争的企业和新进入者都可以获得重要数据,还可以通过强制规定消费者个人数据的完全可携权,使消费者能在不同供应商之间自由切换。应时刻针对以下原则加以审核 :数据访问对确保竞争至关重要,而且不会不当打击数据驱动型企业的创新积极性。

  

  贸易政策。平台型商业也开辟了国际贸易新渠道,带来大量的跨境数据流动(图 O.5)。一个国家的个人数据保护监管框架会对此类贸易的参与产生实质性影响,而增强人们的信任与创造价值之间存在一定对立。各国采用了多种方法来处理这个问题。一些国家允许数据按照私有部门标准开放流动,政府不大参与其中——如美国联邦管辖范围内就是如此。其他国家,如中国、尼日利亚、俄罗斯和越南,则有更多监管控制,要求某些个人数据在国内存储副本(数据本地化),而且很多国际数据交换要由政府授权。介于以上两者之间的国家(包括欧盟成员国以及阿根廷、南非等国)则规定,能否对个人数据进行跨境转移取决于贸易伙伴国是否具备适当的数据保护制度。本报告发现,明确的国内个人数据保护措施与相对宽松的跨境转移规定,这两者相结合可以为数据促成服务的国际贸易提供最有利环境。

税收政策。虽然数据驱动的交易使经济活动更为活跃,但中低收入国家的政府很难通过税收从中公平受益。就间接税(如增值税)而言,税收权明确属于最终销售所在国,但这些国家往往缺乏征收此类税项所需的行政能力。对东亚国家的估算表明,到 2030 年,这方面的财政收入损失可能高达国内生产总值的 1%。至于直接税(例如公司税),关于如何分配对在某个市场无实体存在却在该市场经营的企业的征税权,国际上缺乏统一规则。在尚未就此达成共识的情况下,越来越多的国家正通过征收临时性的数字服务税作为补偿。

健全的机构与治理可改善数据的发展影响

如果相关机构运作不力,那么政策和法律法规就难以有效实施或执行,数据基础设施的潜力也无法发挥。有效的数据治理机构框架必须能够履行若干关键功能,包括设定政策目标、制定配套规则与标准、强保此类法规得到遵守、通过学习和评估不断改善治理等(第 8 章)。比如,乌拉圭成立了一个受总统办公室领导的数据治理机构并以“全政府”视角行事,对该国 2007 年以来成功的电子政务改革发挥了关键作用。

对那些寻求建立良好数据治理机构安排的各国政府来说,没有哪种方法对所有国家都适用,不过某些机构设计特征具有普遍意义。这些机构应当有正式授权和充足资源,并具备在整个政府体系内以协调方式有效履行其职能所需的技术能力。框架内的主要机构通常包括数据治理机构、数据保护机构和网络安全机构,还有一些新型机构——例如数据信托,即责任导向的数据中介机构,使不同个人可将他们的合法数据权利集中起来并指定给承担明确信托责任的受托人。在某些情况下,机构的独立性和职能自主权可能对保护数据治理机构免受不当的政治或商业干预至关重要。行为和文化规范以及政治经济制约因素经常会阻碍改革,使改革措施难以落实,这在中低收入国家尤为突出。变革管理、协作式领导以及绩效和激励文化可以帮助机构克服实施和协调工作的障碍,有效履行其职能与责任。

为了最大程度地争取数据治理生态系统中所有参与者的支持,包括全社会的支持,数据管理必须具有社会包容性,同时应在人们眼中具有合法性。如果政府以透明的方式管理和使用数据并由恰当的问责制度约束,那么合法性就会增强。非政府组织和新兴机制(如数据中介)可在数据治理生态系统中发挥重要作用,帮助政府和最终用户负责任地共享和使用数据,从而更好发挥数据在促进发展方面的价值,同时防范数据不当使用和滥用的风险。以协作、透明的方式与全社会以及国际上的利益相关方合作可以增进人们对数据治理体系的信任,提高合法性,强化围绕数据使用的社会契约。例如,东南亚国家联盟通过了一个地区数字化数据治理框架,用于协调成员国的数据治理安排并力争实现互操作性。

走向统一的国家数据体系

一个运作良好的数据治理框架可确保数据基础设施、法律、经济政策和相关机构共同发挥作用,以符合本国价值观的方式支持数据的使用,同时保护个人的数据权利。这种框架要确定数据如何由所有利益相关方共享、使用和再利用的规则以及相关合规机制。

本报告第三部分提出了建立“综合国家数据系统”(INDS)的愿景。这种系统可以产生高质量数据,然后以一种既使数据得到保护又使之易于获取、便于所有利益相关方共享和再利用的方式加以公开(第 9 章)。理想中的 INDS 与数据治理框架可以无缝配合。如果将治理框架比作制定和执行道路交通法规,那么 INDS 就是连接所有用户、确保数据安全往返目的地的高速公路网。

综合国家数据系统的基础是对数据治理采取一种有意的,全政府、多利益相关方的方法。它将数据的生产、保护、交换和使用明确融入所有政府实体的规划和决策过程,并将公民社会、公共部门和私营部门的各种利益相关方积极纳入数据的整个生命周期以及数据系统治理架构。

一个运作良好的数据系统需要各种人才 :生成、处理和管理高质量数据的人才 ;在相关机构保护数据免遭滥用的人才 ;起草、监督和实施数据战略、政策和法规的人才。它还需要有人来对公共部门和私营部门问责,需要有人利用私营部门生产过程中的数据来改善公共部门政策。所有这些都要求国民具备良好数据素养,以便社会各领域人员都可以从 INDS 中受益。

要想形成一个完善的综合国家数据系统,还必须为相关机构和实体提供产生、保护和共享数据的恰当动机,并为数据基础设施和相关机构提供充足资金,以保障系统的正常运行。最后,还需要形成一种数据使用文化,以此推动高质量数据的供给,并刺激各方对基于数据的决策的需求。离开这种数据文化,国家数据系统将难以维持。

如果政府机构、公民社会、学术界和私营部门安全地参与国家数据系统,那么数据的潜在用途就会扩大,对发展的潜在影响也会扩大。实际上,数据系统的综合性、整合度越高,参与者越多,潜在回报就越高。如果两个参与者安全地交换数据,则数据可以双向流动 ;如果三个参与者交换数据,则数据可沿六个方向流动 ;如果有四个参与者,那么数据可沿 12 个方向流动。随着数据的再利用,这些连接将迅速增加。高整合度要求参与者之间紧密协作和共同治理,但在其他方面这种整合与分散式数据架构是兼容的。综合国家数据系统旨在确保数据自由安全地流动,而不是停留在某一地。分散式系统可能最适合实现这种安全流动。

尽管大多数国家都离建立功能完善的理想数据系统相去甚远,但将目光对准这一目标可指导各国采取恰当步骤来建立这样一个系统。各国具体如何朝着 INDS 愿景迈进取决于它们在数据领域的能力和社会契约现状。如何建立 INDS 没有统一的蓝图,不过本报告提出了用来评估相关进展的成熟度模型。处于 INDS 开发初期阶段的国家可能受益最大,因为它们可以参考此模型建立起实现数据流动和有效使用所需的基本要素,尤其是相关机构要制定旨在改善数据治理的政策和策略。这些基本要素到位之后,政府便可着手让数据在国家数据系统参与者之间流动并将其系统化。这包括建立使能性和保障性机构与基础设施,确保政府所有运作和服务中具有保护数据、提高数据质量和整合数据的能力。在综合国家数据系统的更高阶段,则需要在以下方面进一步努力:建立负责保护数据、减轻隐私风险的机构 ;制定确保数据一致性和互操作性的政策和标准 ;设计促进政府实体之间以及政府实体与国家数据系统其他参与者之间数据共享和再利用的激励 ;建立强调数据素养重要性的教育培训系统。

系统的具体结构将因国家各异,反映各国对安全地再利用和共享数据的本地规范。不过,要想实现数据再利用和共享所带来的发展收益,这类系统还是需要具备一些共同特点。一个运行良好的系统应明确规定有关部门在数据生产、流动和使用方面的职权和责任。它将以本报告中讨论的基础设施、政策、法律法规和机构为基础,整合多种数据来源,并将所有利益相关者连接起来(图 O.6)。

  

  对许多国家来说,建立一个高质量数据在其中流动并由多方参与者安全使用的系统仍是一个遥远愿景。十分贫困、脆弱且治理不善的低收入国家可能连最基本的数据都难以产生,更不用说建立起全政府、多利益相关方的数据治理方式。但无论如何,所有国家都应持有这种愿景,即使是那些在数据领域面临最多困难的国家,因为这一愿景可被用来指导数据系统建设方面的决策(专栏 O.1)。

就新的数据社会契约形成共识(基于人们对数据产生的价值可得到公平分配的信任),找到建立综合国家数据系统的正确蓝图(释放数据通过用户众多的创新应用改善人们生活的潜力)——这是一个非常宏伟的目标。要实现这一目标,就需要大幅改变数据的生产、管理、保护、共享和使用方式。做出改变非常困难,要求付出切实承诺和努力,但不改变的代价将是一个更加不平等和错失许多发展机会的世界。

来源:对外经贸、数字经济与社会

 

扫码加入本站知识星球小密圈,获取1万+行业最新精选报告。

注:本站文章除标明原创外,均来自网友投稿及分享,如有侵权请联系dongxizhiku@163.com删除。

         

发表评论