当前,以人工智能、区块链等为代表的数字技术不断涌现,快速向经济社会各领域融合渗透。以数据为核心的
数字化转型已是大势所趋。金融业是数据密集型行业,在生产经营过程中积累了海量的数据资源。如何做好
数据治理,更快、更好地推进数字化转型。
首先,谈一谈我们面临的数据治理困难,即数据治理之“困”。
第一,存在信息孤岛,有数不能用。当前,金融业数据治理过程中普遍存在“不愿、不敢、不能”共享的问题,导致海量数据散落在众多机构和信息系统中,形成一个个“数据烟囱”。
一是不愿共享,多数机构都将数据作为战略性资源,认为拥有数据就拥有客户资源和市场竞争力,主观上不愿意共享数据;与之类似,机构内部数据权属分割,数据所有权和事权密切相关,部门宁愿将数据“束之高阁”,也不愿轻易拿出来共享。
二是不敢共享,部分金融数据具有一定敏感性,涉及用户个人隐私、商业秘密甚至国家安全,数据共享可能存在法律风险,客观上给机构间共享数据带来障碍。
三是不能共享,由于各机构数据接口不统一,不同机构的数据难以互联互通,严重阻碍数据开放共享,导致数据资产相互割裂、自成体系。(数据孤岛的产生不能怪数据所有者,因为数据产生的初衷肯定是自己用,而并不是为了让别人用,以后也会如此)
第二,
数据质量不高,有数不好用。金融科技背景下,高质量数据成为金融服务与创新的重要基础,也是大数据提升金融精准施策能力的关键前提。然而,当前金融业整体数据质量不高现象依然突出,给数据深入挖掘与高效应用带来困难。
在完整准确性方面,由于缺乏统一的数据治理体系,有些金融机构在
数据采集、存储、处理等环节可能存在不科学、不规范等问题,导致错误数据、异常数据、缺失数据等脏数据产生,无法确保数据的完整性和准确性。
在一致性方面,由于业务条线繁杂、业务种类多样,多个部门往往数据采集标准不一、统计口径各异,同一数据源在不同部门的表述可能完全不同,看似相同的数据实际含义也可能大相径庭,数据一致性难以保障。这给全局数据建模、分析、运用造成障碍,数据挖掘效果大打折扣。
第三,融合应用困难,有数不会用。金融数据来源众多、体量庞大、结构各异、关系复杂。从如此繁杂的海量金融数据中挖掘高价值、关联性强的高质量数据,需要高效的信息技术支撑和可靠的基础设施保障。然而,部分金融机构科技研发投入相对不足、科技人员占比严重失调,利用数据建模分析解决实际问题的能力有待提高。
信息资源利用大多停留在表面,数据应用尚不深入、应用领域相对较窄、数据与场景融合不够,导致数据之“沙”难以汇聚成“塔”,海量数据资源无法盘活,数据潜力得不到充分释放。
第四,治理体系缺失,有数不善用。我们常说,技术本身是中性的,技术运用的善恶完全取决于人,我认为这一结论对数据同样适用。科技要向善,数据也同样要向善。然而,由于法律法规尚不健全、数据治理体系还不完善、机构合规意识不足,数据“不善用”的问题较为突出。
从业机构违法违规成本低,为谋求商业利益而置现有管理规定于不顾,过度采集数据、违规使用数据、非法交易数据等问题屡见不鲜。例如,某些APP、网站,用户不授权提供手机号、通讯录、地理位置等信息,就无法继续使用和浏览,通过“服务胁迫”来达成“数据绑架”。
此外,部分机构数据保护意识、内部管理、技防能力薄弱,数据泄露事件时有发生,用户成为“透明人”,电信欺诈、骚扰电话、暴力催收等屡禁不止,严重侵害用户权益。
面对上述困难和挑战,金融业如何解困破局、实现数据有序治理和高效利用,是需要我们共同探讨的重点议题。下面,我谈一谈数据治理应遵循的基本原则,也就是数据治理之“道”。
一是依法合规,保障安全。数据作为重要的生产要素,确保数据安全应是始终恪守的底线。金融业是对信息安全高度敏感的行业,应建立健全数据安全管理长效机制和防护措施,严防数据泄露、篡改、损毁与不当使用,依法依规保护数据主体隐私权在数据治理过程中不受侵害,不能因开展跨部门数据融合应用而突破现有法律法规与监管规则。
二是物理分散,逻辑集中。由于历史原因,很多机构往往存在“N”个数据中心(数据源),呈现出多个业务条线数据分散存储、分散运行的局面,若采用“推倒重来”的方式显然成本太高、阻力太大。
因此,应在保持现有数据中心职能不变的前提下,维持当前数据物理存放位置和运行主体不变,充分利用各数据中心IT设施和人财资源,构建“1个数据交换管理平台+N个数据中心(数据源)”的数据架构格局。在此基础上,制定实施统一的数据管理规则,实现数据的集中管理。
三是最小够用,用而不存。数据治理的一大难点就是如何在保障数据所有权基础上实现数据的融合应用。应消除数据所有方因信息“所有权让渡”造成“事权转移”的顾虑,规范数据使用行为,严控数据获取和应用范围,确保数据专事专用、最小够用、未经许可不得留存,杜绝数据被误用、滥用。在满足各方合理需求前提下,最大限度保障数据所有方权益,确保数据使用合规、范围可控。
四是一数一源,一源多用。当前,无论是金融管理部门还是金融机构,各业务条线数据分散现象或多或少存在,数据多头收集时有发生。这不但增加信息报送、采集、存储成本,也导致数据责任主体不明,数据安全、数据质量难以保障。应明确源数据管理的唯一主体,保障数据完整性、准确性和一致性,减少重复收集造成的资源浪费和数据冗余。同时,建立数据规范共享机制,提升数据利用效率和应用水平,实现数据多向赋能。
(部分内容来源网络,如有侵权请联系删除)