首页 > 新闻舆情 > 金融业数据应用,在合规与效率之间如何找到出路?

金融业数据应用,在合规与效率之间如何找到出路?

观点 程远 零壹财经 2023-01-12

关键词:数字经济金融业数据合规数据治理数据共享

金融业是数字经济中数字化程度比较高的领域,同时也存在数据合规、数据安全、数据治理、数据共享等问题。

来源 | 零壹财经   作者 | 程远
 
2023年1月6日,“第二届中国信用经济发展峰会暨零壹智库年度峰会”在线上举办,会议以“构建数据基础制度,促进信用经济发展”为主题,围绕数字经济、信用经济等专业话题开展讨论。
 
在本次峰会“金融业数据生态发展现状与趋势”的主题圆桌论坛上,保险行业数字金融和隐私计算专家高翔、全联并购公会信用委员会专家安光勇、银雁科技集团助理副总裁李家菁以及零壹研究院院长于百程一起就金融业的数据生态格局、金融业数据应用的堵点、趋势与机会等话题进行了讨论分析。
 
 
主题圆桌论坛由于百程主持。他说,过去一年,国内在数据层面有许多政策和行业的进展,刚发布“数据二十条”是数据产业发展和应用进程中的关键一步。随着数字经济的发展,数据的积累越来越多,数据产生的价值也越来越大,并成为驱动数字经济发展的核心生产要素。金融业是数字经济中数字化程度比较高的领域,在数据驱动下,智能风控、智能营销、智能运营大大提升了金融业的运行效率。同时,金融业也存在数据合规、数据安全、数据治理、数据共享等问题。
 
本次峰会由全联并购公会信用管理专委会、深圳信用促进会、零壹智库、《陆家嘴》杂志、《价值线》杂志联合主办,中央财经大学银行业研究中心、香港科技大学数字金融实验室、上海金融与发展实验室、中国科技体制改革研究会数字经济研究小组提供学术支持。
 
金融业数据生态的新格局
 
关于金融业数据生态的类型,高翔结合信贷和保险公司的日常业务接触,将数据大致分为三类。第一类是基础的数据提供商,比如进行人脸识别和二三四要素的核验。第二大类是个人或者企业的征信类、资信类信息数据提供商,比如用于信贷的反欺诈、信用评估、模型建设等方面。这方面的数据包括企业网上经营、个人行为数据、征信类数据等,范围比较广。第三类是围绕着数据提供附加服务的公司,比如围绕数据提供方法论、征信模型、隐私计算服务,也包括数据交易所等。
 
高翔说,第一类和第二类数据之所以分开对待,是因为根据《征信业务管理办法》,凡是涉及到个人和企业信用评估类的数据属于征信范畴,需要通过征信持牌机构。在具体业务中,通过跟监管机构和征信机构沟通,基于个人身份识别的数据目前并没有被列为信用评估类的数据进行看待,因此可以不通过征信机构来获取服务。
 
安光勇从国内外对比的维度谈了对于金融数据生态的看法。他说,国内的金融数据应用还不是一个稳定的状态。从国外成熟市场来看,金融数据领域比较稳定,数据类型并不像国内这么丰富多彩,也不需要通过一些替代数据去做补充,相关法律制度也比较完善。相比来讲,国内可能过于去关注数据的创新和替代数据,导致我们忽视了数据的稳定和质量的重要性。实际上,金融行业的客户数据一般来说是最好的,可支撑信用评估的数据也非常多。而且,做信用评估也不是数据越多越好,数据多了反而可能有很多噪音,成本也比较高。金融数据应用应该是用相对少的数据,得出好的结果。
 
安光勇说,数据应用要考虑效率和成本的问题,以及替代数据的稳定性问题。在国外,替代数据主要是用在毕业生或者低收入群体,因为他们缺少传统金融数据。金融领域数据充分、数据敏感,所以金融数据应用和互联网领域不一样,重点不应该是放在扩大数据维度和数据创新等方面,而重点应该是更精准、更高效、成本更优上面。
 
金融是强监管行业,金融数据生态的形成和发展与我国的征信体系建设密切相关。李家菁说,目前我国征信体系是政府加市场双轮驱动的发展模式,央行征信体系的数据库和市场化征信机构的数据库协同发展,互为补充。
 
李家菁说,目前个人征信持牌机构包括百行征信、朴道征信和正在受理中的钱塘征信。企业征信方面包括了130多家在央行分支机构备案的企业征信机构。这些大量的市场化运作的征信公司,依靠自身所处的业态所形成的优势沉淀了行业数据,可以为金融机构提供多维度的个人行为数据和企业经营数据。不同渠道之间的数据,又可以做相互印证和互为补充,这就使得金融机构在金融风控、消费信贷等领域能够获得更全面、更精准的用户画像数据。从系统建设的角度看,因为在不同数据源之间可以做灵活的、无缝的切换,在一定程度上可以确保银行业务的连续性和高可用性。
 
金融数据应用中的堵点与机会
 
个人信贷和保险营销等业务,和个人数据息息相关。高翔说,在《个人信息保护法》出台后,随着三方数据市场的逐渐规范,金融业务层面可运用的数据模型、数据源维度骤减。比如,个保法没有出台之前,我们的个人信用评估加上反欺诈的模型大概有三四个,外采数据源大概有3000多个维度,这3000多个维度按照一定频次进行筛选、更换,最终入模入参的可能有几十个。经过了数据要素市场的更新迭代后,出于合规的考虑,一些数据源停止提供,或者数据源还在但更新不足或者维度减少,从而使得一些机器算法模型效果大减或者不可用,需要通过人工核验辅助等其他手段来进行调整。
 
高翔说,经过跟行业的交流跟踪以及业务实践,目前摸索出几个数据应用的方式。第一是跟个人征信持牌机构深度合作,在合理框架下进行数据的深度挖掘,当然有些数据是非标准化的,使用成本比较高。第二是探索尝试运用隐私计算的方式实现,将不在征信业务管理办法的要求内的一些合规数据源进行点对点的数据对接,当然此类对接和挖掘也是个性化的。另外,这一方式还要考虑隐私计算的成本、技术的成本、业务理解的成本、投入和应用的成本等。目前我们也上线了自己的隐私计算平台,在合规的前提下边摸索边试。第三种方式还处于跟踪的阶段,是跟各地方的数据交易所、地方政府政务数据平台进行沟通对接,对于这种方式未来也寄予厚望。不过总体来看,因为数据源维度不够,目前模型效果较之前还是差的。
 
对于近两年数据领域比较热的隐私计算赛道,高翔从需求者的角度表示非常看好。他说,金融行业对于数据保护相关的细则文件非常多,其中很多都已经提到了运用去标识化手段、匿名化手段来解决数据传输过程中的安全问题。目前看隐私计算是最符合去标识化手段和匿名化手段的一些技术的统称,这是第一个看好的原因。第二,从本质看,隐私计算是需求方和供应方点对点的数据价值的交互方式。征信持牌机构和数据交易所则是搭造了一个数据中介平台,大家都跟这个中介平台做交互。这两种方式都是未来数据交易必不可少的方式,平台适合比较标准化的数据产品,而非标准化的数据比较适合隐私计算的点对点方式。第三,隐私计算作为初创行业,已经过了起步阶段,行业已经开始优胜劣汰,少数的几个头部公司逐渐显现,进入到集中度汇集的阶段。监管部门对于隐私计算持鼓励态度,一些行业标准也已经出台,所以这个赛道已经非常明晰了。
 
安光勇从金融创新的方向探讨了数据领域未来的机会。他说,国内金融数据方面的创新主要集中在技术维度,但实际上创新点还有很多,比如法律制度、监管模式以及商业模式创新,这些方向可能是未来的机会。
 
安光勇说,国外这段时间内把更多的精力放在金融数据法律制度和监管方面的创新,最有代表性的是《通用数据保护条例》(GDPR),比如韩国等国家在GDPR的前提下去发展MyData(本人数据管理)模式,就包括了数据的很多领域,包括可携带权,包括隐私计算。所以,未来的发展方向,除了技术维度之外,大家可以更多的在商业模式、法律制度等领域去做一些创新。法律或者制度的落地,对整个社会的影响是很大的,在这方面多花点时间去做研究和创新,可能比花时间在技术维度上的效果更好。
 
李家菁对于监管层面的创新也非常关注。她表示,金融科技公司跟金融持牌机构联合去参与央行推出金融监管沙盒,包括跨境金融监管沙盒相关的项目,其实大家都比较关心的就是比如说像针对数据的隐私计算应用入盒之后,未来要达到什么样的条件才可以出盒去做大规模的市场推广和应用。
 
另外,李家菁从数据应用研发的角度提出未来的趋势。以往传统的数据应用往往是采用专家建模的方式,但专家建模有一定的缺点,专家的人工成本高,并且比较依赖专家的行业经验和技术能力。由于这种人为因素的存在,会导致建模结果存在不稳定和不确定性,也就是技术风险性。针对这种问题,现在金融行业的应用已经开始逐步在推广传统的建模方式加上机器学习的方式来解决,这也是未来发展的一个趋势。
 

耗时 126ms