隐私计算金融应用之困：怎样选择靠谱的公司？

观点高翔零壹财经 2023-02-06 阅读：37850

关键词：隐私计算 金融应用 个人信息保护 联邦学习

从目前落地案例来看，隐私计算产品个性化程度很高，基本是一事一议制定解决方案。

本文首发于《陆家嘴》杂志2022年11/12期，作者：高翔

来源 |《陆家嘴》杂志

作者 |高翔

金融机构落地隐私计算实践探索

2021年以来，作为《个人信息保护法》等法律法规框架下更合规的技术方案，隐私计算技术行业得以迅速发展，其中金融行业应用实践最为靠前。在此过程中有必要总结归纳隐私计算的技术内涵，探究其内在价值与作用，深入分析当前行业应用的问题及原因，并对更广、更深层次的行业应用提出建议。

隐私计算概述

三条技术路径

隐私保护技术有很多，包括：差分隐私、同态加密、多方安全计算、零知识证明、可执行环境、联邦学习等，隐私计算是上述技术的统称。Gartner（高德纳，全球最具权威的IT研究与顾问咨询公司）公司将上述技术路径归纳为三类：处理之前转化数据和算法、数据本地处理模型加密交互、可信环境。中国信息通信研究院最早沿用了该分类，并将三条技术路径分别命名为多方面安全计算、隐私增强联邦学习和可信执行环境。

通俗来说，多方安全计算是将数据进行非对称加密后，在密文状态下交互计算结果，并保证结果与明文交互状态下无偏；隐私增强联邦学习是指每一个计算方法训练一个模型，通过更新交互模型权重和梯度等信息最终聚合得到一个全局模型，常备理解为“数据不动模型动”；可信执行环境是指在中央处理器（CPU）中构建一个安全区域，在确保计算参与方均不可见原始数据的前提下完成交互与建模。

三条技术路径各有优劣势：多方安全计算经过大量学术界检验，安全性较高，但应用于复杂的计算开销和性能损耗大，采用硬件加速是当前主要解决思路；隐私增强联邦学习因大规模联合建模而生，但模型效果只能无限趋近于明文状态下模型效果，算力和通信消耗同样较大；可信执行环境实质是在物理安全区域内明文建模，运算效率高，计算性能和模型效果没有损耗，但安全性建立在硬件基础上，同时受制于国产芯片性能增长速度而应用受限。

价值与作用

隐私计算作为更高安全级别的去标识化技术，更符合个人信息保护法的要求。根据国家标准《信息安全技术个人信息去标识化指南》（GB/T 37964-2019），隐私计算当前运用的底层加密技术中的同态加密、秘密共享、差分隐私等均属于去标识化技术。而个人信息保护法中明确规定：“个人信息处理者应当……采取相应的加密、去标识化等安全技术措施”。因此，金融机构应用隐私计算技术，有助于保障数据处理过程中各方的数据安全，有利于优化数据应用安全环境和维护相关数据主体的权益。

隐私计算有助于实现一定条件下的匿名化。早在2015年，爱沙尼亚应用研究中心（CentAR）在对个人纳税数据分析时使用了基于多方安全计算的解决方案，被数据保护机构基于欧盟一般数据保护条例（GDPR）框架下判定并未对个人信息进行处理，属于匿名化信息，因而也无需获取个人的授权同意。我国《个人信息保护法》也规定了匿名化信息不属于个人信息。虽然通常状况下隐私保护技术并不等同于匿名化手段，但其应用将有助于减轻个人信息处理机构有关授权同意的合规隐患，有助于讲清楚自身责任，甚至实现免责。

隐私计算更符合“最小必要”合规要求。“最小必要”原则不仅是指收集个人信息应控制在最小范围，还表现在个人信息处理者应“采取对个人权益影响最小的方式”和“以最小授权为原则，严格设定信息访问权限”。隐私计算采用了密文或建模中间值等方式替代了个人信息明文传递，有效控制了数据无限复制和滥用对数据价值的极大削弱；同时，隐私计算产品目前均采用“点对点方式”对数据及使用方进行白名单制管理，任何一方可以随时关闭数据价值交互接口，任意调控数据价值交互范围，具有灵活控制访问权限和授权范围的精准调控优势。

行业发展现状与展望

政策鼓励和需求倒逼隐私计算快速发展。《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》陆续出台，彻底改变了三方大数据市场的经营逻辑，个人信息多层倒卖、默认缓存、违规转销等做法因面临严重违法后果而退出市场，合法、合规的数据源及其价值交互方式成为稀缺资源。此时隐私计算行业逐渐纳入视野，尤其得到了监管机构的鼓励发展。多部委联合印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》和中国人民银行发布的《金融科技发展规划（2022-2025年）》中多次提到并鼓励发展隐私计算技术。在此背景下，隐私计算行业风险投资金额屡破新高，头部金融机构开展了大规模项目试点工作，市场认知和接受度快速普及，隐私计算行业迎来快速发展阶段。腾讯银行和毕马威联合发布的《隐私计算行业研究报告》中预测：我国隐私计算系统的销售和服务收入规模在三年之内有望触达100-200亿元的市场空间。

行业发展鱼龙混杂，技术水平参差不齐。由于缺少必要的顶层设计和行业标准，导致行业底层技术应用杂乱无章，企业技术能力水平高低不一，行业鱼龙混杂。截至2021年，通过信通院相关测试的从业机构有86家，但不完全统计至今已突破300家。深入观察发现，多数公司仅自2021年底方才成立或进入市场，技术多从Fate社区等开源渠道修改而来，产品实用性、可用性较差。这也导致2021年底金融行业落地的很多项目或因技术问题被迫流产，或因实现结果偏差中途转包，落地执行效果并不如预期。

技术兼容性形成“新鸿沟”，互联互通任重道远。由于技术路径众多，厂商林立，底层密码协议、使用语言各有不同，导致隐私计算因产品不兼容而产生新的“技术鸿沟”。虽然中国信通院等很多机构致力于标准制定，但由于核心障碍是意愿和商业问题，并不是单纯技术问题，因此会是一个漫长的推动过程。

软硬结合是发展方向。几个趋势锁定了硬件一体机是行业未来发展方向：一是算力和计算效率问题始终是困扰隐私产品性能的首要问题，行业探索至今通过“纯软”方式很难算力加速的进一步提升，行业纷纷转向运用加速卡解决算力瓶颈问题；二是隐私技术路径中可信执行环境（TEE）本身就是软硬结合的解决方案，如果要将市场所有隐私产品做兼容性打通，避免不了硬件底层的支持。行业头部厂商纷纷提出了硬件发展战略，华控清交、冲量正在推出自己的一体机，星云Clustar已经推出加速卡硬件产品，融数联智也在设计过程中。

金融机构应用现状分析

落地项目现状

2021年，金融行业的头部机构纷纷尝试运用隐私计算方法用于个人信息匿踪查询、外部数据引入建模、联合营销、联合统计、反洗钱与反欺诈等涉及数据跨主体应用等场景中，据不完全统计，全年落地的隐私计算项目至少有21个，其中知名项目有：工商银行的基于多方安全计算的工银e生活营销项目、基于联邦学习的工行&工银安盛健康险联合营销项目、基于联邦学习的企业贷中检测项目、光大集团基于多方安全计算的全辖子公司联合统计项目等。目前已知落地隐私计算项目的银行主要有：五大国有银行、银联、光大集团、平安银行、浦发银行、华夏银行、重庆农商银行、北京银行、南京银行、苏州银行、新网银行等。

隐私计算金融应用之困

需要集成多种能力才能实际投入使用。金融行业应用隐私计算的目的是引入更多维合规数据并最终形成决策依据，其中需要多环节能力：一是整合外部数据的能力，通过需求撬动数据供给，说服一手数据源部署安装隐私产品，建立数据测试联动机制；二是结合具体场景设计合理的告知和授权、前端展示、数据全生命周期管理、账户权限分级管理等一整套合规方案；三是具备建模和策略部署能力，帮助有需求的金融机构搭建有效且好用的量化决策体系，并定期运维更迭模型。

产品易用性普遍存在问题。由于隐私计算公司缺乏金融行业的建模经验，导致隐私产品对数据清洗、分栏、特征值和算法选择等环节的灵活性支持不足，很多产品简单将上述环节的策略和标准写死，不支持灵活调整工具及调整后统计结果的反馈，导致大量数据标签被误杀，产出的模型效果无法达到实用标准。

隐私产品的系统安全和网络安全均需要加固。无论是多方安全计算、隐私增强联邦学习还是可信执行环境，均在防范恶意攻击方面缺少有效手段。因此，行业结合硬件集成的发展方向以及等保2.0方案中可信计算环境的防护作用，提出了“可信+隐私计算一体机”的解决方案：即在隐私计算一体机中，引入可信计算硬件模块，对一体机所承载的计算节点的系统安全和网络安全进行主动防御，较大程度上解决恶意攻击问题。目前蚂蚁推出的摩斯一体机便集成了可信平台、可信执行环境、安全容器、算法加速等功能，并通过了国家金融科技测评中心的测评。

隐私计算应用建议

多维度评估隐私计算公司

结合行业实践，建议从以下维度综合评估隐私计算公司能力：公司创始人团队背景与专业履历、已获行业认证情况、专利投资人行业口碑、隐私计算技术沉淀时间、技术人员是否超过100人、已接通的数据源情况（真正能够供数）、已有合作方专业口碑以及合作案例的类型及规模等。结合产品实测的可用性、易用性、建模效率、模型效果等定量维度，对各类隐私产品进行对比分析。

建议在采购隐私计算产品时，秉持解决实际问题的务实思路，对各家公司产品进行对比分析。这一趋势在今年的落地案例中体现愈发明显：如招商银行“慧点隐私计算平台”项目，最终由上海富数、洞见智慧、同盾科技和平安科技4家隐私计算公司联合中标，分别从产品兼容性、稀有数据源、建模经验和性能保证等方面，确保了项目的高度实用性。

重构风控建模流程和技术架构

英文状态下的风控IT架构如下：先搭建了“统一数据对接平台”实现外部数据的统一采集；“统一数据对接平台”与企业自身数据中台共同接入“决策引擎”，实现多维数据同时入模入参，并形成策略后输出。

使用隐私计算产品后，由于离线建模和策略训练，与生产环境下实时跑批生成决策的过程完全一致，且全部置于隐私计算产品之中，同时任意一方无法掌握模型全貌而将完整模型部署在“决策引擎”之中，因此要重新调整风控技术架构。

调整后架构为：将企业自身数据中台和隐私计算产品平台对接，以实现进件数据和外部数据实时、线上入模入参并形成策略，策略仅通过“决策引擎”的组合、并行、串行、分流等策略调度模块实现落地。此时的“决策引擎”失去了部署模型和跑批结果的功能，仅保留策略调度功能；“统一数据对接平台”失去作用，被隐私计算产品替代（若涉及隐私计算下的多方数据建模，则可能还会发挥作用，但目前多数隐私产品不支持多方建模）。

定位于场景化、轻量型解决方案，不宜纳入公司信息科技基础设施

从目前落地案例实施情况看，为应对多元化需求，隐私计算产品个性化程度很高，基本是一事一议制定解决方案。同时由于缺乏标准，不同厂商对于同一需求采取的技术方案存在较大差异。因此不宜将隐私计算作为公司或技术平台的底层技术，从而纳入基础技术框架。隐私计算解决方案应该是具有明确场景化、应用型、针对性的一整套商业解决方案。

以隐私计算为抓手打开数据生态发展空间

充分发挥“隐私计算平台”内外数据交互枢纽作用，利用统一数据外采的规模效应，向上整合合规数据源，在数据源整合层面形成市场竞争优势。进一步加深不同场景下数据交互和建模理解，深度参与隐私产品易用性改造，通过推动隐私产品商用化进程与隐私厂商深度绑定。积累沉淀易用性改造问题点及解决能力，寻找通用性解决办法形成规范式操作，为推行金融应用测试标准积累经验。补齐隐私解决方案下游算法和建模的供给能力短板，完成从数据引入到形成价值的“最后一公里”。

（作者高翔：西南财经大学国家金融中心博士）