• 工作总结
  • 工作计划
  • 读后感
  • 发言稿
  • 心得体会
  • 思想汇报
  • 述职报告
  • 作文大全
  • 教学设计
  • 不忘初心
  • 打黑除恶
  • 党课下载
  • 主题教育
  • 谈话记录
  • 申请书
  • 对照材料
  • 自查报告
  • 整改报告
  • 脱贫攻坚
  • 党建材料
  • 观后感
  • 评语
  • 口号
  • 规章制度
  • 事迹材料
  • 策划方案
  • 工作汇报
  • 讲话稿
  • 公文范文
  • 致辞稿
  • 调查报告
  • 学习强国
  • 疫情防控
  • 振兴乡镇
  • 工作要点
  • 治国理政
  • 十九届五中全会
  • 教育整顿
  • 党史学习
  • 建党100周
  • 当前位置: 蜗牛文摘网 > 实用文档 > 公文范文 > 算法型评分工具:优势、风险与法律规制

    算法型评分工具:优势、风险与法律规制

    时间:2023-02-17 22:30:05 来源:千叶帆 本文已影响

    ○张博文杨斯尧

    1.浙江大学光华法学院 浙江杭州 310008

    2.中国人民银行成都分行 四川成都 610041

    社会信用体系建设是市场经济发展的重要支柱,全面的社会信用体系由多部分共同组成,其中最重要组成部分之一即个人金融借款中的借款人信用评价。这种信用评价指向借款人的信用风险,本质上是通过借款人过往的行为来推断其未来偿还借款的意愿和能力,准确的个人信用评价对信贷机构和借款人来说均意义重大,所以如何作出适当的个人信用评价至关重要。信用评价方法随着金融行业的发展不断改进,近年来,随着大数据时代的来临及机器学习等信息技术的迅猛发展,个人信用评价领域也兴起了引入机器学习算法的新趋势,国内外众多企业纷纷尝试利用机器学习算法和大数据技术进行个人信用评分,渐成燎原之势。

    依托机器学习算法的信用评分工具(以下简称为“算法型评分工具”)在底层逻辑、技术手段、所处理数据的类别与数量上已与传统的信用评分工具(以下简称为“传统型评分工具”)大为不同,凸显出机器学习算法在信用评分领域的巨大优势。然而,在看到机器学习算法在信用评分行业所具有巨大优势的同时,也不能忽略随着机器学习算法嵌入而产生的一系列风险。事实上,新技术手段的应用总是伴随着新的风险,信用评价行业的发展也是与风险持续斗争的过程,故需要在利用其优势的同时,通过法律手段对其中潜藏的风险加以规制。基于此,本文将从以下四个方面分别展开:首先,就算法型评分工具的兴起与发展做简要介绍,重点展现算法型评分工具的特点与发展现状,以勾勒其基本轮廓;
    其次,分析采用算法型评分工具的必要性,尤其是突出算法型评分工具相对于传统型评分工具的优势所在;
    再次,就算法型评分工具针对个人信用评价风险潜藏的风险加以识别;
    最后,就如何在我国现有法律体系下对上述风险加以规制提出对策。期望上述四个部分的分析对算法型信用评分在我国今后金融实践中获得更好发展有所助益。

    (一)演变历程概览

    在征信行业发展的早期,借款人的信用状况仅通过信贷员或专家的判断来决定,信贷员或专家通过面谈的方式,结合自身已有的知识和针对同类借款人的一般经验,对是否授信以及以何种价格授信作出决定。虽然这不仅因耗费大量人力而成本较高,而且因依赖信贷员或专家的品德和知识而易于失真,但却是与彼时技术水平相适应的最优选项。

    随着数学、统计学等学科及计算机技术在20世纪的蓬勃发展,由计算机软件自动进行信用评分取代了人工判断,对借款人信用状况的判断由此进入“评分时代”。信用评分是信用的工业化转化,旨在利用数学模型将相关数据转化成某个数值来指导信用决策。最早的信用评分模型由美国FICO公司的两位创始人在1956年提出,该模型通过利用统计和数学以及消费者信用信息,比当时的人工判断方法更快且更可靠地创建了数字信用评分,并在之后的时间里不断发展,并于20世纪90年代初完全取代了基于人工的信用状况判断。FICO的评分模型深深影响了其他各国信用评分的发展。该评分模型主要考虑借款人的信用信息,具体类别及其所占比例大概如下:信用偿还历史占35%;
    信用账户数占30%;
    使用信用时间长短占15%;
    新开信用账户占10%;
    正在使用的信用组合类型占10%。FICO模型在评分时主要依赖于线性统计方法和有限数量的固定变量。其相关技术主要有判别分析法、线性回归和逻辑回归等。

    此后,FICO评分欠缺包容性的弊端日渐显露,而在进入21世纪之后,借款人的可用数据不断增加,信息科学技术也在持续发展,尤其是2008年金融危机之后信贷机构风险控制意识进一步增强。在这些条件的共同作用之下,考虑传统信用数据之外其他替代数据的评分工具逐渐兴起,其中一部分仍然沿用FICO评分所采用的技术手段,另一部分则是依托更强大的机器学习算法,后者即是本文的研究对象——算法型评分工具。

    (二)算法型评分工具的主要特点

    与传统型评分工具相比,算法型评分工具在技术层面和数据层面具有明显不同,这构成了算法型评分工具的主要特点,具体包括依托机器学习技术为借款人评分和以替代数据(Alternative data)为分析对象。

    1.依托机器学习技术为借款人评分。机器学习的概念源自亚瑟·塞缪尔在1959年编写的一个计算机学习程序,经过多年的发展,时至今日已经演变为一个相当复杂的过程。在技术方法上,机器学习技术不再采用线性判别和逻辑回归,而是主要依靠诸如随机森林模型、梯度提升决策树模型和BP神经网络模型等。也正是因此,依托机器学习算法的评分模型是由计算机算法直接生成的,而不再是由统计学家根据他们对线性回归和相关技术结果的解释作出的决定。算法型评分模型的完整应用流程较为复杂,可简要地概括为表1。

    表1 算法型评分模型的完整应用流程

    2.以新型替代数据为分析对象。在信用评分的语境下,可把借款人的数据做不同的类型划分。其一,根据其在被计算机处理时所运用的技术,可区分为结构化数据、半结构化数据和非结构化数据。所谓结构化数据,是指可由二维表结构来逻辑表达和实现、主要通过关系型数据库进行存储和管理的数据;
    半结构化或非结构化数据则与之相反。能够直接反映借款人财务状况的金融数据多为结构化数据。传统的线性评分模型即可以处理结构化数据,半结构化或非结构化数据则须依托机器学习算法的评分模型来处理。其二,还可根据借款人数据所反映的内容,将其分为信用数据和替代数据。所谓信用数据,专指直接表现借款人既往信用状况的数据,FICO评分中最核心的五类数据即为其典型代表,信用数据属于借款人金融数据的一部分;
    替代数据则是借款人信用数据之外其他可用来评估其信用分数的数据。就替代数据自身而言,还可做更进一步的区分:根据其是否可归入借款人的金融数据范畴,可将之区分为信用数据之外的其他金融数据和非金融数据;
    根据其在既往信用评分实践中被使用的程度,还可以将之分类为主流的替代数据和边缘的替代数据。所谓的主流替代数据主要指的是信用数据之外的其他类型金融数据,如租金支付记录、公共缴费记录和手机支付记录。它们能够反映出借款人连续一段时间内的财务状况,也是可被线性模型处理的结构化数据,在机器学习算法获得广泛使用之前,被用来改善FICO评分中的包容性欠缺问题。边缘替代数据通常是指关于借款人行为的新型数据,主要对应的是借款人的非金融数据,这既包括较为传统的教育、就业经历等数据,也包括更为新型的社交和行为数据,例如社交媒体活动(点赞内容、点击和每次观看时间)、手机使用情况(花在手机上的平均时间、社交网络规模)、健康健身活动、零售和在线浏览数据,甚至关于消费者与信贷机构互动情况的数据。这些新型的替代数据具有强烈的非结构化特征,无法通过传统的线性评分模型处理,而只能依靠采用了机器学习技术的算法型评分工具。

    (三)发展现状

    1.国外的发展现状。近年来,算法型信用评分工具取得了长足的发展,美国、英国、欧盟和印度等不同国家和地区均涌现出了一大批利用机器学习算法为借款人打分的金融科技公司,相关公司及其成立时间、所处位置和官方网站的概括信息可见表2。

    表2 利用机器学习算法为借款人打分的金融科技公司

    上述这些公司在经营模式、功能定位和分析对象上均有所差异。在经营模式上,有的公司是类似于FICO的软件开发公司,仅为银行提供信用评分服务,如Upstart和Underwrite,有的还同时自营信贷业务,如Monedo;
    在功能定位上,有的公司仅利用自身的复杂算法分析信贷机构的既有数据,如Underwrite,有的公司则还收集新的数据,如Upstart;
    在分析对象上,有的公司主要选择教育和工作经历作为新增的替代数据,如Upstart,有的公司则完全选择全新的替代数据,如CreditVidya。以下选取可作为其中代表的Upstart、Monedo和CreditVidya作重点介绍:

    其一,Upstart本身并非信贷机构,而是为合作伙伴Cross River银行提供信用评分服务。当借款人在该平台上申请贷款时,合作银行会利用Upstart公司提供的评分模型进行决策。Upstart的评分模型并非取代了传统的评分数据,而是利用与财务能力和偿还款倾向相关的其他信号来进行补充。Upstart的评分模式既包括对借款人财务数据的检查,也包括对其教育和(或)就业经历的考察。Upstart可以通过使用申请人的教育信息(包括但不限于就读的学校和获得的学位)以及他们目前的工作,来开发借款人的财务能力和个人还款倾向的统计模型。最终的信贷决策基于Upstart评分模型中使用的所有变量的混合①相关信息来源于该公司于2020年向美国金融消费者保护局(CFPB)申请“不行动函(no-action letter)”所提交文件中的自愿披露,参见https://files.consumerfinance.gov/f/documents/201709_cfpb_upstart-no-action-letter-request.pdf.。2021年,Upstart的合作银行发放了130万笔贷款,总计118亿美元②数据来源于美国金融消费者保护局2022年6月8日的新闻消息,参见https://www.consumerfinance.gov/about-us/newsroom/cfpb-issues-order-toterminate-upstart-no-action-letter.。

    其二,Monedo公司(原名Kreditech)使用机器学习算法,通过在线数据对借款人的信贷风险进行分析,包括位置信息、社交网络信息、硬件数据(操作系统、浏览器等)、在线购物行为和其他的在线行为等。该公司主营产品包括LaaS电子商务贷款、Monedo Now分期贷款和Kredito24小额信贷,第一种产品是为合作伙伴提供的信用服务,后两种产品则是自营的贷款产品。

    其三,CreditVidya公司向合作信贷机构提供一个SDK产品,这是一个针对Android系统的软件开发工具包,可以与Android系统中的应用程序集成。它可以帮助信贷机构在获得借款人同意后,通过其手机收集个人信息。该SDK产品主要收集与设备相关的数据以及交易短信中包含的数据,具体包括与监控借款人手机中的应用列表、金融交易相关的消息、设备位置、有关借款人手机设备的特定信息(如硬件型号、操作系统、唯一设备标识符和移动网络信息)、联系人列表和配置文件列表。其中,收集联系人列表是为了通过其社交网络来进行信用评分,收集设备信息则是用于防止欺诈。在收集了借款人的这些信息后,CreditVidya公司将通过自己的人工智能和机器学习平台来处理这些非结构化数据,帮助信贷机构对那些传统信用评分很少或没有的借款人进行信用评价③以上信息均来自该公司官方网站上的说明,参见https://www.creditvidya.com/faqs.。

    2.国内的发展现状。近年来,国内的个人征信业务也处在高速发展的过程中。目前,我国官方的信用评价机构是人民银行下属的征信中心,其出具的个人信用报告为注册用户展示其个人信用信息的基本情况,包括信贷记录、部分公共记录和查询记录的明细信息。其中,除了传统的信贷记录,还包含了非信贷机构提供的公共记录(如法院判决、其他欠缴费情况等)和信用报告的查询记录(短期内多次频繁查询可能意味着在此期间经济状况较差)。这些信息一定程度上也旨在通过对借款人其他行为的判断来分析其信用风险,已经有了向替代数据转变的趋势。随着征信中心与美国FICO公司合作开发了信用报告的数字解读服务,征信中心也已经可以提供信用评分服务。这一解读评分所依托的仍然主要是借款人的信用信息。

    除了官方的征信中心之外,可从事个人征信业务的还有经人民银行监管指导成立的百行征信和朴道征信两家机构。此外,部分互联网公司和银行也在积极推进利用替代数据进行的信用评分。如腾讯公司旗下的微众银行,该银行在针对微粒贷产品进行风控时,会收集借款人的人脸信息、婚姻状况、地址信息、联系人信息、就业信息、职业信息、社保信息、纳税信息、学籍学历信息、网络信息、设备信息及地理位置等替代信息;
    蚂蚁金服公司提供的芝麻信用分,该分数从支付宝用户的守约记录、行为积累、身份证明、资产证明和人际关系五个维度出发对其进行评分,其中,根据用户在商业场景中履约记录和法院提供的强制执行记录数据进行评定的守约记录是最为重要的维度。总体来说,替代数据在我国的信用评分过程中已经发挥较为重要的作用,但目前尚未有任何一家机构明确表示自己采用了机器学习算法技术。

    (一)信用评分工具发展的核心要求

    在信用评价机制由人工判断到计算机自动评分的发展历程背后,始终隐含着一个核心要求,引导并约束着信用评分制度的发展方向。由于信用评分的实质是在信贷机构和借款人之间建立一种授信机会的分配机制,这一核心要求即是使信贷机构的资金尽可能流入最合适的借款人手中。这一核心要求可以从正反两个方面分别展开:从正面来说,这意味着信贷机构能够在最大范围内以风险最小化的方式将资金分配给借款人;
    从反面来说,则是要求信用评分机制不能以不适当的方式将某个借款人或某部分借款人排除在外。这一核心要求可以概括为信用评分工具应具备的三种具体特性:准确性、公平性和可解释性。

    1.准确性。信用评分工具的准确性意味着评分结果应能够较好地展现借款人的违约风险。作为一项风险控制工具,准确性是信用评分工具发展的生命线,不具备准确性或准确性过低的信用评分工具没有任何实践价值。一项信用评分工具准确与否,一方面可以通过模型、参数及比重进行事先判断,另一方面则更多地通过贷款违约率的检验来进行事后观察。在人工信用判断的时期,信用评价结论受评价人的主观影响较大,准确性也因人而异,具有较大波动性;
    在进入算法型评分工具的时代后,评分结果因计算机对人工的取代而更为客观,准确性也能够维持在一个较好的水平。

    2.公平性。信用评分工具的公平性可从两个不同的方面分别展开,其一,公平性可以体现在适用对象的范围上。对象范围意义上的公平性也可称为包容性,主要是指信用评分工具应尽可能地将需要资金的借款人囊括其中,而不能将他们排除在金融体系之外,构成所谓的金融排斥。考虑到借款资金对于他们的生存和发展所具有的重要意义,这种排斥对他们而言是一种经济意义上的不公平。其二,公平性还可以体现在评分结果的计算上。计算结果意义上的公平性是指在具体计算分数时不能考虑那些诸如种族、肤色、性别等与信用状况无关且可能导致非法歧视的因素,以至于人为地降低特定人群的信用评价,并将其排除在金融体系之外。

    对象范围意义上的公平性主要取决于评分所能参考的数据,数据的范围决定了信用评分的包容程度,而这又取决于评分工具所能运用的技术手段。在人工判断信用的时期,作出信用判断主要依靠信贷员对借款人的了解程度,借款多为关系型借款,业务范围也多局限于本地。在传统型信用评分工具时期,以FICO评分为代表的评分工具仅考虑借款人的信用数据,对那些没有或仅有很少信用数据的借款人造成了严重的金融排斥。计算结果意义上的公平性在受到妨碍时须通过对信用判断或评分过程的解释和披露来澄清,而这需要依靠信用评分工具的可解释性程度。

    3.可解释性。与上述准确性和公平性主要针对信用评分结果不同,信用评分工具的可解释性主要针对信用评分过程展开,即评分机构在多大程度上能够使借款人和信贷机构理解该信用评分的决策过程。可解释性之所以具有重要意义,是因为这是判断信用评分是否准确和公平的基础,不可解释的信用评分无法使信贷机构和借款人对其产生信任。在由人工向计算机转变的过程中,信用评分的可解释性随着技术手段的引入和日益复杂化而逐渐被削弱。但在传统型信用评分工具中,由于参考数据与借款人信用状况的直接关联性,线性统计方法也相对较为容易理解,其评分结果的可解释性总体上在一个较为适当的水平。

    (二)算法型评分工具的显著优势

    1.可增强信用评分的包容性。仅考虑信用数据的传统型评分工具在包容性方面的虚弱性已经暴露无遗,饱受批评。在国外,刚毕业的大学生或外来移民很多都遭遇了金融排斥;
    在国内,过分强调既往的信用数据也导致很多购房者因过去的一条逾期记录而被拒绝购房贷款。虽然为弥补传统型信用评分的不足而部分地引入了替代数据,但因其仍然立足于线性模型而作用有限。相比之下,算法型评分工具因依托机器学习算法而能够处理大量非结构化的替代数据,能够将更多“薄信用档案”的借款人纳入信用评分体系中。这一优势也呈现出了传统型评分工具与算法型评分工具的关系:后者并非要取代前者,而是旨在对前者进行补充。

    2.可提高评分预测的准确度。传统型评分工具侧重借款人的信用数据,尤其是信用历史与借款人未来还款情况的关联性,这一观察视角具有内在合理性,但也并非总是准确的。具体来说,该评分策略的准确性主要表现在正向推论而非反向推论之中。易言之,过往信用记录较好的借款人在未来还款意愿或许能够被较好地反映出来;
    但过往信用记录不够好,尤其是因信用历史长度不足而不够好的借款人的信用状况并未被准确反映出来。算法型评分工具通过对借款人替代数据的量化分析,并将由此得出的评分结果与通过传统型评分工具获得的结果相结合,可以提高信用评分的准确性。这再一次说明了算法型评分工具并非对传统型评分工具的替代,而是对其的有力补充。

    算法型信用评分工具在有力补充传统型评分工具,并提高信用评分包容性和准确性的同时,也潜藏着不少风险。所谓风险,专指算法型信用评分对信用评分三项核心要求的背离,风险的存在并不意味着算法型评分工具存在着无法被接受的缺陷。事实上,在信用评价行业的发展历程中,风险始终如影随形,而风险又始终处于不断被弱化和克服的过程中。传统型评分工具取代人工判断增强了信用评分的准确性和客观性,而算法型评分工具又弥补了传统型评分工具在包容性上的不足。至于算法型评分工具中潜藏的风险,在尚无可用来消除其风险之技术手段的背景下,仍可通过法律手段来规制其中潜藏的风险。总的来说,根据其所背离的对象,可将算法型评分工具中的风险概括为信用评分不透明、信用评分不准确和信用评分不公平三种。

    (一)信用评分不透明

    依托机器学习算法进行信用评分时的不透明是对信用评分可解释性的背离。根据信用评分不透明形成的原因,可将其分为三种类型:基于故意隐瞒和自我保护的不透明、基于代码编码及阅读专业性和技术性的不透明、机器学习中数字最优化与人类推理要求及语义解释风格不匹配导致的不透明。第一种类型的不透明主要是因为算法设计和数据集构成信用评分机构的商业秘密,信用评分机构为了维持自身的竞争优势,而多选择不公开算法。第二种类型的不透明主要是因为在计算机取代人工之后,信用评分演变成由代码操作的任务处理流程,作为外行人的借款人对信息技术缺乏了解。但以因果性为基础的传统模型均可针对模型进行归因分析,具有相对较高的可解释性,因而可通过一定程度上的说明减弱或消除这种不透明性。第三种类型的不透明则专属于算法型信用评分,是算法黑箱在信用评分这一场景中的具体表现。算法黑箱是一种隐喻,是指计算机系统在输入的数据和输出的答案之间存在着人类无法洞悉的“隐层”。算法结构的复杂性(如深度神经网络由数千个人工神经元组成)以及机器学习依赖人类无法透视的几何关系是算法黑箱形成的技术原因。算法型信用评价的黑箱之所以比传统信用评价更难破解,也正是因为它可以通过这些技术进行相关性推演,导致结果与数据之间的逻辑关系让人难以琢磨。

    信用评分不透明的危害在于:其一,面对并不透明的评分算法,借款人和信贷机构均难以完全排除违约风险或歧视的存在,算法开发者与算法使用者之间的信息不对称导致难以真正建立起对算法的信任;
    其二,信用评分过程的不可解释性使借款人无法确知自己如何才能维持良好的信用水平,导致其无法形成有效的行为指引;
    其三,信用评分不透明提供了滋生算法权力的土壤,使借款人虽然饱受评价不公正或不准确之苦,却无法与之对抗。

    (二)信用评分不准确

    虽然算法型评分工具的优势之一是补充传统型评分工具准确性的不足,但这并不意味着算法型评分工具自身不存在准确性偏离的问题。事实上,算法型评分工具能够补充传统型评分工具准确性不足的前提是算法型评分工具自身的评分结果是准确的。信用评分不准确既可能将风险较低的借款人排除在外,也可能将风险较高的借款人吸纳进来,对借款人和信贷机构均有不利影响。算法型评分工具之所以会出现准确性失真,与其庞大的数据需求以及所采用的复杂技术之间存在密切联系。如有观点指出,算法为信用评分系统带来的潜在效率提高通常取决于数据和算法模型的质量,它们一旦出现偏差就会导致信用评分失真。

    在传统型信用评分工具中,数据质量偏差主要是指采集到的借款人数据因不完整、过时或被弄混等而无法准确反映借款人的信用状况。如美国的“朱迪·托马斯案”中,美国三大征信报告机构之一的TransUnion弄混了姓名、出生日期和社会安全号码相似的两个女性的信用档案,导致信用状况本来较好的朱迪·托马斯长期受到陌生人坏账的干扰。

    在算法型评分工具中,数据质量偏差还体现在用于机器学习的训练数据存在错误。如前文提到的算法型评分工具的工作流程所展示的,设计机器学习算法模型时收集并转换海量的训练数据,算法设计师在进行这一步骤时主要关注所采集信息的数量,而较少检查并纠正其中可能存在的错误,由此可使错误的数据进入机器学习的过程,并导致算法模型的质量可能存在问题。另外,算法型评分工具还可能因所选择的相关性存在偏差而失真。前文已经提到,机器学习算法所追求的并非因果关系,而是相关性。计算机科学对这种方法相当推崇,但算法设计者对工具理性的过度追捧也会造成对机器学习所发现相关性的盲目信任。具体来说,算法设计者过度相信通过机器学习技术对数据相关性的发现,将计算机发现的共性不加区分地与借款人的信用分数关联起来,对只是众多数据偶然共享的特征赋予过高权重,以至于评分结果无法反映借款人真实的信用状况。较为激进的观点甚至认为,大数据产生的基于相关性的知识可能被误认为是因果关系,而实际上它们只是巧合,当这些相关性被用作决策的基础时,会导致虚假的积极影响和负面影响,最终出现谬误。

    (三)信用评分不公平

    算法型信用评分的不公平并非包容性的不足,而更多地表现为一种偏见,即在对借款人进行信用评分时,考虑了会造成歧视的因素,如种族、宗教、性别或肤色等。在由信贷员或专家作出信用评价的时期,难以排除他们主观判断中偏见的存在;
    在采用机器学习算法后,信用评分中的偏见也并未完全消失,而是以更为隐蔽的方式被保留下来。这实质上是算法偏见在信用评分这一场景的具体表现。应当注意的是,信用评分本身就是为了在借款人之间进行区分以分配授信机会,因此算法区分本身并无问题,仅在评分时选用了不适当的标准而违反公认的规范、法律或道德原则而对数据进行处理时才构成算法偏见。概而言之,只要利用算法得出的分数不符合人类社会普遍遵循的正义原则,即属于信用评价不公平。

    算法偏见的形成原因较为复杂。按其成因基础不同,信用评分不公平可分为基于数据的不公平和基于规则的不公平,前者是在训练算法时使用了存在偏见的数据,后者则是采用了不适当的标准而导致偏见。不公平可能也并非算法设计者在选取数据或设计模型时有意为之,即使算法设计者已经保持了中立也可能导致偏见,因为现实世界中既存的偏见可能在算法模型训练过程中被带入进来。

    算法型评分工具中的不公平分数不仅剥夺了借款人获得资金发展的自身机会,还同时贬损其人格权益。更为关键的是,一旦某个包含偏见的数据被其他算法工程师用以训练新的算法模型,这一新的算法模型就会延续之前的偏见,从而发生系统性歧视连锁反应。

    通过上述分析不难发现,算法型评分工具中潜藏的风险都是由算法技术的应用带来的,但却不能指望仅通过技术的迭代来消除这些风险。这不仅是因为机器学习算法已经是当下最前沿的科学技术,更是因为技术本身虽然不具有任何价值倾向,但它始终只是技术使用者手中的工具,会受到技术使用者价值判断的影响。因此,要始终将新技术的应用置于法律的监管之下,才能最大限度地削弱或消除新技术手段带来的风险。

    关于信用评价,我国《民法典》第一千零二十九条规定:“民事主体可以依法查询自己的信用评价;
    发现信用评价不当的,有权提出异议并请求采取更正、删除等必要措施。信用评价人应当及时核查,经核查属实的,应当及时采取必要措施。”该条文首次就民事主体的信用权益及法律保护作出了规定。然而,从既往的司法实践来看,该条仅以人民银行征信中心出具的征信报告中所存在的记载错误为对象。这意味着,现行法律体系下民事主体的信用权益仅指征信报告中的正确记载,并不包含基于机器学习算法的信用评分。然而,随着今后机器学习算法越来越多地被使用到信用评价中、信用评分获得越来越普遍的应用,信用权益也应涵盖作出准确且公正的信用评分。这无疑为信用评分失当的法律保护提供了正当性依据,但该条中的删除权和更正权均是为征信报告记载错误而设,并不能用于规制算法型评分工具,必须另行寻找其他规制手段。

    法律规制手段的确定应结合风险的类型在“风险—规制”的框架下予以确定。如前所述,算法型评分工具中潜藏的风险均是因利用机器学习算法而生,在我国现行的法律体系下,能够对其进行规制的主要是2021年11月1日起生效的《个人信息保护法》。被识别的风险包括信用评分不透明、信用评分不准确和信用评分不公平,《个人信息保护法》中可用以规制的这三种风险的法律手段主要有第五十五条中的保护影响评估、第二十四条第三款中的算法解释权和算法结果拒绝权。

    (一)以信用评分算法的影响评估作为规制手段

    所谓算法影响评估,是要求算法治理的相关利益主体在算法设计、部署与运行期间,对算法可能造成的风险及其对社会的影响进行充分地评估,以了解和减轻算法系统可能造成的风险或者负面影响。该制度首见于《欧盟通用数据保护条例》第35条的数据保护影响评估制度,《个人信息保护法》第五十五条也明确规定“利用个人信息进行自动化决策的情形下,个人信息处理者应当事前进行个人信息保护影响评估,并对处理情况进行记录。”算法影响评估的义务主体是信用评分机构,其既可以自行评估,也可以委托第三方展开评估。

    算法影响评估反映的是一种预防性的风险治理理念,具有多重意义:其一,利益相关主体获得了程序性保障和参与渠道,创建了算法决策运行过程中的信任沟通机制;
    其二,有助于帮助信用评分机构预先识别和系统跟踪算法内置或者潜在偏误;
    其三,对于信用评分机构来说,算法影响评估程序也是一个建立并证明合规性的程序,能够帮助信用评分机构减小未来的责任风险;
    其四,也是最重要的,算法影响评估能够帮助监管机关确定算法的风险程度,并根据风险程度建立与之适配的监管体系。由此可见,算法影响评估在风险规制中发挥着重要作用,既可削减信用评分的不准确和不公平,也可增强信用评分的透明性。对信用评分算法开展影响评估须注意以下三点:

    1.针对信用评价算法的全周期开展影响评估。虽然《个人信息保护法》第五十五条仅规定了事前的影响评估,但对信用评分算法的影响评估应持续性地贯穿信用评价算法的全周期,即涵盖从算法设计、运行到结果输出的所有环节。之所以如此,是因为有些风险到后续环节才会暴露出来,仅对设计环节进行影响评估难以准确评估该算法中存在的风险。譬如,对算法设计环节的评估可以审查出信用评价目标是否得到了准确设置,训练数据和特征选择是否妥当,是否采取了合理措施确保人工智能不生成歧视结果。但信用分数是否因偏离设计者的预定目标而不准确或不公平,必须根据最终输出的信用评分结果来判断。

    2.信用评分机构应履行算法记录义务。虽然《个人信息保护法》第五十五条规定了个人信息处理者的算法记录义务,但该记录义务是指对影响评估结果的记录,并非本文所称的算法记录义务。本文所称的算法记录义务,是指留存算法设计、测试、运行全过程的记录。算法记录是算法风险控制的基础性工具,缺乏记录也就无法有效地进行算法评估。我国目前尚缺乏关于算法记录义务的法律依据,国外明确规定了算法记录义务的主要是《欧盟通用数据保护条例》第30条和欧盟委员会于2020年发布的人工智能白皮书《走向卓越与信任——欧洲人工智能监管新路径》。后者明确指出,算法设计者和使用者应当做到:留存与算法或编程有关的测试记录;
    准确记录特定情形下高风险人工智能应用测试的数据集;
    详细描述数据集的主要特征和选择方式;
    留存有关建立、测试和验证人工智能系统的训练方法;
    留存使用流程和相关技术的资料文件。

    3.遵循较为严格的影响评估标准。影响评估应采取与风险等级相适应的评估标准。所谓风险等级,主要是个人信息处理活动导致侵害的概率与发生侵害事件后权益影响程度的叠加。风险等级则须根据算法的应用场景具体判断,风险等级越高,影响评估的标准就应当越严格。将机器学习算法应用于信用评分场景,潜藏着对借款人和信贷机构的诸多不利影响,当这些不利现实化发生之后,又会对借款人和信贷机构的权益带来较强不利影响,因而应划入风险等级较高的行列,并采用较为严格的评估标准。

    (二)将借款人的算法解释权作为规制手段

    1.借款人算法解释权及其行使。算法公开是破除算法黑箱的必要手段。算法公开有两条可选路径,分别是《欧盟通用数据保护条例》所采取的赋权模式和美国所采取的外部问责模式。前者赋予被决策者要求算法使用者进行解释说明的权利,后者则是由监管机关根据相关法律规定对算法使用者的披露情况进行监督,并在其未按要求披露的情况下科以法律责任。我国现行法采纳了赋予被决策者以算法解释权的模式。《个人信息保护法》第二十四条第三款明确规定:“通过自动化决策方式作出对个人权益有重大影响的决定,个人有权要求个人信息处理者予以说明。”算法解释权是一种私法上的权利,其理论正当性可在贯彻意思自治原则、矫正信息不对称、分配风险负担等层面得到充分证实。算法解释权的直接功能在于破除算法黑箱,化解信用评分不透明的风险;
    间接功能则在于增强信用评分算法的可解释性,来辨别信用评分的结果是否具有不准确或不公平之处。

    根据《个人信息保护法》第二十四条第三款的条文表述,借款人并非在任何情况下均可行使算法解释权,而是当通过算法自动计算出来的信用分数对借款人的权益产生了重大影响时才可行使。于此,权益不仅涉及被决策者的人身权益,而且也包含其财产权益;
    影响则是指该决定改变了个人法律上的权利、义务和责任关系(拒绝订立合同或者撤销合同)或使得个人的经济地位、社会地位等状况发生改变。通常来说,较低的信用分数意味着借款人将会丧失与信贷机构订立借款合同的机会,显然构成对借款权益的影响,而该影响是否重大则需根据个案的事实情况做具体认定。被信贷机构拒绝贷款对借款人而言是否构成一种重大影响,可以从借款人获得替代借款机会的可能和借款的资金用途两个方面考虑,具体可区分为以下三种情形:其一,如果某一信用评分算法在特定国家或地区具有近乎垄断的地位,以至于借款人想要获得借款就必须接受该算法为其评分,则可构成重大影响,但算法型评分工具目前尚不具备如此广泛的适用性;
    其二,对特定借款人来说,通过传统型评分工具只能获得较低分数,即只能依赖于该算法型评分工具,则可认为构成对借款人权益的重大影响;
    其三,如果贷款资金具有非常重要的且可证明的用途,虽然借款人可通过其他途径获得贷款,但这会导致贷款的预定目的无法实现,则可认定为对借款人权益有重大影响。

    主张并行使解释权的主体是借款人,负有解释义务的主体则根据业务模式的不同而有差别:如果发放借款的信贷机构并非算法型评分工具设计者,则解释主体是该评分机构;
    反之,则由信贷机构负担解释义务。另外,可根据解释对象的不同将算法解释权的模式分为两种类型:以算法系统功能为中心的解释权模式与以具体决策为中心的解释权模式。两种模式在信用评分算法中均有体现,前者表现为解释信用评分算法的基本运行逻辑,后者则表现为解释针对特定借款人的某个具体评分如何计算得出;
    前者可由算法使用者统一披露并随着算法的迭代而持续更新,后者则只能应借款人的解释请求具体作出。

    2.借款人算法解释权的可行性与实效性。算法解释权的可行性与实效性一直处在争议中,且这种争议并未随着算法解释权在实证法中的确立而消弭,因此有必要在算法型评分工具场景下,就借款人算法解释权的可行性与实效性作相应说明。

    在可行性方面,质疑在于借款人算法解释权与信用评分机构商业秘密保护之间的冲突。有部分观点认为,算法解释权要求信用评分机构公开自身的算法程序,这无异于要求其主动放弃自己投资研发的智慧成果,而将自身暴露在竞争对手的视线中。然而,不能认为借款人算法解释权必然与信用评分机构的商业秘密相冲突,而应当结合解释的具体内容和目的进行个别分析。算法的技术核心在于源代码,但算法解释应以用户行为干预为导向,解释的内容包括算法、数据与其他决策理由等多项内容,而非技术源代码,解释时可以权利人理解的方式提供有关算法决策的信息。因此,算法作为商业秘密并不会因为向某个借款人披露逻辑和数据分类等信息而受到威胁。另外,信用评分机构商业秘密的保护也应受更高位阶利益,尤其是社会公共利益的限制。

    在实效性方面,最为核心的质疑在于机器学习算法具有高度的专业性和复杂性,机器学习算法模型中充满了专业术语表达和复杂的非线性函数计算,即使赋予算法解释权,外行人也难以理解。然而这种质疑并不成立,因为借款人的算法解释权的目的本就不是使“技术文盲”变为“技术通”,重要的不是外行人不能理解的内容,而是他们能够理解什么。在算法型信用评分中,借款人不必、也不想知道算法的源代码及其中所应用的各种函数,对他们而言,重要的是分数得出的逻辑是否符合他们的认知,使他们产生信赖,从而接受这个评分结果。所以,信用评分机构可以简洁明了地对这一问题作出说明,而不必涉及复杂的技术问题。

    (三)将借款人的算法结果拒绝权作为规制手段

    《个人信息保护法》第二十四条第三款除了算法解释权,还为借款人规定了算法结果拒绝权,即通过自动化决策方式作出对个人权益有重大影响的决定时,个人有权拒绝个人信息处理者仅通过自动化决策的方式作出决定。于此,借款人所享有的并非拒绝信贷机构利用机器学习算法对其进行评分的权利,而是在对仅通过算法计算出的分数不满意时,享有拒绝接受该分数的权利。与本条相类似的比较法规是《欧盟通用数据保护条例》第22条第1款:“数据主体应享有拒绝仅基于自动化处理形成的,对自身产生法律效力或类似重大影响之决定的权利,这也包括数据画像在内。”《欧盟通用数据保护条例》通过设置例外规定,更好地平衡了信贷机构与借款人的利益关系,根据该条例第22条第2款第1项的规定,在自动化决策算法的应用是为合同订立所必需时,借款人不得行使算法结果拒绝权。但不得不遗憾地指出,目前《个人信息保护法》第二十四条第三款的构造过于粗疏,尚欠缺此种例外规定。

    借款人算法结果拒绝权得以行使的前提有两个:其一,仅根据自动化算法作出决定;
    其二,对其自身权益产生重大影响。前文已经就对自身权益重大影响的认定和作用进行了讨论,此处不再赘述。仅由自动化算法作出决定,是指任何人在作出决定的过程中都没有决策权,对决定的内容不能产生影响,至于个人在决策过程中是否以其他方式参与则并不重要。在算法型信用评分的语境中,如果信贷机构完全是根据算法评分的高低来作出是否贷款的决策,则构成仅根据自动决策算法作出决定。

    借款人行使算法结果拒绝权的后果并非信贷机构必须与其订立借款合同,而是信贷机构对借款人的信用评价进行人工干预。由此也可看出,算法结果拒绝权并无增强信用评分透明性的作用,而是使借款人在特定情形下通过拒绝的方式回避信用评分不准确和信用评分不公平。然而对借款人来说,算法结果拒绝权的效果或许并不理想,原因有两点:其一,借款人不能拒绝信贷机构将算法评分作为决策的参考因素,信贷机构可通过声称将算法评分与其他考量相结合来逃避该条的适用;
    其二,在人工评价、传统型评分工具和算法型评分工具三者彼此交织的情况下,传统型评分工具和人工评价的评价因素与算法型评价截然不同,选择算法型评分工具却对结果不满意的,在前两种方法之下也很有可能无法获得较高评分和信用评价,而使能通过行使算法结果拒绝权获得贷款的借款人范围较为有限。

    当下,我国正处于社会信用体系全面建设的重要阶段,个人金融借款领域的算法型评分工具这一在国外已经兴起数年的新趋势尤其值得关注。但在关注过程中,也应当清醒地认识到,将机器学习算法应用于信用评分固然是科技促进金融发展的典型例证,但科技进步是一把双刃剑,其在促进产业发展的同时,也潜藏着诸多风险。无论何时都不应过度追求工具手段,而应始终牢记人的主体地位,科技的进步是为了更好地增进人类的福祉。就算法型评分工具而言,在其增强包容性和准确性的显著优势背后,也潜藏着信用评分不透明、不准确和不公平的风险。面对这样一把双刃剑,必须要将法律的原则和规则嵌入其中,运用算法治理领域的法律手段加以规制,尽可能地消除或削减其中的风险,最终将其“驯化”为有利的金融工具,使其能够更好地促进金融行业的健康发展和全社会的福祉增进。

    猜你喜欢 借款人信用工具 中美信用减值损失模型的比较及启示中国注册会计师(2021年9期)2021-10-14关于“债”的事儿,你必须知道新传奇(2021年2期)2021-01-25波比的工具小太阳画报(2020年11期)2020-12-10波比的工具小太阳画报(2020年10期)2020-10-30加快信用立法 护航“诚信河南”人大建设(2019年7期)2019-10-08准备工具:步骤:红领巾·成长(2018年10期)2018-11-19中国,快步进入信用社会金桥(2018年9期)2018-09-25小微企业借款人瞭望东方周刊(2018年4期)2018-02-01“巧用”工具读者(2017年18期)2017-08-29热词新民周刊(2016年49期)2016-12-26
    相关热词搜索:算法规制评分

    • 名人名言
    • 伤感文章
    • 短文摘抄
    • 散文
    • 亲情
    • 感悟
    • 心灵鸡汤