风险预测方法、装置、存储介质及电子设备与流程

未命名 08-18 阅读:95 评论:0


1.本技术涉及风险预测领域,具体而言,涉及一种风险预测方法、装置、存储介质及电子设备。


背景技术:

2.由于小微企业的信息不透明,财务报告等相关财务数据较难获取、数据可靠性不高,缺乏有公允价值的资产抵押品等因素,银行等金融机构无法准确评估小微企业的抗风险能力,相比于大型企业,小微企业的破产率和违约率更高。
3.相关技术中,小微企业的融资渠道是从银行获得短期贷款,由于对小微企业缺乏有效的监管和信息披露机制,在给小微企业授信时,银行等金融机构能够获取的用于评估其信用风险的数据较少。由于小微企业的财务等数据的缺失和信息不透明,使得基于传统信用数据的信用评分模型评估小微企业的信用风险不准确。尽管有些银行通过派遣信贷专员实地考察小微企业的信用相关信息,但通过线下采集小微企业信息所花费的人力成本和时间成本较高,导致小微企业申请贷款支持较为困难。因此,在深化小微企业金融服务层面,传统银行亟待使用大数据、互联网等新兴信息技术,改造信用评估模型,降低数据收集等成本,提高小微企业金融服务的质量。
4.由于小微企业的传统信用数据不可靠和缺失等因素,银行无法基于财务报告等传统信用数据评估其信用风险,并且线下采集获取小微企业信用信息耗费人力和时间成本较高。
5.针对相关技术中对企业的风险评估不准确的问题,目前尚未提出有效的解决方案。


技术实现要素:

6.本技术的主要目的在于提供一种风险预测方法、装置、存储介质及电子设备,以解决相关技术中对企业的风险评估不准确的问题。
7.为了实现上述目的,根据本技术的一个方面,提供了一种风险预测方法。该方法包括:获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;基于风险预测评估值对待预测企业提供目标融资服务。
8.可选地,基于目标信息确定待预测企业的企业风险特征数据:从工商登记信息中提取待预测企业所属目标行业、待预测企业的运营时间和实缴资本,并从管理者信息中提取待预测企业的管理者数量;确定目标行业第一预设周期内的企业破产比例,得到第一破
产比例,并确定待预测企业所属地区第一预设周期内的企业破产比例,得到第二破产比例;将至少以下之一特征确定为企业风险特征数据:运营时间、实缴资本、管理者数量、第一破产比例和第二破产比例。
9.可选地,基于目标信息确定待预测企业的关联企业风险特征数据包括:基于管理者信息确定待预测企业的管理者关系网络,并基于交易流水数据确定待预测企业的交易关系网络,其中,管理者关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业具有相同的管理者,交易关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业之间具有交易往来记录;从管理者关系网络中获取第一节点信息,并从交易关系网络中获取第二节点信息;将第一节点信息和第二节点信息确定为关联企业风险特征数据。
10.可选地,从管理者关系网络中获取第一节点信息,并从交易关系网络中获取第二节点信息包括:获取待预测企业对应的节点在管理者关系网络中的第一节点度、第一节点强度、第一相邻节点破产比例和第一总破产比例,其中,第一节点度用于表征管理者关系网络中与待预测企业的节点相连的边的个数,第一节点强度用于表征待预测企业的节点与其他节点之间具有相同的管理者的个数,其他节点是与待预测企业的节点相连接的节点,第一相邻节点破产比例用于表征其他节点中破产企业对应的节点占所有其他节点的比例,第一总破产比例用于表征管理者关系网络中破产企业对应的节点占所有节点的比例;将至少以下之一特征确定为第一节点信息:第一节点度、第一节点强度、第一相邻节点破产比例、第一总破产比例;获取待预测企业对应的节点在交易关系网络中的第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例,其中,第二节点度用于表征交易关系网络中与待预测企业的节点相连的边的个数,第二节点强度用于表征待预测企业的节点与其他节点之间的交易金额,其他节点是与待预测企业的节点相连接的节点,第二相邻节点破产比例用于表征其他节点中破产企业对应的节点占所有其他节点的比例,第二总破产比例用于表征交易关系网络中破产企业对应的节点占所有节点的比例;将至少以下之一特征确定为第二节点信息:第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例。
11.可选地,基于目标信息确定待预测企业的交易流水风险特征数据包括:从交易流水数据中提取待预测企业第二预设周期内的收入、支出、交易次数、交易支付平均金额和交易收入平均金额;计算收入与支出的差,得到第二预设周期内的盈利金额;计算收入与支出的和,并计算收入与和的比值,得到第二预设周期内收入占流水的比例;将至少以下之一特征确定为交易流水风险特征数据:收入、支出、交易次数、交易支付平均金额、交易收入平均金额、盈利金额和收入占流水的比例。
12.可选地,目标预测模型通过以下方式得到:获取多个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;将每个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值作为一组训练样本,得到多组训练样本;将多组训练样本输入分类器模型进行训练,得到训练后的目标预测模型。
13.可选地,基于风险预测评估值对待预测企业提供目标融资服务包括:判断风险预测评估值是否大于等于评估值阈值;在风险预测评估值大于等于评估值阈值的情况下,向待预测企业发送目标消息,其中,目标消息用于表征待预测企业存在破产风险,不具备融资
资格;在风险预测评估值小于评估值阈值的情况下,向待预测企业提供预设额度的融资金额。
14.为了实现上述目的,根据本技术的另一方面,提供了一种风险预测装置。该装置包括:获取单元,用于获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;确定单元,用于基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;输入单元,用于将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;提供单元,用于基于风险预测评估值对待预测企业提供目标融资服务。
15.通过本技术,采用以下步骤:获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;基于风险预测评估值对待预测企业提供目标融资服务,解决了相关技术中对企业的风险评估不准确的问题。通过从目标信息中提取企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据,并将上述特征数据输入目标预测模型得到风险预测评估值,基于风险预测评估值提供对应的融资服务,进而达到了精准评估企业风险的效果。
附图说明
16.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
17.图1是根据本技术实施例提供的风险预测方法的流程图;
18.图2是根据本技术实施例提供的风险评估的模型框架的示意图;
19.图3是根据本技术实施例提供的风险预测装置的示意图;
20.图4是根据本技术实施例提供的电子设备的示意图。
具体实施方式
21.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
22.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
23.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
24.需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
25.下面结合优选的实施步骤对本发明进行说明,图1是根据本技术实施例提供的风险预测方法的流程图,如图1所示,该方法包括如下步骤:
26.步骤s101,获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据。
27.具体地,待预测企业可以为传统信用数据(例如财务报告等)较难获取的小微企业,工商登记信息可以为待预测企业所属目标行业、待预测企业的运营时间和实缴资本等信息,管理者信息可以为管理者数量、股东和高管信息等,交易流水数据可以为待预测企业的收入、支出、交易次数、交易支付平均金额和交易收入平均金额等。通过获取待预测企业的目标信息来提取用于评估风险预测评估值的风险特征数据。
28.例如,通过企业基本信息数据库和企业流水数据库获取目标信息。企业基本信息数据库中的小微企业信息,包括企业工商登记数据、企业股东数据以及企业高管数据,更新至2022年6月。其中,企业工商登记信息主要包括企业名称、企业id、类别、运营范围、行业、地址、注册资本,信息更新时间(最后年检时间、注销/吊销登记时间)和是否正常运营等企业基本信息。企业高管和股东数据则主要有高管/股东唯一标识id,职位以及所属公司id等信息。
29.提取2020年初到2021年年底的小微企业对公客户现金流水记录,至少包括2亿条数据,涵盖了超过15万家小微企业。这些数据的字段主要包括企业id、交易金额、交易对象名称id、交易附言和交易时间等信息。其中,交易附言为文本信息,主要说明这笔交易的目的,例如“货款”,“预交水电费”,“工资”,“代扣税款”等。所提取的现金流水数据基本涵盖了小微企业包括日常交易、税费缴纳、工资支付等日常运营活动,并能够反映企业最新的运营情况。
30.需要说明的是,随着大数据存储技术的发展,银行积累了海量的企业交易流水数据。相比于传统的信用数据,交易流水数据真实可靠,对于银行来说更易于获取,且实时动态更新,能够反映企业近期运营情况。交易流水数据实时更新,基本涵盖了小微企业在日常经济活动中的现金流入和流出情况。在财务报告等传统信用数据缺失的情况下,银行可以充分利用大数据技术,挖掘交易流水数据的潜在价值,用于辅助小微企业的信用评估和贷款决策。本技术实施例基于小微企业在银行的的交易流水数据,建立待预测企业的风险预测模型,以缓解由于信息不对称的因素,对小微企业的信用风险评估不准确的问题。
31.步骤s102,基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据。
32.具体地,企业风险特征数据可以为待预测企业的运营时间、实缴资本、管理者数量、所属行业中企业的破产比例和所属地区中企业的破产比例。关联企业风险特征数据可以为待预测企业的股东或高管关联的企业数量、关联的企业中企业的破产比例,与待预测企业有交易往来记录的企业数量和破产比例。交易流水风险特征数据可以为待预测企业的收入、支出、交易次数、交易支付平均金额和交易收入平均金额等数据,通过确定企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据进而预测待预测企业的风险预测评估值。
33.步骤s103,将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值。
34.具体地,目标预测模型可以为逻辑回归或者随机森林等分类器模型,通过多组训练样本训练分类器模型,得到可以评估预测企业的风险预测评估值的目标预测模型。将待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入训练好的目标预测模型,得到待预测企业的风险预测评估值。
35.步骤s104,基于风险预测评估值对待预测企业提供目标融资服务。
36.具体地,针对不同企业的风险预测评估值提供不同的融资服务,例如,a企业的风险预测评估值低于评估值阈值,说明a企业抗风险能力较差,可能存在破产无法按时偿还贷款的情况,因此对a企业不提供融资,b企业的风险预测评估值高于评估值阈值,说明b企业抗风险能力较强,因此对b企业提供预设额度的融资金额。
37.本技术实施例提供的风险预测方法,通过获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;基于风险预测评估值对待预测企业提供目标融资服务,解决了相关技术中对企业的风险评估不准确的问题。通过从目标信息中提取企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据,并将上述特征数据输入目标预测模型得到风险预测评估值,基于风险预测评估值提供对应的融资服务,进而达到了精准评估企业风险的效果。
38.企业风险特征数据是基于工商登记信息和管理者信息中提取的,可选地,在本技术实施例提供的风险预测方法中,基于目标信息确定待预测企业的企业风险特征数据:从工商登记信息中提取待预测企业所属目标行业、待预测企业的运营时间和实缴资本,并从管理者信息中提取待预测企业的管理者数量;确定目标行业第一预设周期内的企业破产比例,得到第一破产比例,并确定待预测企业所属地区第一预设周期内的企业破产比例,得到第二破产比例;将至少以下之一特征确定为企业风险特征数据:运营时间、实缴资本、管理者数量、第一破产比例和第二破产比例。
39.具体地,企业的风险承受能力与多方面因素相关,基于企业自身的因素提取出企
业风险特征数据,用于评估待预测企业的风险承受能力。通过查询待预测企业的工商等级信息,提取待预测企业所属目标行业、待预测企业的运营时间和实缴资本等企业风险特征数据,通过查询待预测企业的管理者信息,提取管理者数量等企业风险特征数据。这些企业风险特征数据例如待预测企业所属目标行业、企业运营时间、实缴资本是否为缺失、实缴资本是否有异常、实缴资本/注册资本、高管人数、股东人数、近5年来待预测企业所属地区破产企业的比例(也即第二破产比例)、近5年来待预测企业所属行业破产企业的比例(也即第一破产比例)、近5年来待预测企业所属企业类型破产企业的比例等。通过确定待预测企业的企业风险特征数据为确定待预测企业的风险预测评估值提供了数据基础。
40.关联企业风险特征数据是基于管理者信息和交易流水数据中提取的,可选地,在本技术实施例提供的风险预测方法中,基于目标信息确定待预测企业的关联企业风险特征数据包括:基于管理者信息确定待预测企业的管理者关系网络,并基于交易流水数据确定待预测企业的交易关系网络,其中,管理者关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业具有相同的管理者,交易关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业之间具有交易往来记录;从管理者关系网络中获取第一节点信息,并从交易关系网络中获取第二节点信息;将第一节点信息和第二节点信息确定为关联企业风险特征数据。
41.具体地,管理者关系网络可以包括股东关系网络和高管关系网络,在对银行数据库中的各企业之间的数据进行关联等预处理之后,根据小微企业之间的股东和高管关联关系,构建股东关系网络和高管关系网络;基于交易流水数据所包含的小微企业之间的日常资金交易活动信息,构建交易关系网络。通过提取管理者关系网络中的第一节点信息和交易关系网络中的第二节点信息作为关联企业风险特征数据。通过企业之间的管理者关系网络和交易关系网络,体现企业之间的高管/股东和交易往来与企业破产之间的联系。用于确定基于交易流水数据和企业关系网络的关联企业风险特征数据。
42.例如,股东关系网络和高管关系网络主要反映企业之间的股东联系和高管联系,即两个企业之间是否有相同的股东或者相同高管。如果两个企业之间有n个相同股东,n大于等于1,连接这两个企业的边的权重为n。这样,就建立了一个以企业为节点,企业之间相同股东数为边(或边权重)的股东关系网络。高管网络的建立和股东网络相似,只是连接企业的边(边权重)为两个企业之间相同高管数。企业的对公账户记录了企业之间因交易和融资等行为产生的现金流关联关系。交易关系网络能够更完整地反映企业之间的借贷关系和供应链关系等信息。如果公司a和公司b有现金交易关系,a和b之间就通过交易关联建立了交易(借贷)等关系。在交易网络中用边表示这种关系,并用边权重表示企业a与企业b之间的交易金额。
43.可选地,在本技术实施例提供的风险预测方法中,从管理者关系网络中获取第一节点信息,并从交易关系网络中获取第二节点信息包括:获取待预测企业对应的节点在管理者关系网络中的第一节点度、第一节点强度、第一相邻节点破产比例和第一总破产比例,其中,第一节点度用于表征管理者关系网络中与待预测企业的节点相连的边的个数,第一节点强度用于表征待预测企业的节点与其他节点之间具有相同的管理者的个数,其他节点是与待预测企业的节点相连接的节点,第一相邻节点破产比例用于表征其他节点中破产企业对应的节点占所有其他节点的比例,第一总破产比例用于表征管理者关系网络中破产企
业对应的节点占所有节点的比例;将至少以下之一特征确定为第一节点信息:第一节点度、第一节点强度、第一相邻节点破产比例、第一总破产比例;获取待预测企业对应的节点在交易关系网络中的第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例,其中,第二节点度用于表征交易关系网络中与待预测企业的节点相连的边的个数,第二节点强度用于表征待预测企业的节点与其他节点之间的交易金额,其他节点是与待预测企业的节点相连接的节点,第二相邻节点破产比例用于表征其他节点中破产企业对应的节点占所有其他节点的比例,第二总破产比例用于表征交易关系网络中破产企业对应的节点占所有节点的比例;将至少以下之一特征确定为第二节点信息:第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例。
44.具体地,第一节点信息例如:待预测企业在高管网络中是否为非孤立节点,也即周围是否存在其他节点与待预测企业对应的节点连接、待预测企业在高管网络中的节点度、待预测企业在高管网络中的节点强度、在高管网络中,与该企业相邻的节点的破产比例,也即第一相邻节点破产比例。在高管网络中,待预测企业所属的社区的节点破产比例,也即第一总破产比例;待预测企业在股东网络中是否为非孤立节点、待预测企业在股东网络中的节点度、待预测企业在股东网络中的节点强度,在股东网络中,与待预测企业相邻的节点的破产比例,在股东网络中,在股东网络中,待预测企业所属的社区的节点破产比例等。
45.第二节点信息例如:待预测企业在交易关系网络中是否为非孤立节点,也即周围是否存在其他节点与待预测企业对应的节点连接、待预测企业在交易关系网络中的节点度、待预测企业在交易关系网络中的节点强度、在交易关系网络中,与该企业对应的节点相邻的节点的破产比例,也即第二相邻节点破产比例。在交易关系网络中,待预测企业所属的社区的节点破产比例,也即第二总破产比例。通过确定第一节点信息和第二节点信息进而确定为关联企业风险特征数据。
46.交易流水风险特征数据是基于交易流水数据提取的,可选地,在本技术实施例提供的风险预测方法中,基于目标信息确定待预测企业的交易流水风险特征数据包括:从交易流水数据中提取待预测企业第二预设周期内的收入、支出、交易次数、交易支付平均金额和交易收入平均金额;计算收入与支出的差,得到第二预设周期内的盈利金额;计算收入与支出的和,并计算收入与和的比值,得到第二预设周期内收入占流水的比例;将至少以下之一特征确定为交易流水风险特征数据:收入、支出、交易次数、交易支付平均金额、交易收入平均金额、盈利金额和收入占流水的比例。
47.具体地,第二预设周期可以为一个月,交易流水风险特征数据例如:近30天企业现金流入总量也即收入、近30天企业现金流出总量也即支出、近30天企业发生交易数量总量也即交易次数、近30天企业每笔交易支付平均金额也即交易支付平均金额、近30天企业每笔交易收入平均金额也即交易收入平均金额、近30天企业现金流入总量-近30天企业现金流出总量也即盈利金额、近30天企业现金流入总量/(近30天企业现金流入总量+近30天企业现金流出总量)也即收入占流水的比例。
48.需要说明的是,银行积累的海量交易流水数据反映了企业日常运营的现金流入与流出情况,一定程度上缓解了银行和企业之间的信息不对称。基于交易流水数据构建目标预测模型能够降低模型对传统信用信息的依赖,从而避免了收集传统信用信息的花销。同时,该模型能够及时准确评估企业的信用风险。交易流水数据准确客观的记录了企业的现
金流入流出信息,数据可靠、数据质量高;对于银行来说,交易流水数据更容易获取,只要小微企业在银行有账户,就可以获取到该企业的交易信息;交易流水数据实时更新,能够反映小微企业的最近的经营状况。
49.对待预测企业进行预测前需要训练好目标预测模型,可选地,在本技术实施例提供的风险预测方法中,目标预测模型通过以下方式得到:获取多个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;将每个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值作为一组训练样本,得到多组训练样本;将多组训练样本输入分类器模型进行训练,得到训练后的目标预测模型。
50.具体地,在训练目标预测模型时,为了符合准确评估待预测企业的风险承受能力,按照不同的时间点对多组训练样本划分训练集和测试集。例如将时间点t之前生成的训练样本作为训练集,而在t时刻之后生成的训练样本作为测试集。使用训练集内数据进行模型训练,训练后的目标预测模型对待预测企业进行预测和评估。通过训练目标预测模型来评估待预测企业的风险承受能力。
51.需要说明的是,为了评估交易网络信息和交易流水数据在破产预测任务中的预测能力,本技术实施例将所有特征子集组合成五个不同的模型,表1是每种模型训练时采用的特征数据。模型1是基线模型,只使用小微企业自身的企业风险特征数据。模型2结合了模型1中使用的特征数据和关联企业风险特征数据。模型3和模型4分别在模型2的特征数据的基础上添加了交易流水风险特征数据和交易网络信用风险特征数据。最后,模型5纳入了所有特征数据。分别使用线性判别分析(lda)、逻辑回归(lr)、线性支持向量机(svm)、决策树(dt)、随机森林(rf)、xgboost(xgb)和神经网络(nn)对表1中的5个模型进行信用评分预测。
52.表1
[0053][0054]
为了评估交易流水风险特征数据和交易网络信用风险特征数据在预测模型中的重要性,分别根据不同的指标组合,构建了五个模型。每一个模型训练时所采用的特征数据的组合都各不相同,用于评估是否加入各种类型的特征数据对模型分类表现的影响。在提取特征数据时,着重考虑了企业近期交易量、交易频率和交易总金额等信息。在经济学意义上,这些信息和小微企业的健康运营与增长是正相关的。例如,在交易量上,一个濒临破产的企业通常比不过正常运营的企业。同样的,交易的频率也能够反映出该企业的活跃度,交易金额则是公司财力的重要体现。
[0055]
本技术实施例的目标预测模型通过企业风险特征数据、关联企业风险特征数据和
交易流水风险特征数据进行训练,能够及时准确地预测企业的信用风险,为银行的贷款决策提供了重要依据。对于银行来说,相比于传统信用数据,例如财务报告等数据,交易流水数据更易于获取。本技术实施例所提出的目标预测模型不受传统信用数据缺失的约束,可操作性强。目标预测模型并不完全依赖于小微企业财报等相关财务数据,可有效降低小微企业财务数据造假而导致的信用风险误判情况。
[0056]
对待预测企业预测得到风险预测评估值后,基于风险预测评估值为待预测企业提供相应的融资服务,可选地,在本技术实施例提供的风险预测方法中,基于风险预测评估值对待预测企业提供目标融资服务包括:判断风险预测评估值是否大于等于评估值阈值;在风险预测评估值大于等于评估值阈值的情况下,向待预测企业发送目标消息,其中,目标消息用于表征待预测企业存在破产风险,不具备融资资格;在风险预测评估值小于评估值阈值的情况下,向待预测企业提供预设额度的融资金额。
[0057]
具体地,评估值阈值可以为基于专家规则人为设置的值,若待预测企业的风险预测评估值超过评估值阈值,说明该企业存在破产风险,银行可以基于风险预测评估值不对待预测企业提供融资服务。若待预测企业的风险预测评估值小于评估值阈值,说明该企业的抗风险能量较好,可以为其提供预设额度的融资金额。
[0058]
根据本技术的另一实施例,还提供了一种风险评估的模型框架,图2是根据本技术实施例提供的风险评估的模型框架的示意图。如图2所示,该模型框架包括:
[0059]
数据集获取,采集小微企业的企业工商登记信息、股东和高管信息,以及小微企业的交易流水数据;企业关系网络构建,基于采集到的企业工商登记信息、股东和高管信息和交易流水数据构建高管网络、股东网络和交易网络;信用风险特征提取,从企业工商登记信息中提取小企业自身信用风险指标,从高管网络、股东网络和交易网络中提取高管网络风险指标、股东网络风险指标和交易网络风险指标,从交易流水数据中提取交易流水数据相关信用风险指标;模型训练,将上述风险指标作为训练集数据输入分类器(逻辑回归、随机森林等)训练;模型评估,基于训练好的模型对小微企业进行破产风险评估。
[0060]
根据本技术实施例提供的风险评估的模型框架,从企业基本信息、企业关联网络信息(包括股东、高管和交易网络)和企业交易流水信息三方面提取信用评价指标,多方位刻画小微企业的信用风险,助力银行基于最新的数据及时评价小微企业信用风险,分析交易流水数据在小微企业破产预测中的潜在应用价值。
[0061]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0062]
本技术实施例还提供了一种风险预测装置,需要说明的是,本技术实施例的风险预测装置可以用于执行本技术实施例所提供的用于风险预测方法。以下对本技术实施例提供的风险预测装置进行介绍。
[0063]
图3是根据本技术实施例提供的风险预测装置的示意图。如图3所示,该装置包括:
[0064]
获取单元10,用于获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;
[0065]
确定单元20,用于基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;
[0066]
输入单元30,用于将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;
[0067]
提供单元40,用于基于风险预测评估值对待预测企业提供目标融资服务。
[0068]
本技术实施例提供的风险预测装置,通过获取单元10,获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;确定单元20,基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;输入单元30,将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值,其中,目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;提供单元40,基于风险预测评估值对待预测企业提供目标融资服务,解决了相关技术中对企业的风险评估不准确的问题,通过从目标信息中提取企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据,并将上述特征数据输入目标预测模型得到风险预测评估值,基于风险预测评估值提供对应的融资服务,进而达到了精准评估企业风险的效果。
[0069]
可选地,在本技术实施例提供的风险预测装置中,确定单元20包括:第一提取模块,用于从工商登记信息中提取待预测企业所属目标行业、待预测企业的运营时间和实缴资本,并从管理者信息中提取待预测企业的管理者数量;第一确定模块,用于确定目标行业第一预设周期内的企业破产比例,得到第一破产比例,并确定待预测企业所属地区第一预设周期内的企业破产比例,得到第二破产比例;第二确定模块,用于将至少以下之一特征确定为企业风险特征数据:运营时间、实缴资本、管理者数量、第一破产比例和第二破产比例。
[0070]
可选地,在本技术实施例提供的风险预测装置中,确定单元20包括:第三确定模块,用于基于管理者信息确定待预测企业的管理者关系网络,并基于交易流水数据确定待预测企业的交易关系网络,其中,管理者关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业具有相同的管理者,交易关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业之间具有交易往来记录;获取模块,用于从管理者关系网络中获取第一节点信息,并从交易关系网络中获取第二节点信息;第四确定模块,用于将第一节点信息和第二节点信息确定为关联企业风险特征数据。
[0071]
可选地,在本技术实施例提供的风险预测装置中,获取模块包括:第一获取子模块,用于获取待预测企业对应的节点在管理者关系网络中的第一节点度、第一节点强度、第一相邻节点破产比例和第一总破产比例,其中,第一节点度用于表征管理者关系网络中与待预测企业的节点相连的边的个数,第一节点强度用于表征待预测企业的节点与其他节点之间具有相同的管理者的个数,其他节点是与待预测企业的节点相连接的节点,第一相邻节点破产比例用于表征其他节点中破产企业对应的节点占所有其他节点的比例,第一总破产比例用于表征管理者关系网络中破产企业对应的节点占所有节点的比例;第一确定子模块,用于将至少以下之一特征确定为第一节点信息:第一节点度、第一节点强度、第一相邻
节点破产比例、第一总破产比例;第二获取子模块,用于获取待预测企业对应的节点在交易关系网络中的第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例,其中,第二节点度用于表征交易关系网络中与待预测企业的节点相连的边的个数,第二节点强度用于表征待预测企业的节点与其他节点之间的交易金额,其他节点是与待预测企业的节点相连接的节点,第二相邻节点破产比例用于表征其他节点中破产企业对应的节点占所有其他节点的比例,第二总破产比例用于表征交易关系网络中破产企业对应的节点占所有节点的比例;第二确定子模块,用于将至少以下之一特征确定为第二节点信息:第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例。
[0072]
可选地,在本技术实施例提供的风险预测装置中,确定单元20包括:第二提取模块,用于从交易流水数据中提取待预测企业第二预设周期内的收入、支出、交易次数、交易支付平均金额和交易收入平均金额;第一计算模块,用于计算收入与支出的差,得到第二预设周期内的盈利金额;第二计算模块,用于计算收入与支出的和,并计算收入与和的比值,得到第二预设周期内收入占流水的比例;第五确定模块,用于将至少以下之一特征确定为交易流水风险特征数据:收入、支出、交易次数、交易支付平均金额、交易收入平均金额、盈利金额和收入占流水的比例。
[0073]
可选地,在本技术实施例提供的风险预测装置中,目标预测模型通过以下方式得到:获取多个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;将每个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值作为一组训练样本,得到多组训练样本;将多组训练样本输入分类器模型进行训练,得到训练后的目标预测模型。
[0074]
可选地,在本技术实施例提供的风险预测装置中,提供单元40包括:判断模块,用于判断风险预测评估值是否大于等于评估值阈值;发送模块,用于在风险预测评估值大于等于评估值阈值的情况下,向待预测企业发送目标消息,其中,目标消息用于表征待预测企业存在破产风险,不具备融资资格;提供模块,用于在风险预测评估值小于评估值阈值的情况下,向待预测企业提供预设额度的融资金额。
[0075]
风险预测装置包括处理器和存储器,上述获取单元10、确定单元20、输入单元30和提供单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0076]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来精准评估企业风险。
[0077]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
[0078]
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现风险预测方法。
[0079]
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行风险预测方法。
[0080]
图4是根据本技术实施例提供的电子设备的示意图。如图4所示,电子设备401包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以
下步骤:风险预测方法。本文中的设备可以是服务器、pc、pad、手机等。
[0081]
本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:风险预测方法。
[0082]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0083]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0084]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0085]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0086]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0087]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
[0088]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0089]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的
过程、方法、商品或者设备中还存在另外的相同要素。
[0090]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0091]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。

技术特征:
1.一种风险预测方法,其特征在于,包括:获取待预测企业的目标信息,其中,所述目标信息至少包括以下之一:所述待预测企业的工商登记信息、所述待预测企业的管理者信息和所述待预测企业的交易流水数据;基于所述目标信息确定所述待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;将所述企业风险特征数据、所述关联企业风险特征数据和所述交易流水风险特征数据输入目标预测模型,得到所述待预测企业的风险预测评估值,其中,所述目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;基于所述风险预测评估值对所述待预测企业提供目标融资服务。2.根据权利要求1所述的方法,其特征在于,基于所述目标信息确定所述待预测企业的企业风险特征数据包括:从所述工商登记信息中提取所述待预测企业所属目标行业、所述待预测企业的运营时间和实缴资本,并从所述管理者信息中提取所述待预测企业的管理者数量;确定所述目标行业第一预设周期内的企业破产比例,得到第一破产比例,并确定所述待预测企业所属地区所述第一预设周期内的企业破产比例,得到第二破产比例;将至少以下之一特征确定为所述企业风险特征数据:所述运营时间、所述实缴资本、所述管理者数量、所述第一破产比例和所述第二破产比例。3.根据权利要求1所述的方法,其特征在于,基于所述目标信息确定所述待预测企业的关联企业风险特征数据包括:基于所述管理者信息确定所述待预测企业的管理者关系网络,并基于所述交易流水数据确定所述待预测企业的交易关系网络,其中,所述管理者关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业具有相同的管理者,所述交易关系网络包含多个节点,每个节点表征一个企业,任意两个节点间相连接的边表征两个企业之间具有交易往来记录;从所述管理者关系网络中获取第一节点信息,并从所述交易关系网络中获取第二节点信息;将所述第一节点信息和所述第二节点信息确定为所述关联企业风险特征数据。4.根据权利要求3所述的方法,其特征在于,从所述管理者关系网络中获取第一节点信息,并从所述交易关系网络中获取第二节点信息包括:获取所述待预测企业对应的节点在所述管理者关系网络中的第一节点度、第一节点强度、第一相邻节点破产比例和第一总破产比例,其中,所述第一节点度用于表征所述管理者关系网络中与所述待预测企业的节点相连的边的个数,所述第一节点强度用于表征所述待预测企业的节点与其他节点之间具有相同的管理者的个数,其他节点是与所述待预测企业的节点相连接的节点,所述第一相邻节点破产比例用于表征所述其他节点中破产企业对应的节点占所有其他节点的比例,所述第一总破产比例用于表征所述管理者关系网络中破产企业对应的节点占所有节点的比例;将至少以下之一特征确定为所述第一节点信息:所述第一节点度、所述第一节点强度、所述第一相邻节点破产比例、所述第一总破产比例;
获取所述待预测企业对应的节点在所述交易关系网络中的第二节点度、第二节点强度、第二相邻节点破产比例和第二总破产比例,其中,所述第二节点度用于表征所述交易关系网络中与所述待预测企业的节点相连的边的个数,所述第二节点强度用于表征所述待预测企业的节点与其他节点之间的交易金额,其他节点是与所述待预测企业的节点相连接的节点,所述第二相邻节点破产比例用于表征所述其他节点中破产企业对应的节点占所有其他节点的比例,所述第二总破产比例用于表征所述交易关系网络中破产企业对应的节点占所有节点的比例;将至少以下之一特征确定为所述第二节点信息:所述第二节点度、所述第二节点强度、所述第二相邻节点破产比例和所述第二总破产比例。5.根据权利要求1所述的方法,其特征在于,基于所述目标信息确定所述待预测企业的交易流水风险特征数据包括:从所述交易流水数据中提取所述待预测企业第二预设周期内的收入、支出、交易次数、交易支付平均金额和交易收入平均金额;计算所述收入与所述支出的差,得到所述第二预设周期内的盈利金额;计算所述收入与所述支出的和,并计算所述收入与所述和的比值,得到所述第二预设周期内收入占流水的比例;将至少以下之一特征确定为所述交易流水风险特征数据:所述收入、所述支出、所述交易次数、所述交易支付平均金额、所述交易收入平均金额、所述盈利金额和所述收入占流水的比例。6.根据权利要求1所述的方法,其特征在于,所述目标预测模型通过以下方式得到:获取多个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;将每个企业的历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值作为一组训练样本,得到多组训练样本;将所述多组训练样本输入分类器模型进行训练,得到训练后的所述目标预测模型。7.根据权利要求1所述的方法,其特征在于,基于所述风险预测评估值对所述待预测企业提供目标融资服务包括:判断所述风险预测评估值是否大于等于评估值阈值;在所述风险预测评估值大于等于所述评估值阈值的情况下,向所述待预测企业发送目标消息,其中,所述目标消息用于表征所述待预测企业存在破产风险,不具备融资资格;在所述风险预测评估值小于所述评估值阈值的情况下,向所述待预测企业提供预设额度的融资金额。8.一种风险预测装置,其特征在于,包括:获取单元,用于获取待预测企业的目标信息,其中,所述目标信息至少包括以下之一:所述待预测企业的工商登记信息、所述待预测企业的管理者信息和所述待预测企业的交易流水数据;确定单元,用于基于所述目标信息确定所述待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;输入单元,用于将所述企业风险特征数据、所述关联企业风险特征数据和所述交易流
水风险特征数据输入目标预测模型,得到所述待预测企业的风险预测评估值,其中,所述目标预测模型由多组训练样本训练得到,每组训练样本包括历史企业风险特征数据、历史关联企业风险特征数据、历史交易流水风险特征数据和历史风险预测评估值;提供单元,用于基于所述风险预测评估值对所述待预测企业提供目标融资服务。9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制所述非易失性存储介质所在的设备执行权利要求1至7中任意一项所述的风险预测方法。10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的风险预测方法。

技术总结
本申请公开了一种风险预测方法、装置、存储介质及电子设备。该方法包括:获取待预测企业的目标信息,其中,目标信息至少包括以下之一:待预测企业的工商登记信息、待预测企业的管理者信息和待预测企业的交易流水数据;基于目标信息确定待预测企业的企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据;将企业风险特征数据、关联企业风险特征数据和交易流水风险特征数据输入目标预测模型,得到待预测企业的风险预测评估值;基于风险预测评估值对待预测企业提供目标融资服务。通过本申请,解决了相关技术中对企业的风险评估不准确的问题。准确的问题。准确的问题。


技术研发人员:苏瑀
受保护的技术使用者:吉林亿联银行股份有限公司
技术研发日:2023.05.23
技术公布日:2023/8/16
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐