授信额度模型的建模方法、装置、介质及程序产品与流程

未命名 07-13 阅读:87 评论:0


1.本技术属于大数据技术领域,尤其涉及一种授信额度模型的建模方法、装置、介质及程序产品。


背景技术:

2.授信额度是贷款的关键要素之一,如何核定授信额度是各银行机构要解决的难点。
3.现有技术的常见做法有两种,一种是通过专家经验模型确定授信额度,例如,通过“授信参考变量*专家系数”的方式确定授信额度,但是这种方式主要集中在一个维度,因此得到的授信额度受单一变量的影响较大,致使根据模型确定出的授信额度不准确;另一种是通过构建客户贷款资金需求与客户数据特征的关系,得到授信额度模型,然后基于授信额度模型可以确定客户的授信额度,但是这种方式面临模型的目标变量定义模糊的问题,目标变量定义的不准确,也会出现根据模型确定出的授信额度不准确的问题。
4.因此,亟需一种授信额度模型的建模方法,以提高确定授信额度的准确率。


技术实现要素:

5.本技术实施例提供一种授信额度模型的建模方法、装置、介质及程序产品,能够提高确定授信额度的准确率。
6.一方面,本技术实施例提供一种授信额度模型的建模方法,包括:
7.获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据,第二时间点在第一时间点之前,且第二时间点与第一时间点的距离为第二预设时间段;
8.针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;
9.依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。
10.在本技术的一些实施例中,非线性回归模型为幂指函数模型或决策树回归模型。
11.在本技术的一些实施例中,非线性回归模型为幂指函数模型,依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:
12.针对每个第一样本,求解历史用户的第一授信额度的对数,得到历史用户的第一授信额度的对数值;
13.依据多个第一样本的第一授信额度的对数值以及目标特征参数的样本数据,构建第一授信额度的对数与目标特征参数的线性关系;
14.将第一授信额度的对数与目标特征参数的线性关系转换为第一授信额度与目标
特征参数的幂指函数关系,得到幂指函数模型。
15.在本技术的一些实施例中,非线性回归模型为决策树回归模型,依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:
16.依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,采用分类回归树算法,构建第一授信额度与目标特征参数的非线性关系,得到决策树回归模型。
17.在本技术的一些实施例中,预设条件包括以下至少一种:
18.字符型特征以及波动率小于第一预设值;
19.特征缺失率高于第二预设值;
20.单一值比例高于第三预设值;
21.与第一授信额度的相关系数小于第四预设值;
22.特征之间的两两相关系数大于第五预设值;
23.特征的稳定性大于第六预设值。
24.在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
25.获取多个第二样本,每个第二样本包括历史用户的第一授信额度的真实值以及历史用户的目标特征参数的样本数据;
26.将目标特征参数的样本数据输入授信额度模型,得到第一授信额度的预测值;
27.根据第一授信额度的真实值和预测值,确定授信额度模型的评价指标数值。
28.在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
29.获取多个第二样本,每个第二样本包括历史用户的目标特征参数的样本数据;
30.根据多个第二样本中的目标特征参数的样本数据以及多个第一样本中的目标特征参数的样本数据,确定授信额度模型的评价指标数值。
31.在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
32.获取用户的目标特征参数的数据;
33.将目标特征参数的数据输入授信额度模型,得到用户的目标授信额度。
34.另一方面,本技术实施例提供了一种授信额度模型的建模装置,装置包括:
35.第一获取单元,用于获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据,第二时间点在第一时间点之前,且第二时间点与第一时间点的距离为第二预设时间段;
36.筛选单元,用于针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;
37.训练单元,用于依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。
38.在本技术的一些实施例中,非线性回归模型为幂指函数模型或决策树回归模型。
39.在本技术的一些实施例中,非线性回归模型为幂指函数模型,训练单元包括:
40.求解单元,用于针对每个第一样本,求解历史用户的第一授信额度的对数,得到历史用户的第一授信额度的对数值;
41.第一构建单元,用于依据多个第一样本的第一授信额度的对数值以及目标特征参数的样本数据,构建第一授信额度的对数与目标特征参数的线性关系;
42.转换单元,用于将第一授信额度的对数与目标特征参数的线性关系转换为第一授信额度与目标特征参数的幂指函数关系,得到幂指函数模型。
43.在本技术的一些实施例中,非线性回归模型为决策树回归模型,训练单元包括:
44.第二构建单元,用于依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,采用分类回归树算法,构建第一授信额度与目标特征参数的非线性关系,得到决策树回归模型。
45.在本技术的一些实施例中,预设条件包括以下至少一种:
46.字符型特征以及波动率小于第一预设值;
47.特征缺失率高于第二预设值;
48.单一值比例高于第三预设值;
49.与第一授信额度的相关系数小于第四预设值;
50.特征之间的两两相关系数大于第五预设值;
51.特征的稳定性大于第六预设值。
52.在本技术的一些实施例中,建模装置还包括:
53.第四获取单元,用于获取用户的所述目标特征参数的数据;
54.第三确定单元,用于将所述目标特征参数的数据输入所述授信额度模型,得到所述用户的目标授信额度。
55.另一方面,本技术实施例提供一种授信额度模型的建模设备,数据处理设备包括:处理器以及存储有计算机程序指令的存储器;
56.处理器执行计算机程序指令时实现上述任一实施例的授信额度模型的建模方法。
57.另一方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述任一实施例的授信额度模型的建模方法。
58.另一方面,本技术实施例提供一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述任一实施例的授信额度模型的建模方法。
59.根据本技术实施例提供的授信额度模型的建模方法、装置、介质及程序产品,将历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值作为第一授信额度,准确地的定义了目标变量,而且由于实际经济活动中,用户授信额度需求与用户数据特征的关系大多不是线性关系,更多表现出来的是非线性关系,故本技术实施例中利用第一授信额度以及目标特征参数的样本数据,基于非线性回归建立授信额度模型的建模方法所建立的授信额度模型可以更准确的反应用户授信额度需求与用户数据特征的关系,且模型受单一变量的影响较小,故能够提高确定授信额度的准确率。
附图说明
60.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
61.图1是本技术实施例提供的授信额度模型的建模方法的一种流程示意图;
62.图2是本技术实施例提供的授信额度模型的建模方法的另一种流程示意图;
63.图3是本技术实施例提供的授信额度模型的建模方法的另一种流程示意图;
64.图4是本技术实施例提供的授信额度模型的建模装置的一种结构示意图;
65.图5是本技术实施例提供的授信额度模型的建模设备的结构示意图。
具体实施方式
66.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
67.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
68.本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
69.授信额度是贷款的关键要素之一,如何核定授信额度是各银行机构要解决的难点。
70.现有技术的常见做法有两种,一种是通过专家经验模型确定授信额度,例如,通过“授信参考变量*专家系数”的方式确定授信额度,但是这种方式主要集中在一个维度,因此得到的授信额度受单一变量的影响较大,致使根据模型确定出的授信额度不准确;另一种是通过构建客户贷款资金需求与客户数据特征的关系,得到授信额度模型,然后基于授信额度模型可以确定客户的授信额度,但是这种方式面临模型的目标变量定义模糊的问题,目标变量定义的不准确,也会出现根据模型确定出的授信额度不准确的问题。
71.为了解决上述技术问题,本技术实施例提供了一种授信额度模型的建模方法、装置、介质及程序产品,能够提高确定授信额度的准确率。
72.图1是本技术实施例提供的授信额度模型的建模方法的一种流程示意图,下面结合图1对本技术实施例所提供的授信额度模型的建模方法进行介绍。
73.s101,获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间
段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据,第二时间点在第一时间点之前,且第二时间点与第一时间点的距离为第二预设时间段。
74.具体地,历史用户可以为小微企业,多个特征参数可以从客户画像指标体系中获得,例如可以为用户的存款数额、盈利数额、经营年数等。
75.目标变量定义为本技术实施例建模的关键,授信额度模型的目标变量定义较为困难,如何寻找到一个衡量客户真实需求额度或者可接收额度的变量需要认真分析,本技术实施例将历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值作为目标变量,例如,第一预设时间段为6个月,历史用户在6个月内每个月的贷款余额为20万、50万、40万、30万、10万以及10万,则历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值为50万,50万即为该历史用户的第一授信额度。本技术中可以选取第一授信额度大于0的数据作为样本。
76.第一时间点可以为样本观察点,在建模过程中,观察点取的是历史时点,为消除季节性的影响,可以在每个季度选择一个月份作为观察点。
77.第一预设时间段为表现期,表现期是能完整监控到客户表现的时间周期,表现期太短,则无法准确体现客户的贷款需求量,而表现期太长,则模型预测时点与客户实际表现时点可能出现较长间隔,影响模型效果。考虑目标变量对客户行为描述的准确性,表现期定为6个月。
78.第二时间点为取数点,取数点为位于观察时点能取到的最新客户指标的时间点,对于月度指标数据,最多会有1个月的滞后性,因此第二时间段可以为1个月,第二时间点选在第一时间点之前且距离第一时间点一个月的时间点。
79.举例:综合考虑样本表现期、收支流水数据质量情况及指标的最大时间窗口,样本观察点选择2020-12-31、2021-03-31、2021-06-30、2021-09-30,取数点对应选择2020-10-31、2021-01-31、2021-04-30、2021-07-31,其中样本观察点在2020-12-31、2021-03-31、2021-06-30,取数点在2020-10-31、2021-01-31、2021-04-30的数据为第一样本的数据,按照7:3划分为训练数据和验证数据,70%的第一样本作为训练数据,30%的第一样本作为验证数据。训练数据用于训练模型,验证数据用于验证模型是否过拟合以及调整模型超参数。
80.样本观察点在2021-09-30,取数点在2021-07-31的数据为第二样本的数据,第二样本的数据为时间外测试数据,时间外测试数据用于评价模型泛化能力和稳定性。
81.s102,针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据。
82.为了保证模型具有一定解释性,需要对多个特征参数进行筛选,入模特征不能太多。
83.具体地,预设条件可以包括至少一种:
84.字符型特征以及波动率小于第一预设值;特征缺失率高于第二预设值;单一值比例高于第三预设值;与第一授信额度的相关系数小于第四预设值;特征之间的两两相关系数大于第五预设值;特征的稳定性大于第六预设值。
85.由于授信额度模型的目标变量为连续型特征,因此需筛除字符型特征,且筛除容易波动的特征,如时间窗口为1个月、3个月的特征、环比/同比类特征等,第一预设值可以根据实际需要设置。
86.特征缺失率=特征值为空的样本数/总样本数,第二预设值可以为0.7,即筛除缺失率高于0.7的特征,第二预设值还可以根据实际需求设置。
87.单一值比例=特征值等于最高频率值的客户数/总客户数,第三预设值可以为0.7,即单一值比例高于0.7的特征,第三预设值还可以根据实际需求设置。
88.相关系数描述的是特征与目标变量的相关程度,相关系数较低的特征,对模型的贡献较小,第四预设值可以为0.1,即本技术实施例中筛除了相关系数小于0.1的特征,第四预设值还可以根据实际需求设置。
89.如果入模特征的两两相关系数较高,则会使得模型的参数估计不稳定,特征的解释性不符合业务理解,这种情况下实际上只需要保留一个特征即可。第五预设值可以为0.6,即本技术实施例对于特征两两相关系数大于0.6的,保留与目标变量的相关系数较大的特征,第五预设值还可以根据实际需求设置。
90.特征的稳定性可用psi(population stability index)描述。
91.psi的一般解读指引请参见下表:
92.表1psi评价标准
93.psi范围意义0-0.1没有变化或者很少变化0.1-0.25有变化,继续监控后续变化大于0.25发生较大变化,进行特征项分析
94.由于到该步骤保留的特征数仍然较多,因此第六预设值可以为0.05,即本技术实施例筛除psi》0.05的特征,第六预设值还可以根据实际需求设置。
95.s103,依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。
96.在得到了多个第一样本的第一授信额度以及目标特征参数的样本数据后,基于非线性回归,训练回归模型,得到授信额度模型。
97.在进行回归过程中,可以逐步回归继续筛选掉对目标变量影响不显著的目标特征参数,保留显著的目标特征参数,还可以基于回归系数、p值、业务含义对目标特征参数进行进一步筛选,得到最终的目标特征参数。
98.根据本技术实施例提供的授信额度模型的建模方法,将历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值作为第一授信额度,准确地的定义了目标变量,而且由于实际经济活动中,用户授信额度需求与用户数据特征的关系大多不是线性关系,更多表现出来的是非线性关系,故本技术实施例中利用第一授信额度以及目标特征参数的样本数据,基于非线性回归建立授信额度模型的建模方法所建立的授信额度模型可以更准确的反应用户授信额度需求与用户数据特征的关系,且模型受单一变量的影响较小,故能够提高确定授信额度的准确率。
99.在本技术的一些实施例中,非线性回归模型为幂指函数模型或决策树回归模型。
100.图2是本技术实施例提供的授信额度模型的建模方法的另一种流程示意图,下面结合图2对本技术实施例所提供的授信额度模型的建模方法进行介绍。其中s201、s201与s101、s102相同,在此不再详细说明。
101.在本技术的一些实施例中,非线性回归模型为幂指函数模型。
102.依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:
103.s203,针对每个第一样本,求解历史用户的第一授信额度的对数,得到历史用户的第一授信额度的对数值。
104.具体地,若目标变量为y,则求解lny,得到目标变量对应的对数值。
105.s204,依据多个第一样本的第一授信额度的对数值以及目标特征参数的样本数据,构建第一授信额度的对数与目标特征参数的线性关系。
106.在构建线性关系的过程中,还可以逐步回归继续筛选掉对目标变量影响不显著的目标特征参数,保留显著的目标特征参数,还可以基于回归系数、p值、业务含义对目标特征参数进行进一步筛选,得到最终的目标特征参数,然后得到第一授信额度的对数与最终的目标特征参数的线性关系。
107.第一授信额度的分布不为正态分布,而是大致服从左偏的分布,因此若直接用第一授信额度做因变量进行线性回归进行建模,模型的拟合效果会较差,y的跨度值较大,做回归模型时,容易牺牲掉y值较小的样本的贡献,本技术创造性的采用了第一授信额度的对数和目标特征参数进行线性回归进行建模,用lny做因变量建模可以降低y跨度较大的影响,因此将lny作为因变量进行建模,可以得到更优的模型。
108.s205,将第一授信额度的对数与目标特征参数的线性关系转换为第一授信额度与目标特征参数的幂指函数关系,得到幂指函数模型。
109.具体地,幂指函数模型满足以下公式:
[0110][0111]
其中,y为第一授信额度,i为目标特征参数的个数,a为目标特征参数的权重,x为目标特征参数。
[0112]
由于第一授信额度与目标特征参数符合幂指函数关系,是非线性关系,因此该授信额度模型是基于非线性回归建立的模型。
[0113]
本技术实施例的建模方法,巧妙的对y做了对数化处理,能较好的适用y分布差异较大的情况,将非线性关系转化为了线性关系,使得模型的解释性得到大大增强。
[0114]
该幂指函数模型的业务解释性强,模型结果直观,模型稳定性一般较好,模型预测值分布较为丰富。
[0115]
图3是本技术实施例提供的授信额度模型的建模方法的另一种流程示意图,下面结合图3对本技术实施例所提供的授信额度模型的建模方法进行介绍。其中s301、s301与s101、s102相同,在此不再详细说明。
[0116]
在本技术的一些实施例中,非线性回归模型为决策树回归模型。
[0117]
依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:
[0118]
s303,依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,采用分类回归树算法,构建第一授信额度与目标特征参数的非线性关系,得到决策树回归模型。
[0119]
对于非线性关系,采用决策树回归能得到更好的拟合效果,同时考虑到授信额度模型需要一定的业务解释性,本技术实施例选取分类回归树算法,也即单棵树cart算法,根据特征向量决定对应的输出y值。cart回归选择的切分点为使得平方误差最小化的切分点,
最终输出为各叶子阶段内y的均值。
[0120]
该决策树回归模型的模型拟合效果一般较好;模型不会受样本极端值的影响;模型训练步骤简单。
[0121]
在本技术的一些实施例中,在训练好授信额度模型之后,可以根据30%的第一样本的数据对授信额度模型进行验证,验证模型是否过拟合以及调整模型超参数。
[0122]
在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
[0123]
获取多个第二样本,每个第二样本包括历史用户的第一授信额度的真实值以及历史用户的目标特征参数的样本数据。
[0124]
将目标特征参数的样本数据输入授信额度模型,得到第一授信额度的预测值。
[0125]
根据第一授信额度的真实值和预测值,确定授信额度模型的评价指标数值。
[0126]
具体地,样本观察点在2021-09-30,取数点在2021-07-31的数据为第二样本的数据,第二样本的数据为时间外测试数据,时间外测试数据用于评价模型泛化能力和稳定性。
[0127]
根据第一授信额度的真实值和预测值,确定授信额度模型的评价指标数值,包括以下两种方式:
[0128]
第一种:对于回归模型,评价模型拟合精度的常用评价指标为可决系数,是指回归平方和和总离差平方和的比值,计算公式为:
[0129][0130]
其中,r2为可决系数,ss
res
为回归平方和,ss
tot
为总离差平方和,yi为第一授信额度的预测值,fi为第一授信额度的真实值,为第一授信额度的平均值,可以由yi进行求和再平均得到。
[0131]
从以上计算公式可以看出,可决系数取值在0-1之间,越大,说明模型解释的变差占总变差的比例越高,模型的拟合精度越高。
[0132]
表2可决系数应用参考范围
[0133][0134]
本技术实施例的授信额度模型的可决系数可以为0.4。
[0135]
第二种:模型预测值的分布是业务关注的重点,一方面会比较模型预测值与样本的真实值差异是否较大,另一方面也会关注预测值的分布是否与业务预期相符。
[0136]
在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:
[0137]
获取多个第二样本,每个第二样本包括历史用户的目标特征参数的样本数据。
[0138]
根据多个第二样本中的目标特征参数的样本数据以及多个第一样本中的目标特征参数的样本数据,确定授信额度模型的评价指标数值。
[0139]
具体地,可以利用psi,确定授信额度模型的评价指标数值。
[0140]
在本技术的一些实施例中,在依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,方法还包括:获取用户的目标特征参数的数据;将目标特征参数的数据输入授信额度模型,得到用户的目标授信额度。
[0141]
在训练好授信额度模型之后,可以使用该模型对用户的授信额度进行预测,将用户的目标特征参数的数据输入授信额度模型后,即可得到用户的目标授信额度。由于该授信额度模型准确地的定义了目标变量,而且该模型是基于非线性回归建立的模型,因此模型受单一变量的影响较小,故能够提高确定授信额度的准确率。
[0142]
图4是本技术实施例提供的授信额度模型的建模装置的一种结构示意图,下面结合图4对本技术实施例所提供的授信额度模型的建模装置进行介绍。授信额度模型的建模装置包括:
[0143]
第一获取单元401,用于获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据,第二时间点在第一时间点之前,且第二时间点与第一时间点的距离为第二预设时间段。
[0144]
筛选单元402,用于针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据。
[0145]
训练单元403,用于依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。
[0146]
在本技术的一些实施例中,非线性回归模型为幂指函数模型或决策树回归模型。
[0147]
在本技术的一些实施例中,非线性回归模型为幂指函数模型,训练单元403,包括:
[0148]
求解单元,用于针对每个第一样本,求解历史用户的第一授信额度的对数,得到历史用户的第一授信额度的对数值。
[0149]
第一构建单元,用于依据多个第一样本的第一授信额度的对数值以及目标特征参数的样本数据,构建第一授信额度的对数与目标特征参数的线性关系。
[0150]
转换单元,用于将第一授信额度的对数与目标特征参数的线性关系转换为第一授信额度与目标特征参数的幂指函数关系,得到幂指函数模型。
[0151]
在本技术的一些实施例中,非线性回归模型为决策树回归模型,训练单元403,包括:
[0152]
第二构建单元,用于依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,采用分类回归树算法,构建第一授信额度与目标特征参数的非线性关系,得到决策树回归模型。
[0153]
在本技术的一些实施例中,预设条件包括以下至少一种:
[0154]
字符型特征以及波动率小于第一预设值;
[0155]
特征缺失率高于第二预设值;
[0156]
单一值比例高于第三预设值;
[0157]
与第一授信额度的相关系数小于第四预设值;
[0158]
特征之间的两两相关系数大于第五预设值;
[0159]
特征的稳定性大于第六预设值。
[0160]
在本技术的一些实施例中,授信额度模型的建模装置还包括:
[0161]
第二获取单元,用于获取多个第二样本,每个第二样本包括历史用户的第一授信额度的真实值以及历史用户的目标特征参数的样本数据。
[0162]
预测单元,用于将目标特征参数的样本数据输入授信额度模型,得到第一授信额度的预测值。
[0163]
第一确定单元,用于根据第一授信额度的真实值和预测值,确定授信额度模型的评价指标数值。
[0164]
在本技术的一些实施例中,授信额度模型的建模装置还包括:
[0165]
第三获取单元,用于获取多个第二样本,每个第二样本包括历史用户的目标特征参数的样本数据。
[0166]
第二确定单元,用于根据多个第二样本中的目标特征参数的样本数据以及多个第一样本中的目标特征参数的样本数据,确定授信额度模型的评价指标数值。
[0167]
在本技术的一些实施例中,授信额度模型的建模装置还包括:
[0168]
第四获取单元,用于获取用户的目标特征参数的数据;
[0169]
第三确定单元,用于将目标特征参数的数据输入授信额度模型,得到用户的目标授信额度。
[0170]
根据本技术实施例提供的授信额度模型的建模装置,将历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值作为第一授信额度,准确地的定义了目标变量,而且由于实际经济活动中,用户授信额度需求与用户数据特征的关系大多不是线性关系,更多表现出来的是非线性关系,故本技术实施例中利用第一授信额度以及目标特征参数的样本数据,基于非线性回归建立授信额度模型的建模方法所建立的授信额度模型可以更准确的反应用户授信额度需求与用户数据特征的关系,且模型受单一变量的影响较小,故能够提高确定授信额度的准确率。
[0171]
图5是本技术实施例提供的授信额度模型的建模设备的结构示意图。
[0172]
授信额度模型的建模设备可以包括处理器501以及存储有计算机程序指令的存储器502。
[0173]
具体地,上述处理器501可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0174]
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态
存储器。
[0175]
存储器可包括只读存储器(rom),随机存取存储器(ram),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
[0176]
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的授信额度模型的建模方法。
[0177]
在一个示例中,信息交互设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
[0178]
通信接口503,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。
[0179]
总线510包括硬件、软件或两者,将信息交互设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0180]
该授信额度模型的建模设备执行本技术实施例中的授信额度模型的建模方法,从而实现图1至图3的授信额度模型的建模方法。
[0181]
另外,结合上述实施例中的授信额度模型的建模方法,本技术实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种授信额度模型的建模方法。
[0182]
需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
[0183]
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
[0184]
还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中
提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
[0185]
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
[0186]
以上所述,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。

技术特征:
1.一种授信额度模型的建模方法,其特征在于,所述方法包括:获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及所述历史用户的多个特征参数的样本数据,所述第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,所述多个特征参数的样本数据为在第二时间点获得的数据,所述第二时间点在所述第一时间点之前,且所述第二时间点与所述第一时间点的距离为第二预设时间段;针对每个第一样本,分别从所述多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。2.根据权利要求1所述的方法,其特征在于,所述非线性回归模型为幂指函数模型或决策树回归模型。3.根据权利要求2所述的方法,其特征在于,所述非线性回归模型为幂指函数模型,所述依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:针对每个第一样本,求解历史用户的第一授信额度的对数,得到所述历史用户的第一授信额度的对数值;依据所述多个第一样本的第一授信额度的对数值以及所述目标特征参数的样本数据,构建所述第一授信额度的对数与所述目标特征参数的线性关系;将所述第一授信额度的对数与所述目标特征参数的线性关系转换为所述第一授信额度与所述目标特征参数的幂指函数关系,得到所述幂指函数模型。4.根据权利要求2所述的方法,其特征在于,所述非线性回归模型为决策树回归模型,所述依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型,包括:依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,采用分类回归树算法,构建所述第一授信额度与所述目标特征参数的非线性关系,得到所述决策树回归模型。5.根据权利要求1所述的方法,其特征在于,所述预设条件包括以下至少一种:字符型特征以及波动率小于第一预设值;特征缺失率高于第二预设值;单一值比例高于第三预设值;与所述第一授信额度的相关系数小于第四预设值;特征之间的两两相关系数大于第五预设值;特征的稳定性大于第六预设值。6.根据权利要求1-5任意一项所述的方法,其特征在于,在所述依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,所述方法还包括:获取多个第二样本,每个第二样本包括历史用户的第一授信额度的真实值以及所述历史用户的所述目标特征参数的样本数据;
将所述目标特征参数的样本数据输入所述授信额度模型,得到所述第一授信额度的预测值;根据所述第一授信额度的真实值和预测值,确定所述授信额度模型的评价指标数值。7.根据权利要求1-5任意一项所述的方法,其特征在于,在所述依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,所述方法还包括:获取多个第二样本,每个第二样本包括历史用户的所述目标特征参数的样本数据;根据所述多个第二样本中的所述目标特征参数的样本数据以及所述多个第一样本中的所述目标特征参数的样本数据,确定所述授信额度模型的评价指标数值。8.根据权利要求1-5任意一项所述的方法,其特征在于,在所述依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型之后,所述方法还包括:获取用户的所述目标特征参数的数据;将所述目标特征参数的数据输入所述授信额度模型,得到所述用户的目标授信额度。9.一种授信额度模型的建模装置,其特征在于,所述装置包括:第一获取单元,用于获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及所述历史用户的多个特征参数的样本数据,所述第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,所述多个特征参数的样本数据为在第二时间点获得的数据,所述第二时间点在所述第一时间点之前,且所述第二时间点与所述第一时间点的距离为第二预设时间段;筛选单元,用于针对每个第一样本,分别从所述多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;训练单元,用于依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。10.根据权利要求9所述的装置,其特征在于,所述非线性回归模型为幂指函数模型或决策树回归模型。11.根据权利要求10所述的装置,其特征在于,所述非线性回归模型为幂指函数模型,所述训练单元,包括:求解单元,用于针对每个第一样本,求解历史用户的第一授信额度的对数,得到所述历史用户的第一授信额度的对数值;第一构建单元,用于依据所述多个第一样本的第一授信额度的对数值以及所述目标特征参数的样本数据,构建所述第一授信额度的对数与所述目标特征参数的线性关系;转换单元,用于将所述第一授信额度的对数与所述目标特征参数的线性关系转换为所述第一授信额度与所述目标特征参数的幂指函数关系,得到所述幂指函数模型。12.根据权利要求10所述的装置,其特征在于,所述非线性回归模型为决策树回归模型,所述训练单元,包括:第二构建单元,用于依据所述多个第一样本中的第一授信额度以及所述目标特征参数的样本数据,采用分类回归树算法,构建所述第一授信额度与所述目标特征参数的非线性关系,得到所述决策树回归模型。
13.根据权利要求9所述的装置,其特征在于,所述预设条件包括以下至少一种:字符型特征以及波动率小于第一预设值;特征缺失率高于第二预设值;单一值比例高于第三预设值;与所述第一授信额度的相关系数小于第四预设值;特征之间的两两相关系数大于第五预设值;特征的稳定性大于第六预设值。14.根据权利要求9-13任意一项所述的装置,其特征在于,所述装置还包括:第四获取单元,用于获取用户的所述目标特征参数的数据;第三确定单元,用于将所述目标特征参数的数据输入所述授信额度模型,得到所述用户的目标授信额度。15.一种授信额度模型的建模设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如权利要求1-8任意一项所述的授信额度模型的建模方法。16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的授信额度模型的建模方法。17.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-8中任意一项所述的授信额度模型的建模方法。

技术总结
本申请公开了一种授信额度模型的建模方法、装置、介质及程序产品,涉及大数据技术领域,方法包括:获取多个第一样本,每个第一样本包括历史用户的第一授信额度以及历史用户的多个特征参数的样本数据,第一授信额度为历史用户在第一时间点后第一预设时间段内新增贷款的余额最大值,多个特征参数的样本数据为在第二时间点获得的数据;针对每个第一样本,分别从多个特征参数的样本数据中去除满足预设条件的特征参数的样本数据,得到目标特征参数的样本数据;依据多个第一样本中的第一授信额度以及目标特征参数的样本数据,训练非线性回归模型,得到授信额度模型。能够提高确定授信额度的准确率。额度的准确率。额度的准确率。


技术研发人员:邓强
受保护的技术使用者:建信金融科技有限责任公司
技术研发日:2023.03.27
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐