[摘 要] 本文对信用评分领域中主要的模型和方法做了细致的概述和优缺点比较, 这些模型包括判别分析模型、决策树分析回归分析和神经网络模型。
[关键词] 信用评分 判别分析模型 决策树分析 回归分析法 神经网络法
一、信用评分概况
信用评分模型作为信用风险的基础和核心,无论是对于建立征信体系还是对于机构的信贷资产管理,都有着不可替代的作用。其主要目的,在于尽量将能够预测借款人未来行为的指标加以整合,并统一成可以比较的单一指标,以显示借款人在未来特定时间内违约的可能性,所有的信用评分模型,无论采用什么理论或方法,其最终目的都是将贷款者的信用级别分类。为达到分类目的。当前,对个人信用评分模型的定义有多种,较为权威的种观点认为:“信用评分是预测贷款申请人或现有借款人违约可能性的一种方法。”这一观点指出了信用评分的作用和目的,不过随着信用评分模型的不断发展,信用评分已不仅是一种统计方法,也包含了运筹学,如规划法、非线性模糊数学(如神经网络方法)等。此外,信用评分的实际操作应用也与决策原则紧密相关,决策原则事实上决定了信用评分模型实现其目的和作用的程度。因此,对个人信用评分模型这一数学工具在金融和业中的应用来说,较为全面和恰当的定义应是,“信用评分是运用数学优化理论(包括统计方法、运筹方法等),依照即定原则或策略(损失最小原则或风险溢价原则),在数据分析决策阶段区分不同违约率水平客户的方法。
二、各类信用评分模型概述
1.判别分析模型
判别分析法是对研究对象所属类别进行判别的一种统计分析方法。进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值。判别分析就是要从中筛选出能提供较多信息变量并建立判别函数,使推导出的判别函数对观测样本分类时的错判率最小。这种方法的理论基础是样本由两个分布有显著差异的子样本组成,并且它们拥有共同的属性。它起源于1936年Fisher引进的线性判别函数,这个函数的目的是寻找一个变量的组合,把两个拥有一些共同特征的组区分开来。
判别分析方法的优点:适用于二元或多元性目标变量,能够判断,区分个体应该属于多个不同小组中的哪一组。自身也存在不可避免的缺点:该模型假设前提是自变量的分布都是正态分布的,而实践中的数据往往不是完全的正态分布,从而导致统计结果的不可靠性。
2.决策树方法
决策树模型是对总体进行连续的分割,以预测一定目标变量的结果的统计技术。决策树构造的输入是一组带有类别标记的例子,构造的结果是一棵二叉或多叉树。构造决策树的方法是采用自上而下的递归构造。在实际中,为进行个人信用分析,选取个人信用作为目标属性,其他属性作为独立变量。所有客户被划分为两类,即好客户的和坏客户,将客户信用状况转换为“是否好客户”(值为1或0),而后利用数据集合来生成一个完整的决策树。在生成的决策树中可以建立一个规则基。一个规则基包含一组规则,每一条规则对应决策树的一条不同路径,这条路径代表它经过节点所表示的条件的一条链接。通过创立一个对原始祥本进行最佳分类判别的决策树,采用递归分割方法使期望误判损失达到最小。
决策树模型的优点:浅层的决策树视觉上非常直观,容易解释;对数据的结构和分布不需做任何假设;可以容易地转化成商业规则。它的缺点在于:深层的决策树视觉上和解释上都比较困难;决策树对样本量的需求比较大;决策树容易过分微调于样本数据而失去稳定性和抗震荡性。
3.回归分析法
回归分析法是目前为止应用最为广泛的一种信用评分模型, 这其中以著名的logistic回归为代表。除此之外, 线性回归分析、probit回归等方法亦属于此类。最早使用回归分析的Orgler,他采用线性回归模型制定了一个类似于信用卡的评分卡, 他的研究表明消费者行为特征比表资料更能够预测未来违约可能性的大小。同规划方法中一样, 假设已经通过一定的方法从样本变量中提取出了若干指标作为特征向量, 回归分析的思想就是将这些指标变量拟合成为一个可以预测申请者违约率的被解释变量, 自然就是违约率p,回归分析中应用最广泛的模型当属线性回归模型,它是对大量的数据点中表现出来的数量关系模拟出一条直线,回归分析的目标就是使目标变量值和实际的目标变量值之间的误差最小。因此最早将回归方法应用于信用评分研究的模型,就是简单的线性回归模型,目前基于logistic回归的信用评分系统应用最为普遍。
回归模型的优点:容易解释和使用;自变量可以是连续性的,也可以是类别性的;许多直观的指标来衡量模型的拟合度。缺点:不能有效处理缺失值,必须通过一定的数据加工和信息转换才能处理;模型往往呈线形关系,比较难把握数据中的非线形关系和变量间的互动关系,而且模型假定变量呈正态分布;模型受样本极端值的影响往往比较大。
4.人工神经网络法
近些年来, 随着信用评分领域的研究深入, 有学者将人工智能领域的一些模型算法引入到了信用评分研究中, 人工神经网络模型为典型代表。人工神经网络是由大量简单的基本元件——神经元相互连接而成的自适应非线性动态系统,是一种把各种投入要素通过复杂的网络转换成产出的信息加工结构。神经网络模型本质上所解决的问题仍是分类或者说模式识别问题, 但其原理却与其做方法迥然相异。人工神经网络有多种模型, 比如BP神经网络、RBF神经网络、Hopfield网络等。BP神经网络为目前研究最为成熟、算法最为稳定同时应用也最为广泛的一种神经网络模型。
神经网络模型的优点:有效地捕捉数据中非线性,非可加性的数量关系;适用于二元性,多元性和连续性的目标变量;能处理连续性和类别性的预测变量。缺点:基本上是一个黑箱方案,难以理解;如果不经过仔细控制,容易微调于样本数据,从而不具备充分的抗震荡性和稳定性。
三、结语
信用评分作为一种严谨的基于统计学等理论的决策手段, 正在逐渐被我国商业重视。信用评分系统的建设在我国属于起步阶段,应逐步建设适合我国特色的、高水平的信贷决策支持制度不但需要借鉴国外已有的理论研究成果和实践方案, 更需要我界的创新或结合我国本土数据的实证研究。
参考文献:
[2]郭敏华:信用评级.中国人民出版社,2004
[3]孙 薇:浅析信用风险评价方法.沿海企业与科技,2005