Aplicación de árboles de decisión en modelos de riesgo crediticio

Aplicación de árboles de decisión en modelos de riesgo crediticio - Page 1
Aplicación de árboles de decisión en modelos de riesgo crediticio - Page 2
Aplicación de árboles de decisión en modelos de riesgo crediticio - Page 3
Aplicación de árboles de decisión en modelos de riesgo crediticio - Page 4
Aplicación de árboles de decisión en modelos de riesgo crediticio - Page 5

Esto es sólo una vista previa del documento.

Descargar el documento original para ver más páginas

Descargar

1 de 13

Aplicaci´ on de ´ arboles de decisi´ on en modelos de


Documentos relacionados


Subject: Transcripciones

Revista Colombiana de Estad́ıstica
Volumen 27 No 2. Págs. 139 a 151. Diciembre 2004
Aplicación de árboles de decisión en modelos de
riesgo crediticio
Paola Andrea Cardona Hernández *
Resumen
En este art́ıculo se presentan algunos puntos generales del marco teórico
de los riesgos a los que se enfrenta una institución financiera, su clasi-
ficación y definición, centrándose espećıficamente en el riesgo crediticio,
para el que se presenta el marco legal: los enunciados básicos del Acuerdo
de Basilea II y la reglamentación del sistema de administración de riesgo
crediticio de la Superintendencia Bancaria en Colombia. Dentro de este
marco, se ilustrará cómo la estad́ıstica juega un papel importante en el
cumplimiento de esta normatividad. Espećıficamente se presenta la uti-
lización de los árboles de decisión como herramienta para el cálculo de
probabilidades de incumplimiento en crédito, mostrando sus ventajas y
desventajas.
Palabras Claves: Teoŕıa de riesgo, Riesgo crediticio, árboles de decisión.
Abstract
This paper presents some general concepts in risk theory, and especially
in credit risk, where statistics plays a central role. The text emphasizes
on decision trees as a very usefull tool in the calculus of probabilities
related to credit risk.
Keywords: Risk theory, Credit risk, Decision trees.
*Estad́ıstica. Profesional de Modelos, Análisis de Portafolio, Banco Colpatria Red Multi-
banca. Email: cardonp@banco.colpatria.com.co.
139
140 Paola A. Cardona H.
1. Introducción
Por esencia, la actividad de una entidad financiera es la toma de riesgos,
cada una de sus operaciones contiene impĺıcita o expĺıcitamente la incertidum-
bre. Desde las distintas dimensiones de su operación está expuesta a diferentes
tipos de riesgo que deben ser identificados, medidos y controlados, como base
para fijar las estrategias de mercadeo y especialmente de precios, que resulten
en una ecuación favorable entre el riesgo asumido y la recompensa obtenida,
medida como la rentabilidad neta del negocio.
Esta importante relación ha hecho que en los últimos años las instituciones
financieras, hayan dado un vuelco en su forma de gestionar el riesgo, al evolu-
cionar de procesos emṕıricos a metodoloǵıas apoyadas en procesos estad́ısticos.
Técnicamente la valoración del riesgo mide el grado de variación de los resul-
tados financieros de una empresa frente a los estimados. Sin importar que sean
a favor o en contra, entre más volátiles sean los resultados, más riesgo verá un
accionista, pues no tiene la certeza de obtener los resultados presupuestados.
Muchos elementos pueden incidir en los resultados de una empresa, deri-
vados de su gestión de riesgo: los criterios de aceptación de los créditos, la
posterior administración, el estudio de la tendencia de los portafolios y los
virajes de poĺıtica con base en ellos, entre muchos otros. El resultado estará in-
fluenciado tanto por factores internos de la empresa, como por factores externos
que pueden provenir de los mercados financieros, como tasas de interés, tasas
de cambio o precios, o de variables macroeconómicas como inflación, tasa de
desempleo, etc.
Un buen entendimiento de los conceptos de riesgo, permite a los adminis-
tradores planear adecuadamente la forma de anticiparse a posibles resultados
adversos y sus consecuencias y, de este modo, prepararse para enfrentar la
incertidumbre sobre las variables que puedan afectar dichos resultados.
Dentro del análisis de riesgo se deben identificar las principales fuentes de
exposición, desde el enfoque de los activos financieros se tiene la información
presentada en la Figura 1:
2. Definiciones
Se definen los tipos de riesgo mencionados anteriormente1:
1 Caṕıtulo VI de la Circular Externa 100 de 1995 - Circular Básica Financiera, Contable y
de Remisión de información de la Superintendencia Bancaria. Circular Externa 011 de 2002.
Aplicación de árboles de decisión en modelos de riesgo crediticio 141
Gráfica 1: Riesgo en las operaciones activas del balance.
Riesgo de liquidez: es la posibilidad de que una institución financiera no
pueda cumplir un compromiso financiero con un cliente o mercado en algún
lugar, moneda o momento determinado. Las exposiciones de liquidez pueden
surgir de las actividades de “trading” relacionados con productos o mercados
espećıficos; y de las actividades relacionadas con la obtención de fondos para la
entidad. El primero es un riesgo en el cual no se puede deshacer una posición
determinada al precio o cerca del precio del mercado, debido a la poca pro-
fundidad o desórdenes del mismo. El segundo es el riesgo de no poder cumplir
con las obligaciones de pago en la fecha de cancelación y surgen principalmen-
te del desfase de activos, pasivos, y madurez de contratos de los compromisos
adquiridos.
Riesgo legal: es la contingencia de pérdida derivada de situaciones de orden
legal, que puedan afectar la titularidad de las inversiones o la efectiva recupe-
ración de su valor, que los contratos no sean legalmente aplicables o no estén
correctamente documentados, ó variaciones de orden normativo que impliquen
cambio en las reglas de juego impuestas por el regulador.
Modifica el Caṕıtulo II de la Circular Externa No. 100 de 1995, Referente a la gestión del
riesgo de crédito. Resolución 200/1995 - Capitulo V, Evaluación de los riesgos de solvencia y
juŕıdicos. Circular Externa 100/1995, Caṕıtulo XIII, Superintendencia Bancaria de Colombia.
142 Paola A. Cardona H.
Riesgo operativo: es la posibilidad de pérdida como resultado de deficien-
cias a causa de fallas en los sistemas de información, fallas en procesos, control
de atribuciones y cupos en tiempo real, errores humanos, mala fe de los fun-
cionarios y fallas en el control gerencial.
Riesgo de mercado: el riesgo de mercado o precio es la contingencia de
pérdida o ganancia de una posición de la entidad financiera, como resultado de
un cambio en el nivel o la volatilidad de las tasas de interés, tasas de cambio o
precios.
Riesgo de contraparte: es la posibilidad de incumplimiento de las obliga-
ciones contractuales entre la entidad financiera y el sector real o financiero. Se
genera entre otros por incumplimiento en la entrega de documentos, ignorancia
de los acuerdos de neteo para la liquidación de los contratos de derivados y
problemas operativos o resolución de los mismos.
Riesgo de crédito: es la posibilidad de que una entidad incurra en pérdidas
y se disminuya el valor de sus activos como consecuencia de que sus deudores
fallen en el cumplimiento oportuno o cumplan imperfectamente los términos
contractuales acordados.
Cada uno de estos tipos de riesgo tiene sus métodos y formas de medición,
algunos estad́ısticos, como el caso de riesgo de mercado en el que se usa la
metodoloǵıa value at risk–var (Jorion 1997), o riesgo de crédito con el uso de
modelos estad́ısticos para predecir probabilidades de incumplimiento. En otros
casos como el riesgo legal, la forma de controlarlos es más de procedimientos
y gestión gerencial y el riesgo de contraparte en el que se hace una exhaustivo
análisis financiero.
Este documento se centra en los modelos para la medición y control del
riesgo de crédito.
3. Riesgo de crédito
La necesidad de medir el riesgo y promover que las instituciones financieras
hagan una correcta evaluación de ellos ha sido un esfuerzo de todos los bancos
a nivel mundial. El comité de supervisión bancaria de Basilea2, ha sido pre-
2 Establecido por los bancos centrales del grupo de los 10, a finales de 1974 cuyos miem-
bros son: Bélgica, Canadá, Francia, Alemania, Italia, Japón, Luxemburgo, Holanda, España,
Aplicación de árboles de decisión en modelos de riesgo crediticio 143
cursor de la reglamentación de la medición integral de riesgos y el adecuado
provisionamiento de capitales, para sobrellevar los posibles riesgos incurridos
y evitar la quiebra de las instituciones financieras. Este comité no posee una
autoridad de supervisión supranacional y sus conclusiones no son mandatorias,
sin embargo formula estándares de supervisión internacional y da gúıas de las
mejores prácticas del mercado. Se aspira que todos los bancos activos interna-
cionalmente apliquen las nuevas recomendaciones consignadas en el acuerdo de
capitales (Basilea I – 1988) y el nuevo acuerdo de capitales (Basilea II–1999)
que definen el capital mı́nimo que deben tener las entidades financieras para
poder operar, relacionando el riesgo de los activos con el nivel y calidad del
patrimonio, además, determina el capital mı́nimo necesario para que un banco
haga frente a posibles quebrantos debido a los riesgos que maneja.
Aśı mismo, siguiendo la tendencia mundial, en Colombia la Superintenden-
cia Bancaria reglamenta la creación del sistema de administración de riesgo
crediticio SARC, para las entidades financieras bajo su vigilancia. Mediante la
Carta Circular 31 de 2002 y la Circular externa 11 de 2002, se definen los linea-
mientos básicos que las entidades colombianas deben implementar para la me-
dición de riesgos. Aśı, el sistema de administración del riesgo crediticio (SARC)
en una entidad financiera debe contar al menos con los siguientes componentes
básicos: unas poĺıticas claras de administración de riesgos, una estructura orga-
nizacional adecuada, unas metodoloǵıas y procesos apropiados para la gestión
de riesgos, una infraestructura y capital humano idóneos, aśı como un proceso
de auditoria general (Carta circular 31 de 2002).
Dentro de este proceso de medición de riesgo crediticio, se contempla la
utilización de una metodoloǵıa interna para el cálculo de la probabilidad de
deterioro de cada crédito y la estimación o cuantificación de la pérdida esperada
si el deudor llegara a incumplimiento.
4. Pérdida esperada y probabilidad de
incumplimiento
Ya se definió el riesgo de crédito como la pérdida potencial debida a la inca-
pacidad de la contraparte de cumplir sus obligaciones, esto lleva a la necesidad
de cuantificar dicha pérdida. La pérdida esperada puede definirse entonces como
el monto de capital que podŕıa perder una institución como resultado de la ex-
posición crediticia en un horizonte de tiempo dado (Wilson & Press 1978). De
este modo, una definición importante para calcular la pérdida esperada es la de
Suecia, Suiza, Reino Unido y Estados Unidos.
144 Paola A. Cardona H.
incumplimiento y basada en ésta, calcular la probabilidad que un cliente tenga
esta condición. Se define el incumplimiento de un cliente cuando este alcanza
una altura de mora m, en la que el banco asume la pérdida del capital.
Aśı, la pérdida esperada se calcula como:
PE = PI ∗ S ∗ E, donde,
PI: Probabilidad de incumplimiento para el peŕıodo dado.
S: Severidad: es el porcentaje de la cantidad expuesta que la
entidad pierde si los deudores incumplen sus obligaciones.
E: Exposición: es el monto de los activos expuestos al
incumplimiento en el peŕıodo definido.
Usando esta definición, las pérdidas esperadas aumentan en función del
monto del crédito o exposición crediticia y de la probabilidad de deterioro
asignada a cada activo. Las pérdidas serán menores cuanto más baja sea la
severidad. Las provisiones de capital se basan en el resultado obtenido de esta
ecuación y son precisamente las reglamentadas por la Superintendencia Ban-
caria en las circulares mencionadas anteriormente.
Para el cálculo de la probabilidad de incumplimiento, existen diferentes me-
todoloǵıas estad́ısticas con las que es posible predecir, según las caracteŕısticas
del cliente, la probabilidad de llegar a la altura de mora definida previamen-
te como incumplimiento, en un peŕıodo dado. Entre estas metodoloǵıas están
análisis discriminante, regresión loǵıstica, análisis probit, redes neuronales, ma-
trices de transición y árboles de decisión, que son las más comúnmente usadas
en el sector financiero.
En este art́ıculo se presenta espećıficamente el uso de árboles de decisión
como herramienta para el cálculo de probabilidades de incumplimiento, por
cuanto representa un método efectivo para la estimación, al igual que la mayoŕıa
de los métodos alternativos, pero ofrece una ventaja fundamental al ser un
método de fácil entendimiento para personas que no cuentan con conocimientos
avanzados de estad́ıstica. Un mismo modelo permite hacer diferentes usos, como
mantenimiento de clientes considerados como buenos (probabilidades bajas de
incumplimiento), cobranza proactiva y discriminada por nivel de riesgo para
los clientes considerados como malos o con probabilidades altas de llegar a
incumplimiento.
Aplicación de árboles de decisión en modelos de riesgo crediticio 145
5. Modelos estad́ısticos para predecir
probabilidades de incumplimiento
Se definen dos tipos de modelos para predecir la probabilidad de incum-
plimiento: el primero de iniciación, con el que se controla el primer ciclo de
crédito, el de otorgamiento. Aśı, usando las variables de la solicitud de crédito
se trata de predecir, para cada perfil o segmento identificado, la probabilidad
de que un año después del otorgamiento del crédito, el cliente alcance la altura
de mora definida como incumplimiento.
El segundo tipo de modelo es el de comportamiento, con el que se controla
el proceso durante la maduración del crédito. Este tipo de modelo se calcula
en el mes t y se basa en el comportamiento de pagos del cliente x meses atrás
desde el tiempo t, (t− x, usualmente x = 12) para determinar su probabilidad
de deterioro y que llegue a incumplimiento un año adelante (t + 12) .
Se define entonces la variable respuesta Y para cualquier tipo de modelo:
1 Si el cliente ha alcanzado altura de mora en el peŕıodo t + 12,
0 Si el cliente no ha alcanzado altura de mora M en el peŕıodo t + 12.
en el caso de iniciación t = 0.
Se debe aclarar que la definición de los peŕıodos de tiempo evaluados no es
estándar pero śı es la más comúnmente utilizada.
Los modelos son calculados por tipo de producto dentro del portafolio de
crédito de la entidad financiera, supeditado a la información histórica disponible
y a su calidad.
Aśı, se usan árboles de decisión binarios, método no paramétrico que no
requiere supuestos distribucionales, permite detectar interacciones, modela re-
laciones no lineales y no es sensible a la presencia de datos faltantes y outliers
((Breiman, Friedman, Olshen & Stone 1984), (Kass 1980)). Su principio básico
es generar particiones recursivas por reglas de clasificación hasta llegar a una
clasificación final, tal que es posible identificar perfiles (nodos terminales) en
los que la proporción de clientes malos es muy alta (o baja) y de esta forma
asignar su probabilidad.
Para los árboles de decisión, existen diferentes metodoloǵıas, entre ellas
Cart, Chaid, Chaid exhaustivo, Quest, C4.5, que difieren en la forma de asig-
nación, las reglas de partición y los criterios de parada. Cualquiera de ellos
generará n nodos terminales y una escala de probabilidades con n posibles va-
lores, que es el resultado final y la probabilidad empleada tanto para validar
146 Paola A. Cardona H.
Gráfica 2: Esquema de la definición de variables.
el modelo, como para el cálculo de la pérdida esperada, mencionada anterior-
mente.
El siguiente gráfico muestra un ejemplo de árbol de decisión para el caso de
modelos de iniciación, con 6 nodos terminales, es decir una escala de probabili-
dades de 6 categoŕıas (cada probabilidad asociada a un nodo), que finalmente
permite identificar 6 perfiles de riesgo, con los que se tomaŕıan decisiones de
otorgamiento de crédito.
Las premisas básicas para la construcción del modelo son la simplicidad,
potencia y estabilidad. La simplicidad es un factor relevante, en cuánto es muy
importante para una entidad que cualquier persona de diferentes instancias,
sea capaz de comprender y entender por qué el modelo funciona y qué es lo que
está prediciendo. La potencia, medida en su capacidad de discriminar correc-
tamente los clientes buenos, de los clientes malos. Y estabilidad, que el modelo
a través del tiempo conserve su capacidad de discriminación y pueda detectar
los cambios en la calidad de la cartera.
Algunas medidas de capacidad de discriminación empleadas son la prueba
de bondad de ajuste de Kolmogorov-Smirnov para 2 muestras (K−S), la curva
ROC (Receive Operative Curve), el coeficiente Gini y la prueba F . De igual
Aplicación de árboles de decisión en modelos de riesgo crediticio 147
Gráfica 3: Ejemplo de árbol de decisión para iniciación.
148 Paola A. Cardona H.
manera se evalúa la distribución de la población, la proporción de malos en cada
nodo y el número de malos por cada bueno, mejor conocido como “odds to be
good”, como se presenta en la siguiente gráfica: La capacidad de predicción
Gráfica 4: Ejemplos de medición de potencia de un modelo.
(K − S y área bajo la curva ROC), de los árboles de decisión es comparable
con la obtenida en una regresión loǵıstica3 con la ventaja de la facilidad de
entendimiento. Sin embargo un factor que puede estar en contra de los árboles
de decisión es que no es posible cuantificar la magnitud con la que una variable
aporta para la predicción del incumplimiento.
En cuanto a la estabilidad de los modelos, cada una de las medidas men-
cionadas anteriormente es calculada con una periodicidad mensual y de esta
manera es posible monitorear el desempeño del modelo medido en términos de
capacidad de discriminación. Adicionalmente se verifica que no haya cambios
3 Ver “Comparación entre regresión loǵıstica y árboles de decisión en modelos de riesgo
crediticio para el Banco Colpatria”. Almanza D., Cardona P., Rodŕıguez N. (2004). Trabajo
de Grado para optar al t́ıtulo de estad́ıstica, Universidad Nacional de Colombia, Sede Bogotá.
Aplicación de árboles de decisión en modelos de riesgo crediticio 149
dramáticos en las probabilidades asignadas a cada nodo terminal. Cabe resal-
Gráfica 5: Ejemplos de medición de estabilidad de un modelo.
tar que otro de los cálculos indispensables para la pérdida esperada es el de
la severidad, en el que también es necesario emplear herramientas estad́ısticas
para estudiar el comportamiento histórico de las pérdidas netas de los clientes
que se han siniestrado en la cartera estudiada y asumir un comportamiento
futuro. Aśı, empleando las probabilidades obtenidas de los árboles de decisión
y la severidad, se calcula el valor de la pérdida esperada con la cuál se realiza la
provisión tal como lo reglamenta la Superintendencia Bancaria. Históricamen-
te en Colombia se hacia provisión únicamente sobre los clientes que ya teńıan
algún grado de morosidad, pero con la aplicación de las nuevas técnicas es-
tad́ısticas se está empezando a hacer una provisión sobre clientes que estando
al d́ıa en sus pagos pueden tener una probabilidad considerable de incurrir en
moras hacia futuro.
150 Paola A. Cardona H.
6. Conclusión
Los árboles de decisión se presentan como una herramienta efectiva para la
predicción de probabilidades de incumplimiento, no solo a nivel de capacidad
de discriminación (potencia), estabilidad a través del tiempo, sino como una
herramienta de fácil entendimiento que permite potencializar sus usos y servir
además de la predicción, para la planeación de estrategias comerciales de venta
de servicios, estrategias de cobranza entre muchas otras.
La importancia de tener un modelo de cálculo de probabilidad de incumpli-
miento confiable y con una alta capacidad de discriminación radica en que esta
impacta considerablemente el cálculo de provisiones, afectando directamente el
balance y las utilidades que podŕıa llegar a tener la entidad. Adicionalmente
como los modelos son empleados para otorgamiento de créditos, mantenimiento
de cuentas, hacen parte fundamental de la gestión integral de riesgo, por tanto
un cálculo u operación inapropiada podŕıa llevar a una institución financiera a
situaciones de insolvencia.
Nota: Las opiniones y los errores eventuales son responsabilidad exclusiva del
autor y sus contenidos no comprometen al Banco Colpatria Red Multibanca.
Bibliograf́ıa
Araya, R. (1994), Induction of Decision Trees when Examples are Described
with Noisy Measurements and with Fuzzy Class Membership.
Breiman, L., Friedman, J., Olshen, R. & Stone, C. (1984), Classification and
Regression Trees, Wadsworth. Belmont.
Comite, B. (2001a), Carta circular 31 de 2001, Technical report, Superinten-
dencia Bancaria de Colombia.
Comite, B. (2001b), Circular externa 011 de 2001, Technical report, Superin-
tendencia Bancaria de Colombia.
Committee, B. (1999), Credit risk modeling current practices and applications,
Technical report, Basle Committee on Banking Supervision. Basle Swit-
zerland.
Committee, B. (2000), Principles for the management of credit risk, Technical
report, Basle Committee on Banking Supervision. Basle Switzerland.
Aplicación de árboles de decisión en modelos de riesgo crediticio 151
Elizondo, A. (2003), Medición integral del riesgo, Limusa Noriega Editores.
Joos, P., Vanhoof, K., Ooghe, H. & Sierens, N. (1998), Credit classification:
a comparison of logit models and decision trees. Faculteit Economie en
Bedrijfskunde.
Kass, G. V. (1980), ‘An exploratory technique for investigating large quantities
of categorical data’, Applied Statistics 29.
Mays, E. (2001), Handbook of Credit Scoring, The Glenlake Publishing Com-
pany Ltda.
Ong, M. (1999), Internal Credit Risk Models, Risk Books.
Wilson, S. & Press, S. J. (1978), ‘Choosing between logistic regression and
discriminant analysis’, American Statistical Association 73, 699–705.

© 2016 - 2017 Docmia. Todos los derechos reservados.