En el apartado anterior hemos analizado uno a uno los ratios, relacionándolos con la quiebra, es decir, hemos realizado un análisis univariante. A partir de ahora vamos a realizar análisis multivariantes, son técnicas que pueden tratar con un conjunto de variables simultáneamente. La técnica estadística multivariante más veterana en estos casos es el análisis discriminante lineal, desarrollado por Ronald Fisher en 1936. Otra técnica que puede utilizarse para el mismo objetivo es la regresión logística o los modelos de redes neuronales como el perceptrón multicapa. Otra técnica con un objetivo similar es support vector machine (SVM). En todos los casos nos interesa:
a) Conocer de qué variables financieras depende el que las empresas quiebren
b) Predecir si una nueva empresa se clasifica como potencialmente quebrada o solvente
En el caso bidimensional se puede representar gráficamente la clasificación que realiza el análisis discriminante mediante la línea recta que mejor separa dos regiones. Lo vemos en el siguiente gráfico.
Edward Altman en 1968 utilizó esta capacidad del análisis discriminante para clasificar las empresas en dos grupos, empresas quebradas y no quebradas, según un indicador llamado Z que fuera mayor o menor que cero. Otros autores posteriormente han utilizado con éxito esta técnica en estudios de predicción de quiebra. Ha sido aplicada además en otro tipo de estudios como calificación de créditos o las emisiones de bonos. Incluso hay adaptaciones del modelo de Altman en app para móvil. En la imagen vemos un volcado de pantalla del móvil, en el que a partir de los datos financieros de una empresa obtenemos su puntuación crediticia y calificación. Muchos portales de información bursátil ofrecen el indicador Z-score de las empresas cotizadas, como Gurufocus.
Altman, E.I. (1968): "Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy", Journal of Finance, September 1968, pag 589-609.
El análisis discriminante es una de las técnicas estadísticas multivariantes más utilizadas a la hora de diseñar modelos matemáticos para la predicción de la quiebra. Vamos a desarrollar nuestro propio modelo de Altman.
En el SPSS -> [ANALIZAR]-> [CLASIFICAR] -> [DISCRIMINANTE]
![]()
Al realizar esta prueba se obtienen nueve errores.
- El error tipo I son los 4 bancos realmente quebrados que fueron clasificados como solventes (lo peor). Son "lobos con piel de cordero".
- El error tipo II son los 5 bancos solventes que fueron clasificados como quebrados (no tan malo, perdemos el coste de oportunidad). Parecen "malotes" pero en el fondo son buenos.
- Altman encontró que el error tipo I es 35 veces más caro que el error tipo II en el caso de quiebras de empresas.
El porcentaje de casos clasificados correctamente es: 86,4%. Podemos ver, una a una, las predicciones del análisis discriminante:
Caso número Grupo real Grupo predicho Puntuación discriminante
1 0
0
-1,3022
2 0
0
-3,3064
3 0
0
-,8533
4 0
0
-,3340
5 0
0
-1,0205
6 0
0
-,5578
7 0
0
-1,1608
8 0
0
-,5718
9 0
0
-1,0636
10 0
0
-,6686
11 0
0
-1,4412
12 0
0
-2,2129
13 0
0
-,5564
14 0
0
-3,0156
15 0
0
-,6967
16 0
0
-1,9277
17 0
0
-3,6232
18 0
0
-1,6696
19 0
0
-,5601
20 0
0
-,2114
21 0
0
-1,8222
22 0
0
-1,1230
23 0
0
-,7108
24 0
0
-1,3936
25 0
0
-1,0803
26 0
0
-1,4448
27 0
0
-,4362
28 0
0
-,5712
29 0
0
-,2645
30 1
1
1,5440
31 1
1
2,3195
32 1**
0 ¡fallo!
-,4114
33 1
1
,6572
34 1
0 ¡fallo!
-,5596
35 1
1
,2666
36 1
1
,7774
37 1
1
2,7389
38 1
1
,2834
39 1
1
-,0463
40 1
1
,7266
41 1
0 ¡fallo!
-,2055
42 1
1
2,6525
43 1
1
,5113
44 1
1
1,3440
45 1
1
1,3452
46 1
1
,9265
47 1
1
2,3399
48 1
1
1,5492
49 1
1
2,3559
50 1
1
,5886
51 1
0 ¡fallo!
-,3275
52 1
1
,2813
53 1
0 ¡fallo!
-,5968
54 1
0 ¡fallo!
-1,2459
55 1
1
3,3703
56 1
1
,5145
57 1
1
1,2060
58 1
1
-,7006
59 1
1
1,0691
60 1
1
1,3616
61 1
1
,9192
62 1
1
1,6012
63 1
1
1,4219
64 1
1
2,1570
65 1
1
1,0712
66 1
1
1,7941
Cuidado: al utilizar toda la muestra disponible para obtener la función discriminante, los porcentajes de clasificación correcta son elevados, aunque no es un procedimiento válido debido a que todos los casos que nos sirven para el test han servido para obtener la función discriminante. Habitualmente este tipo de estudios se llevan a cabo dividiendo la muestra aleatoriamente en dos grupos del mismo tamaño. El primero se utiliza para extraer la función discriminante o entrenar la red neuronal. El segundo sirve como test. Otra posibilidad es aplicar el método jackknife, que a partir de las 66 empresas de la muestra original, obtiene 66 muestras con 65 empresas. La primera muestra se compone de todos los casos a excepción del primero, que sirve para realizar el test. La segunda está formada por todos los casos excepto el segundo, con el que haremos el test, y así sucesivamente.
Concretamente, al aplicar jackknife el análisis discriminante clasifica mal 9 empresas: la 20, 24, 32, 34, 41, 51, 53, 54 y 58. Aplicar jackknife ha servido para detectar dos empresas más que están mal clasificadas, la 20 y la 24.
El Principio de Parsimonia también se llama "navaja de Ockham" por Guillermo de Ockham, fraile
franciscano inglés del siglo XIV, y hace referencia a un
tipo de razonamiento basado en una premisa muy simple: en
igualdad de condiciones la solución más sencilla
es probablemente la correcta. El postulado se enuncia en
latín como "Entia non sunt multiplicanda praeter
necessitatem", que traducido supone que no ha de presumirse
la existencia de más cosas que las absolutamente necesarias.
Si un árbol achicharrado está caído en tierra, podría ser debido a la caída de un rayo o debido a un programa secreto de armas del gobierno. La explicación más simple y suficiente es la lógica -mas no necesariamente la verdadera- según el principio de Ockham. En el caso de árbol, sería la caída del rayo.
En los modelos económicos también cabe plantearse sacrificar la capacidad predictiva si conseguimos un modelo con menos variables, fácil de explicar. Es decir, en vez de incluir todas las variables independientes juntas, podemos tratar de seleccionar un modelo sencillo, parsimonioso, que con un par de ratios sea casi tan bueno. Esto se debe hacer utilizando el buen juicio del especialista en la materia, si bien hay mecanismos que lo hacen de forma automática. En el análisis discriminante podemos usar la opción [Usar método de inclusión por pasos]. Lo que hace seleccionar una sola variable, la que tiene mayor poder explicativo, y luego va agregando más variables, hasta que la ganancia no compensa complicar el modelo.
No obstante, estos métodos automatizados presentan inconvenientes pues excluyen variables interesantes y a veces introducen otras redundantes. Hoy en día, existen métodos de selección de modelos más adecuados. Por ejemplo, el método LASSO (Least Absolute Shrinkage and Selection Operator) de Robert Tibshirani que aproxima a cero los coeficientes de las variables independientes, llegando a excluir algunos de ellos. Así se consiguen modelos que con pocas variables tienen un gran poder explicativo.
La base de datos de préstamos personales P2P de Lending Club contiene datos de clientes que van devolviendo el préstamo solictado y otros que no. La variable dependiente es LOAN_STATUS_FULLY_PAID (0 fracaso - 1 pagando). Las variables independientes continuas son:
No hay problema en utilizar variables independientes binarias, como el destino del préstamo y la vivienda.
EJERCICIO: Realiza un análisis discriminante. ¿Qué porcentaje de acierto has obtenido?
EJERCICIO: ¿Qué variables son importantes? ¿Cuál es el porcentaje de acierto con el Análisis Discriminante? ¿Se te ocurre alguna variable más?
El análisis discriminante es óptimo, en el sentido literal de la palabra. Inmejorable... pero solo si se cumplen unas hipótesis de partida (que las variables sigan una distribución normal multivariante, que no haya correlación elevada entre las variables, que las matrices de covarianzas dentro de cada grupo sean iguales...). Raramente se cumplen estos requisitos cuando usamos información financiera, por ello veremos técnicas que suelen dar mejor resultado y obtener mejores porcentajes de acierto. Puedes ampliar información sobre el Análisis Discriminante en este tutorial que realiza un análisis discriminante con una hoja de cálculo.