03. Clasificar a las empresas utilizando varios ratios a la vez con análisis discriminante

1) ¿Para qué sirve el análisis discriminante?

En el apartado anterior hemos analizado uno a uno los ratios, relacionándolos con la quiebra, es decir, hemos realizado un análisis univariante. A partir de ahora vamos a realizar análisis multivariantes, son técnicas que pueden tratar con un conjunto de variables simultáneamente. La técnica estadística multivariante más veterana en estos casos es el análisis discriminante lineal, desarrollado por Ronald Fisher en 1936. Otra técnica que puede utilizarse para el mismo objetivo es la regresión logística o los modelos de redes neuronales como el perceptrón multicapa. Otra técnica con un objetivo similar es support vector machine (SVM). En todos los casos nos interesa:

En el caso bidimensional se puede representar gráficamente la clasificación que realiza el análisis discriminante mediante la línea recta que mejor separa dos regiones. Lo vemos en el siguiente gráfico.

h

Edward Altman en 1968 utilizó esta capacidad del análisis discriminante para clasificar las empresas en dos grupos, empresas quebradas y no quebradas, según un indicador llamado Z que fuera mayor o menor que cero. Otros autores posteriormente han utilizado con éxito esta técnica en estudios de predicción de quiebra. Ha sido aplicada además en otro tipo de estudios como calificación de créditos o las emisiones de bonos. Incluso hay adaptaciones del modelo de Altman en app para móvil. En la imagen vemos un volcado de pantalla del móvil, en el que a partir de los datos financieros de una empresa obtenemos su puntuación crediticia y calificación. Muchos portales de información bursátil ofrecen el indicador Z-score de las empresas cotizadas, como Gurufocus.

h

Altman, E.I. (1968): "Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy", Journal of Finance, September 1968, pag 589-609.


3) Nuestro propio modelo de Altman

El análisis discriminante es una de las técnicas estadísticas multivariantes más utilizadas a la hora de diseñar modelos matemáticos para la predicción de la quiebra. Vamos a desarrollar nuestro propio modelo de Altman.
En el SPSS -> [ANALIZAR]-> [CLASIFICAR] -> [DISCRIMINANTE]

Al realizar esta prueba se obtienen nueve errores.

h

El porcentaje de casos clasificados correctamente es: 86,4%. Podemos ver, una a una, las predicciones del análisis discriminante:
 
Caso número Grupo real Grupo predicho Puntuación discriminante

1

0

0

-1,3022

2

0

0

-3,3064

3

0

0

-,8533

4

0

0

-,3340

5

0

0

-1,0205

6

0

0

-,5578

7

0

0

-1,1608

8

0

0

-,5718

9

0

0

-1,0636

10

0

0

-,6686

11

0

0

-1,4412

12

0

0

-2,2129

13

0

0

-,5564

14

0

0

-3,0156

15

0

0

-,6967

16

0

0

-1,9277

17

0

0

-3,6232

18

0

0

-1,6696

19

0

0

-,5601

20

0

0

-,2114

21

0

0

-1,8222

22

0

0

-1,1230

23

0

0

-,7108

24

0

0

-1,3936

25

0

0

-1,0803

26

0

0

-1,4448

27

0

0

-,4362

28

0

0

-,5712

29

0

0

-,2645

30

1

1

1,5440

31

1

1

2,3195

32

1**

0 ¡fallo!

-,4114

33

1

1

,6572

34

1

0 ¡fallo!

-,5596

35

1

1

,2666

36

1

1

,7774

37

1

1

2,7389

38

1

1

,2834

39

1

1

-,0463

40

1

1

,7266

41

1

0 ¡fallo!

-,2055

42

1

1

2,6525

43

1

1

,5113

44

1

1

1,3440

45

1

1

1,3452

46

1

1

,9265

47

1

1

2,3399

48

1

1

1,5492

49

1

1

2,3559

50

1

1

,5886

51

1

0 ¡fallo!

-,3275

52

1

1

,2813

53

1

0 ¡fallo!

-,5968

54

1

0 ¡fallo!

-1,2459

55

1

1

3,3703

56

1

1

,5145

57

1

1

1,2060

58

1

1

-,7006

59

1

1

1,0691

60

1

1

1,3616

61

1

1

,9192

62

1

1

1,6012

63

1

1

1,4219

64

1

1

2,1570

65

1

1

1,0712

66

1

1

1,7941

Cuidado: al utilizar toda la muestra disponible para obtener la función discriminante, los porcentajes de clasificación correcta son elevados, aunque no es un procedimiento válido debido a que todos los casos que nos sirven para el test han servido para obtener la función discriminante. Habitualmente este tipo de estudios se llevan a cabo dividiendo la muestra aleatoriamente en dos grupos del mismo tamaño. El primero se utiliza para extraer la función discriminante o entrenar la red neuronal. El segundo sirve como test. Otra posibilidad es aplicar el método jackknife, que a partir de las 66 empresas de la muestra original, obtiene 66 muestras con 65 empresas. La primera muestra se compone de todos los casos a excepción del primero, que sirve para realizar el test. La segunda está formada por todos los casos excepto el segundo, con el que haremos el test, y así sucesivamente.

Concretamente, al aplicar jackknife el análisis discriminante clasifica mal 9 empresas: la 20, 24, 32, 34, 41, 51, 53, 54 y 58. Aplicar jackknife ha servido para detectar dos empresas más que están mal clasificadas, la 20 y la 24.

aMejor con menos variables


El Principio de Parsimonia también se llama "navaja de Ockham" por Guillermo de Ockham, fraile franciscano inglés del siglo XIV, y hace referencia a un tipo de razonamiento basado en una premisa muy simple: en igualdad de condiciones la solución más sencilla es probablemente la correcta. El postulado se enuncia en latín como "Entia non sunt multiplicanda praeter necessitatem", que traducido hsupone que no ha de presumirse la existencia de más cosas que las absolutamente necesarias.

Si un árbol achicharrado está caído en tierra, podría ser debido a la caída de un rayo o debido a un programa secreto de armas del gobierno. La explicación más simple y suficiente es la lógica -mas no necesariamente la verdadera- según el principio de Ockham. En el caso de árbol, sería la caída del rayo.

En los modelos económicos también cabe plantearse sacrificar la capacidad predictiva si conseguimos un modelo con menos variables, fácil de explicar. Es decir, en vez de incluir todas las variables independientes juntas, podemos tratar de seleccionar un modelo sencillo, parsimonioso, que con un par de ratios sea casi tan bueno. Esto se debe hacer utilizando el buen juicio del especialista en la materia, si bien hay mecanismos que lo hacen de forma automática. En el análisis discriminante podemos usar la opción [Usar método de inclusión por pasos]. Lo que hace seleccionar una sola variable, la que tiene mayor poder explicativo, y luego va agregando más variables, hasta que la ganancia no compensa complicar el modelo.

No obstante, estos métodos automatizados presentan inconvenientes pues excluyen variables interesantes y a veces introducen otras redundantes. Hoy en día, existen métodos de selección de modelos más adecuados. Por ejemplo, el método LASSO (Least Absolute Shrinkage and Selection Operator) de Robert Tibshirani que aproxima a cero los coeficientes de las variables independientes, llegando a excluir algunos de ellos. Así se consiguen modelos que con pocas variables tienen un gran poder explicativo.

 

aAnálisis discriminante con los datos de los préstamos P2P


La base de datos de préstamos personales P2P de Lending Club contiene datos de clientes que van devolviendo el préstamo solictado y otros que no. La variable dependiente es LOAN_STATUS_FULLY_PAID (0 fracaso - 1 pagando). Las variables independientes continuas son:

No hay problema en utilizar variables independientes binarias, como el destino del préstamo y la vivienda.


EJERCICIO: Realiza un análisis discriminante. ¿Qué porcentaje de acierto has obtenido?

DatosP2P.sav h

 

 

aPractica con la base de datos de seguros


En la base de datos que contiene características de los clientes de una compañía de seguros y de sus automóviles, los clientes han sido clasificados en "buenos" y "malos" según hayan tenido o no accidentes.

EJERCICIO: ¿Qué variables son importantes? ¿Cuál es el porcentaje de acierto con el Análisis Discriminante? ¿Se te ocurre alguna variable más?

Seguros.sav h

 

 

aEl análisis discriminante es óptimo... pero


El análisis discriminante es óptimo, en el sentido literal de la palabra. Inmejorable... pero solo si se cumplen unas hipótesis de partida (que las variables sigan una distribución normal multivariante, que no haya correlación elevada entre las variables, que las matrices de covarianzas dentro de cada grupo sean iguales...). Raramente se cumplen estos requisitos cuando usamos información financiera, por ello veremos técnicas que suelen dar mejor resultado y obtener mejores porcentajes de acierto. Puedes ampliar información sobre el Análisis Discriminante en este tutorial que realiza un análisis discriminante con una hoja de cálculo.

 

 

© Citar como: Serrano Cinca C. (