Redes neuronales y escalas multidimensionales

IV Obtener una representación gráfica que sintetice un amplio conjunto de datos con escalas multidimensionales

1) ¿Qué hacen?

Medir la distancia que hay entre una serie de puntos en un mapa es sencillo: basta con utilizar una regla. Posteriormente se confecciona una tabla de distancias, como las que usan los automovilistas. Pero, ¿y el proceso contrario?, es decir a partir de dicha tabla de distancias ¿cómo podríamos representar gráficamente los puntos en un mapa?. Ese es el objetivo de las escalas multidimensionales.


2)
¿Para qué sirven?

Sus aplicaciones son variadas: el tratamiento de encuestas que utilizan análisis de juicios de similaridad por parejas emitidos por un conjunto de sujetos, las percepciones que un grupo de usuarios tienen de productos de diferentes compañías,...


3)
Veamos un ejemplo de funcionamiento

La siguiente base de datos en excel es una tabla con la distancia entre ciudades europeas: ciudades.xls ciudades.zip o ciudades.exe.

La siguiente figura muestra un mapa de Europa, con las principales capitales:

Figura: Mapa de Europa

A partir de dicho mapa sería sencillo con una regla obtener las distancias entre las capitales y obtener una tabla como la siguiente:

Figura: Tabla con las distancias entre ciudades de Europa

Pero ¿y el proceso contrario?. Es decir dada la tabla obtener el mapa. Eso es mucho más difícil "a mano" y de ello se encarga el algoritmo del modelo de escalas multidimensionales.

Al aplicar las escalas multidimensionales obtuvimos el siguiente mapa:

Figura: Recomposición del mapa de Europa mediante las escalas multidimensionales

Que se parece bastante al mapa real de Europa. Las diferencias se explican porque hamos tomado la distancia por carretera.


4)
Utilidad en el análisis contable

Esta capacidad del escalado multidimensional de representar distancias en un mapa es muy atractiva para analizar la información financiera.

Estudiando la información que suministran los estados contables de las empresas podemos extraer una serie de ratios. No es difícil establecer una medida de similaridad entre las empresas según los valores de estos ratios y después mediante las escalas multidimensionales, representarlas en un plano, de forma que las empresas con ratios similares aparezcan próximas en el mapa.

Lo que estamos haciendo es reducir un gran volumen de datos en información útil para la toma de decisiones. Usualmente aparecerán una serie de dimensiones que se plasman en mapas sencillos de interpretar.


5)
Aplicación al caso de la quiebra

En la figura vemos la ubicación en el mapa multidimensional de las empresas quebradas -de la 1 a la 29- y solventes -de la 30 a la 66-. Claramente observamos que se ha producido un agrupamiento de las empresas solventes a la izquierda del mapa y de las empresas insolventes a la derecha del mismo.

Figura: Mapa obtenido al aplicar las escalas multidimensionales a los datos de empresas quebradas y solventes


6)
¿Cómo se trabaja con las escalas multidimensionales?

Para obtener el mapa anterior hemos tenido que hacer varias cosas:

a) Si los datos son distancias se trabaja con ellos, en otro caso se estandarizan y es necesario elegir la medida de distancia apropiada. Normalmente, se elige la distancia euclídea. La estandarización más habitual supone media cero y varianza uno.

b) A continuación se calcula el número de dimensiones, comprobando que el ajuste sea bueno. Cuanto más dimensiones mejor es el ajuste pero es más difícil de interpretar, así que se trata de buscar un compromiso.

¿Es bueno el ajuste?
Función de Stress. Se realiza el escalado multidimensional suponiendo un número de dimensiones igual a dos, y se calcula la función de stress. Si el valor es inferior a un cierto límite se acepta como válido que ese número de dimensiones es capaz de representar correctamente el problema. Si no, se calcula el escalado multidimensional con tres dimensiones, reiterando el proceso hasta hallar el número óptimo.

c) Se obtienen los mapas. Se visualiza la primera dimensión frente a la segunda, la primera frente a la tercera, etc. ...y a interpretar los resultados.


7)
Interpretación de los resultados

En el ejemplo de las ciudades no es difícil interpretar las dos dimensiones o ejes del gráfico. Se corresponden con la longitud y latitud de las ciudades. Hay que señalar que el gráfico bien pudo haber aparecido invertido, ya que sólo se garantiza que las distancias se conservan, no la orientación del mapa.

En otras ocasiones no será tan sencillo interpretar los ejes, por lo que es conveniente realizar una técnica conocida con el nombre de análisis profit o ajuste de propiedades que ayuda a interpretar qué son las dimensiones que aparecen en el estudio. Es una técnica estadística basada en el cálculo de regresiones, que hemos aplicado utilizando el programa SPSS.

Para ello se toman como variables independientes los valores de de las dimensiones y como variable dependiente cada uno de los nueve ratios. Como se observa en la figura los ratios 5, 6, 7 y 9 son casi paralelos al eje de las X, -primera dimensión- que asociamos a la rentabilidad de la empresa. El eje de las Y -la segunda dimensión-, se explica a partir de los ratios 1, 2 y 3, ratios de liquidez.

Figura: Análisis profit, que ayuda a interpretar los resultados

Otra posibilidad interesante para interpretar los resultados es superponer al mapa los resultados del análisis de conglomerados, como veremos luego.


8)
Opinión

Técnicas multivariantes como las escalas multidimensionales son menos exigentes en cuanto a las hipótesis de partida que la mayoría de las técnicas estadísticas, mucho más intuitivas y fácil de aplicar que otras técnicas y están siendo aplicadas con éxito en las Ciencias Sociales. No han sido suficientemente explotadas en el análisis de la información contable y pueden tener un hueco en la aplicación en la empresa.

Ir a CiberConta Retroceder  Inicio leccion   Avanzar