Introducción.

 

En la mayoría de los modelos siempre se asume implícitamente el carácter cuantitativo de las variables. Sin embargo, hay variables que se quieren controlar y no se pueden cuantificar. Por ejemplo, si se quiere conocer si el estado del mercado laboral en que se encuentra un individuo puede afectar a sus pautas de consumo, se puede construir una variable que tome el valor 1 cuando el individuo está desempleado y 0 en caso contrario. Asimismo, si se desea conocer si existen diferencias en el tránsito desde el desempleo al empleo en los diferentes trimestres de cada año, se puede crear un conjunto de variables ficticias que tomen el valor 1 en el trimestre correspondiente y 0 en el resto.

 

Por otro lado, en muchos contextos el fenómeno que se pretende modelizar no es continuo sino discreto. Si se está interesado en examinar el efecto que tiene un conjunto de variables independientes sobre la variable dependiente, entonces la variable endógena será cualitativa o tomará valores discretos (0 ó 1). Por ejemplo, se puede estar interesado en contrastar el efecto de un conjunto de variables sobre si se hace o no una compra importante (por ejemplo, un ordenador). En este caso, se define una variable que toma el valor 1 si el individuo ha comprado el ordenador y 0 en caso contrario. También, si se quiere conocer si vivir en las ciudades afecta al estado del mercado laboral de las mujeres. La variable dependiente puede tomar el valor 1 si la mujer está desempleada, y 0 en caso contrario. En estos ejemplos, la variable de interés toma valores discretos, y el modelo planteado requiere un tratamiento específico.

 

A lo largo de este tema se va a analizar la utilidad de las variables cualitativas o ficticias y los diferentes tipos de variables ficticias que se pueden construir para tener en cuenta factores explicativos cualitativos. También, se analizarán los modelos que presentan variables ficticias endógenas. En este caso, se discutirá en primer lugar la estimación y las propiedades de los estimadores en un modelo que la variable endógena es cualitativa (modelo de probabilidad lineal). Finalmente, se plantearán diferentes modelos que solucionan los problemas que tienen los estimadores aplicados al modelo de probabilidad lineal (modelos logit y probit).