Introducción.
En la mayoría de los modelos siempre se asume
implícitamente el carácter cuantitativo de las variables. Sin embargo, hay
variables que se quieren controlar y no se pueden cuantificar. Por ejemplo, si
se quiere conocer si el estado del mercado laboral en que se encuentra un
individuo puede afectar a sus pautas de consumo, se puede construir una
variable que tome el valor 1 cuando el individuo está desempleado y 0 en caso
contrario. Asimismo, si se desea conocer si existen diferencias en el tránsito
desde el desempleo al empleo en los diferentes trimestres de cada año, se puede
crear un conjunto de variables ficticias que tomen el valor 1 en el trimestre correspondiente
y 0 en el resto.
Por otro lado, en muchos contextos el fenómeno que
se pretende modelizar no es continuo sino discreto. Si se está interesado en
examinar el efecto que tiene un conjunto de variables independientes sobre la
variable dependiente, entonces la variable endógena será cualitativa o tomará
valores discretos (0 ó 1). Por ejemplo, se puede estar interesado en contrastar
el efecto de un conjunto de variables sobre si se hace o no una compra
importante (por ejemplo, un ordenador). En este caso, se define una variable
que toma el valor 1 si el individuo ha comprado el ordenador y 0 en caso
contrario. También, si se quiere conocer si vivir en las ciudades afecta al
estado del mercado laboral de las mujeres. La variable dependiente puede tomar
el valor 1 si la mujer está desempleada, y 0 en caso contrario. En estos
ejemplos, la variable de interés toma valores discretos, y el modelo planteado
requiere un tratamiento específico.
A lo largo de este tema se va a analizar la
utilidad de las variables cualitativas o ficticias y los diferentes tipos de
variables ficticias que se pueden construir para tener en cuenta factores
explicativos cualitativos. También, se analizarán los modelos que presentan
variables ficticias endógenas. En este caso, se discutirá en primer lugar la
estimación y las propiedades de los estimadores en un modelo que la variable
endógena es cualitativa (modelo de probabilidad lineal). Finalmente, se
plantearán diferentes modelos que solucionan los problemas que tienen los
estimadores aplicados al modelo de probabilidad lineal (modelos logit y
probit).