Modelo Tobit

El modelo Tobit es un modelo estadístico propuesto por James Tobin (1958) para describir la relación entre una variable dependiente no negativa y i {\displaystyle y_{i}} y una variable independiente (o vector ) x i {\displaystyle x_{i}} . El término Tobit fue derivado del nombre truncando de Tobin y añadiendo, por analogía, el it como en el modelo probit o en el modelo logit.[1]

El modelo supone que existe una variable latente (no observable por ejemplo) y i {\displaystyle y_{i}^{*}} . Esta variable depende linealmente de x i {\displaystyle x_{i}} a través de un parámetro(vector) β {\displaystyle \beta } que determina la relación entre la variable independiente (o vector) x i {\displaystyle x_{i}} y la variable latente y i {\displaystyle y_{i}^{*}} (Tal como en un modelo lineal). Además, hay un término de error u i {\displaystyle u_{i}} con una distribución normal para captar las influencias aleatorias en esta relación. La variable observable y i {\displaystyle y_{i}} se define como igual a la variable latente cuando la variable latente es superior a cero y cero en caso contrario.

y i = { y i si y i > 0 0 si y i 0 {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&{\textrm {si}}\;y_{i}^{*}>0\\0&{\textrm {si}}\;y_{i}^{*}\leq 0\end{cases}}}

donde y i {\displaystyle y_{i}^{*}} es una variable latente:

y i = β x i + u i , u i N ( 0 , σ 2 ) {\displaystyle y_{i}^{*}=\beta x_{i}+u_{i},u_{i}\sim N(0,\sigma ^{2})\,}

La consistencia

Si el parámetro de relación β {\displaystyle \beta } se estima mediante una regresión de lo observado y i {\displaystyle y_{i}} en x i {\displaystyle x_{i}} , el resultado obtenido usando el estimador de mínimos cuadrados ordinarios es inconsistente. Esto dará lugar a una estimación a la baja de polarización del coeficiente de la pendiente hacia arriba y una estimación sesgada de la intersección. Takeshi Amemiya (1973) ha demostrado que el estimador de máxima verosimilitud propuesto por Tobin para este modelo es consistente.

Interpretación

La β {\displaystyle \beta } del coeficiente no debe interpretarse como el efecto de los x i {\displaystyle x_{i}} en y i {\displaystyle y_{i}} , como uno haría con un modelo de regresión lineal , lo que es un error común. En su lugar, debe interpretarse como la combinación de (1) el cambio en y i {\displaystyle y_{i}} de aquellos por encima del límite, ponderados por la probabilidad de estar por encima del límite, y (2) el cambio en la probabilidad de estar por encima del límite, ponderado por el valor esperado de y i {\displaystyle y_{i}} si es superior.[2]

Variaciones del modelo Tobit

Las variaciones del modelo Tobit pueden ser producidas mediante el cambio de dónde y cuándo se produce la censura. Amemiya (1985) clasifica estas variaciones en cinco categorías (Tobit tipo I - Tobit tipo V), donde Tobit tipo I representa el primer modelo descrito anteriormente. Schnedler (2005) proporciona una fórmula general para obtener estimadores consistentes de probabilidad para estas y otras variaciones del modelo Tobit.

Tipo I

El modelo Tobit es un caso especial de un modelo de regresión censurada , ya que la variable latente y i {\displaystyle y_{i}^{*}} no puede siempre ser observada mientras que la variable independiente x i {\displaystyle x_{i}} es observable. Una variante común del modelo Tobit está censurando a un valor y L {\displaystyle y_{L}} diferente de cero:

y i = { y i si y i > y L y L si y i y L . {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&{\textrm {si}}\;y_{i}^{*}>y_{L}\\y_{L}&{\textrm {si}}\;y_{i}^{*}\leq y_{L}.\end{cases}}}

Otro ejemplo es la censura de los valores anteriores y U {\displaystyle y_{U}} .

y i = { y i si y i < y U y U si y i y U . {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&{\textrm {si}}\;y_{i}^{*}<y_{U}\\y_{U}&{\textrm {si}}\;y_{i}^{*}\geq y_{U}.\end{cases}}}

Sin embargo, otro modelo resulta cuando y i {\displaystyle y_{i}} se censura desde arriba y abajo al mismo tiempo.

y i = { y i si y L < y i < y U y L si y i y L y U si y i y U . {\displaystyle y_{i}={\begin{cases}y_{i}^{*}&{\textrm {si}}\;y_{L}<y_{i}^{*}<y_{U}\\y_{L}&{\textrm {si}}\;y_{i}^{*}\leq y_{L}\\y_{U}&{\textrm {si}}\;y_{i}^{*}\geq y_{U}.\end{cases}}}

El resto de los modelos se presenta como estando limitada desde abajo a 0, aunque esto se puede generalizar como lo hemos hecho en Tipo I.

Tipo II

Tipo II modelos Tobit introducir una variable latente segundo.

y 2 i = { y 2 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{2i}={\begin{cases}y_{2i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}

Heckman (1987) cae en el tipo II Tobit. En el tipo Tobit I, la variable latente absorbe tanto el proceso de participación y los "resultados" de interés. En el Tipo Tobit II permite que el proceso de participación / selección y el proceso de "resultado" sean independientes, condicionado a x.

Tipo III

Tipo III introduce una segunda variable dependiente observada

y 1 i = { y 1 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{1i}={\begin{cases}y_{1i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}
y 2 i = { y 2 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{2i}={\begin{cases}y_{2i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}

El modelo Heckman cae en este tipo.

Tipo IV

Tipo IV introduce tercera variable observada dependiente y una variable latente tercero.

y 1 i = { y 1 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{1i}={\begin{cases}y_{1i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}
y 2 i = { y 2 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{2i}={\begin{cases}y_{2i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}
y 3 i = { y 3 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{3i}={\begin{cases}y_{3i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}

Tipo V

Semejante al II, Tipo V, solo observar el signo de y 1 i {\displaystyle y_{1i}^{*}} .

y 2 i = { y 2 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{2i}={\begin{cases}y_{2i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}
y 3 i = { y 3 i si y 1 i > 0 0 si y 1 i 0. {\displaystyle y_{3i}={\begin{cases}y_{3i}^{*}&{\textrm {si}}\;y_{1i}^{*}>0\\0&{\textrm {si}}\;y_{1i}^{*}\leq 0.\end{cases}}}

La función de verosimilitud

A continuación se presentan la Función de verosimilitud y las funciones de registro de probabilidad para un tipo que Tobit. Este es un Tobit censurado desde abajo en y L {\displaystyle y_{L}} cuando la variable latente y j y L {\displaystyle y_{j}^{*}\leq y_{L}} . Al escribir la función de verosimilitud, primero definimos una función indicadora I ( y j ) {\displaystyle I(y_{j})} donde:

I ( y j ) = { 0 si y j = y L 1 si y j y L . {\displaystyle I(y_{j})={\begin{cases}0&{\textrm {si}}\;y_{j}=y_{L}\\1&{\textrm {si}}\;y_{j}\neq y_{L}.\end{cases}}}

A continuación, nos referimos Φ {\displaystyle \Phi } a ser el normal estándar función de distribución acumulativa y ϕ {\displaystyle \phi } a ser el normal estándar función de densidad de probabilidad . Para un conjunto de datos con n observaciones de la función de verosimilitud para un tipo que Tobit es:

L ( β , σ ) = j = 1 N ( 1 σ ϕ ( Y j X j β σ ) ) I ( y j ) ( 1 Φ ( X j β y L σ ) ) 1 I ( y j ) {\displaystyle {\mathcal {L}}(\beta ,\sigma )=\prod _{j=1}^{N}\left({\frac {1}{\sigma }}\phi \left({\frac {Y_{j}-X_{j}\beta }{\sigma }}\right)\right)^{I\left(y_{j}\right)}\left(1-\Phi \left({\frac {X_{j}\beta -y_{L}}{\sigma }}\right)\right)^{1-I\left(y_{j}\right)}}

y la probabilidad de registro está dada por

log L ( β , σ ) = j = 1 n I ( y j ) log ( 1 σ φ ( y j X j β σ ) ) + ( 1 I ( y j ) ) log ( 1 Φ ( X j β y L σ ) ) {\displaystyle \log {\mathcal {L}}(\beta ,\sigma )=\sum _{j=1}^{n}I(y_{j})\log \left({\frac {1}{\sigma }}\varphi \left({\frac {y_{j}-X_{j}\beta }{\sigma }}\right)\right)+(1-I(y_{j}))\log \left(1-\Phi \left({\frac {X_{j}\beta -y_{L}}{\sigma }}\right)\right)}

Tenga en cuenta que esto es diferente de la función de verosimilitud del modelo de regresión truncada.[3]

Versión no paramétrica

Si la variable subyacente latente y i {\displaystyle y_{i}^{*}} no se distribuye normalmente, se deben usar cuantiles en lugar de momentos para analizar la variable observable y i {\displaystyle y_{i}} . El estimador CLAD de Powell ofrece una forma posible de lograr esto.[4]

Referencias

  1. International Encyclopedia of the Social Sciences (2008)
  2. McDonald, John F.; Moffit, Robert A. (1980), «The Uses of Tobit Analysis», The Review of Economics and Statistics (The MIT Press) 62 (2): 318-321 .
  3. Park, B.U., L. Simar, and V. Zelenyuk (2008). "Local likelihood estimation of truncated regression and its partial derivatives: Theory and application," Journal of Econometrics 146(1), pages 185-198.
  4. Powell, James L (1 de julio de 1984). «Least absolute deviations estimation for the censored regression model». Journal of Econometrics 25 (3): 303-325. doi:10.1016/0304-4076(84)90004-6. 

Bibliografía adicional

  • Amemiya, Takeshi (1973). «Regression analysis when the dependent variable is truncated normal». Econometrica 41 (6): 997-1016. JSTOR 1914031. doi:10.2307/1914031. 
  • Amemiya, Takeshi (1984). «Tobit models: A survey». Journal of Econometrics 24 (1–2): 3-61. doi:10.1016/0304-4076(84)90074-5. 
  • Amemiya, Takeshi (1985). Advanced Econometrics. Oxford: Basil Blackwell. ISBN 0-631-13345-3. 
  • Schnedler, Wendelin (2005). «Likelihood estimation for censored random vectors». Econometric Reviews 24 (2): 195-217. doi:10.1081/ETC-200067925. 
  • Tobin, James (1958). «Estimation of relationships for limited dependent variables». Econometrica 26 (1): 24-36. JSTOR 1907382. doi:10.2307/1907382. 


Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q1307251
  • Wd Datos: Q1307251