Un instrumento débil es aquel que está poco correlacionado con la variable endógena que pretende instrumentar. Este problema es potencialmente más grave que la endogeneidad original, ya que genera tres efectos perniciosos que pueden hacer que la estimación por variables instrumentales (IV) sea peor que mínimos cuadrados ordinarios (MCO).
El primer problema es el sesgo en muestras finitas. Aunque el estimador IV es asintóticamente consistente, en muestras pequeñas o medianas presenta un sesgo que puede superar al sesgo de endogeneidad de MCO. Este sesgo es inversamente proporcional a la fuerza del instrumento: cuanto más débil es el instrumento, mayor es el sesgo.
El segundo problema es la imprecisión extrema. La varianza del estimador IV es inversamente proporcional al cuadrado de la correlación entre el instrumento y la variable endógena. Si esta correlación es pequeña, la varianza se dispara, haciendo que las estimaciones sean muy imprecisas y los intervalos de confianza extremadamente amplios.
El tercer problema es la cobertura incorrecta de los intervalos de confianza. Los errores estándar convencionales infravaloran la verdadera incertidumbre cuando los instrumentos son débiles, lo que hace que un intervalo nominal del 95% cubra el verdadero parámetro mucho menos del 95% de las veces.
Para diagnosticar instrumentos débiles, el estadístico fundamental es el F de la primera etapa. En la primera etapa de mínimos cuadrados en dos etapas (MC2E), regresamos la variable endógena sobre los instrumentos y los controles exógenos:
donde \(x_i\) es la variable endógena, \(z_i\) es el instrumento, \(w_i\) son los controles exógenos, y \(v_i\) es el error de la primera etapa.
El estadístico F contrasta la hipótesis nula de que todos los instrumentos excluidos son irrelevantes:
El estadístico F se calcula como:
donde \(q\) es el número de instrumentos excluidos, \(n\) es el tamaño muestral, y \(k\) es el número total de parámetros en la primera etapa.
Staiger y Stock (1997) establecieron una regla práctica ampliamente utilizada: el estadístico F de la primera etapa debe ser mayor que 10 para considerar que los instrumentos son suficientemente fuertes. Esta regla se basa en simulaciones que muestran que con F < 10, el sesgo del estimador IV puede superar al sesgo de MCO, y los intervalos de confianza tienen cobertura muy por debajo del nivel nominal.
Cuando F < 10, se recomienda usar métodos robustos a instrumentos débiles, como los intervalos de confianza de Anderson-Rubin, o buscar instrumentos más fuertes. La regla F > 10 es conservadora pero práctica para la mayoría de aplicaciones empíricas.