¿El 95% es específico del intervalo de confianza de alguna manera?
Soy consciente de la idea errónea de que "un intervalo de confianza del 95% significa que hay un 95% de probabilidad de que el parámetro verdadero se encuentre en este rango", y que la interpretación correcta es que si construye, digamos, 100 de estos intervalos de confianza a partir de muestreo aleatorio, entonces 95 de los intervalos de confianza deben incluir el parámetro verdadero.
En https://www.econometrics-with-r.org/5-2-cifrc.html, Veo lo siguiente:

¿Es esta redacción incorrecta? Parece estar diciendo que el valor real tiene un 95% de probabilidad de estar en ese intervalo de confianza específico.
Mi segunda pregunta es, digamos que tiene uno de estos 95 intervalos de confianza. Aparte de usar el 95% para obtener la puntuación Z de 1,96, ¿de qué otra manera se manifiesta el 95% en este intervalo de confianza?
Respuestas
¿Es esta redacción incorrecta? Parece estar diciendo que el valor real tiene un 95% de probabilidad de estar en ese intervalo de confianza específico.
Tienes que tener en cuenta que, en las estadísticas frecuentistas, el parámetro que estás estimando (en tu caso $\beta_i$, el valor verdadero del coeficiente) no se considera una variable aleatoria, sino un número real fijo. Eso significa que no es correcto decir algo como "$\beta_i$ está en el intervalo $[a,b]$ con $95\%$probabilidad " , porque$\beta_i$no es una variable aleatoria y por lo tanto no tiene una distribución de probabilidad. La probabilidad de$\beta_i$ estar en el intervalo es $100\%$ (si el valor fijo $\beta_i\in[a,b]$) o $0\%$ (si el valor fijo $\beta_i\notin[a,b]$)
Es por eso que "el intervalo de confianza del 95% significa que hay un 95% de probabilidad de que el verdadero parámetro se encuentre en este rango" es un concepto erróneo.
Por otro lado, los límites del intervalo de confianza en sí mismos son variables aleatorias, ya que se calculan a partir de los datos de la muestra. Eso significa que es correcto decir "en el 95% de todas las muestras posibles,$\beta_i$ está en el intervalo de confianza del 95% ". No significa que $\beta_i$ tiene $95\%$probabilidad de estar dentro de un intervalo particular, significa que el intervalo de confianza , que es diferente para cada muestra, tiene$95\%$ probabilidad de caer $\beta_i$.
Observe que el intervalo de confianza contendrá $\beta_i$con un 95% de probabilidad antes de muestrear los datos. Después de que se muestrea, los bordes de los intervalos de confianza serán solo dos números fijos, ya no variables aleatorias y se aplica el mismo razonamiento del primer párrafo. Creo que la siguiente imagen ofrece una buena visualización de esta idea:

Por lo tanto, la redacción utilizada allí es realmente correcta.
Aparte de usar el 95% para obtener la puntuación Z de 1,96, ¿de qué otra manera se manifiesta el 95% en este intervalo de confianza?
La puntuación Z de 1,96 es el único lugar donde aparece el 95%. Si lo cambia por el puntaje Z correspondiente a, digamos, 85%, tendría la fórmula intervalo de confianza del 85%.
Quizás si reformula a:
" Imagínese que repite su muestreo bajo las mismas condiciones exactas de manera indefinida. Para cada extracción, calcula un parámetro estimado y su error estándar para calcular un intervalo de confianza del 95% [fórmula en su figura]. Entonces este intervalo de confianza del 95% capturará el verdadero parámetro de población en el 95% del tiempo si se cumplen todos los supuestos y la hipótesis nula es verdadera " .
¿Eso tendría más sentido?
En cuanto a su segunda pregunta, considere la distribución normal estándar a continuación. El área total bajo la curva es igual a 1. Si considera que el nivel de significancia es del 5% y lo divide entre cada cola (áreas rojas), entonces se queda con el 95% en el medio. Si la hipótesis nula es verdadera, entonces esta es el área en la que no rechazaría la hipótesis nula, ya que cualquier puntaje Z que caiga en esa área es plausible bajo la hipótesis nula. Solo si su puntaje Z cae en las áreas rojas, rechaza la hipótesis nula, ya que su muestra proporciona evidencia significativa contra la hipótesis nula, o en otras palabras, probablemente hizo un descubrimiento - hurra: D
Ahora, al multiplicar la puntuación Z crítica de +/- 1,96 (en el caso de un 95% de confianza) por el error estándar de la muestra, está traduciendo este intervalo del 95% de nuevo a la escala de medición original. Entonces, cada intervalo de confianza corresponde a una prueba de hipótesis en su escala de medición como se sugiere en la última oración de su imagen.

95% conf.int.
significa que hay solo un 5% de probabilidad de que el valor empírico real se salga de este intervalo. En otras palabras, 5% de probabilidad de falso positivo si (y cuando) se trata ese rango como verdad fundamental.