Interpretación de los resultados del intervalo de confianza para conjuntos de datos

Aug 19 2020

Creé un conjunto de datos automáticamente y quería aclarar mi interpretación de la cantidad de ruido utilizando el intervalo de confianza.

Seleccioné una muestra aleatoria y anoté manualmente la muestra y descubrí que el 98 % de las etiquetas eran correctas. Basándome en estos valores, calculé el intervalo de confianza al 99 %, lo que dio un límite inferior de 0,9614 y un límite superior de 0,9949. ¿Significa esto que el ruido en el conjunto de datos general se encuentra entre el límite inferior y el superior y luego es del 0,005 % al 0,038 %?

Respuestas

1 RobertLong Aug 29 2020 at 01:51

No, eso no es lo que significa.

Por un lado, no está claro para qué parámetro es el intervalo de confianza que calculó.

En cualquier caso, se necesita cierto cuidado en la interpretación de los intervalos de confianza (frecuentistas).

En las estadísticas frecuentistas, un intervalo de confianza es aleatorio y el parámetro para el que es el intervalo es fijo. En el caso de un intervalo del 99%, esto significa que si los datos se recopilaran nuevamente, muchas veces, y el intervalo de confianza se volviera a calcular cada vez, entonces 99 de cada 100 veces contendría el valor real del parámetro. Esta es la única interpretación técnicamente correcta del intervalo de confianza frecuentista. A menudo se interpreta incorrectamente como un intervalo que contiene el parámetro con una probabilidad del 99% y esa parece ser la interpretación que está utilizando.