Interprétation des résultats de l'intervalle de confiance pour les ensembles de données
J'ai créé un ensemble de données automatiquement et je voulais clarifier mon interprétation de la quantité de bruit à l'aide de l'intervalle de confiance.
J'ai sélectionné un échantillon aléatoire et annoté manuellement l'échantillon et j'ai constaté que 98 % des étiquettes étaient correctes. Sur la base de ces valeurs, j'ai ensuite calculé l'intervalle de confiance à 99% qui a donné une borne inférieure de 0,9614 et une borne supérieure de 0,9949. Cela signifie-t-il que le bruit dans l'ensemble de données global se situe entre la limite inférieure et la limite supérieure et est alors compris entre 0,005 % et 0,038 % ?
Réponses
Non, ce n'est pas ce que ça veut dire.
D'une part, il n'est pas clair à quel paramètre correspond l'intervalle de confiance que vous avez calculé.
Dans tous les cas, une certaine prudence s'impose dans l'interprétation des intervalles de confiance (fréquentistes).
Dans les statistiques fréquentistes, un intervalle de confiance est aléatoire et le paramètre auquel l'intervalle est destiné est fixe. Dans le cas d'un intervalle de 99 %, cela signifie que si les données étaient collectées à nouveau plusieurs fois et que l'intervalle de confiance était recalculé à chaque fois, alors 99 fois sur 100, il contiendrait la vraie valeur du paramètre. C'est la seule interprétation techniquement correcte de l'intervalle de confiance fréquentiste. Il est souvent interprété, à tort, comme étant un intervalle contenant le paramètre avec une probabilité de 99 %, et cela semble être l'interprétation que vous utilisez.