데이터 세트에 대한 신뢰 구간 결과 해석
Aug 19 2020
저는 데이터 세트를 자동으로 생성했으며 신뢰 구간을 사용하여 노이즈 양에 대한 해석을 명확히하고 싶었습니다.
무작위 샘플을 선택하고 샘플에 수동으로 주석을 달았는데 라벨의 98 %가 정확하다는 것을 발견했습니다. 이 값을 기반으로 99 %에서 신뢰 구간을 계산하여 하한 0.9614와 상한 0.9949를 제공했습니다. 이것은 전체 데이터 세트의 노이즈가 하한과 상한 사이에 있고 0.005 %에서 0.038 %까지임을 의미합니까?
답변
1 RobertLong Aug 29 2020 at 01:51
아니, 그게 의미하는 바가 아닙니다.
한 가지 이유는 계산 한 신뢰 구간의 매개 변수가 무엇인지 명확하지 않습니다.
어쨌든 (빈도주의) 신뢰 구간의 해석에 약간의주의가 필요합니다.
빈도주의 통계에서 신뢰 구간은 무작위이며 구간이 적용되는 모수는 고정되어 있습니다. 99 % 구간의 경우 이는 데이터가 여러 번 다시 수집되고 신뢰 구간이 매번 다시 계산되면 100 개 중 99 번이 매개 변수의 실제 값을 포함 함을 의미합니다. 이것은 빈도주의 신뢰 구간에 대한 유일한 기술적으로 올바른 해석입니다. 확률이 99 % 인 모수를 포함하는 구간으로 잘못 해석되는 경우가 많으며 사용중인 해석으로 보입니다.