La estadística es una especie de mezcla entre matemáticas y probabilidad. El objetivo de las estadísticas es describir los procesos que puede observar en el mundo (la altura de los robles o la probabilidad de que una vacuna funcione para defenderse de la enfermedad) sin tener que medir cada roble del mundo o vacunar a cada persona antes de decidir cómo. efectivo es un fármaco.
Debido a que la probabilidad describe cosas que involucran el azar, tenemos que aceptar que sea cual sea el proceso que estemos usando para medir las estadísticas, nunca obtendremos una imagen completa.
¿Por qué usar estadísticas?
Suponga que lanza una moneda cuatro veces. Obtienes tres caras y una cruz. Sin usar estadísticas, podríamos concluir que la probabilidad de obtener cara es del 75 por ciento, donde la probabilidad real de obtener cara en un lanzamiento de moneda es 1:1, o una probabilidad de 50-50. Si hiciéramos 40 lanzamientos de monedas, sin duda nos acercaríamos mucho más a una proporción de 1:1 de cara a cruz, y el uso de estadísticas reflejaría esto.
"Gran parte de las estadísticas tiene que ver con el razonamiento de una muestra, las observaciones reales, a las características de la población, todas las observaciones posibles", dice John Drake, profesor de investigación en el Centro de Ecología de Enfermedades Infecciosas de la Universidad de Georgia, en un correo electrónico. "Por ejemplo, podríamos estar interesados en la altura de los robles. No podemos medir todos los robles del mundo, pero podemos medir algunos. Podemos calcular la altura promedio de los robles en la muestra, pero esto no necesariamente será el mismo que el promedio de todos los robles".
Intervalos de confianza
Debido a que no podemos medir todos los robles del mundo, los estadísticos presentan un rango estimado de alturas en función de la probabilidad y todos los datos a su disposición. Este rango se llama intervalo de confianza y consta de dos números: uno que probablemente sea más pequeño que el valor real y otro que probablemente sea más grande. El verdadero valor probablemente esté en algún punto intermedio.
"Un 'intervalo de confianza del 95 por ciento' significa que 95 de cada 100 veces que el intervalo de confianza se construye de esta manera, el intervalo incluirá el valor real", dice Drake. "Si midiéramos muestras de robles 100 veces, el intervalo de confianza basado en los datos recopilados en 95 de esos experimentos incluiría la media de la población o la altura promedio de todos los robles. Por lo tanto, un intervalo de confianza es una medida de la precisión de una estimación. La estimación se vuelve más y más precisa a medida que recopila más datos. Es por eso que los intervalos de confianza se reducen a medida que hay más datos disponibles".
Entonces, un intervalo de confianza ayuda a mostrar cuán buena o mala es la estimación. Cuando lanzamos una moneda solo cuatro veces, nuestra estimación del 75 por ciento tiene un amplio intervalo de confianza porque el tamaño de nuestra muestra es muy pequeño. Nuestra estimación con 40 lanzamientos de moneda tendría un intervalo de confianza mucho más estrecho.
El significado real de un intervalo de confianza tiene que ver con repetir un experimento una y otra vez. En el caso de los cuatro lanzamientos de moneda, un intervalo de confianza del 95 por ciento significa que si repetimos el experimento del lanzamiento de moneda 100 veces, en 95 de ellas, nuestra probabilidad de obtener cara caerá dentro de ese intervalo de confianza.
Los límites de la estadística
Hay límites para las estadísticas. Tienes que diseñar un buen estudio: las estadísticas no pueden decirte nada que no hayas preguntado.
Digamos que está estudiando la eficacia de una vacuna, pero no incluyó a niños en su estudio. Puede crear un intervalo de confianza basado en los datos que recopiló, pero no le dirá nada sobre qué tan bien protege la vacuna a los niños.
“Además de tener suficientes datos, la muestra también debe ser representativa”, dice Drake. "Por lo general, esto significa tener una muestra aleatoria o una muestra aleatoria estratificada. Suponiendo que los 1000 participantes en su ensayo hipotético de la vacuna sean representativos de la población, entonces es razonable concluir que la verdadera eficacia de la vacuna está dentro del intervalo de confianza informado. Si la muestra no es representativa, si no incluye niños, entonces no hay una base estadística para sacar conclusiones sobre la parte no representada de la población".
Ahora que es interesante:
Florence Nightingale fue una de las estadísticas más importantes de la historia y utilizó la ciencia en la que fue pionera para salvar las vidas de los soldados durante la Guerra de Crimea.