R - Distribución normal
En una recopilación aleatoria de datos de fuentes independientes, generalmente se observa que la distribución de datos es normal. Lo que significa que, al trazar un gráfico con el valor de la variable en el eje horizontal y el recuento de los valores en el eje vertical, obtenemos una curva en forma de campana. El centro de la curva representa la media del conjunto de datos. En el gráfico, el cincuenta por ciento de los valores se encuentra a la izquierda de la media y el otro cincuenta por ciento se encuentra a la derecha del gráfico. Esto se conoce como distribución normal en las estadísticas.
R tiene cuatro funciones integradas para generar una distribución normal. Se describen a continuación.
dnorm(x, mean, sd)
pnorm(x, mean, sd)
qnorm(p, mean, sd)
rnorm(n, mean, sd)
A continuación se muestra la descripción de los parámetros utilizados en las funciones anteriores:
x es un vector de números.
p es un vector de probabilidades.
n es el número de observaciones (tamaño de la muestra).
meanes el valor medio de los datos de la muestra. Su valor predeterminado es cero.
sdes la desviación estándar. Su valor predeterminado es 1.
dnorm ()
Esta función da la altura de la distribución de probabilidad en cada punto para una media y una desviación estándar dadas.
# Create a sequence of numbers between -10 and 10 incrementing by 0.1.
x <- seq(-10, 10, by = .1)
# Choose the mean as 2.5 and standard deviation as 0.5.
y <- dnorm(x, mean = 2.5, sd = 0.5)
# Give the chart file a name.
png(file = "dnorm.png")
plot(x,y)
# Save the file.
dev.off()
Cuando ejecutamos el código anterior, produce el siguiente resultado:
pnorm ()
Esta función da la probabilidad de que un número aleatorio distribuido normalmente sea menor que el valor de un número dado. También se denomina "Función de distribución acumulativa".
# Create a sequence of numbers between -10 and 10 incrementing by 0.2.
x <- seq(-10,10,by = .2)
# Choose the mean as 2.5 and standard deviation as 2.
y <- pnorm(x, mean = 2.5, sd = 2)
# Give the chart file a name.
png(file = "pnorm.png")
# Plot the graph.
plot(x,y)
# Save the file.
dev.off()
Cuando ejecutamos el código anterior, produce el siguiente resultado:
qnorm ()
Esta función toma el valor de probabilidad y da un número cuyo valor acumulativo coincide con el valor de probabilidad.
# Create a sequence of probability values incrementing by 0.02.
x <- seq(0, 1, by = 0.02)
# Choose the mean as 2 and standard deviation as 3.
y <- qnorm(x, mean = 2, sd = 1)
# Give the chart file a name.
png(file = "qnorm.png")
# Plot the graph.
plot(x,y)
# Save the file.
dev.off()
Cuando ejecutamos el código anterior, produce el siguiente resultado:
rnorm ()
Esta función se utiliza para generar números aleatorios cuya distribución es normal. Toma el tamaño de la muestra como entrada y genera esa cantidad de números aleatorios. Dibujamos un histograma para mostrar la distribución de los números generados.
# Create a sample of 50 numbers which are normally distributed.
y <- rnorm(50)
# Give the chart file a name.
png(file = "rnorm.png")
# Plot the histogram for this sample.
hist(y, main = "Normal DIstribution")
# Save the file.
dev.off()
Cuando ejecutamos el código anterior, produce el siguiente resultado: