R - Distribuzione normale

In una raccolta casuale di dati da fonti indipendenti, si osserva generalmente che la distribuzione dei dati è normale. Ciò significa che, tracciando un grafico con il valore della variabile sull'asse orizzontale e il conteggio dei valori sull'asse verticale, otteniamo una curva a campana. Il centro della curva rappresenta la media del set di dati. Nel grafico, il cinquanta percento dei valori si trova a sinistra della media e l'altro cinquanta percento si trova a destra del grafico. Questa viene definita distribuzione normale nelle statistiche.

R ha quattro funzioni integrate per generare la distribuzione normale. Sono descritti di seguito.

dnorm(x, mean, sd)
pnorm(x, mean, sd)
qnorm(p, mean, sd)
rnorm(n, mean, sd)

Di seguito è riportata la descrizione dei parametri utilizzati nelle funzioni di cui sopra:

  • x è un vettore di numeri.

  • p è un vettore di probabilità.

  • n è il numero di osservazioni (dimensione del campione).

  • meanè il valore medio dei dati di esempio. Il suo valore predefinito è zero.

  • sdè la deviazione standard. Il valore predefinito è 1.

dnorm ()

Questa funzione fornisce l'altezza della distribuzione di probabilità in ogni punto per una data media e deviazione standard.

# Create a sequence of numbers between -10 and 10 incrementing by 0.1.
x <- seq(-10, 10, by = .1)

# Choose the mean as 2.5 and standard deviation as 0.5.
y <- dnorm(x, mean = 2.5, sd = 0.5)

# Give the chart file a name.
png(file = "dnorm.png")

plot(x,y)

# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato:

pnorm ()

Questa funzione fornisce la probabilità che un numero casuale distribuito normalmente sia inferiore al valore di un dato numero. È anche chiamata "Funzione di distribuzione cumulativa".

# Create a sequence of numbers between -10 and 10 incrementing by 0.2.
x <- seq(-10,10,by = .2)
 
# Choose the mean as 2.5 and standard deviation as 2. 
y <- pnorm(x, mean = 2.5, sd = 2)

# Give the chart file a name.
png(file = "pnorm.png")

# Plot the graph.
plot(x,y)

# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato:

qnorm ()

Questa funzione prende il valore di probabilità e fornisce un numero il cui valore cumulativo corrisponde al valore di probabilità.

# Create a sequence of probability values incrementing by 0.02.
x <- seq(0, 1, by = 0.02)

# Choose the mean as 2 and standard deviation as 3.
y <- qnorm(x, mean = 2, sd = 1)

# Give the chart file a name.
png(file = "qnorm.png")

# Plot the graph.
plot(x,y)

# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato:

rnorm ()

Questa funzione viene utilizzata per generare numeri casuali la cui distribuzione è normale. Prende la dimensione del campione come input e genera tanti numeri casuali. Disegniamo un istogramma per mostrare la distribuzione dei numeri generati.

# Create a sample of 50 numbers which are normally distributed.
y <- rnorm(50)

# Give the chart file a name.
png(file = "rnorm.png")

# Plot the histogram for this sample.
hist(y, main = "Normal DIstribution")

# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato: