R - Distribusi Normal

Dalam pengumpulan data secara acak dari sumber-sumber independen, secara umum diketahui bahwa distribusi datanya normal. Artinya, pada pembuatan grafik dengan nilai variabel pada sumbu horizontal dan jumlah nilai pada sumbu vertikal didapatkan kurva berbentuk lonceng. Pusat kurva mewakili mean dari kumpulan data. Dalam grafik, lima puluh persen nilai terletak di sebelah kiri mean dan lima puluh persen lainnya berada di sebelah kanan grafik. Ini disebut sebagai distribusi normal dalam statistik.

R memiliki empat fungsi bawaan untuk menghasilkan distribusi normal. Mereka dijelaskan di bawah ini.

dnorm(x, mean, sd)
pnorm(x, mean, sd)
qnorm(p, mean, sd)
rnorm(n, mean, sd)

Berikut adalah deskripsi parameter yang digunakan dalam fungsi di atas -

  • x adalah vektor angka.

  • p adalah vektor probabilitas.

  • n adalah jumlah observasi (ukuran sampel).

  • meanadalah nilai rata-rata dari data sampel. Nilai defaultnya adalah nol.

  • sdadalah deviasi standar. Nilai defaultnya adalah 1.

dnorm ()

Fungsi ini memberikan ketinggian distribusi probabilitas pada setiap titik untuk mean dan deviasi standar tertentu.

# Create a sequence of numbers between -10 and 10 incrementing by 0.1.
x <- seq(-10, 10, by = .1)

# Choose the mean as 2.5 and standard deviation as 0.5.
y <- dnorm(x, mean = 2.5, sd = 0.5)

# Give the chart file a name.
png(file = "dnorm.png")

plot(x,y)

# Save the file.
dev.off()

Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -

pnorm ()

Fungsi ini memberikan probabilitas bilangan acak terdistribusi normal menjadi lebih kecil dari nilai bilangan tertentu. Ini juga disebut "Fungsi Distribusi Kumulatif".

# Create a sequence of numbers between -10 and 10 incrementing by 0.2.
x <- seq(-10,10,by = .2)
 
# Choose the mean as 2.5 and standard deviation as 2. 
y <- pnorm(x, mean = 2.5, sd = 2)

# Give the chart file a name.
png(file = "pnorm.png")

# Plot the graph.
plot(x,y)

# Save the file.
dev.off()

Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -

qnorm ()

Fungsi ini mengambil nilai probabilitas dan memberikan angka yang nilai kumulatifnya cocok dengan nilai probabilitas.

# Create a sequence of probability values incrementing by 0.02.
x <- seq(0, 1, by = 0.02)

# Choose the mean as 2 and standard deviation as 3.
y <- qnorm(x, mean = 2, sd = 1)

# Give the chart file a name.
png(file = "qnorm.png")

# Plot the graph.
plot(x,y)

# Save the file.
dev.off()

Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -

rnorm ()

Fungsi ini digunakan untuk menghasilkan bilangan acak yang distribusinya normal. Dibutuhkan ukuran sampel sebagai input dan menghasilkan banyak angka acak. Kami menggambar histogram untuk menunjukkan distribusi angka yang dihasilkan.

# Create a sample of 50 numbers which are normally distributed.
y <- rnorm(50)

# Give the chart file a name.
png(file = "rnorm.png")

# Plot the histogram for this sample.
hist(y, main = "Normal DIstribution")

# Save the file.
dev.off()

Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -