R - Mean, Median dan Mode
Analisis statistik di R dilakukan dengan menggunakan banyak fungsi built-in. Sebagian besar fungsi ini adalah bagian dari paket dasar R. Fungsi-fungsi ini mengambil vektor R sebagai masukan bersama dengan argumen dan memberikan hasil.
Fungsi yang kita bahas dalam bab ini adalah mean, median dan mode.
Berarti
Ini dihitung dengan mengambil jumlah nilai dan membaginya dengan jumlah nilai dalam seri data.
Fungsinya mean() digunakan untuk menghitung ini di R.
Sintaksis
Sintaks dasar untuk menghitung mean di R adalah -
mean(x, trim = 0, na.rm = FALSE, ...)
Berikut ini adalah deskripsi parameter yang digunakan -
x adalah vektor masukan.
trim digunakan untuk melepaskan beberapa pengamatan dari kedua ujung vektor yang diurutkan.
na.rm digunakan untuk menghapus nilai yang hilang dari vektor input.
Contoh
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find Mean.
result.mean <- mean(x)
print(result.mean)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
[1] 8.22
Menerapkan Opsi Trim
Ketika parameter trim diberikan, nilai dalam vektor akan diurutkan dan kemudian jumlah observasi yang diperlukan dihapus dari penghitungan mean.
Ketika trim = 0,3, 3 nilai dari setiap ujung akan dihapus dari perhitungan untuk menemukan mean.
Dalam hal ini vektor yang diurutkan adalah (−21, −5, 2, 3, 4.2, 7, 8, 12, 18, 54) dan nilai yang dihapus dari vektor untuk menghitung mean adalah (−21, −5,2) dari kiri dan (12,18,54) dari kanan.
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find Mean.
result.mean <- mean(x,trim = 0.3)
print(result.mean)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
[1] 5.55
Menerapkan Opsi NA
Jika ada nilai yang hilang, maka fungsi mean mengembalikan NA.
Untuk menghilangkan nilai yang hilang dari perhitungan, gunakan na.rm = TRUE. yang berarti menghapus nilai NA.
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)
# Find mean.
result.mean <- mean(x)
print(result.mean)
# Find mean dropping NA values.
result.mean <- mean(x,na.rm = TRUE)
print(result.mean)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
[1] NA
[1] 8.22
Median
Nilai paling tengah dalam rangkaian data disebut median. Itumedian() fungsi digunakan dalam R untuk menghitung nilai ini.
Sintaksis
Sintaks dasar untuk menghitung median di R adalah -
median(x, na.rm = FALSE)
Berikut ini adalah deskripsi parameter yang digunakan -
x adalah vektor masukan.
na.rm digunakan untuk menghapus nilai yang hilang dari vektor input.
Contoh
# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find the median.
median.result <- median(x)
print(median.result)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
[1] 5.6
Mode
Mode adalah nilai yang memiliki jumlah kejadian tertinggi dalam satu set data. Tidak seperti mean dan median, mode dapat memiliki data numerik dan karakter.
R tidak memiliki fungsi built-in standar untuk menghitung mode. Jadi kita membuat fungsi pengguna untuk menghitung mode kumpulan data di R. Fungsi ini mengambil vektor sebagai input dan memberikan nilai mode sebagai output.
Contoh
# Create the function.
getmode <- function(v) {
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}
# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)
# Calculate the mode using the user function.
result <- getmode(v)
print(result)
# Create the vector with characters.
charv <- c("o","it","the","it","it")
# Calculate the mode using the user function.
result <- getmode(charv)
print(result)
Ketika kita menjalankan kode di atas, hasilnya adalah sebagai berikut -
[1] 2
[1] "it"