R-평균, 중앙값 및 모드

R의 통계 분석은 많은 내장 함수를 사용하여 수행됩니다. 이러한 함수의 대부분은 R 기본 패키지의 일부입니다. 이 함수는 인수와 함께 R 벡터를 입력으로 사용하고 결과를 제공합니다.

이 장에서 논의하는 기능은 평균, 중앙값 및 모드입니다.

평균

값의 합계를 데이터 시리즈의 값 수로 나누어 계산합니다.

함수 mean() R에서 이것을 계산하는 데 사용됩니다.

통사론

R에서 평균을 계산하는 기본 구문은 다음과 같습니다.

mean(x, trim = 0, na.rm = FALSE, ...)

다음은 사용 된 매개 변수에 대한 설명입니다.

  • x 입력 벡터입니다.

  • trim 정렬 된 벡터의 양쪽 끝에서 일부 관측치를 삭제하는 데 사용됩니다.

  • na.rm 입력 벡터에서 누락 된 값을 제거하는 데 사용됩니다.

# Create a vector. 
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <- mean(x)
print(result.mean)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] 8.22

트림 옵션 적용

trim 매개 변수가 제공되면 벡터의 값이 정렬되고 필요한 관측치 수가 평균 계산에서 제외됩니다.

trim = 0.3이면 평균을 찾기 위해 계산에서 각 끝의 3 개 값이 삭제됩니다.

이 경우 정렬 된 벡터는 (−21, −5, 2, 3, 4.2, 7, 8, 12, 18, 54)이고 평균을 계산하기 위해 벡터에서 제거 된 값은 (−21, −5,2)입니다. 왼쪽에서, (12,18,54) 오른쪽에서.

# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find Mean.
result.mean <-  mean(x,trim = 0.3)
print(result.mean)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] 5.55

NA 옵션 적용

누락 된 값이 있으면 mean 함수는 NA를 반환합니다.

계산에서 누락 된 값을 삭제하려면 na.rm = TRUE를 사용하십시오. 즉, NA 값을 제거해야합니다.

# Create a vector. 
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)

# Find mean.
result.mean <-  mean(x)
print(result.mean)

# Find mean dropping NA values.
result.mean <-  mean(x,na.rm = TRUE)
print(result.mean)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] NA
[1] 8.22

중앙값

데이터 시리즈에서 가장 중간 값을 중앙값이라고합니다. 그만큼median() 함수는 R에서이 값을 계산하는 데 사용됩니다.

통사론

R에서 중앙값을 계산하는 기본 구문은 다음과 같습니다.

median(x, na.rm = FALSE)

다음은 사용 된 매개 변수에 대한 설명입니다.

  • x 입력 벡터입니다.

  • na.rm 입력 벡터에서 누락 된 값을 제거하는 데 사용됩니다.

# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)

# Find the median.
median.result <- median(x)
print(median.result)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] 5.6

방법

모드는 데이터 세트에서 발생 횟수가 가장 많은 값입니다. Unike 평균 및 중앙값, 모드는 숫자 및 문자 데이터를 모두 가질 수 있습니다.

R에는 모드를 계산하는 표준 내장 함수가 없습니다. 따라서 R에서 데이터 세트의 모드를 계산하는 사용자 함수를 만듭니다.이 함수는 벡터를 입력으로 사용하고 모드 값을 출력으로 제공합니다.

# Create the function.
getmode <- function(v) {
   uniqv <- unique(v)
   uniqv[which.max(tabulate(match(v, uniqv)))]
}

# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)

# Calculate the mode using the user function.
result <- getmode(v)
print(result)

# Create the vector with characters.
charv <- c("o","it","the","it","it")

# Calculate the mode using the user function.
result <- getmode(charv)
print(result)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] 2
[1] "it"