R-상자 그림
상자 그림은 데이터 세트의 데이터가 얼마나 잘 분포되어 있는지를 측정 한 것입니다. 데이터 세트를 3 사 분위수로 나눕니다. 이 그래프는 데이터 세트의 최소, 최대, 중앙값, 1 사 분위수 및 3 사 분위수를 나타냅니다. 또한 각 데이터 세트에 대한 상자 그림을 그려 데이터 세트 간의 데이터 분포를 비교하는 데 유용합니다.
상자 그림은 R에서 boxplot() 함수.
통사론
R에서 상자 그림을 만드는 기본 구문은 다음과 같습니다.
boxplot(x, data, notch, varwidth, names, main)
다음은 사용 된 매개 변수에 대한 설명입니다.
x 벡터 또는 공식입니다.
data 데이터 프레임입니다.
notch논리 값입니다. 노치를 그리려면 TRUE로 설정하십시오.
varwidth논리 값입니다. 샘플 크기에 비례하는 상자의 너비를 그리려면 true로 설정합니다.
names 각 상자 그림 아래에 인쇄 될 그룹 레이블입니다.
main 그래프에 제목을 지정하는 데 사용됩니다.
예
R 환경에서 사용할 수있는 데이터 세트 "mtcars"를 사용하여 기본 상자 그림을 만듭니다. mtcars의 "mpg"및 "cyl"열을 살펴 보겠습니다.
input <- mtcars[,c('mpg','cyl')]
print(head(input))
위의 코드를 실행하면 다음과 같은 결과가 생성됩니다.
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
상자 그림 만들기
아래 스크립트는 mpg (갤런 당 마일)와 cyl (실린더 수) 간의 관계에 대한 상자 그림 그래프를 생성합니다.
# Give the chart file a name.
png(file = "boxplot.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
ylab = "Miles Per Gallon", main = "Mileage Data")
# Save the file.
dev.off()
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
노치가있는 상자 그림
노치가있는 상자 그림을 그려서 서로 다른 데이터 그룹의 중앙값이 서로 어떻게 일치하는지 알아낼 수 있습니다.
아래 스크립트는 각 데이터 그룹에 대한 노치가있는 상자 그림 그래프를 생성합니다.
# Give the chart file a name.
png(file = "boxplot_with_notch.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
xlab = "Number of Cylinders",
ylab = "Miles Per Gallon",
main = "Mileage Data",
notch = TRUE,
varwidth = TRUE,
col = c("green","yellow","purple"),
names = c("High","Medium","Low")
)
# Save the file.
dev.off()
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.