R-산점도
산점도는 데카르트 평면에 그려진 많은 점을 보여줍니다. 각 점은 두 변수의 값을 나타냅니다. 하나의 변수는 수평 축에서 선택되고 다른 하나는 수직 축에서 선택됩니다.
단순 산점도는 plot() 함수.
통사론
R에서 산점도를 만드는 기본 구문은 다음과 같습니다.
plot(x, y, main, xlab, ylab, xlim, ylim, axes)
다음은 사용 된 매개 변수에 대한 설명입니다.
x 값이 수평 좌표 인 데이터 세트입니다.
y 값이 수직 좌표 인 데이터 세트입니다.
main 그래프의 타일입니다.
xlab 가로축의 레이블입니다.
ylab 세로축의 레이블입니다.
xlim 플로팅에 사용되는 x 값의 한계입니다.
ylim 플로팅에 사용되는 y 값의 한계입니다.
axes 두 축을 플롯에 그려야하는지 여부를 나타냅니다.
예
우리는 데이터 세트를 사용합니다. "mtcars"R 환경에서 기본 산점도를 생성 할 수 있습니다. mtcars에서 "wt"및 "mpg"열을 사용하겠습니다.
input <- mtcars[,c('wt','mpg')]
print(head(input))
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
wt mpg
Mazda RX4 2.620 21.0
Mazda RX4 Wag 2.875 21.0
Datsun 710 2.320 22.8
Hornet 4 Drive 3.215 21.4
Hornet Sportabout 3.440 18.7
Valiant 3.460 18.1
산점도 만들기
아래 스크립트는 wt (무게)와 mpg (갤런 당 마일) 사이의 관계에 대한 산점도 그래프를 생성합니다.
# Get the input values.
input <- mtcars[,c('wt','mpg')]
# Give the chart file a name.
png(file = "scatterplot.png")
# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
xlab = "Weight",
ylab = "Milage",
xlim = c(2.5,5),
ylim = c(15,30),
main = "Weight vs Milage"
)
# Save the file.
dev.off()
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
산점도 행렬
두 개 이상의 변수가 있고 한 변수와 나머지 변수 간의 상관 관계를 찾으려면 산점도 행렬을 사용합니다. 우리는 사용pairs() 산점도 행렬을 생성하는 함수입니다.
통사론
R에서 산점도 행렬을 만드는 기본 구문은 다음과 같습니다.
pairs(formula, data)
다음은 사용 된 매개 변수에 대한 설명입니다.
formula 쌍으로 사용되는 일련의 변수를 나타냅니다.
data 변수를 가져올 데이터 세트를 나타냅니다.
예
각 변수는 나머지 각 변수와 쌍을 이룹니다. 각 쌍에 대해 산점도가 그려집니다.
# Give the chart file a name.
png(file = "scatterplot_matrices.png")
# Plot the matrices between 4 variables giving 12 plots.
# One variable with 3 others and total 4 variables.
pairs(~wt+mpg+disp+cyl,data = mtcars,
main = "Scatterplot Matrix")
# Save the file.
dev.off()
위의 코드가 실행되면 다음과 같은 결과가 나옵니다.