ggplot2-시계열
시계열은 특정 시간 순서로 일련의 데이터 포인트를 나타내는 그래픽 플롯입니다. 시계열은 연속적으로 동일한 간격의 시점에서 시퀀스로 촬영 한 시퀀스입니다. 시계열은 이산 시간 데이터로 간주 할 수 있습니다. 이 장에서 사용할 데이터 세트는 미국 경제 시계열의 모든 세부 정보를 포함하는 "경제학"데이터 세트입니다.
데이터 프레임에는 아래에 언급 된 다음 속성이 포함됩니다.
데이트 | 데이터 수집 월 |
Psavert | 개인 저축률 |
PC | 개인 소비 지출 |
실업 | 수천 명의 실업자 수 |
강조되지 않음 | 실업 기간 중앙값 |
팝 | 수천의 총 인구 |
필수 패키지를로드하고 기본 테마를 설정하여 시계열을 만듭니다.
> library(ggplot2)
> theme_set(theme_minimal())
> # Demo dataset
> head(economics)
# A tibble: 6 x 6
date pce pop psavert uempmed unemploy
<date> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1967-07-01 507. 198712 12.6 4.5 2944
2 1967-08-01 510. 198911 12.6 4.7 2945
3 1967-09-01 516. 199113 11.9 4.6 2958
4 1967-10-01 512. 199311 12.9 4.9 3143
5 1967-11-01 517. 199498 12.8 4.7 3066
6 1967-12-01 525. 199657 11.8 4.8 3018
시계열 구조를 만드는 기본 선 플롯을 만듭니다.
> # Basic line plot
> ggplot(data = economics, aes(x = date, y = pop))+
+ geom_line(color = "#00AFBB", size = 2)
다음 명령을 사용하여 데이터의 하위 집합을 그릴 수 있습니다.
> # Plot a subset of the data
> ss <- subset(economics, date > as.Date("2006-1-1"))
> ggplot(data = ss, aes(x = date, y = pop)) +
+ geom_line(color = "#FC4E07", size = 2)
시계열 생성
여기에서는 psavert 및 uempmed 변수를 날짜별로 플로팅합니다. 여기서 우리는 tidyr 패키지를 사용하여 데이터의 형태를 변경해야합니다. 이는 동일한 열 (새 열)에서 psavert 및 uempmed 값을 축소하여 수행 할 수 있습니다. R 함수 : gather () [tidyr]. 다음 단계는 수준이 psavert 및 uempmed 인 그룹화 변수를 만드는 것입니다.
> library(tidyr)
> library(dplyr)
Attaching package: ‘dplyr’
The following object is masked from ‘package:ggplot2’: vars
The following objects are masked from ‘package:stats’: filter, lag
The following objects are masked from ‘package:base’: intersect, setdiff, setequal, union
> df <- economics %>%
+ select(date, psavert, uempmed) %>%
+ gather(key = "variable", value = "value", -date)
> head(df, 3)
# A tibble: 3 x 3
date variable value
<date> <chr> <dbl>
1 1967-07-01 psavert 12.6
2 1967-08-01 psavert 12.6
3 1967-09-01 psavert 11.9
"psavert"와 "unempmed"사이의 관계를 살펴보기 위해 다음 명령을 사용하여 다중 라인 플롯을 만듭니다.
> ggplot(df, aes(x = date, y = value)) +
+ geom_line(aes(color = variable), size = 1) +
+ scale_color_manual(values = c("#00AFBB", "#E7B800")) +
+ theme_minimal()