Python Pandas-날짜 기능
시계열을 확장하면 날짜 기능이 재무 데이터 분석에서 중요한 역할을합니다. 날짜 데이터로 작업하는 동안 우리는 자주 다음을 보게 될 것입니다.
- 날짜 순서 생성
- 날짜 시리즈를 다른 빈도로 변환
날짜 범위 만들기
사용 date.range()기간과 빈도를 지정하여 함수를 사용하면 날짜 시리즈를 만들 수 있습니다. 기본적으로 범위 빈도는 일입니다.
import pandas as pd
print pd.date_range('1/1/2011', periods=5)
이것의 output 다음과 같습니다-
DatetimeIndex(['2011-01-01', '2011-01-02', '2011-01-03', '2011-01-04', '2011-01-05'],
dtype='datetime64[ns]', freq='D')
날짜 빈도 변경
import pandas as pd
print pd.date_range('1/1/2011', periods=5,freq='M')
이것의 output 다음과 같습니다-
DatetimeIndex(['2011-01-31', '2011-02-28', '2011-03-31', '2011-04-30', '2011-05-31'],
dtype='datetime64[ns]', freq='M')
bdate_range
bdate_range ()는 비즈니스 날짜 범위를 나타냅니다. date_range ()와 달리 토요일과 일요일을 제외합니다.
import pandas as pd
print pd.date_range('1/1/2011', periods=5)
이것의 output 다음과 같습니다-
DatetimeIndex(['2011-01-01', '2011-01-02', '2011-01-03', '2011-01-04', '2011-01-05'],
dtype='datetime64[ns]', freq='D')
3 월 3 일 이후에는 날짜가 4 일과 5 일을 제외하고 3 월 6 일로 점프합니다. 달력에서 요일을 확인하십시오.
다음과 같은 편의 기능 date_range 과 bdate_range다양한 주파수 별칭을 활용합니다. date_range의 기본 빈도는 달력 일이고 bdate_range의 기본값은 영업일입니다.
import pandas as pd
start = pd.datetime(2011, 1, 1)
end = pd.datetime(2011, 1, 5)
print pd.date_range(start, end)
이것의 output 다음과 같습니다-
DatetimeIndex(['2011-01-01', '2011-01-02', '2011-01-03', '2011-01-04', '2011-01-05'],
dtype='datetime64[ns]', freq='D')
오프셋 별칭
유용한 공통 시계열 주파수에 여러 문자열 별칭이 제공됩니다. 이러한 별칭을 오프셋 별칭이라고합니다.
별명 | 기술 | 별명 | 기술 |
---|---|---|---|
비 | 영업일 빈도 | BQS | 비즈니스 분기 시작 빈도 |
디 | 달력 일 빈도 | ㅏ | 연간 (연도) 종료 빈도 |
W | 주간 빈도 | BA | 비즈니스 연말 빈도 |
미디엄 | 월말 빈도 | BAS | 사업 연도 시작 빈도 |
SM | 반달 종료 빈도 | BH | 업무 시간 빈도 |
BM | 영업 월 종료 빈도 | H | 시간당 빈도 |
MS | 월 시작 빈도 | T, 분 | 미세한 빈도 |
SMS | SMS 반월 시작 빈도 | 에스 | 두 번째 빈도 |
BMS | 영업 월 시작 빈도 | L, ms | 밀리 초 |
큐 | 분기 종료 빈도 | U, 우리 | 마이크로 초 |
BQ | 비즈니스 분기 종료 빈도 | 엔 | 나노초 |
QS | 분기 시작 빈도 |