Python Pandas-날짜 기능

시계열을 확장하면 날짜 기능이 재무 데이터 분석에서 중요한 역할을합니다. 날짜 데이터로 작업하는 동안 우리는 자주 다음을 보게 될 것입니다.

  • 날짜 순서 생성
  • 날짜 시리즈를 다른 빈도로 변환

날짜 범위 만들기

사용 date.range()기간과 빈도를 지정하여 함수를 사용하면 날짜 시리즈를 만들 수 있습니다. 기본적으로 범위 빈도는 일입니다.

import pandas as pd

print pd.date_range('1/1/2011', periods=5)

이것의 output 다음과 같습니다-

DatetimeIndex(['2011-01-01', '2011-01-02', '2011-01-03', '2011-01-04', '2011-01-05'],
   dtype='datetime64[ns]', freq='D')

날짜 빈도 변경

import pandas as pd

print pd.date_range('1/1/2011', periods=5,freq='M')

이것의 output 다음과 같습니다-

DatetimeIndex(['2011-01-31', '2011-02-28', '2011-03-31', '2011-04-30', '2011-05-31'],
   dtype='datetime64[ns]', freq='M')

bdate_range

bdate_range ()는 비즈니스 날짜 범위를 나타냅니다. date_range ()와 달리 토요일과 일요일을 제외합니다.

import pandas as pd

print pd.date_range('1/1/2011', periods=5)

이것의 output 다음과 같습니다-

DatetimeIndex(['2011-01-01', '2011-01-02', '2011-01-03', '2011-01-04', '2011-01-05'],
   dtype='datetime64[ns]', freq='D')

3 월 3 일 이후에는 날짜가 4 일과 5 일을 제외하고 3 월 6 일로 점프합니다. 달력에서 요일을 확인하십시오.

다음과 같은 편의 기능 date_rangebdate_range다양한 주파수 별칭을 활용합니다. date_range의 기본 빈도는 달력 일이고 bdate_range의 기본값은 영업일입니다.

import pandas as pd
start = pd.datetime(2011, 1, 1)
end = pd.datetime(2011, 1, 5)

print pd.date_range(start, end)

이것의 output 다음과 같습니다-

DatetimeIndex(['2011-01-01', '2011-01-02', '2011-01-03', '2011-01-04', '2011-01-05'],
   dtype='datetime64[ns]', freq='D')

오프셋 별칭

유용한 공통 시계열 주파수에 여러 문자열 별칭이 제공됩니다. 이러한 별칭을 오프셋 별칭이라고합니다.

별명 기술 별명 기술
영업일 빈도 BQS 비즈니스 분기 시작 빈도
달력 일 빈도 연간 (연도) 종료 빈도
W 주간 빈도 BA 비즈니스 연말 빈도
미디엄 월말 빈도 BAS 사업 연도 시작 빈도
SM 반달 종료 빈도 BH 업무 시간 빈도
BM 영업 월 종료 빈도 H 시간당 빈도
MS 월 시작 빈도 T, 분 미세한 빈도
SMS SMS 반월 시작 빈도 에스 두 번째 빈도
BMS 영업 월 시작 빈도 L, ms 밀리 초
분기 종료 빈도 U, 우리 마이크로 초
BQ 비즈니스 분기 종료 빈도 나노초
QS 분기 시작 빈도