데이터 구조 소개
Pandas는 다음 세 가지 데이터 구조를 다룹니다.
- Series
- DataFrame
- Panel
이러한 데이터 구조는 Numpy 배열 위에 구축되므로 빠릅니다.
치수 및 설명
이러한 데이터 구조를 생각하는 가장 좋은 방법은 고차원 데이터 구조가 저 차원 데이터 구조의 컨테이너라는 것입니다. 예를 들어 DataFrame은 Series의 컨테이너이고 Panel은 DataFrame의 컨테이너입니다.
데이터 구조 | 치수 | 기술 |
---|---|---|
시리즈 | 1 | 1D 레이블이 지정된 동종 배열, 크기는 변경할 수 없습니다. |
데이터 프레임 | 2 | 유형이 다른 열이있는 일반 2D 레이블, 크기 변경 가능한 표 구조. |
패널 | 삼 | 일반적인 3D 레이블, 크기 변경 가능 배열. |
2 차원 이상의 배열을 만들고 처리하는 것은 지루한 작업이며, 함수를 작성할 때 데이터 세트의 방향을 고려해야하는 부담이 사용자에게 있습니다. 그러나 Pandas 데이터 구조를 사용하면 사용자의 정신적 노력이 줄어 듭니다.
예를 들어 테이블 형식 데이터 (DataFrame)의 경우 다음을 생각하는 것이 의미 론적으로 더 유용합니다. index (행) 및 columns 축 0과 축 1이 아니라
가변성
모든 Pandas 데이터 구조는 값을 변경할 수 있으며 (변경 가능) Series를 제외하고 모두 크기를 변경할 수 있습니다. 시리즈는 크기를 변경할 수 없습니다.
Note− DataFrame은 널리 사용되며 가장 중요한 데이터 구조 중 하나입니다. 패널은 훨씬 적게 사용됩니다.
시리즈
시리즈는 동일한 데이터가있는 구조와 같은 1 차원 배열입니다. 예를 들어, 다음 시리즈는 정수 10, 23, 56,…
10 | 23 | 56 | 17 | 52 | 61 | 73 | 90 | 26 | 72 |
키 포인트
- 동종 데이터
- 크기 불변
- 가변 데이터의 가치
DataFrame
DataFrame은 이기종 데이터가 포함 된 2 차원 배열입니다. 예를 들면
이름 | 나이 | 성별 | 평가 |
---|---|---|---|
스티브 | 32 | 남성 | 3.45 |
리아 | 28 | 여자 | 4.6 |
빈 | 45 | 남성 | 3.9 |
케이티 | 38 | 여자 | 2.78 |
이 표는 전체 성과 등급과 함께 조직의 영업 팀 데이터를 나타냅니다. 데이터는 행과 열로 표시됩니다. 각 열은 속성을 나타내고 각 행은 사람을 나타냅니다.
열의 데이터 유형
네 열의 데이터 유형은 다음과 같습니다.
기둥 | 유형 |
---|---|
이름 | 끈 |
나이 | 정수 |
성별 | 끈 |
평가 | 흙손 |
키 포인트
- 이기종 데이터
- 크기 변경 가능
- 데이터 변경 가능
패널
패널은 이기종 데이터가있는 3 차원 데이터 구조입니다. 패널을 그래픽으로 표현하는 것은 어렵습니다. 그러나 패널은 DataFrame의 컨테이너로 설명 할 수 있습니다.
키 포인트
- 이기종 데이터
- 크기 변경 가능
- 데이터 변경 가능