Pengantar Struktur Data
Panda berurusan dengan tiga struktur data berikut -
- Series
- DataFrame
- Panel
Struktur data ini dibangun di atas array Numpy, yang artinya cepat.
Dimensi & Deskripsi
Cara terbaik untuk memikirkan struktur data ini adalah bahwa struktur data berdimensi lebih tinggi adalah wadah dari struktur data berdimensi lebih rendah. Misalnya, DataFrame adalah wadah Seri, Panel adalah wadah DataFrame.
Struktur data | Ukuran | Deskripsi |
---|---|---|
Seri | 1 | 1D berlabel larik homogen, ukuran tidak dapat diubah. |
Bingkai Data | 2 | Umum 2D berlabel, struktur tabel yang dapat diubah ukurannya dengan kolom yang berpotensi diketik secara heterogen. |
Panel | 3 | Umum berlabel 3D, larik yang dapat diubah ukurannya. |
Membangun dan menangani array dua atau lebih dimensi adalah tugas yang membosankan, beban ditempatkan pada pengguna untuk mempertimbangkan orientasi kumpulan data saat menulis fungsi. Tetapi dengan menggunakan struktur data Pandas, upaya mental pengguna berkurang.
Misalnya, dengan data tabular (DataFrame), akan lebih membantu jika memikirkan file index (baris) dan columns bukan sumbu 0 dan sumbu 1.
Mutabilitas
Semua struktur data Pandas adalah nilai yang dapat berubah (dapat diubah) dan kecuali Seri, semuanya dapat diubah ukurannya. Seri adalah ukuran yang tidak berubah.
Note- DataFrame banyak digunakan dan salah satu struktur data terpenting. Panel digunakan lebih sedikit.
Seri
Seri adalah struktur seperti array satu dimensi dengan data yang homogen. Misalnya, rangkaian berikut adalah kumpulan bilangan bulat 10, 23, 56,…
10 | 23 | 56 | 17 | 52 | 61 | 73 | 90 | 26 | 72 |
Poin Utama
- Data homogen
- Ukuran Tidak Berubah
- Nilai Data yang Dapat Diubah
DataFrame
DataFrame adalah array dua dimensi dengan data heterogen. Sebagai contoh,
Nama | Usia | Jenis kelamin | Peringkat |
---|---|---|---|
Steve | 32 | Pria | 3.45 |
Lia | 28 | Perempuan | 4.6 |
Vin | 45 | Pria | 3.9 |
Katie | 38 | Perempuan | 2.78 |
Tabel tersebut mewakili data tim penjualan dari suatu organisasi dengan peringkat kinerjanya secara keseluruhan. Data direpresentasikan dalam baris dan kolom. Setiap kolom mewakili atribut dan setiap baris mewakili seseorang.
Jenis Data Kolom
Tipe data dari empat kolom adalah sebagai berikut -
Kolom | Tipe |
---|---|
Nama | Tali |
Usia | Bilangan bulat |
Jenis kelamin | Tali |
Peringkat | Mengapung |
Poin Utama
- Data heterogen
- Ukuran Dapat Berubah
- Data Dapat Diubah
Panel
Panel merupakan struktur data tiga dimensi dengan data yang heterogen. Sulit untuk merepresentasikan panel dalam representasi grafis. Tapi panel dapat diilustrasikan sebagai wadah DataFrame.
Poin Utama
- Data heterogen
- Ukuran Dapat Berubah
- Data Dapat Diubah