Pengantar Struktur Data

Panda berurusan dengan tiga struktur data berikut -

  • Series
  • DataFrame
  • Panel

Struktur data ini dibangun di atas array Numpy, yang artinya cepat.

Dimensi & Deskripsi

Cara terbaik untuk memikirkan struktur data ini adalah bahwa struktur data berdimensi lebih tinggi adalah wadah dari struktur data berdimensi lebih rendah. Misalnya, DataFrame adalah wadah Seri, Panel adalah wadah DataFrame.

Struktur data Ukuran Deskripsi
Seri 1 1D berlabel larik homogen, ukuran tidak dapat diubah.
Bingkai Data 2 Umum 2D berlabel, struktur tabel yang dapat diubah ukurannya dengan kolom yang berpotensi diketik secara heterogen.
Panel 3 Umum berlabel 3D, larik yang dapat diubah ukurannya.

Membangun dan menangani array dua atau lebih dimensi adalah tugas yang membosankan, beban ditempatkan pada pengguna untuk mempertimbangkan orientasi kumpulan data saat menulis fungsi. Tetapi dengan menggunakan struktur data Pandas, upaya mental pengguna berkurang.

Misalnya, dengan data tabular (DataFrame), akan lebih membantu jika memikirkan file index (baris) dan columns bukan sumbu 0 dan sumbu 1.

Mutabilitas

Semua struktur data Pandas adalah nilai yang dapat berubah (dapat diubah) dan kecuali Seri, semuanya dapat diubah ukurannya. Seri adalah ukuran yang tidak berubah.

Note- DataFrame banyak digunakan dan salah satu struktur data terpenting. Panel digunakan lebih sedikit.

Seri

Seri adalah struktur seperti array satu dimensi dengan data yang homogen. Misalnya, rangkaian berikut adalah kumpulan bilangan bulat 10, 23, 56,…

10 23 56 17 52 61 73 90 26 72

Poin Utama

  • Data homogen
  • Ukuran Tidak Berubah
  • Nilai Data yang Dapat Diubah

DataFrame

DataFrame adalah array dua dimensi dengan data heterogen. Sebagai contoh,

Nama Usia Jenis kelamin Peringkat
Steve 32 Pria 3.45
Lia 28 Perempuan 4.6
Vin 45 Pria 3.9
Katie 38 Perempuan 2.78

Tabel tersebut mewakili data tim penjualan dari suatu organisasi dengan peringkat kinerjanya secara keseluruhan. Data direpresentasikan dalam baris dan kolom. Setiap kolom mewakili atribut dan setiap baris mewakili seseorang.

Jenis Data Kolom

Tipe data dari empat kolom adalah sebagai berikut -

Kolom Tipe
Nama Tali
Usia Bilangan bulat
Jenis kelamin Tali
Peringkat Mengapung

Poin Utama

  • Data heterogen
  • Ukuran Dapat Berubah
  • Data Dapat Diubah

Panel

Panel merupakan struktur data tiga dimensi dengan data yang heterogen. Sulit untuk merepresentasikan panel dalam representasi grafis. Tapi panel dapat diilustrasikan sebagai wadah DataFrame.

Poin Utama

  • Data heterogen
  • Ukuran Dapat Berubah
  • Data Dapat Diubah