Veri Yapılarına Giriş

Pandalar aşağıdaki üç veri yapısıyla ilgilenir -

  • Series
  • DataFrame
  • Panel

Bu veri yapıları, Numpy dizisi üzerine inşa edilmiştir, bu da hızlı oldukları anlamına gelir.

Boyut ve Açıklama

Bu veri yapılarını düşünmenin en iyi yolu, yüksek boyutlu veri yapısının, daha düşük boyutlu veri yapısının bir kabı olmasıdır. Örneğin, DataFrame bir Series kapsayıcıdır, Panel bir DataFrame kapsayıcısıdır.

Veri yapısı Boyutlar Açıklama
Dizi 1 1D etiketli homojen dizi, boyut değiştirilemez.
Veri Çerçeveleri 2 Potansiyel olarak heterojen tipte sütunlara sahip genel 2D etiketli, boyutu değişebilir tablo yapısı.
Panel 3 Genel 3B etiketli, boyut değiştirilebilir dizi.

İki veya daha fazla boyutlu dizilerin oluşturulması ve kullanılması meşakkatli bir iştir, işlevler yazılırken veri kümesinin yönünü dikkate alma yükü kullanıcıya yüklenir. Ancak Pandalar veri yapılarını kullanarak, kullanıcının zihinsel çabası azalır.

Örneğin, tablo verileriyle (DataFrame), anlamsal olarak index (satırlar) ve columns Eksen 0 ve eksen 1 yerine.

Değişkenlik

Tüm Pandalar veri yapıları değiştirilebilir (değiştirilebilir) ve Seriler dışında tümü boyut değiştirilebilir. Seri boyut değiştirilemez.

Note- DataFrame yaygın olarak kullanılmaktadır ve en önemli veri yapılarından biridir. Panel çok daha az kullanılır.

Dizi

Seri, homojen verilere sahip tek boyutlu dizi benzeri bir yapıdır. Örneğin, aşağıdaki dizi 10, 23, 56,… tam sayılarından oluşan bir koleksiyondur.

10 23 56 17 52 61 73 90 26 72

Anahtar noktaları

  • Homojen veriler
  • Boyut Değişmez
  • Değişken Verilerin Değerleri

Veri çerçevesi

DataFrame, heterojen verilere sahip iki boyutlu bir dizidir. Örneğin,

İsim Yaş Cinsiyet Değerlendirme
Steve 32 Erkek 3.45
Lia 28 Kadın 4.6
Vin 45 Erkek 3.9
Katie 38 Kadın 2.78

Tablo, bir organizasyonun satış ekibinin verilerini genel performans derecelendirmeleriyle temsil eder. Veriler satırlar ve sütunlar halinde temsil edilir. Her sütun bir özniteliği temsil eder ve her satır bir kişiyi temsil eder.

Sütunların Veri Türü

Dört sütunun veri türleri aşağıdaki gibidir -

Sütun Tür
İsim Dize
Yaş Tamsayı
Cinsiyet Dize
Değerlendirme Yüzer

Anahtar noktaları

  • Heterojen veriler
  • Boyut Değişebilir
  • Veri Değişebilir

Panel

Panel, heterojen veriler içeren üç boyutlu bir veri yapısıdır. Paneli grafik olarak temsil etmek zordur. Ancak bir panel, bir DataFrame konteyneri olarak gösterilebilir.

Anahtar noktaları

  • Heterojen veriler
  • Boyut Değişebilir
  • Veri Değişebilir