Seaborn - Veri Kümelerini ve Kitaplıkları İçe Aktarma

Bu bölümde, Veri Kümelerinin ve Kitaplıkların nasıl içe aktarılacağını tartışacağız. Kitaplıkların nasıl içe aktarılacağını anlayarak başlayalım.

Kitaplıkları İçe Aktarma

İlişkisel (tablo biçiminde) veri kümelerini yönetmek için harika bir kitaplık olan Pandas'ı içe aktararak başlayalım. Seaborn, veri analizi için en yaygın olarak kullanılan veri yapısı olan DataFrames ile uğraşırken işe yarar.

Aşağıdaki komut Pandaları içe aktarmanıza yardımcı olacaktır -

# Pandas for managing datasets
import pandas as pd

Şimdi, grafiklerimizi özelleştirmemize yardımcı olan Matplotlib kitaplığını içe aktaralım.

# Matplotlib for additional customization
from matplotlib import pyplot as plt

Seaborn kitaplığını aşağıdaki komutla içe aktaracağız -

# Seaborn for plotting and styling
import seaborn as sb

Veri Kümelerini İçe Aktarma

Gerekli kitaplıkları içe aktardık. Bu bölümde, gerekli veri setlerinin nasıl içe aktarılacağını anlayacağız.

Seaborn, kütüphanede birkaç önemli veri kümesiyle birlikte gelir. Seaborn kurulduğunda, veri kümeleri otomatik olarak indirilir.

Öğrenmek için bu veri kümelerinden herhangi birini kullanabilirsiniz. Aşağıdaki fonksiyonun yardımıyla gerekli veri setini yükleyebilirsiniz

load_dataset()

Verileri Pandas DataFrame olarak İçe Aktarma

Bu bölümde, bir veri setini içe aktaracağız. Bu veri kümesi, varsayılan olarak Pandas DataFrame olarak yüklenir. Pandas DataFrame'de herhangi bir işlev varsa, bu DataFrame'de çalışır.

Aşağıdaki kod satırı, veri kümesini içe aktarmanıza yardımcı olacaktır -

# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()

Yukarıdaki kod satırı aşağıdaki çıktıyı üretecektir -

total_bill  tip   sex    smoker day  time   size
0    16.99    1.01   Female  No    Sun  Dinner  2
1    10.34    1.66   Male    No    Sun  Dinner  3
2    21.01    3.50   Male    No    Sun  Dinner  3
3    23.68    3.31   Male    No    Sun  Dinner  2
4    24.59    3.61   Female  No    Sun  Dinner  4

Seaborn kitaplığındaki mevcut tüm veri setlerini görüntülemek için aşağıdaki komutu kullanarak get_dataset_names() aşağıda gösterildiği gibi işlev -

import seaborn as sb
print sb.get_dataset_names()

Yukarıdaki kod satırı, aşağıdaki çıktı olarak mevcut veri kümelerinin listesini döndürecektir.

[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots', 
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips', 
u'titanic']

DataFramesverileri, verilerin kolayca görüntülenebileceği dikdörtgen ızgaralar biçiminde depolayın. Dikdörtgen ızgaranın her satırı, bir örneğin değerlerini içerir ve ızgaranın her sütunu, belirli bir değişken için verileri tutan bir vektördür. Bu, bir DataFrame'in satırlarının aynı veri türündeki değerleri içermesine gerek olmadığı, sayısal, karakterli, mantıksal vb. Olabileceği anlamına gelir. Python için DataFrames, Pandas kitaplığıyla birlikte gelir ve iki boyutlu etiketli veri yapıları olarak tanımlanır. potansiyel olarak farklı sütun türleri ile.

DataFrames ilgili daha fazla ayrıntı için lütfen ziyaret öğretici pandalar hakkında.