Seaborn - Veri Kümelerini ve Kitaplıkları İçe Aktarma
Bu bölümde, Veri Kümelerinin ve Kitaplıkların nasıl içe aktarılacağını tartışacağız. Kitaplıkların nasıl içe aktarılacağını anlayarak başlayalım.
Kitaplıkları İçe Aktarma
İlişkisel (tablo biçiminde) veri kümelerini yönetmek için harika bir kitaplık olan Pandas'ı içe aktararak başlayalım. Seaborn, veri analizi için en yaygın olarak kullanılan veri yapısı olan DataFrames ile uğraşırken işe yarar.
Aşağıdaki komut Pandaları içe aktarmanıza yardımcı olacaktır -
# Pandas for managing datasets
import pandas as pd
Şimdi, grafiklerimizi özelleştirmemize yardımcı olan Matplotlib kitaplığını içe aktaralım.
# Matplotlib for additional customization
from matplotlib import pyplot as plt
Seaborn kitaplığını aşağıdaki komutla içe aktaracağız -
# Seaborn for plotting and styling
import seaborn as sb
Veri Kümelerini İçe Aktarma
Gerekli kitaplıkları içe aktardık. Bu bölümde, gerekli veri setlerinin nasıl içe aktarılacağını anlayacağız.
Seaborn, kütüphanede birkaç önemli veri kümesiyle birlikte gelir. Seaborn kurulduğunda, veri kümeleri otomatik olarak indirilir.
Öğrenmek için bu veri kümelerinden herhangi birini kullanabilirsiniz. Aşağıdaki fonksiyonun yardımıyla gerekli veri setini yükleyebilirsiniz
load_dataset()
Verileri Pandas DataFrame olarak İçe Aktarma
Bu bölümde, bir veri setini içe aktaracağız. Bu veri kümesi, varsayılan olarak Pandas DataFrame olarak yüklenir. Pandas DataFrame'de herhangi bir işlev varsa, bu DataFrame'de çalışır.
Aşağıdaki kod satırı, veri kümesini içe aktarmanıza yardımcı olacaktır -
# Seaborn for plotting and styling
import seaborn as sb
df = sb.load_dataset('tips')
print df.head()
Yukarıdaki kod satırı aşağıdaki çıktıyı üretecektir -
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
Seaborn kitaplığındaki mevcut tüm veri setlerini görüntülemek için aşağıdaki komutu kullanarak get_dataset_names() aşağıda gösterildiği gibi işlev -
import seaborn as sb
print sb.get_dataset_names()
Yukarıdaki kod satırı, aşağıdaki çıktı olarak mevcut veri kümelerinin listesini döndürecektir.
[u'anscombe', u'attention', u'brain_networks', u'car_crashes', u'dots',
u'exercise', u'flights', u'fmri', u'gammas', u'iris', u'planets', u'tips',
u'titanic']
DataFramesverileri, verilerin kolayca görüntülenebileceği dikdörtgen ızgaralar biçiminde depolayın. Dikdörtgen ızgaranın her satırı, bir örneğin değerlerini içerir ve ızgaranın her sütunu, belirli bir değişken için verileri tutan bir vektördür. Bu, bir DataFrame'in satırlarının aynı veri türündeki değerleri içermesine gerek olmadığı, sayısal, karakterli, mantıksal vb. Olabileceği anlamına gelir. Python için DataFrames, Pandas kitaplığıyla birlikte gelir ve iki boyutlu etiketli veri yapıları olarak tanımlanır. potansiyel olarak farklı sütun türleri ile.
DataFrames ilgili daha fazla ayrıntı için lütfen ziyaret öğretici pandalar hakkında.