Python - Operasi Data
Python menangani data dalam berbagai format terutama melalui dua pustaka, Pandas dan Numpy. Kita telah melihat fitur-fitur penting dari kedua perpustakaan ini di bab-bab sebelumnya. Dalam bab ini kita akan melihat beberapa contoh dasar dari masing-masing perpustakaan tentang cara mengoperasikan data.
Operasi Data di Numpy
Objek paling penting yang didefinisikan di NumPy adalah tipe array berdimensi-N yang disebut ndarray. Ini menggambarkan koleksi item dari jenis yang sama. Item dalam koleksi dapat diakses menggunakan indeks berbasis nol. Sebuah instance dari kelas ndarray dapat dibangun oleh rutinitas pembuatan array yang berbeda yang dijelaskan nanti dalam tutorial. Ndarray dasar dibuat menggunakan fungsi array di NumPy sebagai berikut -
numpy.array
Berikut adalah beberapa contoh penanganan Numpy Data.
Contoh 1
# more than one dimensions
import numpy as np
a = np.array([[1, 2], [3, 4]])
print a
Outputnya adalah sebagai berikut -
[[1, 2]
[3, 4]]
Contoh 2
# minimum dimensions
import numpy as np
a = np.array([1, 2, 3,4,5], ndmin = 2)
print a
Outputnya adalah sebagai berikut -
[[1, 2, 3, 4, 5]]
Contoh 3
# dtype parameter
import numpy as np
a = np.array([1, 2, 3], dtype = complex)
print a
Outputnya adalah sebagai berikut -
[ 1.+0.j, 2.+0.j, 3.+0.j]
Operasi Data di Pandas
Panda menangani data melalui Series,Data Frame, dan Panel. Kami akan melihat beberapa contoh dari masing-masing ini.
Seri Panda
Seri adalah larik berlabel satu dimensi yang mampu menampung data jenis apa pun (bilangan bulat, string, float, objek python, dll.). Label sumbu secara kolektif disebut indeks. Seri panda dapat dibuat menggunakan konstruktor berikut -
pandas.Series( data, index, dtype, copy)
Contoh
Di sini kami membuat seri dari Numpy Array.
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print s
Nya output adalah sebagai berikut -
0 a
1 b
2 c
3 d
dtype: object
Pandas DataFrame
Kerangka data adalah struktur data dua dimensi, yaitu, data disejajarkan dalam bentuk tabel dalam baris dan kolom. DataFrame pandas dapat dibuat menggunakan konstruktor berikut -
pandas.DataFrame( data, index, columns, dtype, copy)
Mari kita sekarang membuat DataFrame yang diindeks menggunakan array.
import pandas as pd
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['rank1','rank2','rank3','rank4'])
print df
Nya output adalah sebagai berikut -
Age Name
rank1 28 Tom
rank2 34 Jack
rank3 29 Steve
rank4 42 Ricky
Panel Pandas
SEBUAH paneladalah wadah data 3D. SyaratPanel data berasal dari ekonometrik dan sebagian bertanggung jawab atas nama panda - pan(el)-da(ta)-s.
Panel dapat dibuat menggunakan konstruktor berikut -
pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)
Dalam contoh di bawah ini kami membuat panel dari dict dari Objek DataFrame
#creating an empty panel
import pandas as pd
import numpy as np
data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)),
'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p
Nya output adalah sebagai berikut -
<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4