Python - Operasi Data

Python menangani data dalam berbagai format terutama melalui dua pustaka, Pandas dan Numpy. Kita telah melihat fitur-fitur penting dari kedua perpustakaan ini di bab-bab sebelumnya. Dalam bab ini kita akan melihat beberapa contoh dasar dari masing-masing perpustakaan tentang cara mengoperasikan data.

Operasi Data di Numpy

Objek paling penting yang didefinisikan di NumPy adalah tipe array berdimensi-N yang disebut ndarray. Ini menggambarkan koleksi item dari jenis yang sama. Item dalam koleksi dapat diakses menggunakan indeks berbasis nol. Sebuah instance dari kelas ndarray dapat dibangun oleh rutinitas pembuatan array yang berbeda yang dijelaskan nanti dalam tutorial. Ndarray dasar dibuat menggunakan fungsi array di NumPy sebagai berikut -

numpy.array

Berikut adalah beberapa contoh penanganan Numpy Data.

Contoh 1

# more than one dimensions 
import numpy as np 
a = np.array([[1, 2], [3, 4]]) 
print a

Outputnya adalah sebagai berikut -

[[1, 2] 
 [3, 4]]

Contoh 2

# minimum dimensions 
import numpy as np 
a = np.array([1, 2, 3,4,5], ndmin = 2) 
print a

Outputnya adalah sebagai berikut -

[[1, 2, 3, 4, 5]]

Contoh 3

# dtype parameter 
import numpy as np 
a = np.array([1, 2, 3], dtype = complex) 
print a

Outputnya adalah sebagai berikut -

[ 1.+0.j,  2.+0.j,  3.+0.j]

Operasi Data di Pandas

Panda menangani data melalui Series,Data Frame, dan Panel. Kami akan melihat beberapa contoh dari masing-masing ini.

Seri Panda

Seri adalah larik berlabel satu dimensi yang mampu menampung data jenis apa pun (bilangan bulat, string, float, objek python, dll.). Label sumbu secara kolektif disebut indeks. Seri panda dapat dibuat menggunakan konstruktor berikut -

pandas.Series( data, index, dtype, copy)

Contoh

Di sini kami membuat seri dari Numpy Array.

#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print s

Nya output adalah sebagai berikut -

0   a
1   b
2   c
3   d
dtype: object

Pandas DataFrame

Kerangka data adalah struktur data dua dimensi, yaitu, data disejajarkan dalam bentuk tabel dalam baris dan kolom. DataFrame pandas dapat dibuat menggunakan konstruktor berikut -

pandas.DataFrame( data, index, columns, dtype, copy)

Mari kita sekarang membuat DataFrame yang diindeks menggunakan array.

import pandas as pd
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['rank1','rank2','rank3','rank4'])
print df

Nya output adalah sebagai berikut -

Age    Name
rank1    28      Tom
rank2    34     Jack
rank3    29    Steve
rank4    42    Ricky

Panel Pandas

SEBUAH paneladalah wadah data 3D. SyaratPanel data berasal dari ekonometrik dan sebagian bertanggung jawab atas nama panda - pan(el)-da(ta)-s.

Panel dapat dibuat menggunakan konstruktor berikut -

pandas.Panel(data, items, major_axis, minor_axis, dtype, copy)

Dalam contoh di bawah ini kami membuat panel dari dict dari Objek DataFrame

#creating an empty panel
import pandas as pd
import numpy as np

data = {'Item1' : pd.DataFrame(np.random.randn(4, 3)), 
        'Item2' : pd.DataFrame(np.random.randn(4, 2))}
p = pd.Panel(data)
print p

Nya output adalah sebagai berikut -

<class 'pandas.core.panel.Panel'>
Dimensions: 2 (items) x 4 (major_axis) x 5 (minor_axis)
Items axis: 0 to 1
Major_axis axis: 0 to 3
Minor_axis axis: 0 to 4