NumPy - Fungsi Statistik

NumPy memiliki beberapa fungsi statistik yang berguna untuk menemukan standar deviasi dan varians minimum, maksimum, persentil, dll. Dari elemen yang diberikan dalam larik. Fungsi tersebut dijelaskan sebagai berikut -

numpy.amin () dan numpy.amax ()

Fungsi ini mengembalikan nilai minimum dan maksimum dari elemen dalam larik yang diberikan sepanjang sumbu yang ditentukan.

Contoh

import numpy as np 
a = np.array([[3,7,5],[8,4,3],[2,4,9]]) 

print 'Our array is:' 
print a  
print '\n'  

print 'Applying amin() function:' 
print np.amin(a,1) 
print '\n'  

print 'Applying amin() function again:' 
print np.amin(a,0) 
print '\n'  

print 'Applying amax() function:' 
print np.amax(a) 
print '\n'  

print 'Applying amax() function again:' 
print np.amax(a, axis = 0)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[[3 7 5]
[8 4 3]
[2 4 9]]

Applying amin() function:
[3 3 2]

Applying amin() function again:
[2 4 3]

Applying amax() function:
9

Applying amax() function again:
[8 7 9]

numpy.ptp ()

Itu numpy.ptp() fungsi mengembalikan rentang (maksimum-minimum) nilai di sepanjang sumbu.

import numpy as np 
a = np.array([[3,7,5],[8,4,3],[2,4,9]]) 

print 'Our array is:' 
print a 
print '\n'  

print 'Applying ptp() function:' 
print np.ptp(a) 
print '\n'  

print 'Applying ptp() function along axis 1:' 
print np.ptp(a, axis = 1) 
print '\n'   

print 'Applying ptp() function along axis 0:'
print np.ptp(a, axis = 0)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[[3 7 5]
[8 4 3]
[2 4 9]]

Applying ptp() function:
7

Applying ptp() function along axis 1:
[4 5 7]

Applying ptp() function along axis 0:
[6 3 6]

numpy.percentile ()

Persentil (atau persentil) adalah ukuran yang digunakan dalam statistik yang menunjukkan nilai di bawah persentase pengamatan tertentu dalam kelompok pengamatan. Fungsinyanumpy.percentile() mengambil argumen berikut.

numpy.percentile(a, q, axis)

Dimana,

Sr.No. Argumen & Deskripsi
1

a

Array masukan

2

q

Persentil yang akan dihitung harus antara 0-100

3

axis

Sumbu di mana persentil akan dihitung

Contoh

import numpy as np 
a = np.array([[30,40,70],[80,20,10],[50,90,60]]) 

print 'Our array is:' 
print a 
print '\n'  

print 'Applying percentile() function:' 
print np.percentile(a,50) 
print '\n'  

print 'Applying percentile() function along axis 1:' 
print np.percentile(a,50, axis = 1) 
print '\n'  

print 'Applying percentile() function along axis 0:' 
print np.percentile(a,50, axis = 0)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[[30 40 70]
 [80 20 10]
 [50 90 60]]

Applying percentile() function:
50.0

Applying percentile() function along axis 1:
[ 40. 20. 60.]

Applying percentile() function along axis 0:
[ 50. 40. 60.]

numpy.median ()

Mediandidefinisikan sebagai nilai yang memisahkan separuh sampel data yang lebih tinggi dari separuh yang lebih rendah. Itunumpy.median() fungsi digunakan seperti yang ditunjukkan pada program berikut.

Contoh

import numpy as np 
a = np.array([[30,65,70],[80,95,10],[50,90,60]]) 

print 'Our array is:' 
print a 
print '\n'  

print 'Applying median() function:' 
print np.median(a) 
print '\n'  

print 'Applying median() function along axis 0:' 
print np.median(a, axis = 0) 
print '\n'  
 
print 'Applying median() function along axis 1:' 
print np.median(a, axis = 1)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[[30 65 70]
 [80 95 10]
 [50 90 60]]

Applying median() function:
65.0

Applying median() function along axis 0:
[ 50. 90. 60.]

Applying median() function along axis 1:
[ 65. 80. 60.]

numpy.mean ()

Rata-rata aritmatika adalah jumlah elemen di sepanjang sumbu dibagi dengan jumlah elemen. Itunumpy.mean()fungsi mengembalikan mean aritmatika elemen dalam array. Jika sumbu disebutkan, maka dihitung sepanjang sumbu tersebut.

Contoh

import numpy as np 
a = np.array([[1,2,3],[3,4,5],[4,5,6]]) 

print 'Our array is:' 
print a 
print '\n'  

print 'Applying mean() function:' 
print np.mean(a) 
print '\n'  

print 'Applying mean() function along axis 0:' 
print np.mean(a, axis = 0) 
print '\n'  

print 'Applying mean() function along axis 1:' 
print np.mean(a, axis = 1)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[[1 2 3]
 [3 4 5]
 [4 5 6]]

Applying mean() function:
3.66666666667

Applying mean() function along axis 0:
[ 2.66666667 3.66666667 4.66666667]

Applying mean() function along axis 1:
[ 2. 4. 5.]

numpy.average ()

Rata-rata tertimbang adalah rata-rata yang dihasilkan dari perkalian setiap komponen dengan faktor yang mencerminkan kepentingannya. Itunumpy.average()fungsi menghitung rata-rata tertimbang elemen dalam array sesuai dengan bobot masing-masing yang diberikan dalam array lain. Fungsi tersebut dapat memiliki parameter sumbu. Jika sumbu tidak ditentukan, larik akan diratakan.

Mempertimbangkan larik [1,2,3,4] dan bobot terkait [4,3,2,1], rata-rata tertimbang dihitung dengan menjumlahkan hasil kali dari elemen terkait dan membagi jumlahnya dengan jumlah bobot.

Rata-rata tertimbang = (1 * 4 + 2 * 3 + 3 * 2 + 4 * 1) / (4 + 3 + 2 + 1)

Contoh

import numpy as np 
a = np.array([1,2,3,4]) 

print 'Our array is:' 
print a 
print '\n'  

print 'Applying average() function:' 
print np.average(a) 
print '\n'  

# this is same as mean when weight is not specified 
wts = np.array([4,3,2,1]) 

print 'Applying average() function again:' 
print np.average(a,weights = wts) 
print '\n'  

# Returns the sum of weights, if the returned parameter is set to True. 
print 'Sum of weights' 
print np.average([1,2,3, 4],weights = [4,3,2,1], returned = True)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[1 2 3 4]

Applying average() function:
2.5

Applying average() function again:
2.0

Sum of weights
(2.0, 10.0)

Dalam larik multi-dimensi, sumbu untuk komputasi dapat ditentukan.

Contoh

import numpy as np 
a = np.arange(6).reshape(3,2) 

print 'Our array is:' 
print a 
print '\n'  

print 'Modified array:' 
wt = np.array([3,5]) 
print np.average(a, axis = 1, weights = wt) 
print '\n'  

print 'Modified array:' 
print np.average(a, axis = 1, weights = wt, returned = True)

Ini akan menghasilkan keluaran sebagai berikut -

Our array is:
[[0 1]
 [2 3]
 [4 5]]

Modified array:
[ 0.625 2.625 4.625]

Modified array:
(array([ 0.625, 2.625, 4.625]), array([ 8., 8., 8.]))

Standar Deviasi

Simpangan baku adalah akar kuadrat dari rata-rata deviasi kuadrat dari mean. Rumus deviasi standar adalah sebagai berikut -

std = sqrt(mean(abs(x - x.mean())**2))

Jika arraynya [1, 2, 3, 4], maka meannya adalah 2.5. Oleh karena itu, deviasi kuadrat adalah [2.25, 0.25, 0.25, 2.25] dan akar kuadrat dari rata-ratanya dibagi 4, yaitu akar kuadrat (5/4) adalah 1.1180339887498949.

Contoh

import numpy as np 
print np.std([1,2,3,4])

Ini akan menghasilkan keluaran sebagai berikut -

1.1180339887498949

Perbedaan

Varians adalah rata-rata deviasi kuadrat, yaitu, mean(abs(x - x.mean())**2). Dengan kata lain, deviasi standar adalah akar kuadrat dari varian.

Contoh

import numpy as np 
print np.var([1,2,3,4])

Ini akan menghasilkan keluaran sebagai berikut -

1.25