Python Pandas - Visualisasi

Plot Dasar: plot

Fungsionalitas pada Series dan DataFrame ini hanyalah pembungkus sederhana di sekitar file matplotlib libraries plot() metode.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
   periods=10), columns=list('ABCD'))

df.plot()

Nya output adalah sebagai berikut -

Jika indeks terdiri dari tanggal, ia memanggil gct().autofmt_xdate() untuk memformat sumbu x seperti yang diperlihatkan dalam ilustrasi di atas.

Kita dapat memplot satu kolom versus kolom lainnya menggunakan x dan y kata kunci.

Metode plot memungkinkan beberapa gaya plot selain plot garis default. Metode ini dapat disediakan sebagai argumen kata kunci jenis untukplot(). Ini termasuk -

  • bar atau barh untuk plot bar
  • hist untuk histogram
  • kotak untuk plot kotak
  • 'area' untuk plot area
  • 'pencar' untuk plot pencar

Plot Batang

Sekarang mari kita lihat apa itu Bar Plot dengan membuatnya. Plot batang dapat dibuat dengan cara berikut -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()

Nya output adalah sebagai berikut -

Untuk menghasilkan plot batang bertumpuk, pass stacked=True -

import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)

Nya output adalah sebagai berikut -

Untuk mendapatkan plot batang horizontal, gunakan barh metode -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')

df.plot.barh(stacked=True)

Nya output adalah sebagai berikut -

Histogram

Histogram dapat diplot menggunakan plot.hist()metode. Kami dapat menentukan jumlah tempat sampah.

import pandas as pd
import numpy as np

df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.plot.hist(bins=20)

Nya output adalah sebagai berikut -

Untuk memplot histogram yang berbeda untuk setiap kolom, gunakan kode berikut -

import pandas as pd
import numpy as np

df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.diff.hist(bins=20)

Nya output adalah sebagai berikut -

Plot Kotak

Boxplot bisa ditarik memanggil Series.box.plot() dan DataFrame.box.plot(), atau DataFrame.boxplot() untuk memvisualisasikan distribusi nilai dalam setiap kolom.

Sebagai contoh, berikut adalah diagram kotak yang mewakili lima percobaan dari 10 pengamatan dari variabel acak seragam pada [0,1).

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()

Nya output adalah sebagai berikut -

Plot Area

Plot area dapat dibuat menggunakan Series.plot.area() atau itu DataFrame.plot.area() metode.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()

Nya output adalah sebagai berikut -

Plot Sebar

Plot sebar dapat dibuat menggunakan DataFrame.plot.scatter() metode.

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')

Nya output adalah sebagai berikut -

Pie chart

Bagan pai dapat dibuat menggunakan DataFrame.plot.pie() metode.

import pandas as pd
import numpy as np

df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)

Nya output adalah sebagai berikut -