Python Pandas - Visualisasi
Plot Dasar: plot
Fungsionalitas pada Series dan DataFrame ini hanyalah pembungkus sederhana di sekitar file matplotlib libraries plot() metode.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
Nya output adalah sebagai berikut -
Jika indeks terdiri dari tanggal, ia memanggil gct().autofmt_xdate() untuk memformat sumbu x seperti yang diperlihatkan dalam ilustrasi di atas.
Kita dapat memplot satu kolom versus kolom lainnya menggunakan x dan y kata kunci.
Metode plot memungkinkan beberapa gaya plot selain plot garis default. Metode ini dapat disediakan sebagai argumen kata kunci jenis untukplot(). Ini termasuk -
- bar atau barh untuk plot bar
- hist untuk histogram
- kotak untuk plot kotak
- 'area' untuk plot area
- 'pencar' untuk plot pencar
Plot Batang
Sekarang mari kita lihat apa itu Bar Plot dengan membuatnya. Plot batang dapat dibuat dengan cara berikut -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
Nya output adalah sebagai berikut -
Untuk menghasilkan plot batang bertumpuk, pass stacked=True -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
Nya output adalah sebagai berikut -
Untuk mendapatkan plot batang horizontal, gunakan barh metode -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
Nya output adalah sebagai berikut -
Histogram
Histogram dapat diplot menggunakan plot.hist()metode. Kami dapat menentukan jumlah tempat sampah.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
Nya output adalah sebagai berikut -
Untuk memplot histogram yang berbeda untuk setiap kolom, gunakan kode berikut -
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
Nya output adalah sebagai berikut -
Plot Kotak
Boxplot bisa ditarik memanggil Series.box.plot() dan DataFrame.box.plot(), atau DataFrame.boxplot() untuk memvisualisasikan distribusi nilai dalam setiap kolom.
Sebagai contoh, berikut adalah diagram kotak yang mewakili lima percobaan dari 10 pengamatan dari variabel acak seragam pada [0,1).
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
Nya output adalah sebagai berikut -
Plot Area
Plot area dapat dibuat menggunakan Series.plot.area() atau itu DataFrame.plot.area() metode.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
Nya output adalah sebagai berikut -
Plot Sebar
Plot sebar dapat dibuat menggunakan DataFrame.plot.scatter() metode.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
Nya output adalah sebagai berikut -
Pie chart
Bagan pai dapat dibuat menggunakan DataFrame.plot.pie() metode.
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
Nya output adalah sebagai berikut -