Python Pandas - Visualisierung
Grundlegende Darstellung: Darstellung
Diese Funktionalität für Series und DataFrame ist nur ein einfacher Wrapper um die matplotlib libraries plot() Methode.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
Es ist output ist wie folgt -
Wenn der Index aus Datumsangaben besteht, wird aufgerufen gct().autofmt_xdate() um die x-Achse wie in der obigen Abbildung gezeigt zu formatieren.
Wir können eine Spalte gegen eine andere mit dem zeichnen x und y Schlüsselwörter.
Plotmethoden ermöglichen eine Handvoll anderer Plotstile als das Standardliniendiagramm. Diese Methoden können als Schlüsselwortargument für angegeben werdenplot(). Dazu gehören -
- Bar oder Barh für Bar-Parzellen
- hist für Histogramm
- Box für Boxplot
- 'Fläche' für Flächengrundstücke
- 'Streuung' für Streudiagramme
Bar Plot
Lassen Sie uns nun sehen, was ein Balkendiagramm ist, indem wir eines erstellen. Ein Balkendiagramm kann folgendermaßen erstellt werden:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
Es ist output ist wie folgt -
Um ein gestapeltes Balkendiagramm zu erstellen, pass stacked=True - -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
Es ist output ist wie folgt -
Verwenden Sie die, um horizontale Balkendiagramme zu erhalten barh Methode -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
Es ist output ist wie folgt -
Histogramme
Histogramme können mit der erstellt werden plot.hist()Methode. Wir können die Anzahl der Fächer angeben.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
Es ist output ist wie folgt -
Verwenden Sie den folgenden Code, um unterschiedliche Histogramme für jede Spalte zu zeichnen:
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
Es ist output ist wie folgt -
Box Plots
Boxplot kann telefonisch gezeichnet werden Series.box.plot() und DataFrame.box.plot(), oder DataFrame.boxplot() um die Verteilung der Werte innerhalb jeder Spalte zu visualisieren.
Hier ist zum Beispiel ein Boxplot, der fünf Versuche mit 10 Beobachtungen einer einheitlichen Zufallsvariablen auf [0,1] darstellt.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
Es ist output ist wie folgt -
Flächengrundstück
Flächendiagramm kann mit dem erstellt werden Series.plot.area() oder der DataFrame.plot.area() Methoden.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
Es ist output ist wie folgt -
Streudiagramm
Ein Streudiagramm kann mit dem erstellt werden DataFrame.plot.scatter() Methoden.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
Es ist output ist wie folgt -
Kuchendiagramm
Kreisdiagramm kann mit dem erstellt werden DataFrame.plot.pie() Methode.
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
Es ist output ist wie folgt -