Python Pandas - Visualização
Plotagem básica: plotagem
Esta funcionalidade em Series e DataFrame é apenas um invólucro simples em torno do matplotlib libraries plot() método.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
Está output é o seguinte -
Se o índice consiste em datas, ele chama gct().autofmt_xdate() para formatar o eixo x conforme mostrado na ilustração acima.
Podemos traçar uma coluna contra outra usando o x e y palavras-chave.
Os métodos de plotagem permitem um punhado de estilos de plotagem diferentes da plotagem de linha padrão. Esses métodos podem ser fornecidos como o argumento de palavra-chave kind paraplot(). Isso inclui -
- bar ou barh para parcelas de bar
- hist para histograma
- caixa para boxplot
- 'área' para parcelas de área
- 'scatter' para gráficos de dispersão
Bar Plot
Vamos agora ver o que é um gráfico de barras criando um. Um gráfico de barra pode ser criado da seguinte maneira -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
Está output é o seguinte -
Para produzir um gráfico de barra empilhada, pass stacked=True -
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
Está output é o seguinte -
Para obter gráficos de barra horizontal, use o barh método -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
Está output é o seguinte -
Histogramas
Os histogramas podem ser traçados usando o plot.hist()método. Podemos especificar o número de caixas.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
Está output é o seguinte -
Para traçar histogramas diferentes para cada coluna, use o seguinte código -
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
Está output é o seguinte -
Box Plots
Boxplot pode ser desenhado chamando Series.box.plot() e DataFrame.box.plot(), ou DataFrame.boxplot() para visualizar a distribuição de valores em cada coluna.
Por exemplo, aqui está um boxplot representando cinco tentativas de 10 observações de uma variável aleatória uniforme em [0,1).
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
Está output é o seguinte -
Terreno de área
O gráfico de área pode ser criado usando o Series.plot.area() ou o DataFrame.plot.area() métodos.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
Está output é o seguinte -
Gráfico de dispersão
O gráfico de dispersão pode ser criado usando o DataFrame.plot.scatter() métodos.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
Está output é o seguinte -
Gráfico de pizza
O gráfico de pizza pode ser criado usando o DataFrame.plot.pie() método.
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
Está output é o seguinte -