Python Pandas - Visualização

Plotagem básica: plotagem

Esta funcionalidade em Series e DataFrame é apenas um invólucro simples em torno do matplotlib libraries plot() método.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
   periods=10), columns=list('ABCD'))

df.plot()

Está output é o seguinte -

Se o índice consiste em datas, ele chama gct().autofmt_xdate() para formatar o eixo x conforme mostrado na ilustração acima.

Podemos traçar uma coluna contra outra usando o x e y palavras-chave.

Os métodos de plotagem permitem um punhado de estilos de plotagem diferentes da plotagem de linha padrão. Esses métodos podem ser fornecidos como o argumento de palavra-chave kind paraplot(). Isso inclui -

  • bar ou barh para parcelas de bar
  • hist para histograma
  • caixa para boxplot
  • 'área' para parcelas de área
  • 'scatter' para gráficos de dispersão

Bar Plot

Vamos agora ver o que é um gráfico de barras criando um. Um gráfico de barra pode ser criado da seguinte maneira -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()

Está output é o seguinte -

Para produzir um gráfico de barra empilhada, pass stacked=True -

import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)

Está output é o seguinte -

Para obter gráficos de barra horizontal, use o barh método -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')

df.plot.barh(stacked=True)

Está output é o seguinte -

Histogramas

Os histogramas podem ser traçados usando o plot.hist()método. Podemos especificar o número de caixas.

import pandas as pd
import numpy as np

df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.plot.hist(bins=20)

Está output é o seguinte -

Para traçar histogramas diferentes para cada coluna, use o seguinte código -

import pandas as pd
import numpy as np

df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])

df.diff.hist(bins=20)

Está output é o seguinte -

Box Plots

Boxplot pode ser desenhado chamando Series.box.plot() e DataFrame.box.plot(), ou DataFrame.boxplot() para visualizar a distribuição de valores em cada coluna.

Por exemplo, aqui está um boxplot representando cinco tentativas de 10 observações de uma variável aleatória uniforme em [0,1).

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()

Está output é o seguinte -

Terreno de área

O gráfico de área pode ser criado usando o Series.plot.area() ou o DataFrame.plot.area() métodos.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()

Está output é o seguinte -

Gráfico de dispersão

O gráfico de dispersão pode ser criado usando o DataFrame.plot.scatter() métodos.

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')

Está output é o seguinte -

Gráfico de pizza

O gráfico de pizza pode ser criado usando o DataFrame.plot.pie() método.

import pandas as pd
import numpy as np

df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)

Está output é o seguinte -