Python Pandas-시각화
기본 플로팅 : 플롯
Series 및 DataFrame의이 기능은 matplotlib libraries plot() 방법.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('1/1/2000',
periods=10), columns=list('ABCD'))
df.plot()
이것의 output 다음과 같습니다-
인덱스가 날짜로 구성된 경우 다음을 호출합니다. gct().autofmt_xdate() 위의 그림과 같이 x 축 형식을 지정합니다.
다음을 사용하여 한 열 대 다른 열을 그릴 수 있습니다. x 과 y 키워드.
플로팅 방법을 사용하면 기본 선 플롯 이외의 몇 가지 플롯 스타일을 사용할 수 있습니다. 이러한 메소드는에 대한 kind 키워드 인수로 제공 될 수 있습니다.plot(). 여기에는-
- 막대 그래프의 경우 bar 또는 barh
- 히스토그램에 대한 히스 토
- boxplot 상자
- 면적 플롯의 'area'
- 산점도의 경우 'scatter'
바 플롯
이제 Bar Plot을 만들어 보겠습니다. 막대 그래프는 다음과 같은 방법으로 만들 수 있습니다.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar()
이것의 output 다음과 같습니다-
누적 막대 그림을 생성하려면 pass stacked=True −
import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.bar(stacked=True)
이것의 output 다음과 같습니다-
수평 막대 그래프를 얻으려면 barh 방법-
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d')
df.plot.barh(stacked=True)
이것의 output 다음과 같습니다-
히스토그램
히스토그램은 plot.hist()방법. 빈 수를 지정할 수 있습니다.
import pandas as pd
import numpy as np
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.plot.hist(bins=20)
이것의 output 다음과 같습니다-
각 열에 대해 다른 히스토그램을 그리려면 다음 코드를 사용하십시오.
import pandas as pd
import numpy as np
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
df.diff.hist(bins=20)
이것의 output 다음과 같습니다-
상자 도표
상자 그림을 그릴 수 있습니다. Series.box.plot() 과 DataFrame.box.plot(), 또는 DataFrame.boxplot() 각 열 내의 값 분포를 시각화합니다.
예를 들어, 다음은 [0,1)에 대한 균일 랜덤 변수의 10 개 관측에 대한 5 번의 시행을 나타내는 상자 그림입니다.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()
이것의 output 다음과 같습니다-
면적 플롯
면적 플롯은 Series.plot.area() 아니면 그 DataFrame.plot.area() 행동 양식.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()
이것의 output 다음과 같습니다-
산포도
산점도는 DataFrame.plot.scatter() 행동 양식.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')
이것의 output 다음과 같습니다-
파이 차트
원형 차트는 DataFrame.plot.pie() 방법.
import pandas as pd
import numpy as np
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)
이것의 output 다음과 같습니다-