팬더는 평균을 얻고 중복 제거
Nov 30 2020
다음 데이터 프레임이 있습니다.
import pandas as pd
df = pd.read_csv(...)
A B C
x 3 .
x 5 .
x 1 .
y 6 .
y 4 .
z 1 .
z 1 .
z 2 .
z 4 .
누군가 내가 이것을 어떻게 얻을 수 있는지 말해 줄 수 있습니까?
A B
x 3
y 5
z 2
1. C 열을 삭제합니다
. 2. A 열을 기준으로 평균을 계산합니다.
3. A 열을 기준으로 중복 행을 제거합니다.
파이썬과의 첫 번째 모험, 스팸 죄송합니다. 다른 답변을 사용하려고 시도했지만 아무것도 작동하지 않습니다.
답변
ombk Nov 30 2020 at 07:51
df = pd.DataFrame({"ali":["x","x","x","y","y","z",'z'],"mali":[1,10,2,4,6,6,7]})
#output
ali mali
0 x 1
1 x 10
2 x 2
3 y 4
4 y 6
5 z 6
6 z 7
df.groupby("ali")["mali"].mean()
ali
x 4.333333
y 5.000000
z 6.500000
Name: mali, dtype: float64
귀하의 코드는
df.groupby("A")["B"].mean()
1 frankr6591 Nov 30 2020 at 08:12
시험:
import requests
url = 'https://gist.githubusercontent.com/AlbertKozera/6396b4333d1a9222193e11401069ed9a/raw/ab8733a2135bcf61999bbcac4f92e0de5fd56794/Pojazdy%2520elektryczne%2520w%2520USA.csv'
r = requests.get(url)
from io import StringIO
with StringIO(r.text) as sio:
df = pd.read_csv(sio)
print(df.head(3))
x =df.drop(['state', 'brand', 'model', 'year of production', 'type'], axis=1)
df2 = df.groupby('code').range.mean()
print("\n GROUPBY State x Range (mean)")
print(df2.head())