팬더는 평균을 얻고 중복 제거

Nov 30 2020

다음 데이터 프레임이 있습니다.

import pandas as pd
df = pd.read_csv(...)

A  B  C
x  3  .
x  5  . 
x  1  .
y  6  .
y  4  .
z  1  .
z  1  .
z  2  .
z  4  .

누군가 내가 이것을 어떻게 얻을 수 있는지 말해 줄 수 있습니까?

A  B
x  3
y  5
z  2

1. C 열을 삭제합니다
. 2. A 열을 기준으로 평균을 계산합니다.
3. A 열을 기준으로 중복 행을 제거합니다.

파이썬과의 첫 번째 모험, 스팸 죄송합니다. 다른 답변을 사용하려고 시도했지만 아무것도 작동하지 않습니다.

답변

ombk Nov 30 2020 at 07:51
df = pd.DataFrame({"ali":["x","x","x","y","y","z",'z'],"mali":[1,10,2,4,6,6,7]})

#output
    ali mali
0   x   1
1   x   10
2   x   2
3   y   4
4   y   6
5   z   6
6   z   7


df.groupby("ali")["mali"].mean()

ali
x    4.333333
y    5.000000
z    6.500000
Name: mali, dtype: float64

귀하의 코드는

df.groupby("A")["B"].mean()
1 frankr6591 Nov 30 2020 at 08:12

시험:

import requests
url = 'https://gist.githubusercontent.com/AlbertKozera/6396b4333d1a9222193e11401069ed9a/raw/ab8733a2135bcf61999bbcac4f92e0de5fd56794/Pojazdy%2520elektryczne%2520w%2520USA.csv'
r = requests.get(url)

from io import StringIO
with StringIO(r.text) as sio:
    df = pd.read_csv(sio)


print(df.head(3))

x =df.drop(['state', 'brand', 'model', 'year of production', 'type'], axis=1)
df2 = df.groupby('code').range.mean()

print("\n GROUPBY State x Range (mean)")
print(df2.head())