Pandas groupby (2)
2021. 10. 1. 20:33
프로그래밍/Python
apply, lambda groupby를 통해서 묶인 데이터에 함수 적용 df.groupby('key').apply(lambda x: x.max() - x.min()) # groupby로 묶고 최대값-최소값 get_group groupby로 묶인 데이터에서 key값으로 데이터를 가져올 수 있음 df = pd.read_csv("./univ.csv") # 상위 5개 데이터 df.head() # 데이터 추출 df.groupby("시도").get_group("충남") len(df.groupby("시도").get_group("충남")) # 결과 : 94 예제 👇 aggregate 메소드에 함수를 매개변수로 넣어줄 때, min, max, mean, count 등의 특정 함수들은 문자열 형태로 넘겨줄 수 있음 imp..
Pandas groupby (1)
2021. 9. 30. 20:21
프로그래밍/Python
group by 간단한 집계를 넘어서서 조건부로 집계하고 싶은 경우 df = pd.DataFrame({ 'data1' : range(6), 'data2' : [4,4,6,0,6,1], 'key':['A','B','C','A','B','C'] }) df.groupby('key').sum() # key라는 컬럼으로 groupby df.groupby(['key','data1']).sum() # key와 data1이라는 컬럼으로 groupby => 계층적 groupby aggregate groupby를 통해서 집계를 한번에 계산하는 방법 한 번의 groupby를 통해 여러개의 통계함수를 적용시키고 싶을 때 사용 df.groupby('key').aggregate(['min', np.median, max]) # m..