728x90
반응형

Pandas란?

구조화된 데이터를 효과적으로 처리하고 저장하는 파이썬 라이브러리

Array 계산에 특화된 Numpy를 기반으로 설계

 


 

Series 데이터

Numpy의 array가 보강된 형태로 Data와 Index를 가지고 있음

import pandas as pd

data = pd.Series([1, 2, 3, 4])
print(data)

 

dtype 인자로 데이터 타입을 지정할 수 있음

import pandas as pd

data = pd.Series([1, 2, 3, 4], dtype = "float")
print(data.dtype) # float64

 

인덱스를 지정할 수 있고 인덱스로 접근 가능

import pandas as pd

data = pd.Series([1, 2, 3, 4], index = ['a', 'b', 'c', 'd'])
data['c'] = 5 # 인덱스로 접근하여 요소 변경 가능

 

Dictionary를 활용하여 Series 생성 가능

import pandas as pd

population_dict = {
  'china': 141500,
  'japan': 12718,
  'korea': 5180,
  'usa': 32676
}
population = pd.Series(population_dict)

 

반응형

'프로그래밍 > Python' 카테고리의 다른 글

Pandas 데이터 선택 및 변경하기  (0) 2021.09.27
Pandas 데이터 프레임  (0) 2021.09.24
Numpy 배열의 속성  (0) 2021.09.14
Numpy 배열의 데이터 타입  (0) 2021.09.13
Numpy란?  (0) 2021.09.10
복사했습니다!