판다스(Pandas) DataFrame 로딩 및 기본 API

# AI 이론/Pandas

alz 2022. 1. 7. 18:43

●read_csv()

csv 파일을 편리하게 DataFrame으로 로딩

read_csv()의 sep 인자를 콤마(,)가 아닌 다른 분리자로 변경하여 다른 유형의 파일(\t)도 로드 가능

예제는 https://github.com/chulminkw/PerfectGuide 권철민님 깃허브 소스파일을 사용했습니다.

파일명 : titanic_train.csv 이고 ,이 파일은 콤마(,)로 구분되어있다

type : DataFrame

●head(읽어올 데이터의 수) : 맨앞에서부터 데이터를 읽어올 데이터의 수 만큼 데이터를 읽어옴

맨왼쪽에 0,1,2,3,4 의경우는 RDBMS에서의 KEY라고 이해하는게 좋을거 같다

실질적으로 출력하거나 배열로담을 수있는 값은 아니다.

(뒤에서 인덱스를 column 으로 만드는방식을 설명)

●DataFrame의 생성

딕셔너리 -> DataFrame을 만드는 방식

data_df = pd.DataFrame(dict1)

방식으로 "col1":{값}, "col2":{값} 식으로 사용,

값 : 배열이 들어갈 수 있음

index 값에 0,1,2,3 대신 값을 바꿔서 넣을 수 있음

●DataFrame의 컬럼명과 인덱스

titanic_df.columns : 해당 열의 값을 배열형태로

(dtype = object 는 string으로 이해)

titanic_df.index : 해당 인덱스의 범위를 보여준다

titanic_df.index.values =해당 인덱스값들을 배열로 보여준다

판다스(Pandas) DataFrame의 컬럼 데이터 셋 접근 (0)	2022.01.07
판다스(Pandas) 정렬, 상호변환 (0)	2022.01.07
판다스[Pandas] DataFrame Series,Filtering 추출 (0)	2022.01.07
판다스(Pandas)란? (0)	2022.01.07

peaco