# AI 이론/Pandas

판다스(Pandas)란?

alz 2022. 1. 7. 18:22

판다스(Pandas)란?

"Pandas 공식 깃허브 설명"

관계형 또는 레이블이 된 데이터로 쉽게 직관적으로 작업할 수 있도록 설계되었고 빠르고 유연한 데이터 구조를 제공하는 파이썬 패키지 

 

●판다스의 핵심 개체는 DataFrame

 

Data Frame 이란?

Data Frame은 여러 개의 행과 열로 이뤄진 2차원 데이터를 담는 구조체

Index,Series를 이해하는것이 중요

index : RDBMS의 PK처럼 개별 데이터를 고유하게 식별하는 KEY값

Series : DataFrame은 2차원 데이터 이지만 ,Series는 컬럼이 하나 뿐인 데이터 구조체

 

Pandas를 쓰는 이유?

 

1. 자동적/명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 데이터 구조

   잘못 정렬된 데이터에 의한 오류 방지, 다양한 방식으로 색인된 데이터를 다룰 수 있음

2. 통합된 시계열 기능

3. 시계열/비시계열 데이터를 함께 다룰 수 있는 통합 자료구조

4. SQL같은 일반 데이터베이스 처럼 데이터를 합치고 관계연산 수행가능