판다스(Pandas)란?
"Pandas 공식 깃허브 설명"
관계형 또는 레이블이 된 데이터로 쉽게 직관적으로 작업할 수 있도록 설계되었고 빠르고 유연한 데이터 구조를 제공하는 파이썬 패키지
●판다스의 핵심 개체는 DataFrame
Data Frame 이란?
Data Frame은 여러 개의 행과 열로 이뤄진 2차원 데이터를 담는 구조체
Index,Series를 이해하는것이 중요
index : RDBMS의 PK처럼 개별 데이터를 고유하게 식별하는 KEY값
Series : DataFrame은 2차원 데이터 이지만 ,Series는 컬럼이 하나 뿐인 데이터 구조체
Pandas를 쓰는 이유?
1. 자동적/명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 데이터 구조
잘못 정렬된 데이터에 의한 오류 방지, 다양한 방식으로 색인된 데이터를 다룰 수 있음
2. 통합된 시계열 기능
3. 시계열/비시계열 데이터를 함께 다룰 수 있는 통합 자료구조
4. SQL같은 일반 데이터베이스 처럼 데이터를 합치고 관계연산 수행가능
'# AI 이론 > Pandas' 카테고리의 다른 글
판다스(Pandas) DataFrame의 컬럼 데이터 셋 접근 (0) | 2022.01.07 |
---|---|
판다스(Pandas) 정렬, 상호변환 (0) | 2022.01.07 |
판다스[Pandas] DataFrame Series,Filtering 추출 (0) | 2022.01.07 |
판다스(Pandas) DataFrame 로딩 및 기본 API (0) | 2022.01.07 |