머신러닝이란?
영어 그대로 Machine Learning 즉, 기계학습 이다.
현재, 우리생활 주변에서도 머신러닝의 역할을 많이 볼 수있는데, 예로는 이메일 스팸필터링, 편리한 텍스트와 음성 인식 소프트웨어(Siri,빅스비) 등이있다.
머신 러닝의 세 가지 종류 (지도학습,비지도학습 강화학습)
1.지도학습 (분류,회귀)
1) 레이블된 데이터
2) 직접 피드백
3) 출력 및 미래 예측
지도(supervised)는 희망하는 출력신호가 있는 일련의 데이터 입력을 말함
레이블된 훈련 데이터가 머신러닝 알고리즘에 전달되어, 예측모델을 먼저 훈련후,
새로운 레이블 되지 않은 데이터 입력에 대해 예측을 수행함
분류란
지도 학습의 하위 카테고리
과거의 관측을 기반을 샘플의 범주형 클래스 레이블을 예측하는것이 목적
클래스 레이블은 이산적이고 순서가 없어 샘플이 속한 그룹으로 이해가능
ex) 스펨 메일감지 처럼 이진 분류
회귀란?
지도 학습의 하위 카테고리
연속적인 출력 값을 예측
회귀는 예측 변수(설명변수)와 연속적인 반응변수(결과)가 주어졌을때 출력값을 예측 하기 위해
두변수 사이의 관계를 찾음
머신러닝분야에서는 예측변수를 특성, 반응 변수를 타깃이라고 부름
2.비지도학습
1) 레이블 및 타깃이 존재하지않음
2) 피드백이 없음
3) 데이터에서 숨겨진 구조 찾기
지도학습에서는 모델을 훈련할 때 사전에 옳은 답을 알고,
강화 학습에서는 특정 행동을 보상하는 방법을 정의
비지도학습에서는 레이블되지 않거나 구조를 알 수 없는 데이터를 다룸
비지도 학습 기법을 통해 알려진 출력 값이나 보상 함수의 도움을 받지 않고 의미있는 정보를 추출하기 위해
데이터 구조를 탐색할 수 있다.
군집과 차원 축소
군집(clustering) :서브그룹찾기
사전 정보 없이 쌓여 있는 그룹 정보를 의미 있는 서브그룹 또는 클러스터로 조직하는 탐색적 데이터 분석 기법
분석 과정에서는 각 클러스터는 어느정도 유사성을 공유하고 다른 클러스터와는 비슷하지않은 샘플 그룹을 형성
비지도 분류 라고도 함
예시) 마케터가 고객의 관심거리를 기반으로 마케팅 프로그램 개발
차원축소 : 데이터 압축
고차원의 데이터를 다루어야 하는 경우가 흔하다
잡음 데이터를 제거하기 위해 특성 전처리 단계에서 종종 사용
3D 스위스 롤 모양의 데이터를 2D특성 부분공간으로 압축
3.강화 학습
1) 결정 과정
2) 보상 시스템
3) 연속된 행동에서 학습
강화학습은 머신러닝의 또다른 종류로,
환경과 상호 작용하여 시스템의 성능을 향상하는것이 목적
환경의 현재 상태 정보는 보상 신호를 포함하기 때문에 강화학습을 지도 학습과 관련된 분야로 생각할 수 있지만,
강화 학습의 피드백은 정답 레이블이나 값이 아닌, 보상함수로 얼마나 행동이 좋은지를 측정한 값
예시로는 체스게임이 존재 : 보상은 게임을 종료했을때 승리 or 패배로 정의 가능
'# AI 이론 > Machine Learning' 카테고리의 다른 글
[ML]캐글 신용카드 사기 검출 (0) | 2022.02.05 |
---|---|
LightGBM (0) | 2022.01.26 |
XGBoost 소개(파이썬 Wrapper, 싸이킷런 Wrapper) 및 예제 (0) | 2022.01.26 |
피처 스케일링(Feature Scaling) (0) | 2022.01.19 |
[Sklearn]타이타닉 생존자 예측 (0) | 2022.01.14 |