본문 바로가기
데이터분석자격증 ADsP/Part 3 데이터 분석 R

[ADsP] 지도학습 vs. 비지도학습 (머신러닝의 알고리즘)

by doodlie 2024. 2. 23.

머신러닝(Machine Learning)은 데이터를 이용해 컴퓨터를 학습시키는 방법론을 뜻한다. 머신러닝의 알고리즘 분류에는 크게 비지도학습, 지도학습, 강화학습으로 나누어져 있으며, ADsP 시험 3과목 <데이터분석>에 가장 자주 나오는 개념으로 비지도학습과 지도학습은 꼭 알아두어야 한다. 각 학습의 특징과 모델들을 기억하도록 하자. 

지도학습(Supervised Learning)이란? 

  • 지도학습 - 정답이 있는 데이터를 활용해 분석 모델을 학습시키는 것 
  • 컴퓨터가 학습할 때 입출력 데이터가 모두 필요함 
  • 독립변수에 따른 종속변수가 있음 
  • 예시) 입력 - 고양이 사진 10장, 강아지 사진 10장에 대한 정보, 출력 - 새로운 사진을 입력받을때 동물을 판별
  • 회귀(regression) - 연속형 종속변수
    • 선형회귀분석, 의사결정나무 (회귀트리), 인공신경망 모형, ridge
  • 분류(classification) - 범주형 종속변수
    • 로지스틱 회귀분석, 인공신경망 모형, 의사결정나무 (분류트리), K-NN, 앙상블, SVM(support vector machine), 나이브 베이즈 분류

 

비지도학습(Unsupervised Learning)이란? 

  • 비지도학습 - 정답(레이블)을 알려주지 않고 학습하는 것
  • 입력 데이터만 가지고 그 속에 숨겨진 패턴을 찾아내는 방법
  • 독립변수에 따른 종속변수가 없음
  • 예시) 입력 - 레이블이 없는 고양이와 강아지 사진 100장, 출력 - 어떤 동물인지 정의할 순 없지만, 동물들의 특징이 비슷한 것 끼기 군집화 실시 
  • 군집분석 (clustering)- k-means, SOM, DBSCAN, 병합군집, 계층군집
  • 연관분석 (association) - apriori
  • 차원축소 - 주성분분석, 다차원척도법, 선형판별분석, 특잇값분해