DecordRay

머신러닝 기초(분류 방법) 본문

공부/머신러닝

머신러닝 기초(분류 방법)

DecordRay 2023. 3. 1. 17:43
728x90
반응형
머신러닝이란?
알고리즘을 이용하여 데이터를 분석하고, 분석 결과를 스스로 학습한 후, 이를 기반으로 어떠한 판단이나 예측을 하는 것!
(참고 - 글쓴이는 지도학습 위주로 학습을 진행하고 있기 때문에 비지도학습과 강화학습에 대해서는 다루지 않습니다!)

 

머신러닝은 크게 2가지 목적에 따라 분류 될 수 있다.

1. 학습 방법에 따른 분류

2. 과제에 따른 분류

이에 대해 좀 더 자세하게 알아보자!


학습 방법에 따른 분류

 

지도학습(Supervised Learning)

  • 학습 대상이 되는 데이터에 정답을 주어 규칙성, 즉 데이터 의 패턴을 배우게 하는 학습 방법

 

비지도 학습(Unsupervised Learning)

  • 정답이 없는 데이터 만으로 배우게 하는 학습 방법

 

강화 학습(Reinforcement Learning)

  • 선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법

과제에 따른 분류

 

분류 문제 (Classification)

  • 이미 적절히 분류된 데이터를 학습하여 분류 규칙을 찾고, 그 규칙을 기반으로 새롭게 주어진 데이터를 적절히 분류하는 것 을 목적으로 함(지도학습)

 

회귀 문제 (Regression)

  • 이미 결과값이 있는 데이터를 학습하여 입력 값과 결과 값의 연관성을 찾고, 그 연관성을 기반으로 새롭게 주어진 데이터에 대한 값을 예측하는 것을 목적으로 함(지도학습)

 

클러스터링 (Clustering)

  • 주어진 데이터를 학습하여 적절한 분류 규칙을 찾아 데이터를 분류함을 목적으로 함. 정답이 없으니 성능을 평가 하기 어려움(비지도학습)

머신러닝에 대한 기본적인 개념을 알아보았으니 지도학습에 대해 조금 더 자세하게 알아보자!

 

지도학습에서 가장 많이 하는 실수 혹은 제일 중요한 부분

  • 예측하기 원하는 결과가 분류인지 회귀인지를 명확히 이해해야한다는 것이다!!

why? - 분류인지 회귀인지에 따라 사용할 알고리즘과 평가 방법, 즉 코드가 달라지기 때문!!

 

그렇다면 분류는 무엇이고 회귀는 무엇인가?

분류와 회귀는 예측해야 할 값에 연속성이 있는지 없는지를 확인하면 구분하기 쉽다.

아래 그림을 보면서 어떨때 분류를 써야하고, 어떨때 회귀를 써야하는지 한 번 생각을 해보자.

시험 합격 여부를 예측하는 분류
시험 점수를 예측하는 회귀

 

그렇다면 아래 예시문제를 분류와 회귀를 구분해보자

  1. 다음 달에 약정 기간이 끝나는 고객이 타 통신사로 이동할까? - 분류
  2. 이 타이어는 1,000km 안에 교체해야 할까? - 분류
  3. 내일 주가가 얼마일까? - 회귀
  4. 내일 주가가 오를까? - 분류
  5. 이 제품의 다음 주 수요량은 얼마일까? - 회귀

 

 

다음 글에서는 머신러닝 학습 간 미리 알아 둘 용어에대해 알아보자!

728x90
반응형
Comments