반응형
250x250
Notice
Recent Posts
Recent Comments
Link
DecordRay
머신러닝 기초(분류 방법) 본문
728x90
반응형
머신러닝이란?
알고리즘을 이용하여 데이터를 분석하고, 분석 결과를 스스로 학습한 후, 이를 기반으로 어떠한 판단이나 예측을 하는 것!
(참고 - 글쓴이는 지도학습 위주로 학습을 진행하고 있기 때문에 비지도학습과 강화학습에 대해서는 다루지 않습니다!)
머신러닝은 크게 2가지 목적에 따라 분류 될 수 있다.
1. 학습 방법에 따른 분류
2. 과제에 따른 분류
이에 대해 좀 더 자세하게 알아보자!
학습 방법에 따른 분류
지도학습(Supervised Learning)
- 학습 대상이 되는 데이터에 정답을 주어 규칙성, 즉 데이터 의 패턴을 배우게 하는 학습 방법
비지도 학습(Unsupervised Learning)
- 정답이 없는 데이터 만으로 배우게 하는 학습 방법
강화 학습(Reinforcement Learning)
- 선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법
과제에 따른 분류
분류 문제 (Classification)
- 이미 적절히 분류된 데이터를 학습하여 분류 규칙을 찾고, 그 규칙을 기반으로 새롭게 주어진 데이터를 적절히 분류하는 것 을 목적으로 함(지도학습)
회귀 문제 (Regression)
- 이미 결과값이 있는 데이터를 학습하여 입력 값과 결과 값의 연관성을 찾고, 그 연관성을 기반으로 새롭게 주어진 데이터에 대한 값을 예측하는 것을 목적으로 함(지도학습)
클러스터링 (Clustering)
- 주어진 데이터를 학습하여 적절한 분류 규칙을 찾아 데이터를 분류함을 목적으로 함. 정답이 없으니 성능을 평가 하기 어려움(비지도학습)
머신러닝에 대한 기본적인 개념을 알아보았으니 지도학습에 대해 조금 더 자세하게 알아보자!
지도학습에서 가장 많이 하는 실수 혹은 제일 중요한 부분
- 예측하기 원하는 결과가 분류인지 회귀인지를 명확히 이해해야한다는 것이다!!
why? - 분류인지 회귀인지에 따라 사용할 알고리즘과 평가 방법, 즉 코드가 달라지기 때문!!
그렇다면 분류는 무엇이고 회귀는 무엇인가?
분류와 회귀는 예측해야 할 값에 연속성이 있는지 없는지를 확인하면 구분하기 쉽다.
아래 그림을 보면서 어떨때 분류를 써야하고, 어떨때 회귀를 써야하는지 한 번 생각을 해보자.
그렇다면 아래 예시문제를 분류와 회귀를 구분해보자
- 다음 달에 약정 기간이 끝나는 고객이 타 통신사로 이동할까? - 분류
- 이 타이어는 1,000km 안에 교체해야 할까? - 분류
- 내일 주가가 얼마일까? - 회귀
- 내일 주가가 오를까? - 분류
- 이 제품의 다음 주 수요량은 얼마일까? - 회귀
다음 글에서는 머신러닝 학습 간 미리 알아 둘 용어에대해 알아보자!
728x90
반응형
Comments