머신러닝의 학습 방식 및 방법

2021. 5. 14. 02:29AI-딥러닝/딥러닝

머신러닝은 다시말하면 인간의 학습능력을 컴퓨터에 재현하는 것이라고 정리할 수 있습니다.

 

인간의 학습하는 방법을 생각해보면

1. 반복적으로 외우기 2. 조건에 맞추어 의사를 결정 3. 공통된 특징을 나눠서 생각하기 등.. 여러 방법으로 학습하고 생각합니다.

이러한 방법을 컴퓨터 상에 재현하면 다음과 같이 생각할 수 있습니다.

 

 

강화학습 : 시행착오를 통해 오류, 버그, ‘환경에 가치를 극대화 시키는 행동 학습한다. 예를 들어 게임에서 공략법 등을 개발자는 모르지만 사용자는 반복적인 행위를 통해 개발자보다 방법을 게임을 있는 방법을 많이 습득하는 .  

강화학습 예시

의사결정트리 : 나뭇가지처럼 분기하는 방식으로, 트리구조를 통해 학습 시켜 원하는 예측값을 도출해 나가는 방식. 

의사결정 트리

서포트 벡터 머신 : 기계학습의 분야 하나로 패턴인시그 자료분석을 위한 지도학습 모델입니다.

주로 분류와 회귀분석을 위해 사용하며, 카테리고 어느하나에 속한 데이터의 집합이 주어졌을 , SVM알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 비확률적 이진 선형분류 모델을 만듭니다.

,  여러 학습시켜 모델링하여 처음 틀리게 설정한 1 분류기를 여러 학습시켜 2, 3 점점 정확히 류를 시키는 방법이다.

 2번과 3번은 정확히 분류했지만 여백(마진)으로 보면 3번이 2 보다 낫다. 이러한 여백(마진) 어떻게 공식화하고 마진을 최대화하는 결정 초평면을 찾는 것이 바로 SVM 발상이라고 있다.

서포트 벡터 머신 예시

서포트 벡터 머신을 더 설명하자면

데이터들의 부류를 나누기 위한 방법으로, 공간벡터에서의 평면벡터를 통해 데이터를 나누고, 정교하게 나누기 위해서 평면벡터를 2차원 벡터로 전환하여, 라그랑주 승수법을 통해 최적의 벡터를 구하는 방법이라고 설명할 수 있습니다.

 

 

K 최근접법 : 가장 간단한 머신러닝 알고리즘입니다. 새로운 데이터를 입력 받았을 가장 가까이 있는 것이

무엇이냐를 중심으로 새로운 데이터의 종류를 정해주는 알고리즘 입니다.

최근접 이웃 알고리즘은 “?” 주변에 있는 것이 세모이기 때문에 세모라고 판단합니다하지만 단순히 가장 가까이에 있는 것과 같다고 선택하는것이 옮은 분류가 아니기 때문에 주변의 범위를 나누어 제일 많이 포함되는 분포를 나누게 됩니다. 

 

 

K 의미 주변 분포의 범위를 뜻하며  k=1일때는 파란동그라미를 뜻하지만 k=4일때는 빨간 세모라고 판단할 것입니다. 일반적으로 k 값이 커질수록 분류에서

 이상치의 영향이 줄어들지만 분류자체를 못하게 되는 상황이 발생합니다. 일반적으로는 총데이터의 제곱근값을 사용하고 있으며 최적의 k 값을 찾기 위한 연구는 아직도진행중입니다.

 

뒤 이어 인간의 신경세포를 모사해서 만든 신경망에 대해 설명하겠습니다.

 

 

'AI-딥러닝 > 딥러닝' 카테고리의 다른 글

딥러닝 - 활성화 함수  (0) 2021.06.14
딥러닝 - 순전파  (0) 2021.06.14
딥러닝 - 뉴런을 모아 네트워크화  (0) 2021.06.13
딥러닝 - 뉴런  (0) 2021.06.13
인공지능, 머신러닝, 딥러닝  (0) 2021.05.14