티스토리 뷰

반응형

1. Decision tree

 

 

- 분류 규칙을 통해 데이터를 특정 플로우를 지나게 하면서 분류, 회귀하는 지도 학습 모델이다.

- 한번의 분기에 변수 두개로 구분

 

- 분리 기준은?

-> 불순도 (지니, 엔트로피 지수)

-> 현재노드의 불순도에 비해 자식노드의 불순도가 감소되도록 설정 (여러 클래스가 섞여 있을수록 불순도가 높음)

  • 지니 지수 :
  • 지니 지수의 최대값 : 0.5

계산의 예) 

한 박스에 빨간공 5개와 파란공 10개가 들어있다면,

= 1 - (10/15)^2 - (5/15)^2 = 약 0.45

 

  • 엔트로피 지수 :

계산의 예)

한 박스에 빨간공 5개와 파란공 10개가 들어있다면,

= - 10/15 logbase2(10/15) -5/15 logbase2(5/15)

= -10/15 * (-0.585) - 5/15 * -1.585 = 약 0.918

 

학습을 할때 이 불순도 값들이 줄어드는 방향으로 트리를 형성하게 됨.

 


 

2. Minimum-redundancy-maximum-relevance (mRMR)

 

- feature와 feature간의 관계도 고려 (상호의존성 사용)

- class와 연관성이 높은 feature를 찾되,

- 이미 뽑힌 feature에 대해서는 비슷한 다른 feature을 더 뽑지 않겠다.

반응형

'AI & 머신러닝 > 개념 정리' 카테고리의 다른 글

Atlas based / Patch-based / Label fusion  (0) 2023.02.10
Graphical Model 이란?  (0) 2023.02.09
Regularization이란?  (0) 2023.02.08
F1 score란?  (0) 2023.02.08
ROC 커브란?  (0) 2023.02.08
댓글
공지사항
최근에 올라온 글