본문 바로가기
SEO's Study/프로페셔널한 이야기

데이터 분류(3) - 다른 방법들 Alternative Techniques - 1

by 신SEO세오 2020. 1. 8.
반응형

 

Data Classification의 대표적인 예로 Decision Tree base methods를 소개했었다.

그런데 데이터 분류(1) - 기본개념에서 Data Classifier로 아래 항목을 소개했던 바 있어 추가 Decision Tree 외 항목을 끄적여본다!

 

1. Rule-based Classifier (규칙기반 분류기)

   - "if... then..." Rule을 사용해 항목을 분류하는 기법을 사용한다.

   - Rule : Condition -> y 

        condition = 규칙전항(선결조건)으로 속성 시험들의 결합항을 포함

        y = 규칙 후항으로 class label

 

[ Rule-based Classifier Example_1 ]

R1 : (Given Birth= no)^(Can Fly=yes) -> Birds

R2 : (Given Birth= no)^(Live in water=yes) -> Fishes

R3 : (Given Birth= yes)^(Blood Type=warm) -> mammals
R4 : (Given Birth= no)^(Can Fly= no) -> reptiles

R5 : (Live in water = sometimes) -> amphibians

 

 

[ Rule-based Classifier Example_2 ]

    - match the class yourself : 

R1 : (covers = hawk) -> Birds

R2 : (covers = grizzly bear) -> mammals

 

 

Rule Coverage & Accuracy 규칙의 적용범위와 정확성

  - 데이터 집합 D와 분류 규칙 r : A -> y이 주어질 때, 이 규칙의 적용범위는 규칙 r에 적용되는 D에 속한 모든 항목들의 비율로 정의 됨.

    반면에, 그 Accuracy 또는 신뢰도는 r이 적용되는 항목 중에서 class label이 y와 같은 비율로 정의된다. 

Rule-based Classifier의 작동 원리

위에서 정리한 Rule 기반에 따르면 lemur(여우원숭이)는 온형동물에 새끼를 낳는 R3 즉, 포유류이고 turtle은 R4와 R5에서 충돌이 발생한다.(R4= Given Birth= no)^(Can Fly= no) -> reptiles / R5= (Live in water = sometimes) -> amphibians) 그리고 마지막으로 dogfish shark(돔발상어)의 경우 어떤 규칙도 적용되지 않는다.

 

이 예제는 Rule-based Classifier에 의해 새엉된 규칙 집합의 두 가지 중요한 특성을 보여준다.

 #  Mutually Exclusive Rules (상호 배타적 규칙)

   - 같은 항목에 두 개 이상의 규칙이 적용되지 않을 때

   - 모든 항목이 R에서 하나의 규칙에 의해 적용됨을 보장 

 

  #  Exhaustive Rules(포괄적 규칙)

   - 규칙 내 모든 속성의 값 조합의 경우에 적용되는 규칙이 존재하는 경우에만 해당 ( ex. 체온 )

 

규칙 집합이 Mutually Exclusive Rule이 아닌 경우, 한 항목에 여러 규칙이 적용될 수 있으며 이 문제를 해결하고자 두 가지 방법을 사용함.

    - Ordered Rules (정렬 규칙)

       : 모든 규칙이 우선순위 내림차순으로 정렬, 의사결정 리스트

       : 하나의 시험항목이 복수의 분류규칙에 의해 적용되고 결과는 특정 class에 대한 투표로 간주한다.

    - Unordered Rules (비정렬 규칙) 

        : 하나의 시험항목이 복수의 분류규칙에 의해 적용되고 있으며, 결과는 특정 class에 대한 투표로 간주한다.

 

 

반응형

댓글