Data Classification의 대표적인 예로 Decision Tree base methods를 소개했었다.
그런데 데이터 분류(1) - 기본개념에서 Data Classifier로 아래 항목을 소개했던 바 있어 추가 Decision Tree 외 항목을 끄적여본다!
1. Rule-based Classifier (규칙기반 분류기)
- "if... then..." Rule을 사용해 항목을 분류하는 기법을 사용한다.
- Rule : Condition -> y
condition = 규칙전항(선결조건)으로 속성 시험들의 결합항을 포함
y = 규칙 후항으로 class label
[ Rule-based Classifier Example_1 ]
R1 : (Given Birth= no)^(Can Fly=yes) -> Birds
R2 : (Given Birth= no)^(Live in water=yes) -> Fishes
R3 : (Given Birth= yes)^(Blood Type=warm) -> mammals
R4 : (Given Birth= no)^(Can Fly= no) -> reptiles
R5 : (Live in water = sometimes) -> amphibians
[ Rule-based Classifier Example_2 ]
- match the class yourself :
R1 : (covers = hawk) -> Birds
R2 : (covers = grizzly bear) -> mammals
Rule Coverage & Accuracy 규칙의 적용범위와 정확성
- 데이터 집합 D와 분류 규칙 r : A -> y이 주어질 때, 이 규칙의 적용범위는 규칙 r에 적용되는 D에 속한 모든 항목들의 비율로 정의 됨.
반면에, 그 Accuracy 또는 신뢰도는 r이 적용되는 항목 중에서 class label이 y와 같은 비율로 정의된다.
Rule-based Classifier의 작동 원리
위에서 정리한 Rule 기반에 따르면 lemur(여우원숭이)는 온형동물에 새끼를 낳는 R3 즉, 포유류이고 turtle은 R4와 R5에서 충돌이 발생한다.(R4= Given Birth= no)^(Can Fly= no) -> reptiles / R5= (Live in water = sometimes) -> amphibians) 그리고 마지막으로 dogfish shark(돔발상어)의 경우 어떤 규칙도 적용되지 않는다.
이 예제는 Rule-based Classifier에 의해 새엉된 규칙 집합의 두 가지 중요한 특성을 보여준다.
# Mutually Exclusive Rules (상호 배타적 규칙)
- 같은 항목에 두 개 이상의 규칙이 적용되지 않을 때
- 모든 항목이 R에서 하나의 규칙에 의해 적용됨을 보장
# Exhaustive Rules(포괄적 규칙)
- 규칙 내 모든 속성의 값 조합의 경우에 적용되는 규칙이 존재하는 경우에만 해당 ( ex. 체온 )
규칙 집합이 Mutually Exclusive Rule이 아닌 경우, 한 항목에 여러 규칙이 적용될 수 있으며 이 문제를 해결하고자 두 가지 방법을 사용함.
- Ordered Rules (정렬 규칙)
: 모든 규칙이 우선순위 내림차순으로 정렬, 의사결정 리스트
: 하나의 시험항목이 복수의 분류규칙에 의해 적용되고 결과는 특정 class에 대한 투표로 간주한다.
- Unordered Rules (비정렬 규칙)
: 하나의 시험항목이 복수의 분류규칙에 의해 적용되고 있으며, 결과는 특정 class에 대한 투표로 간주한다.
'SEO's Study > 프로페셔널한 이야기' 카테고리의 다른 글
CentOS7 이슈 : sd_journal_get_cursor() failed (0) | 2020.03.27 |
---|---|
[LINUX] 라우팅 설정 변경하기 (0) | 2020.03.14 |
데이터 분류(2) - 의사결정 트리 (0) | 2020.01.02 |
데이터 분류(1) - 기본개념 (0) | 2019.12.29 |
데이터 탐색 (0) | 2019.12.09 |
댓글