-
판별 분석 (Discriminant Analysis)아가개발자/머신러닝 2020. 10. 12. 14:54
판별 분석이란?
: 두개 이상의 모집단에서의 표본들이 지닌 정보 (분포)를 이용하여 이 표본들이 어느 모집단에서 추출된 것인지 결정하는 기준을 찾는 분석법
클래스 구분이 어려운 LD2에 투영된 판별 벡터보다 두개의 클래스를 잘 구분지어주는 LD1에 투영된 판별벡터를 찾아주어야 함
- 판별 분석의 기초개념
판별 변수: 어떤 집단에 속하는지 판별하기 위한 변수로 독립 변수 중 판별력이 높은 변수를 뜻한다. 판별변수는 판별 변수와 상관관계가 적은 독립 변수를 선택하여 판별 함수를 만들어야 한다.
판별 함수: 판별 함수를 이용하여 각 개체들이 소속 집단에 얼마나 잘 판별되는가에 대한 판별력을 측정하고 각 집단을 가장 잘 구분할 수 있는 판별식을 만들어 분별하는 과정
판별 점수: 판별 함수에 어떤 대상을 대입하여 그 대상이 어떤 집단에 속하는지 얼마나 잘 판별한지를 구한 값
표본의 크기: 전체 표본의 크기는 독립 변수의 개수보다 3배 이상이어야 하며, 종속 변수의 집단 각각의 본의 크기 중 최소 크기가 독립변수의 개수보다 커야한다.
- 판별 분석의 단계
1. 독립 변수 찾기: 집단을 구분하는데 도움이 되는 독립 변수를 선정
2. 판별 함수 도출 : 집단을 구분하는 기준이 되는 선형 결합 찾기
3. 분류의 정확도 분석: 판별 함수에 의한 정확도 계산
4. 클래스 예측: 도출한 판별 함수를 이용하여 테스트 데이터가 속하는 클래스 예측
'아가개발자 > 머신러닝' 카테고리의 다른 글
선형 판별 분석(LDA) 실습 (0) 2020.10.14 선형 판별 분석(LDA)/ 이차 판별 분석(QDA) (0) 2020.10.13 multiple logistic regression 실습 (0) 2020.10.09 로지스틱 회귀-Logistic regression (0) 2020.09.28 다중선형회귀 - Multiple Linear Regression (0) 2020.09.28