ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 판별 분석 (Discriminant Analysis)
    아가개발자/머신러닝 2020. 10. 12. 14:54

    판별 분석이란? 

    : 두개 이상의 모집단에서의 표본들이 지닌 정보 (분포)를 이용하여 이 표본들이 어느 모집단에서 추출된 것인지 결정하는 기준을 찾는 분석법 

    source: https://eigenfoo.xyz/lda/

    클래스 구분이 어려운 LD2에 투영된 판별 벡터보다 두개의 클래스를 잘 구분지어주는 LD1에 투영된 판별벡터를 찾아주어야 함 

     

    • 판별 분석의 기초개념 

    판별 변수: 어떤 집단에 속하는지 판별하기 위한 변수로 독립 변수 중 판별력이 높은 변수를 뜻한다. 판별변수는 판별 변수와 상관관계가 적은 독립 변수를 선택하여 판별 함수를 만들어야 한다. 

     

    판별 함수: 판별 함수를 이용하여 각 개체들이 소속 집단에 얼마나 잘 판별되는가에 대한 판별력을 측정하고 각 집단을 가장 잘 구분할 수 있는 판별식을 만들어 분별하는 과정 

     

    판별 점수: 판별 함수에 어떤 대상을 대입하여 그 대상이 어떤 집단에 속하는지 얼마나 잘 판별한지를 구한 값 

     

    표본의 크기: 전체 표본의 크기는 독립 변수의 개수보다 3배 이상이어야 하며, 종속 변수의 집단 각각의 본의 크기 중 최소 크기가 독립변수의 개수보다 커야한다. 

     

    • 판별 분석의 단계 

    1. 독립 변수 찾기: 집단을 구분하는데 도움이 되는 독립 변수를 선정

    2. 판별 함수 도출 : 집단을 구분하는 기준이 되는 선형 결합 찾기

    3. 분류의 정확도 분석: 판별 함수에 의한 정확도 계산

    4. 클래스 예측: 도출한 판별 함수를 이용하여 테스트 데이터가 속하는 클래스 예측 

     

     

     

    댓글

Designed by Tistory.