연령, 나이대별로 인간 분포가 다양함
1-1 성별
여자 728
남자 712
1-2연령대
20 113
30 341
40 444
50 335
60 160
70 47
범주형 변수 인코딩 (One-Hot Encoding)
로지스틱 회귀로 모델 학습 및 평가
변수 중요도 확인 > 결과는 정밀도, 재현율, F1 매우낮음
개선된 불균형 처리 + XGBoost 모델 코드 > 이것도 좀 높아지긴 했지만 아직 낮음 (24%정도)
20 |
113 |
30 |
341 |
40 |
444 |
50 |
335 |
60 |
160 |
70 |
47 |