연령, 나이대별로 인간 분포가 다양함

1-1 성별 여자 728 남자 712

1-2연령대 20 113 30 341 40 444 50 335 60 160 70 47

범주형 변수 인코딩 (One-Hot Encoding)

로지스틱 회귀로 모델 학습 및 평가

변수 중요도 확인 > 결과는 정밀도, 재현율, F1 매우낮음

개선된 불균형 처리 + XGBoost 모델 코드 > 이것도 좀 높아지긴 했지만 아직 낮음 (24%정도)

20 113
30 341
40 444
50 335
60 160
70 47