캐글 코리아 4차 대회

학습내용

대회 링크 : https://www.kaggle.com/c/kakr-4th-competition/overview

목차

01. 라이브러리 임포트 및 데이터 준비
02. 데이터 전처리
03. 모델 구축하기

01. 데이터 준비 및 라이브러리 임포트

목차로 이동하기

데이터 탐색

데이터 정보

age : 나이
workclass : 고용 형태
fnlwgt : 사람 대표성을 나타내는 가중치 (final weight의 약자)
education : 교육 수준 (최종 학력)
education_num : 교육 수준 수치
marital_status: 결혼 상태
occupation : 업종
relationship : 가족 관계
race : 인종
sex : 성별
capital_gain : 양도 소득
capital_loss : 양도 손실
hours_per_week : 주당 근무 시간
native_country : 국적
income : 수익 (예측해야 하는 값, target variable)

02. 데이터 전처리

목차로 이동하기

03. 모델 구축하기

목차로 이동하기

로지스틱 모델

Xgboost 모델

LightGBM 모델

최종 모델 예측