캐글 코리아 4차 대회

학습내용

목차

01. 라이브러리 임포트 및 데이터 준비
02. 데이터 탐색
03. 모델링

01. 데이터 준비 및 라이브러리 임포트

목차로 이동하기

설치

데이터 탐색

데이터 정보

age : 나이
workclass : 고용 형태
fnlwgt : 사람 대표성을 나타내는 가중치 (final weight의 약자)
education : 교육 수준 (최종 학력)
education_num : 교육 수준 수치
marital_status: 결혼 상태
occupation : 업종
relationship : 가족 관계
race : 인종
sex : 성별
capital_gain : 양도 소득
capital_loss : 양도 손실
hours_per_week : 주당 근무 시간
native_country : 국적
income : 수익 (예측해야 하는 값, target variable)

EDA 참고 링크

https://github.com/Aditya-Mankar/Census-Income-Prediction

02. 데이터 탐색

목차로 이동하기

데이터 탐색 및 분석

03. 모델링 - pycaret를 활용

목차로 이동하기

PyCaret은 무엇일까?

설치 및 작업 순서

순서

사용 가능한 모델

CatBoost 모델링

제출