실전 데이터 분석 - Spaceship Titanic 데이터 셋

학습 내용

목차

01. kaggle 데이터 셋 가져오기
02. 라이브러리 준비 및 데이터 셋 가져오기
03. 데이터 EDA
04. 데이터 전처리
05. 모델 구축 및 예측

01. kaggle 데이터 셋 가져오기

목차로 이동하기

대회 개요

사전 준비

구글 드라이브에서 kaggle.json 가져오기 - 방법1

설치

!pip install kaggle --upgrade

구글 드라이브에서 kaggle.json 가져오기 - 방법2

kaggle.json 파일 이동

!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json
!ls -l kaggle.json

필요한 데이터 셋 가져오기

!kaggle competitions download -c spaceship-titanic

데이터 확인

# 파일 확인
!ls -l

# 압축 풀기
!unzip [파일명]

# 파일 확인
!ls -l

02. 라이브러리 준비 및 데이터 셋 가져오기

목차로 이동하기

from pycaret.classification import *

ImportError: Missing optional dependency 'Jinja2'. DataFrame.style requires jinja2. Use pip or conda to install Jinja2.

해결 시도

적용을 위해 재기동 후, 실행

03. 데이터 EDA

목차로 이동하기

결측치 확인

데이터 전처리

결측치 채우기

변수 제거

라벨 인코딩

데이터 나누기

05. 모델 구축 및 예측

목차로 이동하기

앙상블(Ensemble)

모델 해석

제출 결과 : 0.80454

REF