ch02 앙상블 기법- RandomForest(4)

학습 내용

01. 랜덤포레스트 모델의 시각화를 해 보기

라이브러리 설치

회귀 트리(Regression tree)

이미지 스케일 조정

분류 트리(Classification tree)

분류 트리(Classification tree)

Breast Cancer Wisconsin Dataset

분류 트리(Classification tree)

컬럼명 설명 데이터 유형
age 나이 숫자
sex 성별 명목형
bmi 체질량 지수 숫자
bp 평균 혈압 숫자
s1 혈청 측정값1 숫자
s2 혈청 측정값2 숫자
s3 혈청 측정값3 숫자
s4 혈청 측정값4 숫자
s5 혈청 측정값5 숫자
s6 혈청 측정값6 숫자
Y 10개변수 측정 후, 당뇨병 진행도 숫자

캐글 코리아 2차 대회 데이터 셋 데이터

컬럼명 의미 값(기타)
ID 집을 구분하는 번호
date 집을 구매한 날짜
price 집의 가격(Target variable)
bedrooms 침실의 수
bathrooms 화장실의 수
sqft_living 주거 공간의 평방 피트(면적)
sqft_lot 부지의 평방 피트(면적)
floors 집의 층 수
waterfront 집의 전방에 강이 흐르는지 유무 (a.k.a. 리버뷰)
view 집이 얼마나 좋아 보이는지의 정도
condition 집의 전반적인 상태
grade King County grading 시스템 기준으로 매긴 집의 등급
sqft_above 지하실을 제외한 평방 피트(면적)
sqft_basement 지하실의 평방 피트(면적)
yr_built 지어진 년도
yr_renovated 집을 재건축한 년도
zipcode 우편번호
lat 위도
long 경도
sqft_living15 2015년 기준 주거 공간의 평방 피트(면적, 집을 재건축했다면, 변화가 있을 수 있음)
sqft_lot15 2015년 기준 부지의 평방 피트(면적, 집을 재건축했다면, 변화가 있을 수 있음)

REF

교육용으로 작성된 것으로 배포 및 복제시에 사전 허가가 필요합니다.
Copyright 2021 LIM Co. all rights reserved.