사전 훈련된 단어 임베딩 사용

유명한 알고리즘

01 데이터 준비

02. 학습용 데이터 1000개의 샘플로 영화 리뷰 분류

케라스의 Tokenizer을 이용하여 텍스트를 '단어:정수'로 변환

단어와 정수의 딕셔너리 형태 확인

데이터를 학습용 세트와 검증 세트로 분할

Glove 단어 임베딩

모델 구현

모델 구축

모델에 GloVe 임베딩 로드하기

모델 훈련과 평가

모델의 성능을 그래프로 그려보겠다.

성능 그래프 확인

실습

03 사전 훈련된 단어 임베딩을 사용하지 않고, 같은 모델 훈련해 보기

훈련 모델이 더 낫다. 64%

04 테스트 데이터에서 모델을 평가해보기