코딩 기록들

[ 딥러닝 기초 ] 06.1 DNN_영화 리뷰 분류 (이진 분류 예제) 본문

Deep Learning 기초

[ 딥러닝 기초 ] 06.1 DNN_영화 리뷰 분류 (이진 분류 예제)

코딩펭귄 2022. 11. 2. 02:54

  영화 리뷰 분류-이진 분류 예제  

- IMDB데이터셋 : 인터넷영화 데이터베이스로 가져온 양극단의 리뷰 50000개

- 25000개 Training data, 25000개 Test data로 나눠져있음

- Keras 에 기본으로 포함되어있음(MNIST처럼)

 

 데이터와 준비 

- 신경망에 숫자리스트를 바로 주입할수 없으므로, 텐서로 변환해야함.

- one hot encoding을 사용해 10000 차원의 벡터로 변환해서 사용해야함

one-hot-encoding

 

 

  영화 리뷰 분류-이진 분류 예제 실습   

 

https://github.com/SeungHyunKee/Python/blob/main/%EC%98%81%ED%99%94_%EB%A6%AC%EB%B7%B0_%EB%B6%84%EB%A5%98_%EC%9D%B4%EC%A7%84_%EB%B6%84%EB%A5%98_%EC%98%88%EC%A0%9Csh.ipynb

 

GitHub - SeungHyunKee/Python

Contribute to SeungHyunKee/Python development by creating an account on GitHub.

github.com

 

training loss값 말고, validation loss(검증정확도)의 유의미한 값을 찾아야한다.
해당 차트에서는 validationn acc의 값이 갑자기 증가한 표시한 라인인 3번째 점 지점이 가장 정확도가 높게나올것이다.