본문 바로가기

머신러닝,딥러닝

(18)
캐글 자연어처리(NLP) 튜토리얼 입문 2. 머신러닝 모델링 - 백터화 https://www.kaggle.com/c/word2vec-nlp-tutorial 지난 번에 했던 캐글 NLP 튜토리얼 이어서 하겠습니다! 데이터를 정제한 뒤부터 이어지니깐 커널 돌려서 실행한 뒤에 따라서 해주시면 됩니다. 이 포스팅은 박조은님의 인프런 '[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리' 강좌를 듣고 실습하며 따로 내용을 정리한 글입니다! 따라서, 강의 내용 + @ (추가적으로 공부한 내용 및 방법) 으로 구성됩니다! :) scikit-learn 의 기본 알고리즘을 보여주는 그림입니다. 이번 모델링에서는 랜덤포레스트를 사용할 것입니다. 랜덤 포레스트는 https://ko.wikipedia.org/wiki/%EB%9E%9C%EB%8D%A4_%ED%8F%AC..
캐글 자연어처리(NLP) 튜토리얼 입문 1. 데이터 정제 https://www.kaggle.com/c/word2vec-nlp-tutorial Bag of Words Meets Bags of Popcorn Use Google's Word2Vec for movie reviews www.kaggle.com 자연어처리 입문으로 할 때 많이 쓰는 튜토리얼인 Bag of Words Meets Bags of Popcorn 을 다뤄보겠습니다. 위의 링크를 눌러서 'Data'를 누르시면 sources 를 받을 수 있습니다. (로그인이 되어있어야 다운이 될거에요~) 그리고 지금부터 하는 이 튜토리얼 코드는 순수하게 제가 하는 것이 아닌 인프런의 '[NLP] IMDB 영화리뷰 튜토리얼' 강의를 듣고 따라하면서 제가 복습 및 정리하는 내용입니다 :) 1. 데이터 불러서 살펴보기 우..