Notice
Recent Comments
- 안녕하세여 글 잘봤습니다. 저 질문이 있어서⋯
- 엌ㅋㅋ 최고의 댓글이네요. 그렇게 말씀해주⋯
- 진짜 너무 잘 설명해주셔서 울컥하는 바람에⋯
- 이미지를 hsv로 변환하고 다각형 도형 챕터에⋯
- 고맙습니다~!
- 좋은 글 잘 보고 갑니다. 굿굿
- 오 직접 번역까지 하신다니.. 번역하시면 꼭⋯
- 번역본은 없나봐요 찾아봤는데! 나중에 시간⋯
- 도움이 많이 되셨다니 다행이네요 ㅎㅎ 구매⋯
- 안녕하세요. 관련 서적 중 가장 도움이 많이⋯
- 구독까지 해주셔서 감사합니다 !! ^^
- 저도 최근에 톨스토이의 자전소설인 [소년시⋯
- 제 책을 사주셨다니 감사합니다 :) 말씀하신⋯
- 글쎄요. 저는 잘 모르겠습니다 ㅜㅜ
- ^^
목록CountVectorizer (1)
귀퉁이 서재

이전 장에서 BOW에 대해 알아봤고, BOW의 피처 벡터화는 카운트 기반 벡터화(CountVectorizer)와 TF-IDF(Term Frequency - Inverse Document Frequency) 기반 벡터화가 있다고 했습니다. 이번장에서는 CountVectorizer와 TF-IDF에 대해 알아보겠습니다. 이번 장 역시 파이썬 머신러닝 완벽 가이드 (권철민 저), 딥 러닝을 이용한 자연어 처리 입문(유원주 저)을 요약정리했습니다. 카운트 기반 벡터화 이전 장에서 BOW(Bag of Words) 모델에서의 피처 벡터화 수행 방법에 대해 설명했습니다. 그와 마찬가지로, 단어 피처에 값을 부여할 때, 각 문서에서 해당 단어가 나타나는 횟수, 즉 Count를 부여하는 경우를 카운트 벡터화라고 합니다. ..
자연어 처리 (NLP)
2020. 2. 15. 12:04