귀퉁이 서재

스터디 - 파이썬 머신러닝 완벽가이드 본문

토이(Toy) 프로젝트

스터디 - 파이썬 머신러닝 완벽가이드

Baek Kyun Shin 2019. 11. 28. 19:49

공룡책으로 유명한 '파이썬 머신러닝 완벽가이드' 스터디를 했습니다. 2019년 11월 7일에 강의와 교재를 구매하여, 11월 28일인 오늘 7장 군집화까지 모두 끝냈습니다. 퇴근 후 짬을 내어 공부를 하다 보니 3주 정도 걸렸습니다.

'파이썬 머신러닝 완벽가이드'는 워낙 유명한 책이라 아시는 분들도 많을 겁니다. 웬만한 내용은 이미 공부했던 거라 할까 말까 처음엔 망설였지만 하기를 잘한 것 같습니다. 디테일한 부분까지 공부할 수 있었고, 비지도 학습까지도 체계적으로 배울 수 있었습니다. 책을 보면 저자가 얼마나 정성을 들여 집필했는지 알 수 있습니다. 

스터디 방식은 각 챕터별로 먼저 강의를 듣고, 교재로 복습하고, 코드로 재차 복습을 했습니다. 코드나 스터디 히스토리가 궁금하신 분들은 제 깃헙을 참고해주시면 좋을 것 같습니다.

강의 및 책의 목차는 아래와 같이 구성되어있습니다.

1. 파이썬 기반의 머신러닝과 생태계 이해 (~p.86)
- Numpy, Pandas

2. 사이킷런으로 시작하는 머신러닝 (~p.142)
- sklearn 프레임워크, Model Selection(K-fold, Stratified K-fold, cross_val_score, GridSearchCV), 데이터 전처리

3. 평가 (~p.178)
- Accuracy, Precision & Recall, Confusion Matrix, F1 Score, ROC/AUC

4. 분류 (~p.285)
- Decision Tree, Ensemble(Voting, Bagging, Boosting), Random Forest, Gradient Boosting Machine, XGBoost, LightGBM, Under Sampling/Over Sampling(SMOTE), Stacking

5. 회귀 (~p.372)
- Gradient Descent, Stochastic Gradient Descent, Linear Regression, Polynomial Regression, Bias-Variance Trade off, Regularized Linear Models (Ridge, Lasso, ElasticNet), Logistic Regression, Tree Regression, Preprocessing(Scaling, Log Transformation, Feature Encoding), Mixed Model Prediction

6. 차원 축소 (~p.404)
- PCA(Principal Component Analysis), LDA(Linear Discriminant Analysis), SVD(Singular Value Decomposition), Truncated SVD, NMF(Non-Negative Matrix Fatorization)

7. 군집화 (~p.459)
- K-means, Cluster Evaluation(실루엣 계수), Mean Shift, GMM, DBSCAN

머신러닝의 기본에 대해서 어느정도 아시는 분이라면 체계적으로 복습하고 정리할 겸 공부해보시는 것도 좋겠네요

 

Comments