귀퉁이 서재

Data Analyst Nano Degree를 끝내며.. 본문

데이터 분석

Data Analyst Nano Degree를 끝내며..

Baek Kyun Shin 2019. 7. 4. 20:49

Udacity의 Data Analyst Nano Degree를 모두 끝냈습니다. 3월 말 시작하여 3개월 정도가 걸렸습니다. 코스는 굉장히 만족스러웠습니다. 시작하기 전에는 3개월에 100만원이라는 돈을 들이며 온라인 강좌를 듣는 게 낭비는 아닐지 고민했지만 투자한 돈이 아깝다는 생각은 한번도 들지 않았습니다. 

본 코스에서는 데이터 분석에 대해 배웁니다. 통계 기본, 데이터 수집, 데이터 정제, 데이터 시각화 순으로 배우며 주로 Pandas, Numpy, Matplotlib, Seaborn과 같은 라이브러리를 사용합니다. 과정은 동영상 강의 - 읽기 자료 - 추가 레퍼런스 - 퀴즈 - 실습 - 프로젝트순으로 구성되어 있습니다. 커리큘럼도 짜임새 있어 이해하기가 쉬웠습니다. 진도를 나가는 재미도 있었고요. 데이터 분석 과정이기 때문에 어떤 대상에 대한 데이터가 주어졌을 때, 그 대상의 현재 상황/상태를 파악하는 것에 주안점이 두어져있습니다. 향후 예측까지 하려면 머신러닝을 배워야 하므로 그부분까진 다루지 않습니다.  

본 과정을 진행하며 여러 프로젝트를 했습니다. 제 깃헙 Data-Analyst-Nanodegree repository에 프로젝트 데이터 및 코드를 저장해놨습니다. Jupyter notebook의 길이가 길면 깃헙에서 렌더링이 잘 안 되는 경우가 있습니다. 그럴 경우는 제 gist를 보시거나 nbviewer로 미리 렌더링해놓은 아래 링크를 보시기 바랍니다.

Project2: 병원 예약 No Shows 분석

Project3: A/B Test 가설검정 및 회귀

Project4: 데이터 랭글링 프로세스

Project5: 트위터 WeRateDogs API 데이터 랭글링

Project6: 자전거 렌탈 데이터 분석 및 시각화

Nano Degree의 또 다른 특징은 클래스 메이트와 멘토가 배정된다는 점입니다. 멘토인 Karan에게서 많은 것을 배웠습니다. 모르는 것에 대해 항상 친절하게 알려준 멘토 Karan Thacker에게 감사를 전하고 싶습니다. 클래스 메이트 중 일본의 라쿠텐에서 시니어 데이터 사이언티스트로 일하고 있는 분인, Zaryaninov도 있었습니다. 그분에게서 데이터 사이언스에 대한 많은 조언을 얻었습니다.

다음 3개월 동안은 Machine Learning Course를 들을 계획입니다. 머신러닝 또한 공부하며 차근차근 정리하겠습니다.

Comments