관리 메뉴

귀퉁이 서재

Data Analyst Nano Degree를 끝내며.. 본문

데이터 분석

Data Analyst Nano Degree를 끝내며..

Baek Kyun Shin 2019. 7. 4. 20:49

Udacity의 Data Analyst Nano Degree를 모두 끝냈습니다. 3월 말 시작하여 3개월 정도가 걸렸습니다. 코스는 굉장히 만족스러웠습니다. 시작하기 전에는 3개월에 100만원이라는 돈을 들이며 온라인 강좌를 듣는 게 낭비는 아닐지 고민했지만 투자한 돈이 아깝다는 생각은 한번도 들지 않았습니다. 

본 코스에서는 데이터 분석에 대해 배웁니다. 통계 기본, 데이터 수집, 데이터 정제, 데이터 시각화 순으로 배우며 주로 Pandas, Numpy, Matplotlib, Seaborn과 같은 라이브러리를 사용합니다. 과정은 동영상 강의 - 읽기 자료 - 추가 레퍼런스 - 퀴즈 - 실습 - 프로젝트순으로 구성되어 있습니다. 커리큘럼도 짜임새 있어 이해하기가 쉬웠습니다. 진도를 나가는 재미도 있었고요. 데이터 분석 과정이기 때문에 어떤 대상에 대한 데이터가 주어졌을 때, 그 대상의 현재 상황/상태를 파악하는 것에 주안점이 두어져있습니다. 향후 예측까지 하려면 머신러닝을 배워야 하므로 그부분까진 다루지 않습니다.  

본 과정을 진행하며 여러 프로젝트를 했습니다. 제 깃헙 Data-Analyst-Nanodegree repository에 프로젝트 데이터 및 코드를 저장해놨습니다. Jupyter notebook의 길이가 길면 깃헙에서 렌더링이 잘 안 되는 경우가 있습니다. 그럴 경우는 제 gist를 보시거나 nbviewer로 미리 렌더링해놓은 아래 링크를 보시기 바랍니다.

Project2: 병원 예약 No Shows 분석

Project3: A/B Test 가설검정 및 회귀

Project4: 데이터 랭글링 프로세스

Project5: 트위터 WeRateDogs API 데이터 랭글링

Project6: 자전거 렌탈 데이터 분석 및 시각화

Nano Degree의 또 다른 특징은 클래스 메이트와 멘토가 배정된다는 점입니다. 멘토인 Karan에게서 많은 것을 배웠습니다. 모르는 것에 대해 항상 친절하게 알려준 멘토 Karan Thacker에게 감사를 전하고 싶습니다. 클래스 메이트 중 일본의 라쿠텐에서 시니어 데이터 사이언티스트로 일하고 있는 분인, Zaryaninov도 있었습니다. 그분에게서 데이터 사이언스에 대한 많은 조언을 얻었습니다.

다음 3개월 동안은 Machine Learning Course를 들을 계획입니다. 머신러닝 또한 공부하며 차근차근 정리하겠습니다.

4 Comments
댓글쓰기 폼