귀퉁이 서재

Data Analyst Nano Degree를 끝내며.. 본문

데이터 분석

Data Analyst Nano Degree를 끝내며..

데이터 파수꾼 Baek Kyun Shin 2019. 7. 4. 20:49

Udacity의 Data Analyst Nano Degree를 모두 끝냈습니다. 3월 말 시작하여 3개월 정도가 걸렸습니다. 코스는 굉장히 만족스러웠습니다. 시작하기 전에는 3개월에 100만원이라는 돈을 들이며 온라인 강좌를 듣는 게 낭비는 아닐까 고민했지만 투자한 돈이 아깝다는 생각은 한 번도 들지 않았습니다. 

당연한 말이지만 본 코스에서는 데이터 분석에 대해 배웁니다. 통계 기본, 데이터 수집, 데이터 정제, 데이터 시각화 순으로 배우며 주로 Pandas, Numpy, Matplotlib, Seaborn과 같은 라이브러리를 사용합니다. 과정은 동영상 강의 - 읽기 자료 - 추가 레퍼런스 - 퀴즈 - 실습 - 프로젝트로 구성되어 있습니다. 커리큘럼도 짜임새 있어 이해가 쉬웠고 진도를 나가는 재미가 있었습니다. 데이터 분석이기 때문에 어떤 대상에 대한 데이터가 주어졌을 때 그 대상의 현재 상황/상태를 파악하는 것에 주안점이 두어져있습니다. 향후 예측까지 가려면 머신러닝까지 배워야 하므로 그 부분까지 다루지는 않습니다.  

본 과정을 진행하며 여러 프로젝트를 했습니다. 제 깃헙 Data-Analyst-Nanodegree repository에 프로젝트 데이터 및 코드를 저장해놨습니다. Jupyter notebook의 길이가 길면 깃헙에서 렌더링이 잘 안 되는 경우가 있습니다. 그럴 경우는 제 gist를 보시거나 nbviewer로 미리 렌더링해놓은 아래 링크를 보시기 바랍니다.

Project2: 병원 예약 No Shows 분석

Project3: A/B Test 가설검정 및 회귀

Project4: 데이터 랭글링 프로세스

Project5: 트위터 WeRateDogs API 데이터 랭글링

Project6: 자전거 렌탈 데이터 분석 및 시각화

Nano Degree의 또 하나의 특징은 클래스 메이트와 멘토가 배정된다는 것입니다. 멘토인 Karan으로부터 많은 것을 배웠습니다. 모르는 것에 대해서 항상 상세히 알려준 멘토 Karan Thacker에게 감사를 전하고 싶습니다. 클래스 메이트 중 일본의 라쿠텐에서 시니어 데이터 사이언티스트로 일하고 있는 분인, Zaryaninov도 있었습니다. 그 분으로부터 데이터 사이언스에 대한 많은 조언을 얻을 수 있었습니다.

다음 3개월 동안은 Machine Learning Course를 들을 계획입니다. 머신 러닝 또한 공부하며 차근차근 정리하겠습니다.

4 Comments
  • 프로필사진 2020.11.09 15:26 비밀댓글입니다
  • 프로필사진 데이터 파수꾼 Baek Kyun Shin 2020.11.09 17:23 신고 안녕하세요. 제 블로그에 관심을 가져주시고 댓글까지 남겨주셔서 감사드립니다.
    저도 현재 꾸준히 배우고 있는 단계라 제가 뭐라 조언을 드릴 수 있는 입장인지 싶습니다만, 길게 댓글을 남겨주셔서 제 의견을 말씀드립니다.

    우선 저는 Udacity의 데이터 애널리스트 나노디그리로 데이터분석 공부를 시작한 것에 굉장히 만족합니다. 다시 그때로 돌아가도 Udacity 강좌를 수강할 것 같습니다.

    다만, 저는 급하게 공부할 필요는 없었기 때문에 여유를 가지고 강좌를 수강했습니다. 댓글 남겨주신 분께서는 현재 대학교 4학년이시고 취준/코딩테스트 준비도 하셔야 하므로 많이 정신이 없으실 것 같습니다.

    데이터분석 쪽으로 취업하실 예정이시라면 이미 기본적인 분석방법(기초 통계 및 분석, 시각화 등)에 대해서는 알고 계실 것 같습니다. 이미 이런 내용에 대해 알고 계시다면 Udacity 강좌가 쉽게 느껴지실 겁니다.

    하지만 당장 취업할 계획은 아니어서 시간적으로 여유가 있으시다면, 또한 판다스/시각화 라이브러리 등을 많이 사용해본 경험이 없으시다면 추천합니다.

    또 궁금한 점이 있다면 댓글 남겨주세요 ^^
  • 프로필사진 2020.11.09 17:43 비밀댓글입니다
  • 프로필사진 데이터 파수꾼 Baek Kyun Shin 2020.11.09 18:10 신고 네, 그정도면 딱 알맞겠네요 ㅎㅎ
    머신러닝은 나노디그리로 듣지 않았고 무료버전의 강의만 들었습니다.

    나노디그리를 하면 각종 퀴즈/실습/프로젝트를 할 수 있고 그에 다른 피드백도 받을 수 있지만, 무료버전은 그냥 동영상 강의만 들을 수 있습니다.

    전 빠르게 개념을 익히고 캐글 필사를 할 예정이어서 머신러닝 나노디그리는 하지 않았습니다. 머신러닝도 강의 내용 자체는 좋았습니다. 기본 개념을 익히기에 아주 좋은 것 같습니다 ㅎㅎ
댓글쓰기 폼