목록DAND (4)
귀퉁이 서재
Udacity의 Data Analyst Nano Degree를 모두 끝냈습니다. 3월 말 시작하여 3개월 정도가 걸렸습니다. 코스는 굉장히 만족스러웠습니다. 시작하기 전에는 3개월에 100만원이라는 돈을 들이며 온라인 강좌를 듣는 게 낭비는 아닐지 고민했지만 투자한 돈이 아깝다는 생각은 한번도 들지 않았습니다. 본 코스에서는 데이터 분석에 대해 배웁니다. 통계 기본, 데이터 수집, 데이터 정제, 데이터 시각화 순으로 배우며 주로 Pandas, Numpy, Matplotlib, Seaborn과 같은 라이브러리를 사용합니다. 과정은 동영상 강의 - 읽기 자료 - 추가 레퍼런스 - 퀴즈 - 실습 - 프로젝트순으로 구성되어 있습니다. 커리큘럼도 짜임새 있어 이해하기가 쉬웠습니다. 진도를 나가는 재미도 있었고요...
데이터 분석 프로세스는 아래와 같이 총 5단계로 진행됩니다. Ask Questions - Wrangle Data (gather, access, clean) - Perform EDA (Exploratory Data Analysis) - Draw conclusions (or even make predictions) - Communicate your results Ask Questions 주어진 데이터를 기반으로 어떤 분석을 할 수 있을지 질문해보는 단계입니다. Wrangle Data (gather, access, clean) 데이터를 수집하고, 데이터에 접근하고, 데이터 전처리를 하는 단계입니다. 데이터를 수집할 수 있는 방법은 여러가지가 있습니다. 웹 상에서 파일로 다운을 받거나, API를 통해 받아오거나..
Anaconda란? Anaconda(아나콘다)는 데이터 사이언스를 위한 패키지 배포판입니다. Windows, Linux, Mac OS 환경에서 사용가능하며, conda라는 package, environment 매니저를 사용합니다. conda를 이용해서 서로 다른 버전의 파이썬 (python2, python3)이나 서로 다른 패키지 등을 쓰는 독립적인 프로젝트 환경을 만들 수 있습니다. 그렇게 만들어진 환경 안에서 원하는 패키지를 설치, 삭제, 업데이트할 수 있습니다. Anaconda 설치 우선, (Reference1) 본 링크에서 Anaconda를 다운받습니다. python2 말고 python3 버전을 받되, 본인의 환경에 맞는 것을 다운 받습니다. 저는 windows 64-bit 버전을 받았습니다. 프..
데이터 분석 공부를 체계적으로 하고 싶어 여러 사이트 및 학원을 알아봤습니다. 패스트캠퍼스 같은 오프라인 교육부터 코세라, 유데미, 유다시티, K-MOOC와 같은 온라인 교육까지 꼼꼼히 비교를 해봤습니다. 우선 오프라인 교육은 단기 교육이 많습니다. 키포인트 위주로 배울 뿐이지 많은 양을 체계적으로 학습할 수 있을 것 같진 않았습니다. K-MOOC는 사이트를 들어가자 마자 나왔습니다. 관리를 거의 안하고 있고, 컨텐츠도 퀄리티가... 코세라는 무료 강좌지만 교수가 한 강좌 전체를 강의하기 때문에 다양성 혹은 체계성이 부족할 것이라 생각했습니다. (물론 추후에 집중 심화 학습할 땐 상당히 유용할 것 같았습니다.) 유데미는 다양한 주제의 단기 과정이 많아 저의 취지와는 맞지 않았습니다. 그래서 최종적으로 U..