- 아이고 도움이 되셨다니 다행이네요. 감사합니다
- 제가 본 R-CNN 정리글 중에 가장 이해가 잘 되는것 같습니다! 정성스럽고 자세⋯
- 오 빠른 댓글 감사합니다 ㅎㅎ
- 오늘도 잘 보고 갑니다!!
- 읽어주셔서 감사합니다 :-)
- 포스팅 잘 보구 가요!! :)
- RCNN 계열을 2 stage detector, YOLO 계열을 1 stage ⋯
- 안녕하세요! 논문 리뷰 잘 읽었습니다. abstract에서 end-to-end 라⋯
- 안녕하세요! 최종분류 부분에서 '따라서 최종적으로 Heart Disease가 있⋯
- 안녕하세요! 어느 부분을 말씀하시는 것인가요? 마지막에 yes 4개, no 4개인⋯
- 안녕하세요! 글감사합니다. 마지막 결론이 헷갈리는데요, 샘플에서 Heart dis⋯
- 둘 다 보면 더욱 좋죠 ㅎㅎ 읽어주셔서 감사합니다~
- 클린 코드 읽어봐야지 했었는데, 파이썬 코드로 된 버전도 나왔다니 좋은 정보네요!⋯
- 댓글 감사합니다. 머신러닝을 해야 하는데 책들이 재밌어서 딴 짓을 하고 있네요 제⋯
- 머신러닝 공부하려고 들어왔는데 모든 포스팅이 왜 다 제 취향이죠... 저도 민음사⋯
귀퉁이 서재
DATA - 5. 데이터의 종류 (양적 데이터, 질적 데이터) 본문

양적 데이터 (Quantitative, Numeric) |
질적 데이터 (Qualitative, Categorical) |
||
연속형 (Continuos) | ex) 키, 나이, 수입 | 순서형 (Ordinal) | Grade, 순위(랭킹) |
이산형 (Discrete) | ex) 사과의 갯수, 책의 페이지 수 | 명목형 (Nominal) | 성별, 뷔페의 음식 메뉴, 우편 번호 |
양적 데이터는 수학 연산 (덧셈, 뺄셈, 곱셈, 나눗셈 등)을 할 수 있는 데이터를 의미합니다. 양적 데이터는 다시 연속형 데이터와 이산형 데이터로 나뉩니다. 연속형 데이터는 데이터의 수치(값)가 연속되어 있는 데이터를 의미합니다. '키'를 예로 들면 170cm와 171cm 사이에는 무한히 많은 값이 존재합니다. 170.1cm, 170.231cm, 170.99999cm 등 무한한 값이 존재합니다. 즉, 데이터가 끊기지 않고 연속되어 있다는 뜻입니다. 반면 이산형 데이터는 연속된 값이 아닙니다. 하나, 둘, 셋 셀 수 있습니다. 사과의 개수는 3개, 4개로 딱 떨어집니다. 책의 페이지도 마찬가지입니다. 200 페이지면 200 페이지이지 200.5 페이지라는 것은 없습니다. 쉽게, 연속형 데이터는 실수형(float)로 표현이 가능한 것, 이산형은 정수형(int)으로 표현이 가능한 것이라고 봐도 좋습니다.
질적 데이터는 범주형 데이터라고도 합니다. 수학 연산이 가능하지 않은 범주로 나누어지는 데이터를 뜻합니다. 이는 순서형과 명목형으로 나뉩니다. 순서형은 Grade와 같이 A+, A0, A-, B+, B0 등 순서가 정해져 있는 데이터를 의미합니다. 정성적 데이터는 정량적 데이터와 다르게 수학 연산이 불가하다 했습니다. A0와 A-를 더한다고 A+가 되지 않습니다. 각 값들간 사칙연산은 무의미합니다. 명목형 데이터는 순위가 따로 없는 데이터를 뜻합니다. 대표적인 명목형 데이터는 성별이 있습니다. '남'과 '여'는 순서도 없으며 둘 간의 사칙 연산도 가능하지 않습니다.
여기서 주의할 점은 양적 데이터를 수치 데이터, 질적 데이터를 수치가 아닌 데이터로 잘 못 생각하는 경우가 있다는 것입니다. 정성적 데이터의 명목형을 보면 우편 번호도 있습니다. 우편 번호는 수치 데이터이지만 우리집 우편 번호와 옆 집 우편 번호를 더한다고 해서 의미 있는 값이 나오지 않습니다. 따라서 수치형 데이터라고 모두 양적 데이터는 아닙니다.
'데이터 분석' 카테고리의 다른 글
DATA - 7. 분산과 표준편차에서 n이 아니라 n-1로 나누는 이유 (자유도) (6) | 2019.04.10 |
---|---|
DATA - 6. 기술 통계학과 추측 통계학 (0) | 2019.04.08 |
DATA - 4. 판다스 활용 Medical Appointment No-show 분석 (0) | 2019.04.06 |
DATA - 3. Data Analysis Process & Pandas Basic (2) | 2019.03.31 |
DATA - 2. Jupyter Notebooks (0) | 2019.03.31 |