- 감사합니다 :)
- 좋은 글 잘 봤습니다! 좋아요 구독 누르고 갑니다 ㅎㅎ
- 도움되셨다니 기쁘네요. 고맙습니다~~
- 감사합니다. 캡스톤 디자인 수업하며 이 기능을 제가 구현했어야 했는데 너무나 도⋯
- 고맙습니다 !!
- 이제까지 읽은 글 중에 가장 쉽고 자세하게 설명된 글입니다!!! 감사합니다
- 과찬이십니다. 감사합니다~ ㅎㅎ
- 하나의 예시로 가볍고 이해가 쏙쏙되게 설명해주셔서 너무 감사드려요! Decisio⋯
- 댓글 남겨주셔서 고맙습니다 ^^
- mask image 활용해서 open cv 관련해서 알아보고 있었는데 정말 도움 ⋯
- 아이고 도움이 되셨다니 다행이네요. 감사합니다
- 제가 본 R-CNN 정리글 중에 가장 이해가 잘 되는것 같습니다! 정성스럽고 자세⋯
- 오 빠른 댓글 감사합니다 ㅎㅎ
- 오늘도 잘 보고 갑니다!!
- 읽어주셔서 감사합니다 :-)
귀퉁이 서재
DATA - 5. 데이터의 종류 (양적 데이터, 질적 데이터) 본문

양적 데이터 (Quantitative, Numeric) |
질적 데이터 (Qualitative, Categorical) |
||
연속형 (Continuos) | ex) 키, 나이, 수입 | 순서형 (Ordinal) | Grade, 순위(랭킹) |
이산형 (Discrete) | ex) 사과의 갯수, 책의 페이지 수 | 명목형 (Nominal) | 성별, 뷔페의 음식 메뉴, 우편 번호 |
양적 데이터는 수학 연산 (덧셈, 뺄셈, 곱셈, 나눗셈 등)을 할 수 있는 데이터를 의미합니다. 양적 데이터는 다시 연속형 데이터와 이산형 데이터로 나뉩니다. 연속형 데이터는 데이터의 수치(값)가 연속되어 있는 데이터를 의미합니다. '키'를 예로 들면 170cm와 171cm 사이에는 무한히 많은 값이 존재합니다. 170.1cm, 170.231cm, 170.99999cm 등 무한한 값이 존재합니다. 즉, 데이터가 끊기지 않고 연속되어 있다는 뜻입니다. 반면 이산형 데이터는 연속된 값이 아닙니다. 하나, 둘, 셋 셀 수 있습니다. 사과의 개수는 3개, 4개로 딱 떨어집니다. 책의 페이지도 마찬가지입니다. 200 페이지면 200 페이지이지 200.5 페이지라는 것은 없습니다. 쉽게, 연속형 데이터는 실수형(float)로 표현이 가능한 것, 이산형은 정수형(int)으로 표현이 가능한 것이라고 봐도 좋습니다.
질적 데이터는 범주형 데이터라고도 합니다. 수학 연산이 가능하지 않은 범주로 나누어지는 데이터를 뜻합니다. 이는 순서형과 명목형으로 나뉩니다. 순서형은 Grade와 같이 A+, A0, A-, B+, B0 등 순서가 정해져 있는 데이터를 의미합니다. 정성적 데이터는 정량적 데이터와 다르게 수학 연산이 불가하다 했습니다. A0와 A-를 더한다고 A+가 되지 않습니다. 각 값들간 사칙연산은 무의미합니다. 명목형 데이터는 순위가 따로 없는 데이터를 뜻합니다. 대표적인 명목형 데이터는 성별이 있습니다. '남'과 '여'는 순서도 없으며 둘 간의 사칙 연산도 가능하지 않습니다.
여기서 주의할 점은 양적 데이터를 수치 데이터, 질적 데이터를 수치가 아닌 데이터로 잘 못 생각하는 경우가 있다는 것입니다. 정성적 데이터의 명목형을 보면 우편 번호도 있습니다. 우편 번호는 수치 데이터이지만 우리집 우편 번호와 옆 집 우편 번호를 더한다고 해서 의미 있는 값이 나오지 않습니다. 따라서 수치형 데이터라고 모두 양적 데이터는 아닙니다.
'데이터 분석' 카테고리의 다른 글
DATA - 7. 분산과 표준편차에서 n이 아니라 n-1로 나누는 이유 (자유도) (6) | 2019.04.10 |
---|---|
DATA - 6. 기술 통계학과 추측 통계학 (0) | 2019.04.08 |
DATA - 4. 판다스 활용 Medical Appointment No-show 분석 (0) | 2019.04.06 |
DATA - 3. Data Analysis Process & Pandas Basic (2) | 2019.03.31 |
DATA - 2. Jupyter Notebooks (0) | 2019.03.31 |