일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- hadoop2
- codingthematrix
- HelloWorld
- hive
- 딥러닝
- collections
- 텐서플로
- C언어
- 알고리즘
- yarn
- LSTM
- 주식분석
- 파이썬
- python
- 하이브
- NumPy
- 그래프이론
- 코딩더매트릭스
- C
- recursion
- Sort
- 하둡2
- effective python
- scrapy
- 선형대수
- Java
- graph
- GRU
- tensorflow
- RNN
- Today
- Total
EXCELSIOR
Intro. 통계학의 이해 본문
1. 통계학의 정의와 분류
1) 통계학: 불확실하고 잘 알려져 있지 않은 사실과 대상에 대한 통계정보를 얻기 위해 이와 관련된 자료(data)를 수집하고, 그 자료를 요약 정리하여 해석하며, 의사결정을 위한 결론이나 일반성 등을 이끌어내는 데 필요한 이론과 방법을 과학적으로 제시하여 주는 학문이다.
2) 기술통계학(Descriptive Statistics): 자료를 정리하여 그림이나 표로 요약하거나 자료들의 수치값을 요약한 대표값이나 자료의 흩어진 형태(분포)와 변동의 크기 등을 구하는 분야
3) 추측통계학(Inference Statistics): 통계적 모형과 구간을 설정하기도 하고 추측하기도 하며 어떤 기존의 사실에 대하여 가설(hypothesis)을 세우고 이를 검정하고 예측하는 분야
2. 자료의 수집
1) 모집단(population) : 일반적으로 통계조사의 관심이 되는 모든 대상들의 집합
2) 모수(parameter) : 모집단의 특성을 나타내는 수치
3) 표본(sample) : 모집단에서 추출된 집합으로써 모집단의 일부분
4) 통계량(statistics) : 표본의 특성을 나타내는 수치
Ex). 부산시가 시 전체 노동력 조사를 대신하여 남구와 서구의 각 5개 구별 대상으로 노동력 인구와 이들 중 실업자의 비율을 알고자 한다.
- 모집단 : 부산시 전체 노동력 인구와 실업자
- 모수 : 모집단의 노동력 있는 인구 수, 실업자 수, 실업자 비율
- 표본 : 남구와 서구의 각 5개 구별 노동력 인구와 실업자
- 통계량 : 표본의 노동력 있는 인구 수, 실업자 수, 실업자 비율
5) 통계자료분석의 단계
3. 자료의 종류
1) 양적 자료(Quantitative data): 수치로 나타낼 수 있는 자료
- 연속형 자료(continuous data): 관측값들이 셀 수 없는 연속적인 구간의 값을 취하는 자료 (ex. 키, 몸무게)
- 이산형 자료(discrete data): 관측값들이 셀 수 있는 값을 취하는 경우 (ex. 심박수)
2) 질적 자료(qualitative data): 범주(category) 또는 범주의 빈도수를 표현한 자료
- 순위형 자료(odinal data): 순서상의 의미가 있는 자료 (ex. 운동량 [ 1=적음, 2=보통, 3=많음]
- 명목형 자료(nominal data): 수치가 단지 구분하기 위한 것인 자료 (ex. 흡연[1=흡연자, 2=비흡연자])
'Statistics > 통계학 기초' 카테고리의 다른 글
Chap02 - Joint,Marginal,Conditional Probability Distribution (2) | 2019.09.29 |
---|---|
Chap01 - 기술 통계학 (Descriptive statistics) (1) | 2019.01.07 |