Intro. 통계학의 이해
1. 통계학의 정의와 분류
1) 통계학: 불확실하고 잘 알려져 있지 않은 사실과 대상에 대한 통계정보를 얻기 위해 이와 관련된 자료(data)를 수집하고, 그 자료를 요약 정리하여 해석하며, 의사결정을 위한 결론이나 일반성 등을 이끌어내는 데 필요한 이론과 방법을 과학적으로 제시하여 주는 학문이다.
2) 기술통계학(Descriptive Statistics): 자료를 정리하여 그림이나 표로 요약하거나 자료들의 수치값을 요약한 대표값이나 자료의 흩어진 형태(분포)와 변동의 크기 등을 구하는 분야
3) 추측통계학(Inference Statistics): 통계적 모형과 구간을 설정하기도 하고 추측하기도 하며 어떤 기존의 사실에 대하여 가설(hypothesis)을 세우고 이를 검정하고 예측하는 분야
2. 자료의 수집
1) 모집단(population) : 일반적으로 통계조사의 관심이 되는 모든 대상들의 집합
2) 모수(parameter) : 모집단의 특성을 나타내는 수치
3) 표본(sample) : 모집단에서 추출된 집합으로써 모집단의 일부분
4) 통계량(statistics) : 표본의 특성을 나타내는 수치
Ex). 부산시가 시 전체 노동력 조사를 대신하여 남구와 서구의 각 5개 구별 대상으로 노동력 인구와 이들 중 실업자의 비율을 알고자 한다.
- 모집단 : 부산시 전체 노동력 인구와 실업자
- 모수 : 모집단의 노동력 있는 인구 수, 실업자 수, 실업자 비율
- 표본 : 남구와 서구의 각 5개 구별 노동력 인구와 실업자
- 통계량 : 표본의 노동력 있는 인구 수, 실업자 수, 실업자 비율
5) 통계자료분석의 단계
3. 자료의 종류
1) 양적 자료(Quantitative data): 수치로 나타낼 수 있는 자료
- 연속형 자료(continuous data): 관측값들이 셀 수 없는 연속적인 구간의 값을 취하는 자료 (ex. 키, 몸무게)
- 이산형 자료(discrete data): 관측값들이 셀 수 있는 값을 취하는 경우 (ex. 심박수)
2) 질적 자료(qualitative data): 범주(category) 또는 범주의 빈도수를 표현한 자료
- 순위형 자료(odinal data): 순서상의 의미가 있는 자료 (ex. 운동량 [ 1=적음, 2=보통, 3=많음]
- 명목형 자료(nominal data): 수치가 단지 구분하기 위한 것인 자료 (ex. 흡연[1=흡연자, 2=비흡연자])