질문 요약
모수는 그림 4와 같이 0.24 0.16 0.28 0.32로 주어지는데, 이 값들은 표본 통계량이 아니라 모집단의 특성을 나타내는 상수인 것인가요?
답변 요약
네, 맞습니다. 전체 모집단에서 추출한 표본의 숫자는 모수가 아닙니다. 예를 들어 전체 인원이 100명인 경우를 가정한 것은 단순한 예시이며, 실제 현실에서는 전체 인원이 100명일 가능성은 없습니다. 이는 연습 문제로 이해하시면 됩니다.
Unsplash 추천 이미지 (키워드 : population )
통계학에서의 모수와 적합도검정
통계학에서 모수(parameter)는 모집단의 특성을 나타내는 상수로, 모집단의 평균, 분산, 비율 등이 이에 해당합니다. 예를 들어, 전체 인구 중에서 감기에 걸릴 확률이 있다면, 이 확률값이 바로 모수가 됩니다. 모수는 변하지 않는 값이지만, 실제로는 대부분의 경우 모집단 전체를 측정할 수 없기 때문에, 우리는 표본을 추출하여 모수에 대한 추정을 하게 됩니다. 추출된 표본을 바탕으로 계산된 평균, 분산, 비율 등을 표본통계량이라고 합니다.
적합도검정(goodness-of-fit test)은 관찰된 빈도가 특정한 이론적 분포에 적합한지를 검정하는 방법입니다. 이때 사용되는 이론적 분포의 확률이 바로 모수를 기반으로 한다고 할 수 있습니다. 즉, 어떤 모수를 알고 있다면, 이를 기준으로 관찰된 데이터가 그 모수를 따르는 분포를 보이는지를 검정할 수 있습니다.
귀하가 제시한 예제의 경우, 계절별 감기 환자의 비율을 모수로 설정하고, 이 모수가 실제로는 알려진 값이라고 가정한 것입니다. 여기서 0.24, 0.16, 0.28, 0.32는 각 계절에 감기에 걸릴 확률을 나타내며, 이러한 확률들은 모집단에서의 실제 비율을 반영하는 것으로 간주됩니다.
계절별 감기환자 적합도검정 예제 설명
예제에서는 모수가 알려진 경우로, 각 계절별 감기 환자의 비율이 봄 24%, 여름 16%, 가을 28%, 겨울 32%라고 가정합니다. 이러한 비율은 모집단에 대한 이론적인 값으로, 실제로 전체 인구를 대상으로 한 조사에서 얻은 것일 수도 있고 과학적인 연구나 이전의 경험적 자료를 기반으로 설정될 수도 있습니다. 따라서 이 비율들은 모집단 전체의 특성을 나타내는 모수로 사용됩니다.
이제 실제로 병원에서 한 해 동안 감기로 진료 받은 환자의 계절별 분포를 조사한다고 가정합시다. 이 데이터를 통해 각 계절별 확률이 위에서 제시한 모수에 적합한지를 검정하고자 합니다. 이를 위해 귀무가설과 대립가설을 세우게 됩니다.
귀무가설(H0): 실제 감기 환자의 계절별 분포는 모수로 알려진 분포와 같다. (즉, 봄 24%, 여름 16%, 가을 28%, 겨울 32%) 대립가설(H1): 실제 감기 환자의 계절별 분포는 모수로 알려진 분포와 다르다.
적합도검정을 통해 이 귀무가설을 검정하게 됩니다. 실제 관찰된 환자 수와 이론적으로 기대되는 환자 수를 비교하여 적합도검정의 통계량을 계산하고, 이를 바탕으로 귀무가설을 채택할지 여부를 결정하게 됩니다.
이해를 돕기 위해, 모수가 알려진 계절별 감기환자의 비율에 적합도검정을 실시하는 구체적인 예제를 다루어보겠습니다. 이 예제에서는 모수를 알고 있다는 가정하에 실제 데이터와 비교하여 모집단의 특성과 일치하는지를 검증하는 과정을 살펴보게 될 것입니다. 감기 환자의 계절별 분포를 통해 통계학적 검정의 기본적인 이해를 돕고자 합니다.
이처럼 통계학은 이론적 지식과 실제 데이터를 함께 사용하여 현실 세계의 여러 가설을 검증하는 매우 유용한 도구입니다. 모수와 표본통계량의 차이를 이해하고, 적합도검정과 같은 통계적 방법을 적절히 사용하면, 다양한 분야에서 데이터를 바탕으로 한 합리적인 결정을 내릴 수 있게 됩니다.
유니스터디 바로가기 : https://www.unistudy.co.kr/megauni.asp
학습Q&A 바로가기 : https://www.unistudy.co.kr/community/qna_list.asp
0 댓글