티스토리 뷰

공중보건학

보건 통계 의미와 정리

틈새로운 2022. 11. 9. 22:42

보건 통계의 개념과 의의

보건 통계란 인간 집단에서 보건과 관련된 자료, 즉 출생, 질병이환, 사망 등의 현상에 영향을 미치는 자료를 수집, 분석하여 과학적으로 추론하는 방법을 의미합니다. 따라서, 건강이나 질병 등 보건과 관련된 여러 현상을 기술하고, 그 변동을 확률적으로 추론하는 학문을 보건 통계학(health statistics)이라 합니다.

 

우리나라에서 보건 통계는 인구동태 조사의 개념에서 출발하여 점차 통계학의 기본적인 영역인 기술 통계학의 적용이 이루어지기 시작하였습니다. 이후 컴퓨터에 의한 통계적 분석의 필요성이 대두되어 1966년 미국 North Carolina 주의 ASA Institute에서 개발된 SAS나 SPSS와 같은 통계 프로그램이 소개됨으로써 보다 발전적인 보건 통계가 이루어지게 됩니다.

1970년대부터 우리나라에서도 비로소 수집된 자료의 체계적 분석이 이루어져 전국 규모의 보건 통계의 생산이 시작되었습니다.

보건 통계는 지역사회 주민의 건강 수준 측정 및 보건 문제를 파악하기 위하여 수집된 각종 자료 또는 이 자료의 통계학적인 분석 결과입니다. 이 자료는 보건사업의 기획 및 수행에 필요한 근거가 됩니다. 이와 같은 용도 때문에 보건 통계자료는 지역사회 진단과 보건사업 계획에 있어서 필수적입니다.


보건 통계 처리 방법

(1) 보건 통계의 자료수집

보건 통계는 자료마다 조사 방법, 주된 수집 목적에 따라 특징을 가지고 있습니다. 국민건강 영양조사는 전 국민을 모집단으로 하므로 유병 실태 파악에는 다른 자료가 포괄하지 못하는 대상까지 정보수집이 가능합니다. 환자조사의 경우는 의료기관의 기록에 의한 조사로 면접조사의 단점을 보완할 수 있는 상병의 정확성, 좀 더 긴 기간의 의료 이용 정보를 수집할 수 있습니다. 건강보험 진료비 청구자료의 경우는 전 국민건강보험제도에 의하여 개념적으로는 전 국민의 의료 이용에 대한 자료가 수집된다고 할 수 있습니다.


(2) 표본조사 정의

모집단이란 연구 대상이 되는 전체 집단을 의미하며 모집단의 크기에 따라 구성하는 단위가 유한할 때의 모집단을 유한 모집단이라고 하고, 모집단의 측정치 숫자가 끝이 없다면 무한 모집단이라 합니다.

모집단의 크기가 큰 경우에는 전수조사가 곤란하고 무한 모집단의 경우는 전체를 조사하기가 실제로 불가능하기 때문에 통계적 처리를 위하여 모집단에서 추출한 측정값의 집합을 활용하는데, 이를 표본이라 합니다.


(3) 표본추출 방법

모집단에서 조사 대상으로 추출한 일부의 자료로서 확률 표본과 비확률 표본이 있습니다. 확률 표본은 표본을 추출할 때 모든 자료가 동일하게 추출될 조건에서 뽑힌 표본이고, 비확률 표본은 조사자의 편견이 개입되거나 선택적으로 뽑힌 표본을 말합니다. 통계에서는 대부분 확률 표본을 사용하며 확률 표본추출의 방법으로는 단순 임의 추출법, 계통추출법, 층화 임의 추출법, 집락 추출법 등이 있습니다.

 

① 단순임의추출법

모집단의 구성요소인 표본추출 단위가 표본으로 선택될 기회가 동등한 가운데 표본을 추출하는 것으로 무작위 추출을 의미합니다. 예를 들면, 통 속의 쪽지 이용법, 난수표 이용법, 원형 회전판 이용법, 주사위 이용법 등이 있습니다.

② 계통추출법

모집단의 구성요소에 일련번호를 부여하여 일차적으로 단순 확률 추출한 다음 정해진 일정한 간격으로 이차로 표본을 추출하는 방법입니다.

③ 층화 임의 추출법

모집단이 가지고 있는 특성을 고려하여 모집단을 성별, 연령별, 지역별, 사회적·경제적 특성에 따라 부분 집단인 계층으로 나누고 각 부분 집단에서 표본을 무작위로 추출하는 방법입니다.

④ 집락 추출법

모집단의 구성단위를 자연적 또는 인위적으로 몇 개의 집락으로 구분하여 무작위로 추출하여 집단을 전수 조사하는 것으로 주로 행정구역 단위를 많이 이용합니다.


(4) 통계자료의 정리

 

ⓐ 율, 비율, 비

① 율(rate)

단위 시간 동안 다른 측정값의 변화량을 말하며 분모에 시간이라는 단위를 가지고 그 값은 0에서 무한대의 범위를 가집니다.

예를 들면, 발생률, 사망률, 유병률 등이 있습니다.

② 비율(proportion)

비율(상대 빈도, 구성비, 분율)은 전체를 1로 보았을 때 한 항목이 차지하는 값으로 분자는 항상 분모에 포함되며 전체를 100으로 보았을 때 한 항목이 차지하는 값을 백분율(%)이라 합니다.

③ 비(ratio)

서로 배타적인 두 항목 간의 비교로, 1보다 큰 값도 가능하며 분자가 분모에 포함되지 않습니다. 예를 들면, 성비, 종족 비, 사망비 등이 있습니다.

 

ⓑ 도수분포

수집된 자료를 일정한 원칙에 의해 배열한 후 알맞은 간격으로 등분하고 각 등분 안에 어떤 정보가 있는지 알기 쉽게 정리한 분포를 도수분포라 하고, 자료의 규칙성을 알기 쉽게 정리한 표를 도수분포표라 합니다.

통계자료를 이해하기 쉽도록 자료 특성에 맞는 도표를 작성하는데, 작성 목적에 따라 각각 다른 도표를 사용하게 됩니다.

① 막대 도표

연속 변수에 사용되는 주상도와 이산 변수에 사용되는 봉 도표가 있습니다.

② 선 도표

주로 시간적 흐름의 변화를 나타내는 데 사용되며, 가로축의 간격이 동일해야 올바른 변화 파악이 가능합니다.

③ 원 도표

원의 중심으로부터 일정 각도 속에 포함되는 면적을 이용하여 변수의 측정값 분포를 표시하며 분할은 3~5개가 적당하고 나머지는 기타로 묶어서 표현하는 것이 바람직합니다.

④ 상관 도표

한 변수가 취할 수 있는 값을 가로축에, 다른 한 변수가 취할 수 있는 값을 세로축에 눈금으로 나타내어 각 변숫값이 교차하는 지점에 해당 측정값을 점으로 표시한 것으로, 산점도라고도 합니다. 예를 들어, 키와 몸무게, 연령과 혈압 등의 관계를 설명하는 데 사용되며 양의 직선 관계, 음의 직선 관계, 곡선 관계, 수평 또는 수직관계 등 두 변수 간의 관계는 다양합니다.

 

ⓒ 대푯값

대푯값은 평균, 중위수, 최빈수 등이 있고, 평균에는 산술평균, 기하평균, 조화 평균이 있습니다.

대푯값은 측정값의 위치를 대표할 수 있는 요약 지표로, 측정값의 분포가 좌우대칭일 때, 가운데 값에 가까워지기 때문에 중심위치의 측도 또는 중심 경향 값이라고도 합니다.

㉠ 산술평균

모든 측정값을 다 더해서 자료의 개수로 나누어 구하는 값으로 대푯값 중에서 가장 많이 사용되는 방법입니다.

㉡ 기하평균

한 변수의 측정값이 n개 있을 때 n개의 측정값을 곱한 후 n 제곱근을 구하여 계산하는 값으로, 일반적으로 분포가 중앙치가 한쪽으로 몰릴 경우 기하평균을 이용하게 됩니다.

㉢ 조화 평균

한 변수의 n개의 측정값이 있을 때 측정 수를 각 측정값의 역수의 합으로 나누어 계산합니다.

㉣ 중위수

측정값을 크기 순서로 나열한 후 가장 중앙에 위치하는 값입니다.

㉤ 최빈수

측정값 중에서 빈도가 가장 많은 측정값으로 질적 자료나 그룹화된 양적 자료에서 주로 사용됩니다.


보건지표

(1) 인구통계

① 출산통계

㉠ 조출생률(crude live - bith rate)

한 국가의 출생 수준을 표시하는 지표로 평균 인구 1인당 몇 명이 출생하였는가를 나타내며, 보통 출생률이라고도 합니다.

이때 출생은 사산을 포함하지 않은 정상 출생을 의미하고 출산은 사산아를 포함 개념입니다.

㉡ 일반 출산율(general fertility rate)

15~49세의 가임여성 1,000명당 출생률을 의미합니다.

㉢ 연령별 출산율(age - specific fertility rate)

어떤 연도의 특정 연령의 여자 인구 1,000명당 출생률을 의미합니다.

 

②인구의 재생산 통계

㉠ 합계 생산율(total fertility rate)

합계출산율이라고도 하며, 한 세대의 여자들이 15~49세 동안에 낳은 정상 출생아의 크기로, 한 여성이 평생 자녀를 평균 몇 명 낳는가를 나타냅니다.

㉡ 총재 생산율(gross reproduction rate)

한 여성이 평생 낳는 여아의 수를 말하며, 한 세대의 여자들이 15~49세 동안에 낳은 여아의 수를 나타냅니다.

㉢ 순재 생산율(net reproduction rate)

총재 생산율은 15~49세 여성 모두가 재생산에 참여한다는 가정하에 계산된 것이고 각 연령에서의 사망률을 고려하여 계산하는 재생산율입니다. 순재 생산율이 1.0이라면 인구의 증감이 없고, 1.0 이하면 축소 재생산이라 하는데, 이는 현재의 재생산력이 다음 세대에 인구를 감소시키는 것을 의미합니다. 순재 생산율은 태어난 여아의 사망을 고려하여 태어난 여자가 모성의 출산 시 연령에 도달할 때까지의 생존율을 의미합니다.

 

③ 사망통계

㉠ 조사망률(crude death rate)

보통 사망률이라고도 하며 인구 1,000명당 1년 동안 발생한 사망자 수로 표시되는 비율입니다.

㉡ 영아사망률(infant mortality rate)

어떤 연도 중 출생한 정상 출생 수 1,000명에 대하여 그 연도의 1세 미만의 사망자 수로, 국가나 지역사회의 보건 수준을 나타내는 지표로써 큰 의미를 가집니다.

㉢ 신생아 사망률(neonatal mortality rate)

어떤 연도에 출생한 정상 출생 수 1,000명에 대하여 그 연도에 발생한 28일 미만인 신생아의 사망자 수로 표시하는 비율입니다. 신생아 사망은 주로 분만 시 사고, 산모 체내에서의 이상, 유전적 이상 등이므로 이 시기의 사망을 어느 정도 이하로 줄이기는 어렵습니다. 영아 사망에서 신생아 사망의 비율은 보건 수준 평가에 도움이 됩니다. 영아기를 생후 28일 미만의 신생아기와 생후 28일에서 1년 미만까지의 영아 후기로 나누어 볼 때, 영아 사망자 중 신생아 사망비를 보는 방법으로 a-index가 있습니다.

㉣ 주산기사망률(perinatal mortality rate)

어떤 연도의 출생 수 1,000명에 대한 그 연도의 사산 수와 생후 7일 이내 사망자 수입니다. 임신 28주 이후의 사산과 생후 7일 이내 사망은 그 원인이 임신중독, 난산, 조산아, 조기 파수 등 공통적인 것으로 인정되기 때문에 이 시기의 사망을 주산기 사망이라 합니다.

㉤ 사산율(fetal death rate)

사산은 일반적으로 임신 28주 이상의 사태아 분만을 의미하며, 사산율은 어떤 연도 중 정상 출생 수와 사산 수를 합한 분만 수 1,000에 대한 그 연도의 사산 수로 표시하는 비율입니다.

㉥ 모성사망률(maternal mortality rate)

모성사망이란 임신, 분만, 산욕과 관계되는 합병증에 의한 사망을 의미하며, 임신 중의 감염병이나 교통사고 등에 의한 사망은 포함되지 않습니다.

㉦ 비례 사망률(proportional mortality rate)

어떤 연도의 사망자 수 중 한 특성에 의한 사망자 수의 구성 비율입니다.


(2) 질병통계

주요 상병에 관한 자료는 지역사회의 건강 상태를 파악하는 데 중요한 역할을 하며, 질병 빈도의 측정지표로 발생률과 유병률이 있습니다.

① 발생률

일정 기간 내에 관찰 인구에서 어떤 질병이 얼마나 발생하는가를 측정하는 비율입니다. 질병 발생의 직접적인 지표로 질병이 발생하는 정도와 질병 발생 위험 확률에 대한 직접적인 측정지표입니다.

② 발병률

급성 감염병의 비교적 짧은 유행 기간 질병 발생 위험에 노출된 인구 중에서 질병이 발생한 비율을 의미합니다.

③ 유병률

일정 시점의 어떤 인구집단에서 질병에 이환된 사람의 분율을 의미합니다.

어느 한 시점의 환자만을 분자에 포함한다면 이것을 시점 유병률이라고 하고, 질병의 발생 시점을 알기 어려운 질병의 경우에는 일정 기간 질병에 이환된 환자를 포함하여 기간 유병률을 구하기도 합니다. 유병률은 발생률과 질병의 이환 기간에 따라 달라지며, 질병이 치명적이면 이환 기간이 짧고 질병의 발생률이 낮으면 유병률이 낮아집니다.

유병률(P)과 발생률(I) : P = I x D(D: 질병 지속 기간)

④ 이환율

일정한 시점에 사는 인구 중에서 특정 질환을 가진 환자의 비율을 이환율이라고 합니다.

댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday