표본 분산과 모집단 분산의 차이

Anonim

에 관한 관련 정보를 얻을 목적으로 통계 자료의 일부를 선택하는 것을 말한다. 설명

전체에 관한 관련 정보를 얻으려는 목적으로 집계 된 통계 데이터의 일부를 선택하는 것을 말한다. 조사에서 다루는 모든 구성원의 특정 성격에 대한 통계 정보의 전체 또는 전체를 '인구'또는 '우주'라고합니다. (Das, N. G., 2010). 집단 또는 우주의 특성을 얻는 데 사용되는 선택된 집단의 부분을 '표본'이라고합니다. 모집단은 개별 단위 또는 구성원으로 구성되며 일부는 단위로 포함됩니다. 모집단의 총 수를 모집단 크기라고하며, 표본의 수를 표본 크기라고합니다. 모집단과 표본은 유한하거나 무한대 일 수 있으며 유사하게 존재하거나 가설적 일 수 있습니다.

분산: 분산은 한 세트의 데이터에서 개별 수치가 평균에 대해 얼마나 널리 분포되어 있는지를 나타내는 수치입니다. 그것은 각 숫자가 평균과 얼마나 멀리 떨어져 있는지, 그리고 서로가 얼마나 멀어져 있는지를 나타냅니다. 분산 값이 0이면 모든 데이터가 동일 함을 의미합니다. 분산이 많을수록 평균에 대한 값이 더 많아지고, 따라서 서로에 대한 값이 더 많아집니다. 분산이 작을수록 평균에 대한 값이 줄어들고, 따라서 서로에 대한 값이 줄어들며 분산은 음수가 될 수 없습니다.

인구 분산과 표본 분산의 차이

인구 분산과 표본 분산의 주요 차이점은 분산 계산과 관련됩니다. 차이는 5 단계로 계산됩니다. 첫 번째 평균을 계산 한 다음 평균에서 편차를 계산하고 세 번째 편차를 제곱하고 네 번째 편차를 합산 한 다음이 합계를 분산을 계산할 항목 수로 나눕니다. 따라서 variance = Σ (xi-x -) / n. 여기서 xi = iith. 번호, x- = 평균 및 n = 품목 수 …

이제 모집단 데이터에서 분산을 계산할 때 n은 항목 수와 같습니다. 따라서 모든 1000 명의 사람들의 혈압에 대한 데이터로부터 1000 명의 모든 사람들의 혈압 변동을 계산한다면 n = 1000이됩니다. 그러나 표본 데이터 1에서 분산을 계산할 때는 n에서 1을 뺀 다음 제곱 된 편차의 합. 따라서 위 예제에서 샘플 데이터가 100 개 항목 인 경우 분모는 100-1 = 99가됩니다.

이로 인해 샘플 데이터에서 계산 된 분산 값은 채우기 데이터를 사용하여 발견 된 값보다 높습니다. 이를 수행하는 논리는 인구 데이터에 대한 정보 부족을 보완하는 것입니다. 미래의 이야기가 아니라 모든 살아있는 인간의 높이에 대한 정보가 절대적으로 부족하기 때문에 인간의 고소득을 발견하는 것은 불가능합니다.비록 우리가 미국의 모든 살아있는 남성의 신장에 대한 인구 데이터와 같은 적절한 예를 취하더라도 그것은 물리적으로 가능하다. 그러나 이것과 관련된 비용과 시간이 계산 목적을 무너 뜨릴 것이다. 이것이 대부분의 통계 목적을 위해 샘플 데이터가 취해지는 이유이며 이는 대다수의 데이터에 대한 정보가 부족한 결과입니다. 이것을 보상하기 위해 분산의 제곱 인 분산 및 표준 편차의 값은 모집단 데이터의 분산보다 표본 데이터의 경우 높습니다.

이는 분석가와 의사 결정자를위한 자동 방패 역할을합니다. 이 논리는 자본 예산, 개인 및 비즈니스 재무, 건설, 교통 관리 및 많은 적용 가능한 분야에 대한 결정에 적용됩니다. 이것은 스테이크 홀더가 결정을 내리는 동안 또는 다른 추론을 위해 안전한면에있는 데 도움이됩니다.

요약:

모집단 분산은 모집단 데이터로부터 계산 된 분산의 값을 말하며, 표본 분산은 표본 데이터로부터 계산 된 분산이다. 표본 데이터의 경우 분산의 공식에서이 분모의 값으로 인해 'n-1'이고 모집단 데이터의 경우 'n'입니다. 결과적으로 표본 데이터에서 파생 된 분산과 표준 편차가 모두 모집단 데이터에서 발견 된 것보다 많습니다.