T-TEST와 ANOVA의 차이점

Anonim

T-TEST vs. ANOVA

평균을 얻기 위해 통계 데이터를 수집하고 계산하는 것은 종종 길고 지루한 과정. t- 검정과 편도 분산 분석 (ANOVA)은이 목적을 위해 사용 된 가장 일반적인 두 가지 검사입니다.

t- 검정은 귀무 가설이 뒷받침되면 시험 통계가 스튜 디어의 t 분포를 따르는 통계 가설 검정이다. 이 테스트는 테스트 통계가 정규 분포를 따르고 테스트 통계에서 스케일링 용어의 값을 알고있을 때 적용됩니다. 스케일링 용어가 알려지지 않은 경우 사용 가능한 데이터를 기반으로 한 추정치로 대체됩니다. 테스트 통계는 학생의 t- 분포를 따릅니다.

윌리엄 실리 고셋 (William Sealy Gosset)은 1908 년에 t- 통계치를 도입했습니다. 고셋 (Gosset)은 아일랜드 더블린에있는 기네스 양조장의 화학자였습니다. 기네스 양조장은 생화학 및 통계 응용 프로그램을 회사의 기존 산업 공정에 제공 할 수있는 사람들 중에서 옥스포드와 캠브리지에서 최고의 졸업생을 모집하는 방침을 가지고있었습니다. William Sealy Gosset은 그러한 졸업생 중 한 명입니다. 이 과정에서 William Sealy Gosset은 원래 비용 대비 효과적인 방식으로 튼튼한 맥주 (양조장에서 생산되는 맥주)의 품질을 모니터링하는 방법으로 원래 계획되었던 t-test를 고안했습니다. Gosset은 1908 년경 Biometrika에서 펜 ​​이름 'Student'로 테스트를 발표했습니다. 회사 이름이 기네스의 주장이었습니다. 회사가 '영업 비밀'의 일부로 통계를 활용하려는 정책을 유지하기를 원했기 때문입니다.

T- 테스트 통계는 일반적으로 T = Z / s 형식을 따릅니다. 여기서 Z와 s는 데이터의 함수입니다. Z 변수는 대립 가설에 민감하게 설계되었습니다. 사실상, 대체 가설이 참일 때 Z 변수의 크기는 더 크다. 한편, 's'는 T의 분포를 결정할 수있는 스케일링 매개 변수입니다. t- 테스트의 가정은 a) Z는 귀무 가설 하에서 표준 정규 분포를 따른다. b) ps2는 귀무 가설 하에서 p 자유도를 갖는 Ï ‡ 2 분포 (p는 양의 상수)를 따른다. c) Z 값과 s 값은 독립적이다. 특정 유형의 t- 테스트에서 이러한 조건은 데이터를 샘플링하는 방법뿐만 아니라 연구 대상 집단의 결과입니다.

반면에 분산 분석 (ANOVA)은 통계 모델 모음입니다. ANOVA의 원칙은 연구원들과 통계 학자들에 의해 오랫동안 이용되어 왔지만, 1918 년이 되어서야 Ronald Fisher 경이 '멘델 상속의 가정에 대한 친척 간의 상관 관계'라는 기사에서 분산 분석을 공식화하겠다는 제안을했다..그 이후 ANOVA는 그 적용 범위와 적용 범위가 확장되었습니다. ANOVA는 실제로 차이점이 있습니다. 분산의 차이가 아니라 그룹의 평균 차이 때문입니다. 여기에는 특정 변수의 관찰 된 분산이 다른 변동 요인에 기인 한 구성 요소로 분할되는 관련 절차가 포함됩니다. 본질적으로, ANOVA는 여러 그룹의 평균이 모두 동등한지를 결정하기위한 통계적 테스트를 제공하고 결과적으로 두 그룹 이상으로 t- 테스트를 일반화합니다. ANOVA는 유형 I 오류 확약 가능성이 적으므로 2- 표본 t- 검정보다 유용 할 수 있습니다. 예를 들어, 여러 개의 두 표본 t- 검정을하는 것은 평균을 구하는 데 관련된 동일한 변수의 ANOVA보다 오류를 범할 가능성이 더 큽니다. 모델은 동일하며 테스트 통계는 F 비율입니다. 간단히 말해서 t- 검정은 ANOVA의 특별한 경우에 불과합니다. ANOVA를 수행하면 여러 번의 t- 검정과 동일한 결과가 나타납니다. ANOVA 모델에는 다음 세 가지 클래스가 있습니다. a) 데이터가 정상 집단에서 온 것으로 추정되는 고정 효과 모델. b) 데이터가 계층 구조에 의해 제약을받는 다양한 집단의 계층 구조를 기술한다고 가정하는 임의 효과 모델. c) 고정 효과와 무작위 효과가 모두 나타나는 상황 인 혼합 효과 모델. 요약:

두 개의 평균값 또는 평균값이 같은지 또는 다른지를 결정할 때 t- 검정을 사용한다. ANOVA는 세 개 이상의 평균 또는 평균을 비교할 때 선호됩니다.

t- 테스트는 더 많은 수단이 사용되면 오류를 범할 확률이 더 높기 때문에 둘 이상의 수단을 비교할 때 ANOVA가 사용되는 이유입니다.