공분산과 상관 관계의 차이

Anonim

공분산 대 상관 관계

공분산 및 상관 관계는 확률 및 통계 분야에서 두 가지 개념입니다. 두 개념 모두 두 변수 사이의 관계를 설명합니다. 또한 둘은 변수 간의 특정 종류의 종속성을 측정하는 도구입니다.

"공분산"은 "예상 값에서 두 무작위 변이의 변이의 기대 값"으로 정의되고 "상관 관계"는 "두 변이 변이의 예상 값"으로 정의됩니다. "

단순화하기 위해 공분산은 얼마나 많은 변수가 함께 변하는 지 조사하고 측정하려고 시도합니다. 이 개념에서 두 변수는 어떤 관계도 나타내지 않고 동일한 방식으로 변경 될 수 있습니다. 공분산은 두 개 이상의 확률 변수 집합 간의 상관 관계의 강도 또는 약함을 나타내는 척도이며 상관은 공분산의 크기가 조정 된 버전으로 사용됩니다.

공분산과 상관 관계에는 두 가지 유형이 있습니다. 공분산은 양의 공분산 (두 변수가 함께 변하는 경향이 있음)과 음의 공분산 (한 변수가 다른 변수와 비교하여 기대 값보다 높거나 낮음)으로 분류 할 수 있습니다. 반면, 상관 관계에는 양수, 음수 또는 0의 세 가지 범주가 있습니다. 양의 상관 관계는 양수 부호, 음의 상관 관계는 음수 부호 및 상관되지 않은 변수로 표시됩니다. "

공분산과 상관 관계에는 범위가 있습니다. 상관 값은 -1에서 +1의 눈금입니다. 공분산의 관점에서, 값은 상관 범위를 초과하거나 초과 할 수 있습니다. 또한 상관 값은 "X"및 "Y"측정 단위에 따라 다릅니다. "

또 다른 주목할만한 차이점은 상관 관계가 무 차원이라는 것입니다. 대조적으로, 공분산은 한 변수의 단위에 다른 변수의 다른 단위를 곱하여 형성된 단위로 설명됩니다. 공분산은 변수 또는 데이터 세트와 같은 두 엔티티 간의 관계에 중점을 둡니다. 대조적으로 상관 관계에는 두 개 이상의 변수 또는 데이터 세트와 이들 사이의 관계가 포함될 수 있습니다. 둘 사이의 또 다른 주목할만한 차이점은 공분산이 종종 분산 (그 속성 중 하나이지만 산란 또는 분산의 일반적인 척도)과 함께있는 반면, 상관은 의존성 및 회귀 분석과 함께 진행된다는 것입니다. "의존성"은 "두 데이터 집합 또는 임의 변수 간의 모든 관계"로 정의되며 회귀 분석은 독립 변수와 종속 변수 간의 관계를 조사하는 데 사용되는 방법입니다. 상관 관계의 다른 분류는 부분 및 다중 상관입니다.

요약:

1. 공분산과 상관 관계는 통계와 확률에 대한 연구에서 두 가지 개념입니다.그것들은 정의가 다르지만 밀접하게 관련되어 있습니다. 두 개념 모두 관계를 설명하고 둘 이상의 변수 간의 종속성의 종류를 측정합니다. 2. 공분산은 예상 값과 두 무작위 변이 사이의 변이의 기대 값이며 상관은 거의 같은 정의이지만 변이는 포함하지 않습니다. 3. 공분산은 함께 변하는 두 개의 무작위 변수의 척도이기도합니다. 한편 상호 관계는 상호 의존성 또는 연관성과 관련됩니다. 간단히 말해서, 상관 관계 란 두 변수가 서로 얼마나 독립적인지 또는 얼마나 멀리 떨어져 있는지입니다. 4. 공분산은 상관 관계의 척도이며 상관은 공분산의 확장 된 버전입니다. 5. 공분산은 두 변수 또는 데이터 세트 간의 관계를 포함 할 수 있지만 상관 관계는 여러 변수 간의 관계를 포함 할 수 있습니다. 6. 상관 값의 범위는 양수 1에서 음수 1까지입니다. 반면에, 공분산 값은이 스케일을 초과 할 수 있습니다.

7. 상관 관계와 공분산은 그 유형에 대해 긍정적이거나 부정적인 설명을 사용합니다. 공분산에는 양의 공분산 (두 변수가 함께 변하는 경우)과 음의 공분산 (한 변수가 다른 변수보다 높거나 낮은 경우)의 두 가지 유형이 있습니다. 상관 관계 측면에서 긍정적 인 상관 관계와 부정적 상관 관계는 추가 범주 인 "0"과 관련이 있습니다.