카테고리 없음

공분산(Covariance)과 상관계수(correlation coefficient)

호Tuck 2023. 2. 6. 09:04

- 공분산(Covariance)이란?

 공분산은 2개의 확률변수의 상관정도를 나타내는 값이다. 확률 변수 X, Y가 있다고 가정할 때, 확률변수의 값에 따른 상관정도의 그래프를 아래와 같이 그릴 수 있다. 

 제일 왼쪽에 있는 그래프는 X값이 증가할 수 록 Y의 값도 증가하는 Positive(+) Relationship, 가운데에 있는 그래프는 X값이 증가할 수록 Y값은 감소하는 Negative(-) Relationship이라고 할 수 있다. 맨 오른쪽의 그래프는 X와 Y는 관계가 없는, No Relationship을 나타내는 그래프라고 할 수 있다(비상관 확률변수). 

 

공분산의 수식은 아래와 같다. 

 

 

- 상관계수(correlation coefficient)란?

하지만 공분산은 상관관계의 방향만을 알려주며, 정도를 알 수 없다. 이를 해결하기 위해 상관계수를 사용할 수 있다. 

공분산에 확률변수 X, Y의 분산을 나누어 준 것과 같다. 

수식은 아래와 같다.