본문 바로가기
수학/확률

Covariance & Correlation

by Jason J 2019. 11. 17.

공분산은 두 확률변수의 joint distribution을 한 숫자로 요약한 것이라고 볼 수 있다. 간단하게 요약하면, 공분산은 두 확률변수가 같이 증가하고 감소하는 경향을 측정한 것이다. 확률변수 X와 Y의 공분산이 양수라면 X가 증가할 때, Y 역시 증가하는 경향을 보인다는 것이고, 반대로 음수인 경우는 X가 증가할 때, Y는 감소하는 경향을 보인다는 것.

공분산의 정의는 다음과 같다.

 

 

직관적으로 생각해보자면, X와 Y가 같은 방향으로 움직이는 경향을 보일 때, X-EX와 Y-EY 역시 둘 다 양수이거나 음수일 것이다. 따라서 둘의 곱은 양수일 것이며 양수의 공분산을 도출할 것이다.

만약 X와 Y가 독립이라면, 공분산은 0이고 공분산을 0으로 가지는 확률변수를 uncorrelate하다고 한다.

연속확률변수 X,Y가 독립이라면 joint PDF는 각 marginal PDF의 곱으로 나타낼 수 있다. 2D LOTUS를 사용해보자. (이산확률인 경우도 마찬가지)

 

 

 

 

하지만 X,Y가 uncorrelate하다고해서 독립은 아니다. 공분산은 linear한 상관관계를 측정하므로 non-linear한 방식으로 독립이 아닌 경우가 충분히 있을 수 있다. 예를 들어 X ~ N(0,1)이고 Y=X^2 인 경우에, 공분산은 0으로 uncorrelate 하지만 확실히 X와 Y는 독립이 아니다. 

 

 

 

 

 

 

 

 

 

 

 

 

또한 공분산은 다음과 같은 특성을 갖는다.

'수학 > 확률' 카테고리의 다른 글

Multivariate Normal  (0) 2019.11.17
Exponential distribution(망각성질 / 기하분포와의 관계)  (0) 2019.11.13
Moments & MGF  (0) 2019.11.10
Normal Distribution  (0) 2019.11.10
Uniform Distribution  (0) 2019.11.09

댓글