본문 바로가기

수학/확률6

Multivariate Normal Multivariate Normal (다변량 정규분포)는 정규분포를 고차원으로 일반화한 연속분포이다. k 차원의 벡터 X = (X1,X2,...,Xk)가 있을 때, Xj의 모든 선형조합이 정규분포를 갖는다면 벡터 X는 다변량 정규분포를 갖는다고 말한다. 다시 말해, 에서 상수 t1, ... , tk를 어떻게 설정하든 간에 정규 분포를 가져야 한다는 말이다. 여기서 k=2인 경우는 Bivariate Normal이라고 하기도 한다. X = (X1,X2,...,Xk)가 MVN이면 각 marginal distribution Xj는 정규 분포이지만 반대의 경우는 성립하지 않는다. 예를 들어보자. X가 표준정규분포로 놓고 S가 위와 같은 random sign이라 하자. 그러면 Y = SX 또한 표준정규분포를 따른다.. 2019. 11. 17.
Covariance & Correlation 공분산은 두 확률변수의 joint distribution을 한 숫자로 요약한 것이라고 볼 수 있다. 간단하게 요약하면, 공분산은 두 확률변수가 같이 증가하고 감소하는 경향을 측정한 것이다. 확률변수 X와 Y의 공분산이 양수라면 X가 증가할 때, Y 역시 증가하는 경향을 보인다는 것이고, 반대로 음수인 경우는 X가 증가할 때, Y는 감소하는 경향을 보인다는 것. 공분산의 정의는 다음과 같다. 직관적으로 생각해보자면, X와 Y가 같은 방향으로 움직이는 경향을 보일 때, X-EX와 Y-EY 역시 둘 다 양수이거나 음수일 것이다. 따라서 둘의 곱은 양수일 것이며 양수의 공분산을 도출할 것이다. 만약 X와 Y가 독립이라면, 공분산은 0이고 공분산을 0으로 가지는 확률변수를 uncorrelate하다고 한다. 연속확.. 2019. 11. 17.
Exponential distribution(망각성질 / 기하분포와의 관계) 지수분포는 이산분포인 기하함수와 비슷한 연속분포이다. 사건이 서로 독립적일 때, 일정 시간동안 발생하는 사건의 횟수가 푸아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다 interval time t 에서의 평균 성공확률은 tλ이다. 연속확률변수 X가 지수분포를 가진다면 (λ>0), PDF는 다음과 같다. 이때 X ~ Expo(λ)라고 표기하며 상응하는 CDF는 위 그림은 X~Expo(1)의 PDF와 CDF를 그린 것이다. 여기서 우리는 X를 가지고 scale을 조정하여 일반적인 Expo(λ)를 유도할 수 있는데, 위와 같이 X를 원하는 λ값으로 나누면 그 확률변수는 Expo(λ)를 따르게 된다. 간단한 부분적분을 실행하면 위와 같이 지수분포의 기댓값과 분산을 구할 수 있다... 2019. 11. 13.
Moments & MGF 확률변수 X가 평균 μ와 분산 σ^2를 가질 때, 양수인 n에 대해서 X의 n번째 모멘트는 n번째 central moment는 n번째 standardized moment는 각 모멘트는 존재하지 않을 수도 있다. 이미 익숙한 평균과 분산은 각각 first moment, second cetral moment이다. 이 moment라는 말은 물리에서 가져왔다는데 생략한다. Moment generating functions Generating function은 조합론, 확률 분야에서 아주 강력한 도구인데, 확률에서 이산분포와 연속분포에 모두 쓸모가 있다. 수열에서 연속함수를 만들어냄으로써 미분을 활용하여 수열을 해석할 수 있도록 해주는 것. 이름처럼 어떤 분포의 moment들로 바꾸어준다. 한 확률변수 X의 MG.. 2019. 11. 10.