본문 바로가기

전체보기47

Covariance & Correlation 공분산은 두 확률변수의 joint distribution을 한 숫자로 요약한 것이라고 볼 수 있다. 간단하게 요약하면, 공분산은 두 확률변수가 같이 증가하고 감소하는 경향을 측정한 것이다. 확률변수 X와 Y의 공분산이 양수라면 X가 증가할 때, Y 역시 증가하는 경향을 보인다는 것이고, 반대로 음수인 경우는 X가 증가할 때, Y는 감소하는 경향을 보인다는 것. 공분산의 정의는 다음과 같다. 직관적으로 생각해보자면, X와 Y가 같은 방향으로 움직이는 경향을 보일 때, X-EX와 Y-EY 역시 둘 다 양수이거나 음수일 것이다. 따라서 둘의 곱은 양수일 것이며 양수의 공분산을 도출할 것이다. 만약 X와 Y가 독립이라면, 공분산은 0이고 공분산을 0으로 가지는 확률변수를 uncorrelate하다고 한다. 연속확.. 2019. 11. 17.
Exponential distribution(망각성질 / 기하분포와의 관계) 지수분포는 이산분포인 기하함수와 비슷한 연속분포이다. 사건이 서로 독립적일 때, 일정 시간동안 발생하는 사건의 횟수가 푸아송 분포를 따른다면, 다음 사건이 일어날 때까지 대기 시간은 지수분포를 따른다 interval time t 에서의 평균 성공확률은 tλ이다. 연속확률변수 X가 지수분포를 가진다면 (λ>0), PDF는 다음과 같다. 이때 X ~ Expo(λ)라고 표기하며 상응하는 CDF는 위 그림은 X~Expo(1)의 PDF와 CDF를 그린 것이다. 여기서 우리는 X를 가지고 scale을 조정하여 일반적인 Expo(λ)를 유도할 수 있는데, 위와 같이 X를 원하는 λ값으로 나누면 그 확률변수는 Expo(λ)를 따르게 된다. 간단한 부분적분을 실행하면 위와 같이 지수분포의 기댓값과 분산을 구할 수 있다... 2019. 11. 13.
Moments & MGF 확률변수 X가 평균 μ와 분산 σ^2를 가질 때, 양수인 n에 대해서 X의 n번째 모멘트는 n번째 central moment는 n번째 standardized moment는 각 모멘트는 존재하지 않을 수도 있다. 이미 익숙한 평균과 분산은 각각 first moment, second cetral moment이다. 이 moment라는 말은 물리에서 가져왔다는데 생략한다. Moment generating functions Generating function은 조합론, 확률 분야에서 아주 강력한 도구인데, 확률에서 이산분포와 연속분포에 모두 쓸모가 있다. 수열에서 연속함수를 만들어냄으로써 미분을 활용하여 수열을 해석할 수 있도록 해주는 것. 이름처럼 어떤 분포의 moment들로 바꾸어준다. 한 확률변수 X의 MG.. 2019. 11. 10.
Normal Distribution 정규분포는 bell-shape의 PDF를 가진 유명한 연속 분포이다. 많은 숫자의 i.i.d. 확률변수를 합하면 그 개별 확률변수의 분포가 무엇인지에 상관없이 정규분포로 근사한다는 특성(central limit theorem) 때문에 통계에서 광범위하게 사용되는 분포이다. Standard Normal Distribution 일단 가장 간단한 정규분포인 표준정규분포에서 locatoin-scale transformation을 사용하면 어떤 정규분포도 만들어낼 수 있다. 표준정규분포를 가지는 확률변수 Z의 PDF는 다음과 같다. (왜인지 f가 아닌 phi를 사용한다.) 이때, Z~N(0,1)이라 표기하고 Z는 평균 0, 분산 1을 갖는다. 앞에 상수 (1/루트2파이)는 PDF의 특성인 '전부 합치면 1이 된다.. 2019. 11. 10.