제 07강. 여러가지 이산확률분포
Chevyshev Inequality
𝐸[(𝑋−𝑋̂)2]를 minimize하기 위해 𝑋̂를 평균으로 고른다
여기서 𝑋̂로 고른 평균에서부터 얼마나 멀리 떨어져있는지 확률을 말한다.
𝑃[|𝑋−𝐸[𝑋]|≥𝑎]≤𝜎2𝑋𝑎2,𝑎>0
Special Prob Distributions
Bernoulli Distribution ( 베르누이 분포 )
Random Value X가 Binary하다.
예를 들어,
𝑃[𝑠𝑢𝑐𝑐𝑒𝑠𝑠]=𝑃
𝑃[𝑓𝑎𝑖𝑙𝑢𝑟𝑒]=1−𝑃처럼 두 가지 경우로만 나뉘는 것을 말한다.
이 때, 𝐸[𝑋]=𝑃,𝜎2𝑋=𝑃(1−𝑃)이다.
Binomial Distribution
베르누이 분포내에서 n번의 시도를 하는데, 성공할 확률이다.
𝐵(𝑛,𝑝)라고 쓰는데 이는 다음과 같이 풀어쓴다.
𝑃𝑋(𝑥)=(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥
𝑥=0,1,2,⋯,𝑛
∑𝑛𝑥=0(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥={𝑃+(1−𝑃)}𝑛=1
평균을 구해보자.
𝐸[𝑋]=∑𝑛𝑥=0(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥
=∑𝑛𝑥=0𝑥𝑛!(𝑛−𝑥)!𝑥!𝑃𝑥(1−𝑃)𝑛−𝑥
=∑𝑛𝑥=1𝑛!(𝑛−𝑥)!(𝑥−1)!𝑃𝑥(1−𝑃)𝑛−𝑥
=∑𝑛𝑥=1𝑛𝑝(𝑛−1)!(𝑛−1−(𝑥−1))!(𝑥−1)!𝑃𝑥−1(1−𝑃)𝑛−1−(𝑥−1)
∑𝑛−1𝑥=0(𝑛−1)!(𝑛−1−𝑥′))!(𝑥′)!𝑃𝑥′(1−𝑃)𝑛−1−𝑥′
위의 과정에서 𝑥−1=𝑥′로 치환했다.
여기서 (𝑎+𝑏)𝑛−1의 이항분포를 참고해보자.
=∑𝑛−1𝑥=0(𝑛𝑥)𝑎𝑥𝑏𝑛−1−𝑥
=∑𝑛−1𝑥=0(𝑛−1)!(𝑛−1−𝑥))!(𝑥)!𝑎𝑥𝑏𝑛−1−𝑥
위의 바로 치환한 결과와 동일하다.
따라서
𝑛𝑝{𝑃+(1−𝑃)}𝑛−1=𝑛𝑝로 정리가 된다.
분산을 구하기 위해 𝐸[𝑋2]을 구해보자
=∑𝑛𝑥=0𝑥2(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥
=∑𝑛𝑥=0𝑥2𝑛!(𝑛−𝑥)!𝑥!𝑃𝑥(1−𝑃)𝑛−𝑥
=∑𝑛𝑥=0𝑥𝑛!(𝑛−𝑥)!(𝑥−1)!𝑃𝑥(1−𝑃)𝑛−𝑥
=∑𝑛𝑥=1(𝑥−1+1)𝑛!(𝑛−𝑥)!(𝑥−1)!𝑃𝑥(1−𝑃)𝑛−𝑥
여기서 두 가지 식으로 나뉘게 된다.
=∑𝑛𝑥=1(𝑥−1)𝑛!(𝑛−𝑥)!(𝑥−1)!𝑃𝑥(1−𝑃)𝑛−𝑥+∑𝑛𝑥=1𝑛!(𝑛−𝑥)!(𝑥−1)!𝑃𝑥(1−𝑃)𝑛−𝑥
+ 이후의 항은 위의 식을 참고하여 𝑛𝑝{𝑃+(1−𝑃)}𝑛−1로 볼 수 있다.
=∑𝑛−2𝑥=0𝑛(𝑛−1)(𝑛−2)!(𝑛−𝑥)!(𝑥−2)!𝑃2(1−𝑃)𝑥−2(1−𝑃)𝑛−𝑥+𝑛𝑝{𝑃+(1−𝑃)}𝑛−1
=∑𝑛−2𝑥=0𝑛(𝑛−1)𝑃2(𝑛−2)!(𝑛−2−𝑥)!𝑥!𝑃𝑥(1−𝑃)𝑛−𝑥−2+𝑛𝑝{𝑃+(1−𝑃)}𝑛−1
=𝑛(𝑛−1)𝑃2{𝑃+(1−𝑃)}𝑛−2+𝑛𝑝{𝑃+(1−𝑃)}𝑛−1
=𝑛2𝑃2−𝑛𝑃2+𝑛𝑝
𝜎2𝑋=𝐸[𝑋2]−𝐸[𝑋]2
=𝑛2𝑃2−𝑛𝑃2+𝑛𝑝−𝑛2𝑃2
=𝑛𝑃(1−𝑃)
힘겹게 평균과 분산을 구하는 공식을 증명하였다..
Binomial Theorem
{𝑃𝑡+(1−𝑃)}𝑛=∑𝑛𝑥=0(𝑛𝑥)𝑃𝑥𝑡𝑥(1−𝑃)𝑛−𝑥
위 식을 미분하면 다음과 같다.
𝑛𝑝{𝑃𝑡+(1−𝑃)}𝑛−1=∑𝑛𝑥=0(𝑛𝑥)𝑥𝑃𝑥𝑡𝑥−1(1−𝑃)𝑛−𝑥
𝑡=1을 대입하면
𝑛𝑝=∑𝑛𝑥=0𝑥(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥=𝐸[𝑋]
미분한 식을 한 번 더 미분해보자
𝑛(𝑛−1)𝑝2{𝑃𝑡+(1−𝑃)}𝑛−2=∑𝑛𝑥=0(𝑛𝑥)𝑥(𝑥−1)𝑃𝑥(1−𝑃)𝑛−𝑥𝑡𝑥−2
𝑡=1을 대입하면
𝑛2𝑃2−𝑛𝑃2=∑𝑛𝑥=0𝑥2(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥−∑𝑛𝑥=0𝑥(𝑛𝑥)𝑃𝑥(1−𝑃)𝑛−𝑥=𝐸[𝑋2]−𝐸[𝑋]
𝐸[𝑋2]=𝑛2𝑃2−𝑛𝑃2+𝑛𝑝
𝜎2𝑋=𝐸[𝑋2]−𝐸[𝑋]2
=𝑛2𝑃2−𝑛𝑃2+𝑛𝑝−𝑛2𝑃2
=𝑛𝑃(1−𝑃)
이번에도 힘들게 평균과 분산을 구했다... 수학적인 머리가 굳어가는데 더 말랑말랑하게 만들어야겠다..
Geometric Distribution
Random Value X는 첫 번째 성공 까지의 베르누이 분포내에서 시도한 횟수이다.
𝑃𝑋(𝑥)=𝑃(1−𝑃)𝑥−1
𝐸[𝑋]=1𝑃,𝜎2𝑋=(1−𝑃)𝑃2
Geometric Distribution은 Forgetfulness Property를 따른다.
Forgetfulness (Memoryless) Property
주사위 던지기 사례로 이해해보자.
주사위 눈이 6이 나오도록 하는 것이 목표이다.
하지만 10번을 던졌는데 6이 나오지 않았다. 그렇다면 앞으로 5번 더 던져서 6이 나올 확률은 얼마인가?
또, 5번을 던졌는데 6이 나오지 않았다. 그렇다면 앞으로 5번 더 던져서 6이 나올 확률은 얼마인가?
확률은 매 시도마다 계속 16이다.
즉, 이전의 실패횟수는 중요하지 않고, 이후의 시도에 영향을 미치지 않는다는 것이다. 이것이 Geometric distribution의 특징인 Forgetfulness Property이다.
𝑃(𝑋=𝐾+𝑛|𝑋>𝑛)=𝑃(𝑋=𝑛+𝐾∩𝑋>𝑛)𝑃(𝑋>𝑛)
지금까지 n번 던졌고, 앞으로 K번 더 던지겠다는 것이다.
=𝑃(𝑋=𝑛+𝐾)(1−𝑃(𝑋≤𝑛)
여기서 분모는 다음과 같다.
∑∞𝑥=𝑛+1(1−𝑃)𝑥−1𝑃
무한등비급수의 공식을 이용하면 (1−𝑃)𝑛𝑃1−(1−𝑃)=(1−𝑃)𝑛으로 나온다.
마저 정리해보면
=𝑃(1−𝑃)𝑛+𝐾−1(1−𝑃)𝑛=𝑃(1−𝑃)𝐾−1
=𝑃𝑋(𝑋=𝐾)가 된다.
결국에 자체가 X=K일 확률을 구하는 꼴이 된다.