제 06강. 조건부 평균
Geometric distribution
Random Value K : 1번 성공할때까지의 시행횟수.
(𝐾=1):𝑃 = 한 번만에 성공
(𝐾=2):(1−𝑃)𝑃 = 두 번만에 성공
(𝐾=3):(1−𝑃)2𝑃 = 세 번만에 성공
이를 일반화 해보면 다음과 같다.
𝑃𝐾(𝑘)=(1−𝑃)𝑘−1𝑃
∑∞𝑘=1𝑃𝐾(𝑘)=1이고
∑∞𝑘=1(1−𝑃)𝑘−1𝑃는 무한등비급수 공식을 사용하여
𝑃1−(1−𝑃)=1이 된다.
위의 평균을 구하면 다음과 같다.
𝐸[𝑋]=∑∞𝐾=1𝐾(1−𝑃)𝐾−1𝑃
∑∞𝐾=1(1−𝑃)𝐾=1−𝑃𝑃 ( 무한등비급수 합 )
𝑑𝑑𝑝∑∞𝐾=1(1−𝑃)𝐾=−∑∞𝐾=1𝐾(1−𝑃)𝐾−1
이는 1−𝑃𝑃를 미분해보면 −1𝑃2이 나오는 것을 알 수 있다.
따라서 𝐸[𝑋]=∑∞𝐾=1𝐾(1−𝑃)𝐾−1𝑃=𝑃×1𝑃2=1𝑃
그리고 이를 한 번 더 미분해준다.
𝑑𝑑𝑝∑∞𝐾=1𝐾(1−𝑃)𝐾−1=−∑∞𝐾=1𝐾(𝐾−1)(1−𝑃)𝐾−2=−2𝑃3
−1𝑃2를 미분해보면 알 수 있다.
참고로 분수미분은 다음과 같이 진행된다.
(𝑓(𝑥)𝑔(𝑥))′=𝑓′(𝑥)𝑔(𝑥)−𝑓(𝑥)𝑔′(𝑥)(𝑔(𝑥))2
그래서 위의 식을 정리해서 오른편으로 넘기면 다음과 같다.
∑∞𝐾=1𝐾2(1−𝑃)𝐾−1=∑∞𝐾=1𝐾(1−𝑃)𝐾−1+2𝑃3(1−𝑃)
이를 풀어보면
1𝑃2+2𝑃3−2𝑃2=2𝑃3−1𝑃2
𝐸[𝑋2]=∑∞𝐾=1𝐾2𝑃(1−𝑃)𝐾−1=2𝑃2−1𝑃1
P가 곱해져서, P의 차수가 하나씩 줄었다.
𝜎2𝑋=𝐸[𝑋2]−𝐸[𝑋]2=2𝑃2−1𝑃−1𝑃2
=1𝑃2−1𝑃=1−𝑃𝑃2
추가적으로 평균과 분산은 오차를 구하는데 있어서 매우 중요하다.
만약에 𝑓(𝑥)=(𝑥−𝑎1)2라는 식이 있다고 봐보자.
이 식을 최소화하기 위한 x는 𝑎1이라는 것을 알 수 있다.
식이 하나 더 늘어난 𝑓(𝑥)=(𝑥−𝑎1)2+(𝑥−𝑎2)2의 경우에는
이 식을 최소화하기 위한 x는 𝑎1+𝑎22이다.
감이 오는가?
바로 변수들의 평균값이 결과를 최소화하게 만들어준다.
결국에는 식이 늘어남에따라 식을 최소화하기 위한 x는 𝑎1+𝑎2+⋯+𝑎𝑛𝑛ㄱ 가 될 것이다.
이렇게 랜덤할 때는 평균값을 넣는 것이 분산을 줄여서 안전하게 만들어주는 것이다.
반면에 Median( 중간값 ) 을 이용해야하는 경우도 존재한다.
𝑔(𝑥)=|𝑥−𝑎1|이라는 식을 보자.
처음에는 이 식을 최소화하기 위한 x는 𝑎1이라는 것을 알 수 있다.
식이 늘어난 𝑔(𝑥)=|𝑥−𝑎1|+|𝑥−𝑎2|의 경우에는 그래프가 평평하게 그려지는 부분이 생김을 알 수 있다.
아직까지는 평균값을 고르는 것이 괜찮다.
하지만 𝑔(𝑥)=|𝑥−𝑎1|+|𝑥−𝑎2|+|𝑥−𝑎3|의 경우에는 중간값 부분이 뾰족하게 그려진 그래프가 형성된다.
여기서는 식을 최소화하는 x는 평균이 아니라 중간값인 𝑎2가 되는 것이다.
Conditional Expectations
확률에 조건이 붙어서 다음과 같이 표시된다.
𝐸[𝑋|𝐴]
discrete할 때는, ∑𝑥𝑖∈𝐴𝑥𝑖𝑃(𝑥𝑖|𝐴)로 표현이 된다.
continuous할 때는, ∫𝑥𝑖∈𝐴𝑥𝑓𝑋(𝑥|𝐴)𝑑𝑥로 표현된다.
간단하게 하나의 예를 보자.
𝐴={𝑋≤𝑎} 구간에 해당하는 확률을 구하려고 한다.
𝑓𝑋(𝑥|𝐴)=𝑑𝑑𝑥𝐹𝑋(𝑥|𝐴)=𝑑𝑑𝑥𝑃(𝑋≤𝑥|𝐴)=𝑑𝑑𝑥𝑃(𝑋≤𝑥∩𝐴)𝑃(𝐴)=𝑑𝑑𝑥𝑃(𝑋≤𝑎∩𝑋≤𝑥)𝑃(𝑋≤𝑎)]
여기서 두 가지의 경우로 분리가 된다.
(i) 𝑥>𝑎일 때,
𝑑𝑑𝑥𝑃(𝑋≤𝑎)𝑃(𝑋≤𝑎)=0
1을 미분하는 꼴이 되서 0이 된다.
(2) 𝑥≤𝑎일 때,
𝑑𝑑𝑥𝑃(𝑋≤𝑥)𝑃(𝑋≤𝑎)=𝑓𝑋(𝑥)𝐹𝑋(𝑎)