데이타 처리를 하면서 평균과 표준편차를 구해야 하는 경우가 많이 있다. 이 때, 평균과 표준편차의 계산을 점화식을 이용해서 하면 반복문의 수를 반으로 줄여서 빠르게 계산을 할 수 있다.
- 증명따윈 필요없는 귀차니스트를 위한 식
평균: μn+1=nn+1μn+an+1n+1,(n≥0).
표준편차: σ2n+1=nn+1σ2n+(μn+1−an+1)2n,(n≥1).
공변: σ(a,b)n+1=nn+1σ(a,b)n+(μn+1−an+1)(νn+1−bn+1)n,(n≥1).
- 평균 증명
- 점화식을 이용해서 n+1번째 항까지의 평균을 구할 때 우리가 가지고 있는 정보는 다음과 같다.
- n번째 항까지의 평균 μn
- n+1번째 항의 값 an+1
- 이 정보들만 가지고 n+1번째 항까지의 평균을 구해내야 한다.
- 점화식을 이용해서 n+1번째 항까지의 평균을 구할 때 우리가 가지고 있는 정보는 다음과 같다.
μn+1=n+1∑i=1ain+1,=n∑i=1ain+1+an+1n+1,=an+1n+1+nn+1n∑i=1ain.
∴μn+1=nn+1μn+an+1n+1,(n≥0).
- 표준편차 증명
- n+1번째 항까지의 표준편차를 구할 때에 우리가 가지고 있는 정보는 다음과 같다.
- n번째 항까지의 표준편차 σ2n
- n+1번째 항까지의 평균 μn+1
- n+1번째 항의 값 an+1
- 평균과 마찬가지로, 표준편차를 구할 때도 위 세 가지 값만 가지고 n+1번째 항까지의 표준편차를 구해야 한다.
- n+1번째 항까지의 표준편차를 구할 때에 우리가 가지고 있는 정보는 다음과 같다.
σ2n+1=n+1∑i=1(ai−μn+1)2n+1,=n∑i=1(ai−μn+1)2n+1+(an+1−μn+1)2n+1.(1)
두번째 항은 알고있는 값들로만 돼 있으니 놔두고, 첫번째 항을 알고있는 값들로만 바꿔주면 된다.
n∑i=1(ai−μn+1)2−n∑i=1(ai−μn)2=n∑i=1(μn−μn+1)(2ai−μn+1−μn),=(μn−μn+1)(2nμn−nμn+1−nμn),=n(μn+1−μn)2.(2)
이제 식 (2)를 식 (1)에 넣어 정리하면,
σ2n+1=n∑i=1(ai−μn)2n+1+nn+1(μn+1−μn)2+(an+1−μn+1)2n+1,=nn+1σ2n+nn+1(μn+1−μn)2+(an+1−μn+1)2n+1.(3)
n번째 항까지의 평균값은 n+1번째 항까지의 평균값을 구하면서 없어졌으므로, 평균의 점화식 공식을 이용해서 n번째 항까지의 평균값을 없애버리자. 점화식을 다시 정리하면
μn=n+1nμn+1−1nan+1
가 되므로, 이 식을 식 (3)의 두번째 항에 대입하면, 두번째 항은 다음과 같이 된다.
nn+1(μn+1−μn)2=nn+1(μn+1−n+1nμn+1+1nan+1)2,=1n(n+1)(an+1−μn+1)2
∴σ2n+1=nn+1σ2n+(μn+1−an+1)2n,(n≥1).
- 공변 증명은 표준편차 증명과 똑같은 방식이므로 생략한다.
- 각 값의 가중치가 같지 않을 때의 평균과 공변 식
평균: μn+1=WnWn+wn+1μn+wn+1an+1Wn+wn+1,(n≥0).
표준편차: σ2n+1=WnWn+wn+1σ2n+wn+1(μn+1−an+1)2Wn,(n≥1).
공변: σ(a,b)n+1=WnWn+wn+1σ(a,b)n+wn+1(μn+1−an+1)(νn+1−bn+1)Wn,(n≥1).
위 식들에서 Wn=n∑i=1wi이고, wn은 n번째 값의 가중치이다.
- Acknowledgement
- 이정우님이 가중치가 있을 때의 계산 오류에 대해 지적해 주어 바로고침