Mean, RMS and Covariance with computer

데이타 처리를 하면서 평균과 표준편차를 구해야 하는 경우가 많이 있다. 이 때, 평균과 표준편차의 계산을 점화식을 이용해서 하면 반복문의 수를 반으로 줄여서 빠르게 계산을 할 수 있다.

  • 증명따윈 필요없는 귀차니스트를 위한 식

평균: μn+1=nn+1μn+an+1n+1,(n0).

표준편차: σ2n+1=nn+1σ2n+(μn+1an+1)2n,(n1).

공변: σ(a,b)n+1=nn+1σ(a,b)n+(μn+1an+1)(νn+1bn+1)n,(n1).

  • 평균 증명
    • 점화식을 이용해서 n+1번째 항까지의 평균을 구할 때 우리가 가지고 있는 정보는 다음과 같다.
      1. n번째 항까지의 평균 μn
      2. n+1번째 항의 값 an+1
    • 이 정보들만 가지고 n+1번째 항까지의 평균을 구해내야 한다.

μn+1=n+1i=1ain+1,=ni=1ain+1+an+1n+1,=an+1n+1+nn+1ni=1ain.

μn+1=nn+1μn+an+1n+1,(n0).

 

  • 표준편차 증명
    • n+1번째 항까지의 표준편차를 구할 때에 우리가 가지고 있는 정보는 다음과 같다.
      1. n번째 항까지의 표준편차 σ2n
      2. n+1번째 항까지의 평균 μn+1
      3. n+1번째 항의 값 an+1
    • 평균과 마찬가지로, 표준편차를 구할 때도 위 세 가지 값만 가지고 n+1번째 항까지의 표준편차를 구해야 한다.

σ2n+1=n+1i=1(aiμn+1)2n+1,=ni=1(aiμn+1)2n+1+(an+1μn+1)2n+1.(1)

두번째 항은 알고있는 값들로만 돼 있으니 놔두고, 첫번째 항을 알고있는 값들로만 바꿔주면 된다.

ni=1(aiμn+1)2ni=1(aiμn)2=ni=1(μnμn+1)(2aiμn+1μn),=(μnμn+1)(2nμnnμn+1nμn),=n(μn+1μn)2.(2)

이제 식 (2)를 식 (1)에 넣어 정리하면,

σ2n+1=ni=1(aiμn)2n+1+nn+1(μn+1μn)2+(an+1μn+1)2n+1,=nn+1σ2n+nn+1(μn+1μn)2+(an+1μn+1)2n+1.(3)

n번째 항까지의 평균값은 n+1번째 항까지의 평균값을 구하면서 없어졌으므로, 평균의 점화식 공식을 이용해서 n번째 항까지의 평균값을 없애버리자. 점화식을 다시 정리하면

μn=n+1nμn+11nan+1

가 되므로, 이 식을 식 (3)의 두번째 항에 대입하면, 두번째 항은 다음과 같이 된다.

nn+1(μn+1μn)2=nn+1(μn+1n+1nμn+1+1nan+1)2,=1n(n+1)(an+1μn+1)2

σ2n+1=nn+1σ2n+(μn+1an+1)2n,(n1).

  • 공변 증명은 표준편차 증명과 똑같은 방식이므로 생략한다.
  • 각 값의 가중치가 같지 않을 때의 평균과  공변 식

평균: μn+1=WnWn+wn+1μn+wn+1an+1Wn+wn+1,(n0).

표준편차: σ2n+1=WnWn+wn+1σ2n+wn+1(μn+1an+1)2Wn,(n1).

공변: σ(a,b)n+1=WnWn+wn+1σ(a,b)n+wn+1(μn+1an+1)(νn+1bn+1)Wn,(n1).

위 식들에서 Wn=ni=1wi이고, wnn번째 값의 가중치이다.

  • Acknowledgement
    • 이정우님이 가중치가 있을 때의 계산 오류에 대해 지적해 주어 바로고침

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.