계량경제학 강의3-3(한치록)

Updated:

1 minute read

3.7 종속변수가 로그일 때 계수 추정값의 해석

  • 예: $\hat{log(Y)} = 0.245 + 0.07X$
  • 좌변이 $log(Y)$면, $E[log(Y)IX]=\beta_0 +\beta_1X$ 일 때, $logE(YIX) = \beta_0 + \beta_1X$가 성립되지 않는다.
    • $E(log(Y)IX) \ne logE(YIX)$ 이기 때문
    • 그러므로 “$X$가 한 단위 증가할 때 $log(Y)$가 평균 약 0.07 증가하는 것으로 추정된다” 옳지만
    • “$X$가 한 단위 증가할 때 $Y$가 평균 약 7% 증가하는 것으로 추정된다”는 옳지 않다
  • 다시 한번 말하지만 조건부 등식을 고려해봤을 때, ‘평균’ oo% 증가한다는 말은 엄밀하게 옳지 않다
    • 수학적으로 보면,
    • $E(logYIX = x+\Delta x) - E(logYIX=x) = \beta_1\Delta x$
    • 결국, $log(Y)$의 평균과 $Y$의 평균에 로그를 씌운 것은 다르기 때문
    • $E(logY) \ne logE(Y)$

3.8 제곱합

  • SST(total sum of squares): 종속변수의 관측값이 표본평균으로부터 벗어난 편차를 제곱해서 합한 것
  • SSE(explained sum of squares): 맞춘값들이 자신의 표본평균으로부터 변동한 양의 제곱합, 종속변수값 중 독립변수에 의해 설명된 부분에 얼마나 차이가 있는 지를 나타낸 것
  • SSR(residual sum of squares): 잔차값들이 자신의 표본평균으로부터 벗어난 편차를 제곱해서 합한 것, 독립변수로 설명되지 않는 나머지 부분의 차이의 크기 측정

  • $SST = SSE + SSR$
  • $y_i - \bar{y} = \hat{y_i}-\bar{y}+\hat{u_i}$ 인데, 이걸 제곱해보면,
  • $(y_i - \bar{y})^2 = (\hat(y_i)-\bar{y})^2 + \hat{u_i}^2+2(\hat{y_i}-\bar{y})\hat{u_i}$
  • 위 식에서 좌변의 합은 SST, 우변 첫째 항의 합은 SSE, 나머지 제곱합이 SSR이 되어야 한다.
  • 그런데, $\sum_{i=1}^{n}{(\hat{y_i}-\bar{y})\hat{u_i}}=\sum_{i=1}^{n}{\hat{y_i}\hat{u_i}}-\sum_{i=1}^{n}{\bar{y}\hat{u_i}}$이고
  • 직교방정식에 의해 $\sum_{i=1}^{n}{\hat{u_i}}=0$이고, $\sum_{i=1}^{n}{\hat{y_i}\hat{u_i}}=0$이므로, 직교방정식이 성립했다면 위의 식은 성립한다.

3.9 R제곱

  • $SST = SSE + SSR$의 식에서 양변을 $SST$로 나누면,
  • $1=\frac{SSE}{SST}+\frac{SSR}{SST}$
  • 여기에서 $SSE/SST$는 종속변수의 분산 중 $X$에 의해 설명된 부분의 비중을 나타내고 이 걸 결정계수(coefficient of determination)이라 한다.
  • $R^2 = \frac{SSE}{SST} = 1-\frac{SSR}{SST}$

  • 결정계수는 종속변수 값과 이들의 맞춘값 사이의 표본 상관계수를 제곱한 것과도 동일하다
  • $\widehat{cor(y, \hat{y})} = \frac{\sum_{i=1}^{n}{(y_i-\bar{y})(\hat{y_i}-\bar{y})}}{\sqrt{\sum_{i=1}^{n}{(y_i-\bar{y})^2}\times \sum_{i=1}^{n}{(\hat{y_i}-\bar{y})^2}}}$
  • $R^2=\frac{SSE}{SST}=\frac{\sum_{i=1}^{n}{(\hat{y_i}-\bar{y})^2}}{\sum_{i=1}^{n}{(y_i-\bar{y})^2}}=\frac{[\sum_{i=1}^{n}{(\hat{y_i}-\bar{y})^2}]^2}{\sum_{i=1}^{n}{(y_i-\bar{y})^2}\times \sum_{i=1}^{n}{(\hat{y_i}-\bar{y})^2}}$
  • (아래, 위 잔차 제곱항을 곱함)
  • 그런데,$\hat{y_i} = y_i-\hat{u_i}$이고, $\hat{y_i}-\bar{y}=(y_i-\bar{y})-\hat{u_i}$이므로,
  • $\sum_{i=1}^{n}{(\hat{y_i}-\bar{y})^2} = \sum_{i=1}^{n}{(\hat{y_i}-\bar{y})[(y_i-\bar{y})-\hat{u_i}]} = \sum_{i=1}^{n}{(\hat{y_i}-\bar{y})(y_i-\bar{y})}$
  • 위에서 직교방정식에 의해 $\sum_{i=1}^{n}{(\hat{y_i}-\bar{y})\hat{u_i}}=0$임
  • 결국, $R^2=\frac{[\sum_{i=1}^{n}{(\hat{y_i}-\bar{y})(y_i-\bar{y})}]^2}{\sum_{i=1}^{n}{(y_i-\bar{y})^2}\times \sum_{i=1}^{n}{(\hat{y_i}-\bar{y})^2}}$

3.11 측정단위의 변환

  • 측정단위가 변화하면 입력되는 자료의 값도 바뀐다
  • 측정단위가 변화하면 정보를 저장하는 방식만 바뀔 뿐 정보의 양이나 내용에는 변화가 없다
  • 실제로, 계산을 해봐도 단위가 변화해도 계수의 단위에 변화가 있을 뿐, 실질적 변화는 없다

3.12 최소제곱법에 관하여 주의할 점

  • 직교방정식은 반드시 성립해야 하는 수학적 항등식이므로 특이상황이 아닌 이상 무조건 성립한다.
  • 그러므로, 직교방정식은 무조건 1개의 답만을 배출한다.