์ด ๋ฌธ์์ ์๋ณธ์ ์ธ๋ถ ์ํค์์ ๊ฐ์ ธ์์ต๋๋ค.
iid์์ ๋์ด์ด
1. ๊ฐ์[ํธ์ง]
independent and identically distributed (iid)
ํ๋ฅ ๋ณ์๊ฐ ์ฌ๋ฌ ๊ฐ ์์ ๋ (X1 , X2 , ... , Xn) ์ด๋ค์ด ์ํธ๋ ๋ฆฝ์ ์ด๋ฉฐ, ๋ชจ๋ ๋์ผํ ํ๋ฅ ๋ถํฌ f(x)๋ฅผ ๊ฐ์ง๋ค๋ฉด iid์ด๋ค.
ํ๋ฅ ๋ณ์๊ฐ ์ฌ๋ฌ ๊ฐ ์์ ๋ (X1 , X2 , ... , Xn) ์ด๋ค์ด ์ํธ๋ ๋ฆฝ์ ์ด๋ฉฐ, ๋ชจ๋ ๋์ผํ ํ๋ฅ ๋ถํฌ f(x)๋ฅผ ๊ฐ์ง๋ค๋ฉด iid์ด๋ค.
2. ๊นจ์ง๋ ๊ฒฝ์ฐ[ํธ์ง]
ํต๊ณํ์์๋ ์ข์ ๊ฐ์ ์ด ์ฑ๋ฆฝ๋์ง ์์ ๋, ์ถ์ ๋์ ์ด๋ค ์
์ํฅ์ด ์์ผ๋ฉฐ ์ด๋ค ๋์ฒ๋ฅผ ํด์ผ ํ๋์ง ๋ค๋ฃฌ๋ค. ๋ง์ ์ฌํ๊ณผํ ๋ฐ์ดํฐ๋ค์ ์์ฐ๊ณผํ์ ์คํ(experimental) ๋ฐ์ดํฐ์ ๋ค๋ฅด๊ฒ ์์์ ์ธ๊ธํ ์ข์ ๊ฐ์ ๋ค์ ๋ง์กฑํ์ง ๋ชป ํ๊ธฐ ๋๋ฌธ์ ํนํ ๊ณ๋๊ฒฝ์ ํ์ด๋ ์ฌํํต๊ณ์์ ์ค์ํ๋ค.
2.1. Heteroskedasticity(์ด๋ถ์ฐ์ฑ)[ํธ์ง]
๋ง์ผ ์ค์ฐจํญ(error term)์ ๊ณต๋ถ์ฐ ํ๋ ฌ์ ์๋ค๋ฉด, GLS(Generalized Least Square)๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ์ ํ BLUE๋ฅผ ๊ตฌํ ์ ์๋ค. ๊ทธ๋ฌ๋ ์ด ๊ฐ์ ์ ํ์ค์ ์ด์ง ๋ชปํ ๊ฐ์ ์ด๋ฏ๋ก ์ฌ๋ฌ ๋์์ด ๋์๋ค. ๊ทธ ์ค ๋น๊ต์ ๋์ธ๋ก ์๋ฆฌ์ก์ ๊ฒ์ White์ robust covariance matrix estimation์ด๋ค.
2.2. Endogeneity(๋ด์์ฑ)[ํธ์ง]
์ฌํ๊ณผํ์ ์ค์์ฑ์ด ํฐ ํต๊ณํ ๋ฌธ์ ๋ก, ๊ณ๋๊ฒฝ์ ํ๊ณผ ํต๊ณํ ์ฌ์ด์์ ์ฃผ๋ชฉ๋ฐ๋ ์ ๋ ์ฐจ์ด๊ฐ ์ ๋
ํฐ ๋ถ์ผ ์ค ํ๋์ด๋ค. ์๋ฅผ ๋ค์ด ์ฌ๊ต์ก์ด ์ ๊ต์์ฐจ์ ๋ฏธ์น๋ ํจ๊ณผ๋ฅผ ์๊ณ ์ถ๋ค. ๊ฐ๋จํ๊ฒ "์ ๊ต ์์ฐจ = ฮฑ + ฮฒยท์ฌ๊ต์ก๋น + ฮต"์ ์์ ์ธ์ด๋ค๊ณ ํ์. ์ฌ๊ต์ก๋น ์ง์ถ์ ์ํฅ์ ์ฃผ๋ ๊ด์ฐฐ๋์ง ์์ ๊ฐ์ธ๋ณ ํน์ฑ(์: ๋ฅ๋ ฅ)์ด ์์ฐจ์๋ ์ํฅ์ ์ค๋ค๋ฉด, ํต์์ต์์์น(OLS) ์ถ์ ์น์๋ bias๊ฐ ๋ฐ์ํ๋ค. ์ด ํน์ฑ์ ์ค์ฐจํญ(ฮต)์ ๋ฐ์๋์ด ์์ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ด๋ค. ์ค๋ช
๋ณ์(X)์ธ ์ฌ๊ต์ก๋น์ ์ค์ฐจํญ ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ์กด์ฌํ๊ฒ ๋์ด[1] OLS ์ถ์ ๋์ bias๋์ด ์๊ณ inconsistentํ๋ค. ๋ง์ฝ ๋ฅ๋ ฅ์ด ๋์ ํ์์ด ์ฌ๊ต์ก์ ๋ง์ด ๋ฐ๋๋ค๋ฉด ์ฌ๊ต์ก์ ํจ๊ณผ๋ ๊ณผ๋์ถ์ ๋ ๊ฒ์ด๊ณ , ๋ฅ๋ ฅ์ด ๋ฎ์ ํ์์ด ๋ง์ด ๋ฐ๋๋ค๋ฉด ๊ณผ์์ถ์ ๋ ๊ฒ์ด๋ค. ๋ค๋ฅธ ์๋ก "์ผ๋ฐ์ธ 1๋ช
์ด ๋ํ์ ๊ฐ์ ๊ฒฝ์ฐ ์ถ๊ฐ๋ก ์ป๋ ๊ธฐ๋์๋์ด ์ผ๋ง์ผ๊น?" ๋ผ๋ ์ง๋ฌธ์ ์๊ฐํด๋ณด์. ์ฒซ๋ฒ์งธ ์์ด๋์ด๋ ๋ํ์ ๊ฐ ์ฌ๋ 100๋ช
, ์ ๊ฐ ์ฌ๋ 100๋ช
์ ๋น๊ตํด์ ํ๊ท ์๊ธ์ ๋น๊ตํ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฌ๋ ๊ณง ์ด ๋ฐฉ๋ฒ์ด ๋ฌธ์ ๊ฐ ์์์ ๊นจ๋ซ๋๋ค. ๋ํ์ ๊ฐ ์ฌ๋๋ค์ ์๋์ ์ผ๋ก ๊ณต๋ถ๋ฅผ ์ํ๊ณ ๋ํ์์ ์ป์ ๊ฒ์ด ๋ง์ ์ฌ๋๋ค์ด๊ธฐ ๋๋ฌธ์, ์ด๋ฌํ ๋น๊ต๋ฅผ ํ๋ฉด ๋ํ๊ต์ ์๊ธ ์์น ํจ๊ณผ๋ฅผ ๊ณผ๋ํ๊ฐํ๊ฒ ๋๋ ๊ฒ์ด๋ค. ์ด์์ ์ธ ์คํ์ ์ฌ๋ 200๋ช
์ ๋ชจ์ผ๊ณ ๋น์ทํ ์ง๋จ 2๊ฐ๋ก ๋๋คํ๊ฒ ๋๋์ด์, ํ ์ง๋จ์ ๋ํ์ ๋ณด๋ด๊ณ ๋ค๋ฅธ ์ง๋จ์ ๊ทธ๋ฌ์ง ์์ ๋ค์์ ๋ช ๋
ํ ๋ ์ง๋จ์ ์๊ธ์ ๋น๊ตํ๋ ๊ฒ์ด๋, ์ด๋ ํ์ค์ ์ผ๋ก ํ๊ธฐ ํ๋ค๋ค. ๋ฐ๋ผ์ ์ด๋ฌํ ์คํ ์ํฉ์ ์ด๋ป๊ฒ๋ ์ฌํํ๊ธฐ ์ํด, ์์ธ์ ๋ฐ๋ผ ํต์ ๋ณ์๋ฅผ ์ถ๊ฐํ๊ฑฐ๋, ๋๊ตฌ๋ณ์(IV)๋ฅผ ์ฌ์ฉํ๊ฑฐ๋, DiD ๋ชจํ ๋ฑ์ ์ด์ฉํ๋ค.[2]
๋ด์์ฑ์ ์ผ๊ธฐํ๋ ์์ธ์ ์ผ๋ฐ์ ์ผ๋ก ๋๋ฝ๋ณ์(omitted variables), ๋์์ฑ(simultaneity) ๋ฐ ์ธก์ ์ค์ฐจ(measurement error)์ ์ธ ๊ฐ์ง ์นดํ ๊ณ ๋ฆฌ๋ก ๋๋ ์ ์๋ค[3] ๋์์ฑ ๋ฌธ์ ๋ ์์ฐจ ๋ณ์๋ฅผ ์ฌ์ฉํด์ ํด๊ฒฐํ ์ ์๋ค. ํ๊ท ๋ถ์์ ํ์ ๋ ์๊ธฐ๋ ๋๋ฝ ๋ณ์๋ ํจ๋ ๋ถ์์ ์ฌ์ฉํด์ ํด๊ฒฐํ ์ ์๋ค.
๋ด์์ฑ์ ์ผ๊ธฐํ๋ ์์ธ์ ์ผ๋ฐ์ ์ผ๋ก ๋๋ฝ๋ณ์(omitted variables), ๋์์ฑ(simultaneity) ๋ฐ ์ธก์ ์ค์ฐจ(measurement error)์ ์ธ ๊ฐ์ง ์นดํ ๊ณ ๋ฆฌ๋ก ๋๋ ์ ์๋ค[3] ๋์์ฑ ๋ฌธ์ ๋ ์์ฐจ ๋ณ์๋ฅผ ์ฌ์ฉํด์ ํด๊ฒฐํ ์ ์๋ค. ํ๊ท ๋ถ์์ ํ์ ๋ ์๊ธฐ๋ ๋๋ฝ ๋ณ์๋ ํจ๋ ๋ถ์์ ์ฌ์ฉํด์ ํด๊ฒฐํ ์ ์๋ค.
2.3. Multicollinearity(๋ค์ค๊ณต์ ์ฑ)[ํธ์ง]
๊ณต์ ์ฑ์ ์ ๋ฐํ๋ ์ค๋ช
๋ณ์ ์ ๊ฑฐ ๋๋ ์ฐจ๋ถ๊ฐ, ๋ก๊ทธํํ ๋ฑ ์ถ์ ๋ชจํ์ ๋ณํ์์ผ๋ณด๊ฑฐ๋ ๊ฑฐ์๋ณ์์ ๊ฒฝ์ฐ ๋ช
๋ชฉ๊ฐ์ด ์๋ ์ค์ง๊ฐ์ ์ด์ฉํ์ฌ ๋ชจํ์ ์ถ์ ํ๋ค.
[1] Cov(X,ฮต)โ 0
[2] ๊ด๋ จ ๋ฐฉ๋ฒ๋ก ๋ค์ ์์์ ์ธ๊ธํ Mostly harmless econometrics์ ์ง์ค์ ์ผ๋ก ๋์์๋ค.
[3] Wooldridge (2002). 50~51์ชฝ ์ฐธ์กฐ.