์ด ๋ฌธ์„œ์˜ ์›๋ณธ์€ ์™ธ๋ถ€ ์œ„ํ‚ค์—์„œ ๊ฐ€์ ธ์™”์Šต๋‹ˆ๋‹ค.
iid์—์„œ ๋„˜์–ด์˜ด
1. ๊ฐœ์š”2. ๊นจ์ง€๋Š” ๊ฒฝ์šฐ
2.1. Heteroskedasticity(์ด๋ถ„์‚ฐ์„ฑ)2.2. Endogeneity(๋‚ด์ƒ์„ฑ)2.3. Multicollinearity(๋‹ค์ค‘๊ณต์„ ์„ฑ)

1. ๊ฐœ์š”[ํŽธ์ง‘]

independent and identically distributed (iid)

ํ™•๋ฅ ๋ณ€์ˆ˜๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ ์žˆ์„ ๋•Œ (X1 , X2 , ... , Xn) ์ด๋“ค์ด ์ƒํ˜ธ๋…๋ฆฝ์ ์ด๋ฉฐ, ๋ชจ๋‘ ๋™์ผํ•œ ํ™•๋ฅ ๋ถ„ํฌ f(x)๋ฅผ ๊ฐ€์ง„๋‹ค๋ฉด iid์ด๋‹ค.

2. ๊นจ์ง€๋Š” ๊ฒฝ์šฐ[ํŽธ์ง‘]

ํ†ต๊ณ„ํ•™์—์„œ๋Š” ์ข‹์€ ๊ฐ€์ •์ด ์„ฑ๋ฆฝ๋˜์ง€ ์•Š์„ ๋•Œ, ์ถ”์ •๋Ÿ‰์— ์–ด๋–ค ์•…์˜ํ–ฅ์ด ์žˆ์œผ๋ฉฐ ์–ด๋–ค ๋Œ€์ฒ˜๋ฅผ ํ•ด์•ผ ํ•˜๋Š”์ง€ ๋‹ค๋ฃฌ๋‹ค. ๋งŽ์€ ์‚ฌํšŒ๊ณผํ•™ ๋ฐ์ดํ„ฐ๋“ค์€ ์ž์—ฐ๊ณผํ•™์˜ ์‹คํ—˜(experimental) ๋ฐ์ดํ„ฐ์™€ ๋‹ค๋ฅด๊ฒŒ ์œ„์—์„œ ์–ธ๊ธ‰ํ•œ ์ข‹์€ ๊ฐ€์ •๋“ค์„ ๋งŒ์กฑํ•˜์ง€ ๋ชป ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํŠนํžˆ ๊ณ„๋Ÿ‰๊ฒฝ์ œํ•™์ด๋‚˜ ์‚ฌํšŒํ†ต๊ณ„์—์„œ ์ค‘์š”ํ•˜๋‹ค.

2.1. Heteroskedasticity(์ด๋ถ„์‚ฐ์„ฑ)[ํŽธ์ง‘]

๋งŒ์ผ ์˜ค์ฐจํ•ญ(error term)์˜ ๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ์„ ์•ˆ๋‹ค๋ฉด, GLS(Generalized Least Square)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์—ฌ์ „ํžˆ BLUE๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๊ฐ€์ •์€ ํ˜„์‹ค์ ์ด์ง€ ๋ชปํ•œ ๊ฐ€์ •์ด๋ฏ€๋กœ ์—ฌ๋Ÿฌ ๋Œ€์•ˆ์ด ๋‚˜์™”๋‹ค. ๊ทธ ์ค‘ ๋น„๊ต์  ๋Œ€์„ธ๋กœ ์ž๋ฆฌ์žก์€ ๊ฒƒ์€ White์˜ robust covariance matrix estimation์ด๋‹ค.

2.2. Endogeneity(๋‚ด์ƒ์„ฑ)[ํŽธ์ง‘]

์‚ฌํšŒ๊ณผํ•™์  ์ค‘์š”์„ฑ์ด ํฐ ํ†ต๊ณ„ํ•™ ๋ฌธ์ œ๋กœ, ๊ณ„๋Ÿ‰๊ฒฝ์ œํ•™๊ณผ ํ†ต๊ณ„ํ•™ ์‚ฌ์ด์—์„œ ์ฃผ๋ชฉ๋ฐ›๋Š” ์ •๋„ ์ฐจ์ด๊ฐ€ ์œ ๋… ํฐ ๋ถ„์•ผ ์ค‘ ํ•˜๋‚˜์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์‚ฌ๊ต์œก์ด ์ „๊ต์„์ฐจ์— ๋ฏธ์น˜๋Š” ํšจ๊ณผ๋ฅผ ์•Œ๊ณ  ์‹ถ๋‹ค. ๊ฐ„๋‹จํ•˜๊ฒŒ "์ „๊ต ์„์ฐจ = ฮฑ + ฮฒยท์‚ฌ๊ต์œก๋น„ + ฮต"์˜ ์‹์„ ์„ธ์šด๋‹ค๊ณ  ํ•˜์ž. ์‚ฌ๊ต์œก๋น„ ์ง€์ถœ์— ์˜ํ–ฅ์„ ์ฃผ๋Š” ๊ด€์ฐฐ๋˜์ง€ ์•Š์€ ๊ฐœ์ธ๋ณ„ ํŠน์„ฑ(์˜ˆ: ๋Šฅ๋ ฅ)์ด ์„์ฐจ์—๋„ ์˜ํ–ฅ์„ ์ค€๋‹ค๋ฉด, ํ†ต์ƒ์ตœ์†Œ์ž์Šน(OLS) ์ถ”์ •์น˜์—๋Š” bias๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค. ์ด ํŠน์„ฑ์€ ์˜ค์ฐจํ•ญ(ฮต)์— ๋ฐ˜์˜๋˜์–ด ์žˆ์„ ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์„ค๋ช…๋ณ€์ˆ˜(X)์ธ ์‚ฌ๊ต์œก๋น„์™€ ์˜ค์ฐจํ•ญ ๊ฐ„์— ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์กด์žฌํ•˜๊ฒŒ ๋˜์–ด[1] OLS ์ถ”์ •๋Ÿ‰์€ bias๋˜์–ด ์žˆ๊ณ  inconsistentํ•˜๋‹ค. ๋งŒ์•ฝ ๋Šฅ๋ ฅ์ด ๋†’์€ ํ•™์ƒ์ด ์‚ฌ๊ต์œก์„ ๋งŽ์ด ๋ฐ›๋Š”๋‹ค๋ฉด ์‚ฌ๊ต์œก์˜ ํšจ๊ณผ๋Š” ๊ณผ๋Œ€์ถ”์ •๋  ๊ฒƒ์ด๊ณ , ๋Šฅ๋ ฅ์ด ๋‚ฎ์€ ํ•™์ƒ์ด ๋งŽ์ด ๋ฐ›๋Š”๋‹ค๋ฉด ๊ณผ์†Œ์ถ”์ •๋  ๊ฒƒ์ด๋‹ค. ๋‹ค๋ฅธ ์˜ˆ๋กœ "์ผ๋ฐ˜์ธ 1๋ช…์ด ๋Œ€ํ•™์— ๊ฐ”์„ ๊ฒฝ์šฐ ์ถ”๊ฐ€๋กœ ์–ป๋Š” ๊ธฐ๋Œ€์†Œ๋“์ด ์–ผ๋งˆ์ผ๊นŒ?" ๋ผ๋Š” ์งˆ๋ฌธ์„ ์ƒ๊ฐํ•ด๋ณด์ž. ์ฒซ๋ฒˆ์งธ ์•„์ด๋””์–ด๋Š” ๋Œ€ํ•™์— ๊ฐ„ ์‚ฌ๋žŒ 100๋ช…, ์•ˆ ๊ฐ„ ์‚ฌ๋žŒ 100๋ช…์„ ๋น„๊ตํ•ด์„œ ํ‰๊ท  ์ž„๊ธˆ์„ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ณง ์ด ๋ฐฉ๋ฒ•์ด ๋ฌธ์ œ๊ฐ€ ์žˆ์Œ์„ ๊นจ๋‹ซ๋Š”๋‹ค. ๋Œ€ํ•™์— ๊ฐ„ ์‚ฌ๋žŒ๋“ค์€ ์ƒ๋Œ€์ ์œผ๋กœ ๊ณต๋ถ€๋ฅผ ์ž˜ํ•˜๊ณ  ๋Œ€ํ•™์—์„œ ์–ป์„ ๊ฒƒ์ด ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ด๋Ÿฌํ•œ ๋น„๊ต๋ฅผ ํ•˜๋ฉด ๋Œ€ํ•™๊ต์˜ ์ž„๊ธˆ ์ƒ์Šน ํšจ๊ณผ๋ฅผ ๊ณผ๋Œ€ํ‰๊ฐ€ํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด์ƒ์ ์ธ ์‹คํ—˜์€ ์‚ฌ๋žŒ 200๋ช…์„ ๋ชจ์œผ๊ณ  ๋น„์Šทํ•œ ์ง‘๋‹จ 2๊ฐœ๋กœ ๋žœ๋คํ•˜๊ฒŒ ๋‚˜๋ˆ„์–ด์„œ, ํ•œ ์ง‘๋‹จ์€ ๋Œ€ํ•™์„ ๋ณด๋‚ด๊ณ  ๋‹ค๋ฅธ ์ง‘๋‹จ์„ ๊ทธ๋Ÿฌ์ง€ ์•Š์€ ๋‹ค์Œ์— ๋ช‡ ๋…„ ํ›„ ๋‘ ์ง‘๋‹จ์˜ ์ž„๊ธˆ์„ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์ด๋‚˜, ์ด๋Š” ํ˜„์‹ค์ ์œผ๋กœ ํ•˜๊ธฐ ํž˜๋“ค๋‹ค. ๋”ฐ๋ผ์„œ ์ด๋Ÿฌํ•œ ์‹คํ—˜ ์ƒํ™ฉ์„ ์–ด๋–ป๊ฒŒ๋“  ์žฌํ˜„ํ•˜๊ธฐ ์œ„ํ•ด, ์›์ธ์— ๋”ฐ๋ผ ํ†ต์ œ๋ณ€์ˆ˜๋ฅผ ์ถ”๊ฐ€ํ•˜๊ฑฐ๋‚˜, ๋„๊ตฌ๋ณ€์ˆ˜(IV)๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, DiD ๋ชจํ˜• ๋“ฑ์„ ์ด์šฉํ•œ๋‹ค.[2]

๋‚ด์ƒ์„ฑ์„ ์•ผ๊ธฐํ•˜๋Š” ์š”์ธ์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๋ˆ„๋ฝ๋ณ€์ˆ˜(omitted variables), ๋™์‹œ์„ฑ(simultaneity) ๋ฐ ์ธก์ •์˜ค์ฐจ(measurement error)์˜ ์„ธ ๊ฐ€์ง€ ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ๋‹ค[3] ๋™์‹œ์„ฑ ๋ฌธ์ œ๋Š” ์‹œ์ฐจ ๋ณ€์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด์„œ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค. ํšŒ๊ท€ ๋ถ„์„์„ ํ–ˆ์„ ๋•Œ ์ƒ๊ธฐ๋Š” ๋ˆ„๋ฝ ๋ณ€์ˆ˜๋Š” ํŒจ๋„ ๋ถ„์„์„ ์‚ฌ์šฉํ•ด์„œ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค.

2.3. Multicollinearity(๋‹ค์ค‘๊ณต์„ ์„ฑ)[ํŽธ์ง‘]

๊ณต์„ ์„ฑ์„ ์œ ๋ฐœํ•˜๋Š” ์„ค๋ช…๋ณ€์ˆ˜ ์ œ๊ฑฐ ๋˜๋Š” ์ฐจ๋ถ„๊ฐ’, ๋กœ๊ทธํ˜•ํƒœ ๋“ฑ ์ถ”์ •๋ชจํ˜•์„ ๋ณ€ํ™”์‹œ์ผœ๋ณด๊ฑฐ๋‚˜ ๊ฑฐ์‹œ๋ณ€์ˆ˜์˜ ๊ฒฝ์šฐ ๋ช…๋ชฉ๊ฐ’์ด ์•„๋‹Œ ์‹ค์งˆ๊ฐ’์„ ์ด์šฉํ•˜์—ฌ ๋ชจํ˜•์„ ์ถ”์ •ํ•œ๋‹ค.

[1] Cov(X,ฮต)โ‰ 0
[2] ๊ด€๋ จ ๋ฐฉ๋ฒ•๋ก ๋“ค์€ ์œ„์—์„œ ์–ธ๊ธ‰ํ•œ Mostly harmless econometrics์— ์ง‘์ค‘์ ์œผ๋กœ ๋‚˜์™€์žˆ๋‹ค.
[3] Wooldridge (2002). 50~51์ชฝ ์ฐธ์กฐ.