์ด ๋ฌธ์„œ์˜ ์›๋ณธ์€ ์™ธ๋ถ€ ์œ„ํ‚ค์—์„œ ๊ฐ€์ ธ์™”์Šต๋‹ˆ๋‹ค.
1. ๊ฐœ์š”2. ๊ตฌ์กฐ3. ์‚ฌ์šฉ ์˜ˆ์‹œ


๊ณต์‹ ํ™ˆํŽ˜์ด์ง€

1. ๊ฐœ์š”[ํŽธ์ง‘]

Apache Hadoop(High-Availability Distributed Object-Oriented Platform)์€ ์ผ๋ฐ˜ ์ƒ์šฉ ์„œ๋ฒ„๋กœ ๊ตฌ์„ฑ๋œ ํด๋Ÿฌ์Šคํ„ฐ์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ„์‚ฐ ํŒŒ์ผ์‹œ์Šคํ…œ๊ณผ ๋Œ€๋Ÿ‰์˜ ์ž๋ฃŒ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ ๋ถ„์‚ฐ ์ฒ˜๋ฆฌ ์‹œ์Šคํ…œ์„ ์ œ๊ณตํ•˜๋Š” ์•„ํŒŒ์น˜ ์†Œํ”„ํŠธ์›จ์–ด ์žฌ๋‹จ์˜ ์˜คํ”ˆ ์†Œ์Šค ํ”„๋ ˆ์ž„์›Œํฌ์ด๋‹ค. Java๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐœ๋ฐœ๋˜์—ˆ๋‹ค.

์›๋ž˜ ๊ฒ€์ƒ‰ ์—”์ง„ Nutch์˜ ๋ถ„์‚ฐ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•˜์—ฌ ๊ฐœ๋ฐœ๋˜์—ˆ๋‹ค. ์•ผํ›„!์— ์žฌ์ง ์ค‘์ด๋˜ ํ”„๋กœ๊ทธ๋ž˜๋จธ ๋”๊ทธ ์ปคํŒ…์ด ์ฒ˜์Œ ๊ฐœ๋ฐœํ•˜์˜€๊ณ , ์ดํ›„ ํ”„๋กœ์ ํŠธ๊ฐ€ ์•„ํŒŒ์น˜ ์žฌ๋‹จ์œผ๋กœ ๋„˜์–ด๊ฐ„ ๋‹ค์Œ ํ•ด๋‹นํ•˜๋Š” ์ฝ”๋“œ๋ฅผ ๋ถ„๋ฆฌ์‹œ์ผœ ๋…์ž ํ”„๋กœ์ ํŠธ๋กœ ๋ฐœ์ „ํ•ด ๋‚˜๊ฐ”๋‹ค๊ณ  ํ•œ๋‹ค.

๋งˆ์Šค์ฝ”ํŠธ๋Š” ์ฝ”๋ผ๋ฆฌ์ธ๋ฐ, ๋”๊ทธ ์ปคํŒ…์ด ์•„๋“ค์ด ๊ฐ€์ง€๊ณ  ๋†€๋˜ ์ฝ”๋ผ๋ฆฌ ์žฅ๋‚œ๊ฐ์„ ๋ณด๊ณ  ์ง€์—ˆ๋‹ค๊ณ  ํ•œ๋‹ค. ์ฐธ๊ณ ๋กœ ํŒŒ์ƒ ํ”„๋กœ์ ํŠธ๋„ ์ƒ๋‹น์ˆ˜๊ฐ€ ๋™๋ฌผ ์ด๋ฆ„์„ ๋”ฐ์™”๋‹ค(ํƒ€์กฐ#, ํ•˜๋งˆ# ๋“ฑ).

2. ๊ตฌ์กฐ[ํŽธ์ง‘]

2.x ๋ฒ„์ „์—์„œ๋Š” ๊ณตํ†ต๋ชจ๋“ˆ์ธ Hadoop Common, ์Šค์ผ€์ค„๋Ÿฌ์™€ ํด๋Ÿฌ์Šคํ„ฐ ๊ด€๋ฆฌ ๋ชจ๋“ˆ์ธ Hadoop YARN, NoSQL ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์ธ Hadoop HBase, ๋ถ„์‚ฐ ํŒŒ์ผ์‹œ์Šคํ…œ HDFS(Hadoop Distributed File System), ๋ถ„์‚ฐ์ฒ˜๋ฆฌ ์‹œ์Šคํ…œ Hadoop Map Reduce๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค. ํŠนํžˆ Map Reduce์™€ HDFS๋Š” ๊ตฌ๊ธ€์˜ Map Reduce์™€ Google File System(GFS) ๋…ผ๋ฌธ์„ ๋ณด๊ณ  ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ตฌํ˜„ํ•œ ๊ฒƒ์ด๋‹ค.

๊ธฐ์กด์— 1.x ๋ฒ„์ „์—์„œ๋Š” Map Reduce์™€ HDFS๋กœ๋งŒ ๊ตฌํ˜„๋˜์–ด ์žˆ์—ˆ๊ณ  Hadoop YARN์˜ ResourceManager ๊ธฐ๋Šฅ์€ Map Reduce์˜ JobTracker๋ผ๋Š” ์ด๋ฆ„์œผ๋กœ ์กด์žฌํ•˜๊ณ  ์žˆ์—ˆ๋‹ค. ๋˜ํ•œ ์•„์ง๊นŒ์ง€๋Š” Java 8 ์ดํ•˜์˜ ๋ฒ„์ „๊ณผ๋งŒ ํ˜ธํ™˜๋˜๋ฉฐ, Java 9๋ถ€ํ„ฐ๋Š” ๋ชจ๋“ˆ ์‹œ์Šคํ…œ๊ณผ์˜ ํ˜ธํ™˜์„ฑ ๋•Œ๋ฌธ์— ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์œผ๋‹ˆ ์ฐธ๊ณ ํ•˜์ž.

3. ์‚ฌ์šฉ ์˜ˆ์‹œ[ํŽธ์ง‘]

์‚ฌ์šฉ์— ํฐ ์ œํ•œ์ด ์—†๋Š” ์•„ํŒŒ์น˜ ๋ผ์ด์„ ์Šค๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์— Map Reduce๋ฅผ ์ด์šฉํ•˜๊ฑฐ๋‚˜, ๋Œ€๋Ÿ‰์˜ ํŒŒ์ผ ์‹œ์Šคํ…œ์„ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒฝ์šฐ์— ์‚ฌ์šฉ๋œ๋‹ค. ๋Œ€ํ‘œ์ ์œผ๋กœ๋Š” Apache Lucene(๋ฃจ์”ฌ)์„ ์ด์šฉํ•œ ๊ฒ€์ƒ‰ ์—”์ง„์ด๋‚˜ ๊ธฐ๊ณ„ํ•™์Šต, ๋น… ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋“ฑ ์—ฌ๋Ÿฌ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ๋˜๊ณ  ์žˆ๋‹ค.