λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°

μΉ΄ν…Œκ³ λ¦¬ μ—†μŒ

빅데이터와 κ΄€λ ¨λœ 주제둜 μ λ‹Ήν•œ 길이의 ν•œ λ¬Έμž₯ 제λͺ©μ„ λ§Œλ“€μ–΄λ“œλ¦΄ν…Œλ‹ˆ, λŒ€μΆœκ³Ό λ³΄ν—˜ λ‹¨μ–΄λŠ” μ‚¬μš©ν•˜μ§€ μ•Šμ•„μ£Όμ‹œλ©΄ κ°μ‚¬ν•˜κ² μŠ΅λ‹ˆλ‹€.

λΉ…λ°μ΄ν„°μ˜ μ’…λ₯˜

λΉ…λ°μ΄ν„°λž€ λ§Žμ€ μ–‘μ˜ 데이터λ₯Ό μ˜λ―Έν•˜λ©°, λ‹€μ–‘ν•œ ν˜•νƒœμ˜ 데이터λ₯Ό ν¬κ΄„ν•©λ‹ˆλ‹€. 이 ν¬μŠ€νŒ…μ—μ„œλŠ” λΉ…λ°μ΄ν„°μ˜ μ£Όμš” μ’…λ₯˜μ— λŒ€ν•΄ μ†Œκ°œν•˜κ² μŠ΅λ‹ˆλ‹€.

1. μ •ν˜• 데이터 (Structured Data)

μ •ν˜• λ°μ΄ν„°λŠ” ν…Œμ΄λΈ” ν˜•νƒœλ‘œ κ΅¬μ„±λ˜μ–΄ μžˆλŠ” λ°μ΄ν„°λ‘œ, μ—΄κ³Ό ν–‰μœΌλ‘œ 이루어진 ꡬ쑰λ₯Ό κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€λ©΄, κ΄€κ³„ν˜• λ°μ΄ν„°λ² μ΄μŠ€μ˜ ν…Œμ΄λΈ”μ΄λ‚˜ μ—‘μ…€ μ‹œνŠΈ 등이 μ •ν˜• 데이터에 ν•΄λ‹Ήλ©λ‹ˆλ‹€. μ •ν˜• λ°μ΄ν„°λŠ” κ·œμΉ™μ— 따라 κ΅¬μ„±λ˜μ–΄ μžˆμ–΄ μ²˜λ¦¬ν•˜κΈ° 쉽고, λ°μ΄ν„°λ² μ΄μŠ€ 퀴리 등을 톡해 μ‰½κ²Œ 뢄석할 수 μžˆμŠ΅λ‹ˆλ‹€.

2. λΉ„μ •ν˜• 데이터 (Unstructured Data)

λΉ„μ •ν˜• λ°μ΄ν„°λŠ” κ΅¬μ‘°ν™”λ˜μ–΄ μžˆμ§€ μ•Šμ€ λ°μ΄ν„°λ‘œ, ν…μŠ€νŠΈ, 이미지, μ˜€λ””μ˜€, λΉ„λ””μ˜€ λ“± λ‹€μ–‘ν•œ ν˜•μ‹μ„ ν¬ν•¨ν•©λ‹ˆλ‹€. μ†Œμ…œ λ―Έλ””μ–΄ κ²Œμ‹œλ¬Ό, 이메일, μ›Ήλ¬Έμ„œ, μ„Όμ„œ 데이터 등이 λΉ„μ •ν˜• 데이터에 ν•΄λ‹Ήλ©λ‹ˆλ‹€. λΉ„μ •ν˜• λ°μ΄ν„°λŠ” μ²˜λ¦¬ν•˜κΈ° μ–΄λ €μš°λ‚˜, ν…μŠ€νŠΈ λ§ˆμ΄λ‹, 이미지 인식, μŒμ„± 인식 λ“±μ˜ κΈ°μˆ μ„ 톡해 κ°€μΉ˜λ₯Ό μΆ”μΆœν•  수 μžˆμŠ΅λ‹ˆλ‹€.

3. λ°˜μ •ν˜• 데이터 (Semi-structured Data)

λ°˜μ •ν˜• λ°μ΄ν„°λŠ” λΉ„μ •ν˜• 데이터와 μ •ν˜• λ°μ΄ν„°μ˜ 쀑간 ν˜•νƒœλ‘œ, 일뢀 κ΅¬μ‘°ν™”λœ 정보λ₯Ό κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. XML, JSON, CSV λ“±μ˜ ν˜•μ‹μ„ κ°€μ§„ 데이터가 λ°˜μ •ν˜• 데이터에 ν•΄λ‹Ήλ©λ‹ˆλ‹€. λ°˜μ •ν˜• λ°μ΄ν„°λŠ” μΌμ •ν•œ ꡬ쑰λ₯Ό κ°€μ§€κ³  μžˆμ–΄ λΆ„μ„ν•˜κΈ° μƒλŒ€μ μœΌλ‘œ μ‰½μ§€λ§Œ, μ™„μ „ν•œ κ΅¬μ‘°ν™”λ˜μ§€ μ•Šμ•„ 일뢀 μ „μ²˜λ¦¬ 과정이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

4. μ‹œκ³„μ—΄ 데이터 (Time Series Data)

μ‹œκ³„μ—΄ λ°μ΄ν„°λŠ” 일정 μ‹œκ°„ κ°„κ²©μœΌλ‘œ λ°œμƒν•˜λŠ” λ°μ΄ν„°λ‘œ, 주식 μ‹œμ„Έ, 날씨 정보, ꡐ톡 데이터 등이 μ‹œκ³„μ—΄ 데이터에 ν•΄λ‹Ήλ©λ‹ˆλ‹€. μ‹œκ³„μ—΄ λ°μ΄ν„°λŠ” 톡계적인 기법을 μ΄μš©ν•˜μ—¬ λ°μ΄ν„°μ˜ νŒ¨ν„΄, νŠΈλ Œλ“œ, μ£ΌκΈ°μ„± 등을 뢄석할 수 μžˆμŠ΅λ‹ˆλ‹€.

5. 곡간 데이터 (Spatial Data)

곡간 λ°μ΄ν„°λŠ” 지리 정보λ₯Ό κ°€μ§„ λ°μ΄ν„°λ‘œ, 지도 정보, GPS 데이터, μœ„μ„±μ‚¬μ§„ 등이 곡간 데이터에 ν•΄λ‹Ήλ©λ‹ˆλ‹€. 곡간 λ°μ΄ν„°λŠ” μœ„μΉ˜ 정보λ₯Ό 기반으둜 λ‹€μ–‘ν•œ 뢄석을 μˆ˜ν–‰ν•  수 있으며, 지리 정보 μ‹œμŠ€ν…œ(GIS)을 톡해 μ‹œκ°ν™”ν•˜κ³  뢄석할 수 μžˆμŠ΅λ‹ˆλ‹€.

μœ„μ—μ„œ μ†Œκ°œν•œ λΉ…λ°μ΄ν„°μ˜ μ’…λ₯˜λ“€μ€ 각각 λ‹€λ₯Έ νŠΉμ§•κ³Ό 뢄석 방법을 κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. 데이터 뢄석 ν”„λ‘œμ νŠΈλ₯Ό μˆ˜ν–‰ν•  λ•Œμ—λŠ” μ΄λŸ¬ν•œ μ’…λ₯˜μ— λ§žλŠ” μ μ ˆν•œ 기법과 도ꡬλ₯Ό μ„ νƒν•˜μ—¬ 데이터λ₯Ό λΆ„μ„ν•˜κ³  κ°€μΉ˜λ₯Ό μΆ”μΆœν•˜λŠ” 것이 μ€‘μš”ν•©λ‹ˆλ‹€.