arch.ruaniz.com

Scott.Lee, Application Architect

Hadoop ecosystem : Introduction

Created 목요일 20 2월 2017 Hadoop Ecosystem is a platform or a suite which provides various services to solve the big data problems.

1. Introduce

Hadoop 이란?
하둡 소프트웨어 라이브러리는 간단한 프로그래밍 모델을 사용하여 여러대의 컴퓨터 클러스터에서 대규모 데이터 세트를 분산 처리 할 수있게 해주는 프레임워크 이다.
단일 서버에서 수천대의 머신으로 확장 할 수 있도록 설계되었다.
일반적으로 하둡파일시스템(HDFS)과 맵리듀스(MapReduce)프레임워크로 시작되었으나, 여러 데이터저장, 실행엔진, 프로그래밍 및 데이터처리 같은 하둡 생태계 전반을 포함하는 의미로 확장 발전 되었다.

출처:클라우데라 (하둡 생태계)

2. Ecosystem

분산 코디네이터

분산 리소스관리

데이터저장

데이터수집

데이터처리

9. Appendix

reference site