SlideShare a Scribd company logo
Hadoop과 SQL-on-Hadoop
그루터 / 정재화
About me
• Bigdata Platform, Gruter Inc
• Apache Tajo Committer
• jhjung@gruter.com
• http://blrunner.com
• 저서: 시작하세요!하둡 프로그래밍
목차
1. RDBMS의 문제점
2. 하둡이란?
3. HDFS
4. MapReduce
5. SQL-on-Hadoop
1.RDBMS의 문제점
RDBMS
(Relational Database Management system)
: 관계형 데이터베이스 관리 시스템
DB(Database): 데이터 저장소
MS(management system)
: DB에 레코드를 삽입(Insert), 수정(Update), 삭제
(Delete)할 수 있도록 해주는 소프트웨어
 SQL (Structured Query Language) 지원
DROP TABLE table1;
CREATE TABLE table1 (
id int,
name varchar2(255),
score float);
INSERT INTO table1(id, name, score)
VALUES(1, ‘TAJO’, 10.0);
R(Relational)
DBMS의 종류를 의미
여러 개의 테이블을 조합해서 원하는 데이터를 조회
트랜잭션(transaction) 지원
RDBMS란 관계형 데이터베이스를 생성,
수정, 관리할 수 있는 소프트웨어입니다.
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
RDBMS는 데이터를 가져와서,
로직을 수행합니다.
Compute Server
Storage Server Network
1. Copy input data
Compute Server
Storage Server Network
2. Compute data
Compute Server
Storage Server Network
3. Copy output data
문제점은 …
Compute Server
Storage Server BOTTLENECK
또 다른 문제점은…
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
2. 하둡이란?
하둡이란
대용량 데이터를 분산 처리할 수 있는
자바 기반의 오픈소스 프레임워크입니다.
하둡 = 분산 파일 시스템(HDFS)
+ 분산 처리 시스템(MapReduce)
하둡의 주요 특징은 무엇이 있을까요?
데이터가 있는 곳에서 로직을 수행합니다.
Data Locality
하둡은 x86 서버에 설치할 수 있습니다. (vs 유닉스 서버)
하드웨어 장애는 피할 수 없다는 가정하에 설계됐습니다.
Fault Tolerant
서버(노드)를 추가하면, 용량과 컴퓨팅 성능의 선형적
인 확장이 가능합니다.
Scalable
다수의 클러스터를 하나의 스토리지처럼 사용합니다.
Simple
Hdfs://hadoop-cluster/Xyz
하둡의 발자취를 따라가 볼까요?
2003년 구글 GFS 논문 발표
2004년 구글 MapReduce 논문 발표
2005년 더그 커팅이 Nutch 크롤 / 검색 패키지에
구글 논문을 기반으로, HDFS/MapReduce를
추가하면서 시작됩니다.
2006년 더그 커팅이 야후에 입사한 후, 20 노드 클러스터를
셋업합니다.
2008년 야후에서 1000 노드 클러스터를 프러덕션에서 사용
하기 시작합니다.
2008년 하둡이 아파치 탑레벨 프로젝트로 승격됩니다.
2011년 하둡1.0 GA 버전이 릴리즈됩니다.
2013년 하둡2.0 GA 버전이 릴리즈됩니다.
지금까지 들은 이야기로는 꼭…
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
하지만 하둡도 단점이 있습니다.
배치 프로세싱에 최적화되어 있습니다.
하둡 버전과 에코 시스템이 너무 다양합니다. 로그 수
집 하나만 해도 Flume, Chuckwa, Scribe…
설치와 사용이 쉽지 않습니다.
엔지니어를 고용하기 쉽지 않습니다.
3. HDFS
블록1
200MB 파일
 64MB
블록2  64MB
블록3  64MB
파일
저장
HDFS 클러스터
DataNode #3
블록3 블록2 블록4
DataNode #2
블록2 블록1 블록3
DataNode #1
블록1 블록3 블록4
DataNode #4
블록4 블록1 블록2
블록4  8MB
HDFS 파일 복제 구조
HDFS 시스템 구성
Client
DataNode #3
블록3 블록2 블록4
DataNode #2
블록2 블록1 블록3
DataNode #1
블록1 블록3 블록4
DataNode #4
블록4 블록1 블록2
NameNode
하트비트
전송
파일
제어 요청
파일 읽기/쓰기 요청
파일 읽기/쓰기
응답
DataNode 상태
모니터링
메타데이터
Secondary
NameNode
체크포인트
4. MapReduce
사실 MapReduce는 예전부터 있던,
프로그래밍 모델입니다.
MapReduce는 Map과 Reduce라는
두 단계로 데이터를 처리합니다.
Map은 입력 파일을 한 줄씩 읽어서
데이터를 변형(transformation)합니다.
Reduce는 맵의 결과를
집계(aggregation)합니다.
MapReudce의 HelloWorld인
WordCount 예제를 살펴보겠습니다.
read a book
read 1
a 1
book 1
write1
a 1
book 1
read 1
a 1
book 1
write 1
a 1
book 1
read 1
a 2
book 2
write 1
입력 파일 맵 리듀스 출력 파일
write a book
입력 파일의 글자 개수 계산하기…
하둡 MapReduce 프레임워크는 개발자가
MapReduce 프로그램 로직 구현에 집중하
게 해주고, 데이터에 대한 분산과 병렬
처리를 프레임워크가 담당합니다.
마스터 서버
JobTracker
슬레이브 서버
TaskTracker
Task Task
슬레이브 서버
TaskTracker
Task Task
슬레이브 서버
TaskTracker
Task Task
Task 실행
및 모니터링
클라이언트
잡 실행요청 잡 진행 상황 및 완료 결과 공유
Task 실행 요청
하트비트 전송
아직 WordCount만으로는
감이 잘 오지 않기 때문에,
MapReduce를 이용하여,
웹 서비스 접속 통계를 구해보겠습니다.
/authenticate 1
/category/list 1
/category/list 1
/authenticate 1
입력 파일 (아파치 웹 서버 access 로그 파일)
맵
192.168.56.10 - - [11/Nov/2014:22:12:32 +0900] "GET /authenticate HTTP/1.1”
192.168.56.11 - - [11/Nov/2014:22:12:35 +0900] "GET /category/list HTTP/1.1”
192.168.56.12 - - [11/Nov/2014:22:12:38 +0900] "GET /category/list HTTP/1.1”
192.168.56.13 - - [11/Nov/2014:22:13:32 +0900] "GET /authenticate HTTP/1.1”
192.168.56.20 - - [11/Nov/2014:22:14:32 +0900] "GET /mypage HTTP/1.1”
192.168.56.21 - - [11/Nov/2014:22:14:35 +0900] "GET /mypage HTTP/1.1”
192.168.56.22 - - [11/Nov/2014:22:14:36 +0900] "GET /authenticate HTTP/1.1”
192.168.56.23 - - [11/Nov/2014:22:14:40 +0900] "GET /authenticate HTTP/1.1”
/mypage 1
/mypage 1
/authenticate 1
/authenticate 1
192.168.56.10 - - [11/Nov/2014:22:12:32 +0900] "GET /authenticate HTTP/1.1”
192.168.56.11 - - [11/Nov/2014:22:12:35 +0900] "GET /category/list HTTP/1.1”
192.168.56.12 - - [11/Nov/2014:22:12:38 +0900] "GET /category/list HTTP/1.1”
192.168.56.13 - - [11/Nov/2014:22:13:32 +0900] "GET /authenticate HTTP/1.1”
192.168.56.20 - - [11/Nov/2014:22:14:32 +0900] "GET /mypage HTTP/1.1”
192.168.56.21 - - [11/Nov/2014:22:14:35 +0900] "GET /mypage HTTP/1.1”
192.168.56.22 - - [11/Nov/2014:22:14:36 +0900] "GET /authenticate HTTP/1.1”
192.168.56.23 - - [11/Nov/2014:22:14:40 +0900] "GET /authenticate HTTP/1.1
입력 스플릿
1. 스플릿 1. 스플릿
2.레코드
읽기
2.레코드
읽기
Map 단계
/authenticate 1
/category/list 1
/category/list 1
/authenticate 1
맵
/mypage 1
/mypage 1
/authenticate 1
/authenticate 1
/authenticate 1
/authenticate 1
/authenticate 1
/authenticate 1
/category/list 1
/category/list 1
/mypage 1
/mypage 1
파티셔너
파티셔너
파티셔너
/authenticate {1,1,1,1}
/category/list 1 {1,1}
/mypage {1, 1}
리듀스
중간 파일
1. 파티셔닝
2.병합정렬
2.병합정렬
2.병합정렬
1. 파티셔닝
3. 레코드
읽기
3. 레코드
읽기
3. 레코드
읽기
Shuffle 단계
/authenticate {1,1,1,1}
/category/list 1 {1,1}
/mypage {1, 1}
리듀스
/authenticate 4
/category/list 1 2
/mypage 2
출력 파일
1. 출력
1. 출력
1. 출력
Reduce 단계
5. SQL-on-Hadoop
MapReduce에
어떤 문제점이 있을까요?
관계형 처리를 위해 고안된 것이 아니기 때문에, 데이터
처리 모델상의 한계가 있습니다.
Pig, Hive는 MapReduce가 제공하는 기능 이상의 최적
화 불가능합니다.
초기화 및 스케쥴링 시간이 느립니다.
개발 노력이 많이 들어가고, 성능 보장이 어렵습니다.
Ad-hoc 질의에 대한 속도 문제로,DBMS 병행 사용이 불
가피합니다.
SQL-on-Hadoop 이란?
HDFS에 저장된 데이터를 SQL로 처리하는 시스템
탈 MapReduce 모델
다양한 설계 목표 : DataWarehouse VS Query Engine
Function Tajo Hive Impala Spark
Computing 자체
MapReduce or
Tez
자체 자체
Resource
Management
자체 or
YARN
YARN 자체 자체 or YARN
Scheduler FIFO, Fair
FIFO, Fair,
Capacity
FIFO, Fair FIFO, Fair
Storage
HDFS, S3,
HBase
HDFS, HBase, S3 HDFS, HBase
자체 RDD
(HDSF 등)
File Format
CSV, RC,
Parquet,
Avro 등
CSV, RC, ORC,
Parquet, Avro
등
CSV, RC,
Parquet, Avro
등
CSV, RC,
Parquet, Avro
등
Data Model Relational Relational Relational Relational
Query ANSI-SQL HiveQL HiveQL HiveQL
Function Tajo Hive Impala Spark
구현 언어 Java Java C++ Scala
Client
Java API, JDBC,
CLI
CLI, JDBC, ODBC,
Thrift Server
API
CLI, JDBC, ODBC
Shark
JDBC/ODBC,
Scala, Java,
Python API
Query
Latency
Long run,
Interactive
Long run,
(Interactive-
Tez)
Interactive Interactive
컴퓨팅 특징
데이터는 Disk, 중
간 데이터는
Memory/Disk 모
두 사용
데이터는 Disk, 중
간 데이터는
Memory/Disk 모
두 사용
중간 데이터가 In-
Memory
(최근 On-Disk 지
원)
분석 대상 데이터
가 In-Memory
에 로딩
License Apache Apache Apache Apache
Main
Sponsor
Gruter Hortonworks Cloudera Databricks
Apache Tajo 란?
빅데이터 처리를 위한 데이터웨어하우스 시스템입니다.
2014년 아파치 탑레벨 프로젝트에 선정됐습니다.
(http://tajo.apache.org)
표준 SQL과 호환됩니다.
질의 전체를 분산 처리합니다.
Batch 질의와 Interactive Ad-hoc 질의를 모두 지원
합니다. (100ms ~ 수시간)
Q&A
참고 문헌
시작하세요! 하둡 프로그래밍 개정증보판 (위키북스)
하둡 소개 (http://slidesha.re/1AVpyCN)
하둡 좋은 약이지만, 만병 통치약은 아니다
(http://slidesha.re/1wTNv7d)
RDBMS란? (http://bit.ly/1stUhnt)
이미지 출처
http://bit.ly/1AVnJWm
http://bit.ly/1z4Xyfp
http://bit.ly/1BhSZ0J
http://bit.ly/1BhT5FD
http://bit.ly/14UPWim
http://bit.ly/1xk5key
http://bit.ly/1IpQP0Y
http://bit.ly/14uLWEF
http://bit.ly/1CdhZVc
http://bit.ly/1BhU8Wc
http://bit.ly/14uMlH6
http://bit.ly/1stUhnt
http://bit.ly/1y8WVzU
http://bit.ly/1CdhRoy
http://bit.ly/1y8X6et
http://bit.ly/14PTLGc
Ad

More Related Content

What's hot (20)

Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Hadoop Introduction (1.0)
Hadoop Introduction (1.0)
Keeyong Han
 
서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료
Teddy Choi
 
about hadoop yes
about hadoop yesabout hadoop yes
about hadoop yes
Eunsil Yoon
 
HBase 훑어보기
HBase 훑어보기HBase 훑어보기
HBase 훑어보기
beom kyun choi
 
An introduction to hadoop
An introduction to hadoopAn introduction to hadoop
An introduction to hadoop
MinJae Kang
 
하둡 (Hadoop) 및 관련기술 훑어보기
하둡 (Hadoop) 및 관련기술 훑어보기하둡 (Hadoop) 및 관련기술 훑어보기
하둡 (Hadoop) 및 관련기술 훑어보기
beom kyun choi
 
빅데이터 구축 사례
빅데이터 구축 사례빅데이터 구축 사례
빅데이터 구축 사례
Taehyeon Oh
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-HadoopGRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
Gruter
 
하둡완벽가이드 Ch9
하둡완벽가이드 Ch9하둡완벽가이드 Ch9
하둡완벽가이드 Ch9
HyeonSeok Choi
 
Hdfs
HdfsHdfs
Hdfs
Mungyu Choi
 
Hive begins
Hive beginsHive begins
Hive begins
SungMin OH
 
hadoop ch1
hadoop ch1hadoop ch1
hadoop ch1
Mungyu Choi
 
Java 초보자를 위한 hadoop 설정
Java 초보자를 위한 hadoop 설정Java 초보자를 위한 hadoop 설정
Java 초보자를 위한 hadoop 설정
HyeonSeok Choi
 
하둡관리
하둡관리하둡관리
하둡관리
Choonghyun Yang
 
하둡 HDFS 훑어보기
하둡 HDFS 훑어보기하둡 HDFS 훑어보기
하둡 HDFS 훑어보기
beom kyun choi
 
하둡 설치(의사분산모드)
하둡 설치(의사분산모드)하둡 설치(의사분산모드)
하둡 설치(의사분산모드)
Kwangyoung Jeon
 
Realtime Big data Anaytics and Exampes of Daum (2013)
Realtime Big data Anaytics and Exampes of Daum (2013)Realtime Big data Anaytics and Exampes of Daum (2013)
Realtime Big data Anaytics and Exampes of Daum (2013)
Channy Yun
 
Hadoop Introduction (1.0)
Hadoop Introduction (1.0)Hadoop Introduction (1.0)
Hadoop Introduction (1.0)
Keeyong Han
 
서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료서울 하둡 사용자 모임 발표자료
서울 하둡 사용자 모임 발표자료
Teddy Choi
 
about hadoop yes
about hadoop yesabout hadoop yes
about hadoop yes
Eunsil Yoon
 
An introduction to hadoop
An introduction to hadoopAn introduction to hadoop
An introduction to hadoop
MinJae Kang
 
하둡 (Hadoop) 및 관련기술 훑어보기
하둡 (Hadoop) 및 관련기술 훑어보기하둡 (Hadoop) 및 관련기술 훑어보기
하둡 (Hadoop) 및 관련기술 훑어보기
beom kyun choi
 
빅데이터 구축 사례
빅데이터 구축 사례빅데이터 구축 사례
빅데이터 구축 사례
Taehyeon Oh
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-HadoopGRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
Gruter
 
하둡완벽가이드 Ch9
하둡완벽가이드 Ch9하둡완벽가이드 Ch9
하둡완벽가이드 Ch9
HyeonSeok Choi
 
Java 초보자를 위한 hadoop 설정
Java 초보자를 위한 hadoop 설정Java 초보자를 위한 hadoop 설정
Java 초보자를 위한 hadoop 설정
HyeonSeok Choi
 
하둡 HDFS 훑어보기
하둡 HDFS 훑어보기하둡 HDFS 훑어보기
하둡 HDFS 훑어보기
beom kyun choi
 
하둡 설치(의사분산모드)
하둡 설치(의사분산모드)하둡 설치(의사분산모드)
하둡 설치(의사분산모드)
Kwangyoung Jeon
 
Realtime Big data Anaytics and Exampes of Daum (2013)
Realtime Big data Anaytics and Exampes of Daum (2013)Realtime Big data Anaytics and Exampes of Daum (2013)
Realtime Big data Anaytics and Exampes of Daum (2013)
Channy Yun
 

Viewers also liked (16)

BigData, Hadoop과 Node.js
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
고포릿 default
 
빅데이터_ISP수업
빅데이터_ISP수업빅데이터_ISP수업
빅데이터_ISP수업
jrim Choi
 
Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)
Steve Min
 
Cloud Computing v1.0
Cloud Computing v1.0Cloud Computing v1.0
Cloud Computing v1.0
Steve Min
 
[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)
Steve Min
 
Cloud Music v1.0
Cloud Music v1.0Cloud Music v1.0
Cloud Music v1.0
Steve Min
 
Scala overview
Scala overviewScala overview
Scala overview
Steve Min
 
Html5 video
Html5 videoHtml5 video
Html5 video
Steve Min
 
NewSQL Database Overview
NewSQL Database OverviewNewSQL Database Overview
NewSQL Database Overview
Steve Min
 
Apache Htrace overview (20160520)
Apache Htrace overview (20160520)Apache Htrace overview (20160520)
Apache Htrace overview (20160520)
Steve Min
 
vertica_tmp_4.5
vertica_tmp_4.5vertica_tmp_4.5
vertica_tmp_4.5
Hwang Andrew
 
[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)
Steve Min
 
Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)
Steve Min
 
RESTful API Design, Second Edition
RESTful API Design, Second EditionRESTful API Design, Second Edition
RESTful API Design, Second Edition
Apigee | Google Cloud
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
Steve Min
 
Gruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigDataGruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigData
Gruter
 
빅데이터_ISP수업
빅데이터_ISP수업빅데이터_ISP수업
빅데이터_ISP수업
jrim Choi
 
Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)Apache Spark Overview part1 (20161107)
Apache Spark Overview part1 (20161107)
Steve Min
 
Cloud Computing v1.0
Cloud Computing v1.0Cloud Computing v1.0
Cloud Computing v1.0
Steve Min
 
[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)[SSA] 03.newsql database (2014.02.05)
[SSA] 03.newsql database (2014.02.05)
Steve Min
 
Cloud Music v1.0
Cloud Music v1.0Cloud Music v1.0
Cloud Music v1.0
Steve Min
 
Scala overview
Scala overviewScala overview
Scala overview
Steve Min
 
NewSQL Database Overview
NewSQL Database OverviewNewSQL Database Overview
NewSQL Database Overview
Steve Min
 
Apache Htrace overview (20160520)
Apache Htrace overview (20160520)Apache Htrace overview (20160520)
Apache Htrace overview (20160520)
Steve Min
 
[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)[SSA] 04.sql on hadoop(2014.02.05)
[SSA] 04.sql on hadoop(2014.02.05)
Steve Min
 
Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)Apache Spark Overview part2 (20161117)
Apache Spark Overview part2 (20161117)
Steve Min
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
Steve Min
 
Gruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigDataGruter TECHDAY 2014 MelOn BigData
Gruter TECHDAY 2014 MelOn BigData
Gruter
 
Ad

Similar to Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop) (20)

log-monitoring-architecture.pdf
log-monitoring-architecture.pdflog-monitoring-architecture.pdf
log-monitoring-architecture.pdf
Sungkyun Kim
 
[211] HBase 기반 검색 데이터 저장소 (공개용)
[211] HBase 기반 검색 데이터 저장소 (공개용)[211] HBase 기반 검색 데이터 저장소 (공개용)
[211] HBase 기반 검색 데이터 저장소 (공개용)
NAVER D2
 
[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB
[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB
[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB
NAVER D2
 
Hadoop distributed file system rev3
Hadoop distributed file system rev3Hadoop distributed file system rev3
Hadoop distributed file system rev3
Sung-jae Park
 
Hadoop security DeView 2014
Hadoop security DeView 2014Hadoop security DeView 2014
Hadoop security DeView 2014
Gruter
 
2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)
2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)
2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)
JiandSon
 
[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms
[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms
[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms
NAVER D2
 
Spring batch와 함께 하는 TDD
Spring batch와 함께 하는 TDDSpring batch와 함께 하는 TDD
Spring batch와 함께 하는 TDD
Sanghyuk Jung
 
Mongodb2.2와 2.4의 신 기능 소개
Mongodb2.2와 2.4의 신 기능 소개Mongodb2.2와 2.4의 신 기능 소개
Mongodb2.2와 2.4의 신 기능 소개
흥배 최
 
리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API
리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API
리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API
Wooyoung Ko
 
Jco 소셜 빅데이터_20120218
Jco 소셜 빅데이터_20120218Jco 소셜 빅데이터_20120218
Jco 소셜 빅데이터_20120218
Hyoungjun Kim
 
Flamingo 1.2 릴리즈의 지원 기능 정리
Flamingo 1.2 릴리즈의 지원 기능 정리Flamingo 1.2 릴리즈의 지원 기능 정리
Flamingo 1.2 릴리즈의 지원 기능 정리
BYOUNG GON KIM
 
Hadoop Overview 1
Hadoop Overview 1Hadoop Overview 1
Hadoop Overview 1
Kay Kim
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
BOAZ Bigdata
 
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoExpanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with Tajo
Gruter
 
HTTP/3 시대의 웹 성능 최적화 기술 이해하기
HTTP/3 시대의 웹 성능 최적화 기술 이해하기HTTP/3 시대의 웹 성능 최적화 기술 이해하기
HTTP/3 시대의 웹 성능 최적화 기술 이해하기
SangJin Kang
 
Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드
Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드
Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드
cranbe95
 
DBMS 아키텍처
DBMS 아키텍처DBMS 아키텍처
DBMS 아키텍처
HaksunLEE6
 
7가지 동시성 모델 람다아키텍처
7가지 동시성 모델  람다아키텍처7가지 동시성 모델  람다아키텍처
7가지 동시성 모델 람다아키텍처
Sunggon Song
 
log-monitoring-architecture.pdf
log-monitoring-architecture.pdflog-monitoring-architecture.pdf
log-monitoring-architecture.pdf
Sungkyun Kim
 
[211] HBase 기반 검색 데이터 저장소 (공개용)
[211] HBase 기반 검색 데이터 저장소 (공개용)[211] HBase 기반 검색 데이터 저장소 (공개용)
[211] HBase 기반 검색 데이터 저장소 (공개용)
NAVER D2
 
[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB
[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB
[124]네이버에서 사용되는 여러가지 Data Platform, 그리고 MongoDB
NAVER D2
 
Hadoop distributed file system rev3
Hadoop distributed file system rev3Hadoop distributed file system rev3
Hadoop distributed file system rev3
Sung-jae Park
 
Hadoop security DeView 2014
Hadoop security DeView 2014Hadoop security DeView 2014
Hadoop security DeView 2014
Gruter
 
2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)
2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)
2013.02.02 지앤선 테크니컬 세미나 - 하둡으로 배우는 대용량 데이터 분산처리 기술(이현남)
JiandSon
 
[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms
[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms
[223]rye, 샤딩을 지원하는 오픈소스 관계형 dbms
NAVER D2
 
Spring batch와 함께 하는 TDD
Spring batch와 함께 하는 TDDSpring batch와 함께 하는 TDD
Spring batch와 함께 하는 TDD
Sanghyuk Jung
 
Mongodb2.2와 2.4의 신 기능 소개
Mongodb2.2와 2.4의 신 기능 소개Mongodb2.2와 2.4의 신 기능 소개
Mongodb2.2와 2.4의 신 기능 소개
흥배 최
 
리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API
리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API
리스펙토링 세미나 - 웹 브라우저 동작 개념, Node.js를 통한 서버 이해, REST API
Wooyoung Ko
 
Jco 소셜 빅데이터_20120218
Jco 소셜 빅데이터_20120218Jco 소셜 빅데이터_20120218
Jco 소셜 빅데이터_20120218
Hyoungjun Kim
 
Flamingo 1.2 릴리즈의 지원 기능 정리
Flamingo 1.2 릴리즈의 지원 기능 정리Flamingo 1.2 릴리즈의 지원 기능 정리
Flamingo 1.2 릴리즈의 지원 기능 정리
BYOUNG GON KIM
 
Hadoop Overview 1
Hadoop Overview 1Hadoop Overview 1
Hadoop Overview 1
Kay Kim
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [하둡메이트 팀] : 하둡 설정 고도화 및 맵리듀스 모니터링
BOAZ Bigdata
 
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with TajoExpanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with Tajo
Gruter
 
HTTP/3 시대의 웹 성능 최적화 기술 이해하기
HTTP/3 시대의 웹 성능 최적화 기술 이해하기HTTP/3 시대의 웹 성능 최적화 기술 이해하기
HTTP/3 시대의 웹 성능 최적화 기술 이해하기
SangJin Kang
 
Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드
Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드
Ndc2011 성능 향상을_위한_데이터베이스_아키텍쳐_구축_및_개발_가이드
cranbe95
 
DBMS 아키텍처
DBMS 아키텍처DBMS 아키텍처
DBMS 아키텍처
HaksunLEE6
 
7가지 동시성 모델 람다아키텍처
7가지 동시성 모델  람다아키텍처7가지 동시성 모델  람다아키텍처
7가지 동시성 모델 람다아키텍처
Sunggon Song
 
Ad

Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)