0% found this document useful (0 votes)
2K views

2018년 중소기업 기술로드맵 - 02 빅데이터 PDF

This document discusses big data strategies in Korea. It provides an overview of big data, including its definition as large, diverse datasets that are difficult to process using traditional database management and analysis systems. It also discusses the scope and classification of big data. Specifically, it notes that big data refers to extremely large datasets, ranging from terabytes to exabytes in size, and includes diverse data types from sources like server logs, social networks, IoT sensors, and more. The document then analyzes policies, ecosystems, technologies, and provides strategies for small-and-medium enterprises to respond to the big data market. It also outlines several potential big data projects for development.

Uploaded by

ChangwooLee
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
2K views

2018년 중소기업 기술로드맵 - 02 빅데이터 PDF

This document discusses big data strategies in Korea. It provides an overview of big data, including its definition as large, diverse datasets that are difficult to process using traditional database management and analysis systems. It also discusses the scope and classification of big data. Specifically, it notes that big data refers to extremely large datasets, ranging from terabytes to exabytes in size, and includes diverse data types from sources like server logs, social networks, IoT sensors, and more. The document then analyzes policies, ecosystems, technologies, and provides strategies for small-and-medium enterprises to respond to the big data market. It also outlines several potential big data projects for development.

Uploaded by

ChangwooLee
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 289

빅데이터

전략 분야
빅데이터

1. 개요 ········································································································································· 1
2. 정책 분석 ······························································································································· 4
3. 생태계 분석 ···························································································································· 9
4. 기술 분석 ····························································································································· 20
5. 중소기업 시장대응전략 도출 ····························································································· 31
6. 전략품목 ······························································································································· 32

전략 품목
빅데이터 내 데이터 품질 검사 자동화 시스템

1. 개요 ······································································································································ 38
2. 외부환경 분석 ····················································································································· 42
3. 기술 분석 ····························································································································· 51
4. 연구개발 네트워크 ·············································································································· 68
5. 기술개발로드맵 ···················································································································· 71

자연어 처리기반 텍스트 마이닝

1. 개요 ······································································································································ 80
2. 외부환경 분석 ····················································································································· 85
3. 기술 분석 ····························································································································· 92
4. 연구개발 네트워크 ············································································································ 104
5. 기술개발로드맵 ················································································································· 107
유통/물류 빅데이터 구축 및 분석 시스템

1. 개요 ···································································································································· 116
2. 외부환경 분석 ··················································································································· 120
3. 기술 분석 ··························································································································· 127
4. 연구개발 네트워크 ············································································································ 149
5. 기술개발로드맵 ················································································································· 153

빅데이터 분석 및 시각화 플랫폼

1. 개요 ···································································································································· 162
2. 외부환경 분석 ··················································································································· 166
3. 기술 분석 ··························································································································· 173
4. 연구개발 네트워크 ············································································································ 190
5. 기술개발로드맵 ················································································································· 196

데이터 3D 변환 시각화 도구

1. 개요 ···································································································································· 206
2. 외부환경 분석 ··················································································································· 209
3. 기술 분석 ··························································································································· 216
4. 연구개발 네트워크 ············································································································ 235
5. 기술개발로드맵 ················································································································· 237

감성정보 분석 서비스

1. 개요 ···································································································································· 245
2. 외부환경 분석 ··················································································································· 248
3. 기술 분석 ··························································································································· 254
4. 연구개발 네트워크 ············································································································ 273
5. 기술개발로드맵 ················································································································· 275
전략분야 현황분석

빅데이터
빅데이터

빅데이터

1. 개요

가. 정의

 빅데이터(Bigdata)란 기존 데이터베이스로 처리할 수 있는 역량을 넘어서는 초대용량(테라바이트 또는


페타바이트급)의 정형, 비정형 데이터를 생성, 수집, 저장, 관리 및 분석하여 가치를 추출하고 지능화
서비스의 기반을 지원하는 기술

 빅데이터는 다양한 종류의 대규모 데이터로부터 효율적으로 가치를 추출하고, 데이터의


초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처로 이전에는 거대한
데이터 집합 자체만을 의미하였으나, 점차 그 범위가 확대되어, 도구, 플랫폼, 분석 기법
등도 포함

 빅데이터에 대한 정의는 다양하게 설정되고 있으나, 공통된 정의를 규정짓는 특징으로는


양(Volume), 속도(Velocity), 다양성(Variety), 가치(Value) 등이 있으며, 더 많은 특징들이
도출 중

나. 범위 및 분류

(1) 범위

 데이터와 빅데이터

▪ 현실 세계의 사물에 대한 사실을 표현한 것을 데이터(data)라고 하며 보통 스프레드시트나 관계


데이터베이스에 저장 처리하여 의사결정을 위한 정보를 추출함

▪ 대규모로 수집 축적된 데이터를 빅데이터(bigdata)라고 하며 테라바이트, 페타바이트, 엑사바이트


이상의 크기를 가지고 있음

▪ 빅데이터는 서버 로그, 데이터베이스 로그, 검색 엔진 데이터, 소셜 네트워크 데이터, 사용자 생성


콘텐츠(UCC: user created contents), 교통량 관측 데이터, IoT 센서 데이터 등의 새로운 유형의
방대한 크기의 데이터의 폭발적 증대에 따라 보편화되고 있고, 기존의 소규모 데이터와는 구분되는
저장, 처리, 분석 기법이 대두

▪ 데이터를 분석 가공하여 얻은 가치가 있는 패턴 또는 결과를 지식(knowledge)이라고 하며, 이러한


지식을 얻는 과정을 데이터 마이닝(data mining) 또는 지식 탐사(knowledge discovery)라고 함

▪ 사람이 가지고 있는 일반적 지식을 노드와 링크 구조의 시맨틱 네트워크(semantic network)로 표현한
것도 지식(knowledge)이라고 하며, 최근에는 온톨로지(ontology) 형태로 표현

1
1
전략분야 현황분석

 빅데이터는 데이터 형태 또는 특성에 따라 정형 데이터, 비정형 데이터, 반구조 데이터,


스트림 데이터, 그래프 데이터 등으로 구분 가능

▪ 정형 데이터(formatted data)는 고정된 크기의 필드에 저장된 숫자, 문자 형태의 데이터로 관계


데이터베이스(RDB: relational database), 스프레드시트(spreadsheet)에 저장된 데이터 등을 예로 들 수 있음

▪ 정형 데이터의 경우에는 데이터베이스의 스키마에 의해 수집되는 정보의 형태가 정해져 있어서


한정된 데이터들 속에서 유의미한 패턴이나 결과를 도출해야 하는 한계가 있지만, 비교적 수월하게
분석이 가능하다는 장점이 있음

- 정형 데이터의 예로는 지역 인구 통계 데이터, 의학 실험 결과 데이터, 고객 정보, 상품 판매 정보


등을 들 수 있음

▪ 비정형 데이터(unformatted data)는 고정된 크기의 필드에 저장되어 있지 않은 텍스트, 이미지,


영상, 동영상 등의 데이터를 의미하며 페이스북, 트위터, 유튜브의 영상 및 이미지, 음원 파일, 워드
문서, 아래한글 문서, PDF 문서 등을 예로 들 수 있음

- 비정형 데이터는 페이스북, 트위터, 인스타그램, 네이버, 다음 등의 SNS(Social Networking


Service) 서비스를 통해 인터넷 사용자들이 생성하는 사용자 생성 콘텐츠에 의해 폭발적으로 증가

▪ 반-구조 데이터(semi-structured data)는 정형 데이터와 같이 고정된 필드에 저장된 데이터는


아니지만 복잡한 데이터의 구조 정보, 메타데이터 및 스키마를 포함하는 데이터

- 반-구조 데이터의 예로는 XML(eXtensible Markup Language), JSON(JavaScript Object


Notation), HTML(HyperText Markup Language) 문서 등을 들 수 있으며, 주로 태그(tag)를
이용해 문서의 구조를 반영
- HTML의 경우 웹 문서를 보다 쉽게 탐색하고 정확하게 해석하여 의미 있는 정보를 추출하기 위해
HTML5로 발전하였고, HTML5의 경우 머리글 바닥글, 탐색줄, 사이드바와 같은 문서의 의미를 위한
시맨틱 태그(semantic tag)들이 추가되며 문서의 구조, 영역, 범위를 명확히 함으로서 웹 페이지의
전체 또는 일부분에 의미를 부여할 수 있게 되어 검색 시 보다 정확한 정보를 추출할 수 있음

▪ 페이스북, 트위터, 카카오톡, 라인 등의 SNS를 통해 생성되는 데이터들은 트윗/친구 관계 등을 통해


서로 연결되며, 이렇게 노드와 링크 형태로 연결되는 데이터를 그래프 데이터(graph data)라고 함

▪ 온도 센서, 습도 센서, 기계에 부착된 센서 등의 다양한 IoT 센서, CCTV 등에 의해 연속적으로


발생하는 방대한 양의 데이터, 즉 스트림 데이터(stream data)도 대표적인 빅데이터로 등장하고 있음

▪ 정형 데이터가 아닌 다양한 형태의 데이터들은 분석을 위해서 비교적 복잡하고 수준 높은 처리


기술을 필요로 하지만 적용된 분석 방법에 따라 다양하고 유의미한 지식을 창출 가능

2
2
빅데이터

(2) 분류

 데이터 수집·저장·처리 등 빅데이터 플랫폼 운영기술과 빅데이터 분석·예측 기술을 활용하여


빅데이터를 활용할 수 있도록 가공하거나, 분석한 데이터를 시각화하여 새로운 통찰력과
비즈니스 가치를 창출하는 빅데이터 분석·활용 기술로 분류 가능

[ 빅데이터 분류 ]

기술 내용
•빅데이터 수집/정제/융합/가공
•실시간 ETL/ELT
•데이터 생성/증강
•민간정보 은닉, 비식별화 및 필터링
빅데이터 수집/유통
•센서/머신 데이터 수집 및 정제
•웹/소셜 데이터 수집 및 정제
•데이터 품질 및 생명주기 관리
•데이터 유통 및 공유

•대규모 데이터 분산 저장
•대규모 데이터 분산 처리
•복합 스트림/이벤트 데이터 실시간 처리
빅데이터 저장/처리/관리 •인메모리 기반 실시간 데이터 관리
•운영/분석 통합형 데이터 관리
•데이터 큐레이션 자동화
•가상 데이터맵 관리

•통계 분석 및 데이터 마이닝


•대규모 기계학습/딥러닝
•모델링 및 시뮬레이션
•추론 및 예측 분석
빅데이터 분석/예측
•고속 데이터 스트림 실시간 분석
•계층형 협업 분석
•지시적 분석
•이상치 검출
•데이터 시각화 구성 (인포그래픽스)
•데이터 그래픽 프로그래밍 도구
•소셜 데이터 분석 및 응용
빅데이터 활용/시각화
•자동화 시설 오류 예측 및 최적화
•이슈 탐지 및 트렌드 예측
•빅데이터 서비스

3
3
전략분야 현황분석

2. 정책 분석

가. 해외 정책동향

◎ 미국

 빅데이터 R&D전략 계획 [BDIWG, ‘16.5]


▪ 범부처 차원에서 빅데이터 7대 R&D 전략과 18개 세부과제를 제시하여 미래 빅데이터 환경 변화에 대응

▪ 차세대 빅데이터 기술 역량 확보, 신뢰성 탐구 및 획기적인 발견을 위한 빅데이터 R&D 지원,


빅데이터 혁신이 가능한 사이버 인프라 연구 향상 등이 7대 전략으로 선정

▪ 빅데이터 개술 개발, 의사결정 도구 R&D 지원, 빅데이터 인프라 강화, 개인정보 보호와 윤리적
접근 추구, 빅데이터 인력 확충과 협력 생태계 구축이 주요 내용

▪ 빅데이터 R&D전략 계획 후속조치로 빅데이터 지역 혁신 허브화 추진을 통해 사회문제 해결 연구에 활용

 ‘데이터 혁신센터’ 창설과 데이터 혁신 촉진을 위해 의회 차원의 논의가 필요한 입법관련


12개 권고안 발표 [‘15.5]

▪ 정부 데이터 개방 법제화, 금융/해안/지리공간/교육 등의 공공 데이터 관리 향상 등이 포함

 과학기술정책국 빅데이터 R&D 이니셔티브 [OSTP, ‘12.3]


▪ 대통령 과학기술 자문위원회(PCAST)가 빅데이터 관련 기술 투자의 필요성을 역설한 것으로
시작하여 빅데이터 기술 개발·활용, 빅데이터 전문인력 양성을 주요 목적으로 발표

▪ 방대하게 축적된 디지털 데이터에 대한 접근 및 수집·관리에 필요한 기술 및 방법 전반에 대한 발전 추진

 열린정부 지침 DATA.GOV [’09]

▪ 오픈데이터 개방 포털을 통해 공공 데이터를 개방

▪ ‘17년 4월까지 19만 2,322개의 데이터 세트가 제공되고 있으며, 이는 농업·기후·소비·교육·에너지·


재정·의료·공공안전·과학기술·해양 등 크게 14개 분야로 분류·제공 되고 있음

▪ 데이터 활용을 위한 소프트웨어 애플리케이션을 함께 제공하여 누구나 쉽게 데이터를 활용해


부가가치 창출에 기여할 수 있는 환경을 구축

4
4
빅데이터

◎ 유럽

 데이터 경제 육성 전략 [’17]

▪ 유럽 내 통합 디지털 플랫폼(Digital European)을 기반으로 데이터 접근 분석 활용 강화를 통한


새로운 데이터 비즈니스 창출

▪ 데이터 접근권 강화, 기술 표준 제정, 법적 책임 명확화. 특히, 개인 정보보호규정(GDPR) 제정으로


데이터 삭제권, 정보 이동권, 프로파일링에 대한 권리 등 개인정보 보호 강화와 합법적 데이터 유통
동시 추구

 유럽 내 47개 주요 교통, 물류, IT 관련기업 및 기관으로 구성된 컨소시엄이 30개월 간


1,870억 유로의 예산으로 빅데이터 기반의 Transforming Transport 프로젝트를 추진 [‘17.1]

 유럽연합은 ‘15년부터 빅데이터에 대해 향후 5년간 산업 컨소시엄의 20억 유로와 공적 자금


5억을 합친 25억 유로(약 3조 3,870억 원)을 투자

▪ 아토스(Atos), IBM, 노키아, 솔루션앤테크웍스(Nokia Solution and Networks, Microsoft(N),


오렌지(Orange Telecom), SAP, Siemens 등의 기업들과 연구기관들 주도로 민관협력을 추진 중

◎ 중국

 빅데이터산업 발전 규획 (‘16~’20) [’17]


▪ 이미 일상생활에서 광범위하게 활용되는 빅데이터를 제조업 분야로 확대하며, 특히 생산모델 고도화
및 스마트 공장을 추진하는 과정에 빅데이터 응용 필요성을 강조

▪ 빅데이터를 중국의 인구·경제규모를 활용한 전 산업 발전 기회로 인식하고 10개 이상 글로벌


빅데이터 선도기업, 500개 응용서비스 기업 육성 목표 추진

▪ ‘20년까지 빅데이터 관련 제품 및 서비스업 매출을 1조 위안까지 확대하겠다는 목표 제시

▪ 데이터 개방 확대, 플랫폼·오픈소스 기술 지원, 빅데이터 전문 SW 수준 향상, 전문인재의 공급,


데이터거래소 등 생태계 조성

▪ 정확한 고객 수요 파악과 분석을 통해 R&D의 효율성을 높이는 한편 조립·생산 라인의 경쟁력을


높임으로써 생산예측과 관리를 강화하고 경영 효율화를 제고할 수 있을 것으로 기대

 ‘베이징시 빅데이터 및 클라우드 컴퓨팅 발전 행동계획’ 발표 [‘16]


▪ 향후 5년간 정부 데이터의 민간 개방 확대, 핵심기술 개발 및 응용 확대 등을 통한 빅데이터 산업
육성 계획, 특히 경제·사업의 광범위한 영역에서의 빅데이터 응용 계획 제시

5
5
전략분야 현황분석

 빅데이터의 응용 기술 표준 및 통계 표준 제정

▪ 통계국은 국가통계국과 텐센트 등 6개 기업 공동으로 연구를 진행하여 정부 통계 데이터를


이용하여 빅데이터 기반 공동 수집·처리·분석·탐색·발표 기술 개발 표준과 통계 표준을 제정

 빅데이터 발전 촉진을 위한 행동 요강 [국무원, ‘15.8]

▪ 리커창 총리 주재로 열린 국무원 상무회의에서 빅데이터 개발 및 응용을 통한 대중창업, 만민혁신


추진 및 경제성장을 위한 신동력 개발, 정부의 관리감독 서비스 개선 추진

▪ 본 행동요강을 통해 관련 산업의 법률·법규 확립 및 정부의 데이터 개방 등 구체적인 목표 제시

◎ 일본

 정부 주도로 정부, 지자체, 민간 보유의 모든 데이터를 정리하여 개방할 계획 발표 [‘18]

▪ ‘20년에 포털 사이트의 형태로 공개할 예정으로, 취합한 빅데이터 자료들을 모두 데이터베이스화 한


후 일반에게 공개하여 다방면에서 인공지능을 활용한 분석자료로 사용할 예정

▪ 국가가 보유한 각종 통계데이터, 지도데이터, 기상데이터와 민간에서 보유한 도로 상황 및 교통량과


관련된 데이터, 작물의 재배 상황 정보, 위치정보 등 광범위한 분야의 정보를 취합하는 것이 목표

▪ 인공지능 분석이 용이하도록 행정용어에서부터 산업용어까지 빅데이터 내에서의 용어를 통일·정리하여


취합할 예정

▪ G20 정상회의에서 데이터베이스 구축에 미국과 유럽의 참가를 요청해 10억 명 이상의 정보가
집적된 초국가적인 데이터베이스 Pool 구축을 최종 목표로 함

▪ ‘14년도부터 추진한 공공기관의 데이터 공개를 통한 정부의 투명성, 경제 활성화, 공공서비스 향상


목적의 ‘빅데이터 활용을 통한 Open Data 정책’의 연장선으로 파악

 미래투자전략 2017-Society 5.0의 실현을 위한 개혁 [총무성, ‘17.6]


▪ 빅데이터를 ICT 융합 활성화 촉매로 활용하기 위해 이노베이션·벤처를 탄생시키는 선순환 시스템을
구축하여 빅데이터 산업 집중 투자를 추진

▪ 건강수명연장, 이동혁명실현, 공급망 첨단화, 쾌적한 도시만들기, 핀테크의 5대 신성장 전략분야에


데이터를 활용한 기반구축

▪ 새로운 사회의 인프라로서 ‘데이터기반(현실데이터 플랫폼)’을 구축하고 데이터 활용을 향한


제도정비, 교육·인재 역량강화, 혁신벤처 선순환 시스템 구축

 관민데이터 활용 추진 기본법 제정 [’16.12]


▪ 관민 데이터 활용 추진 기본법을 기반으로 데이터 유통·활용에 대한 대책 구체화

6
6
빅데이터

나. 국내 정책 동향

 데이터 산업 활성화 전략: I-Korea 4.0 데이터 분야 계획 I-Data [관계부처 합동, ‘18.6]

▪ 4차 산업혁명 시대 데이터가 모든 산업의 발전과 새로운 가치 창출의 촉매 역할을 하는 ‘데이터


경제(Data Economy)’로의 패러다임 전환에 입각하여 데이터 이용제도 패러다임 전환, 데이터
가치사슬 전방위 확산, 글로벌 데이터산업 육성기반 조성 등을 추진과제로 발표

▪ 공공데이터의 원칙적 개방(국가안보·개인정보 제외) 등을 통해 공공부문 핵심 데이터 (통계·연구·참조표준


등) 구축 개방 전면화

▪ 데이터의 효율적인 저장 관리를 위한 클라우드 본격 확산 및 데이터 유통 촉진을 위해 민간 공공을


연계한 개방형 데이터 기반 구축하고 ‘22년까지 중소 벤처기업 1만개 이상에 클라우드 도입을 지원

▪ 빅데이터 산업이 4차 산업혁명을 선도하는 핵심 성장주체로 거듭날 수 있도록 4차 산업혁명


요소기술 융합, 분석 전문인력 양성, 컴퓨팅파워 기반 기업성장 인프라 지원 등을 아우르는 역동적
산업 생태계 조성

- 빅데이터 전문기업 성장 지원으로 데이터 강소기업 100개社를 육성하고 빅데이터 개발에 필수적인
컴퓨팅 자원, 데이터셋 등이 집적된 판교 글로벌 ICT 혁신 클러스터 지속 고도화 및 활용 지원
- K-ICT빅데이터센터, K-ICT클라우드혁신센터, 글로벌 IoT시험인증센터, 정보보호클러스터,
HPC이노베이션허브 등, 세계 최고수준의 성능을 갖춘 초고성능컴퓨터 5호기와도 연계

 대통령 직속 4차 산업혁명위원회에서는 데이터 산업 활성화 전략을 발표하여 개인정보


보호와 활용의 균형 및 데이터 경제 활성화 추진 [‘18]
▪ 정보주체인 개인이 데이터 통제·활용권을 가지게 하고, 개인정보의 안전한 활용을 위한 법제화·안심존
구축·신기술 적용 등을 지원하며, 데이터 구축·개방, 저장·유통, 분석·활용의 빅데이터 활용 전과종의
지원 체계를 마련

- 데이터 주권을 강화하여 개인정보가 해외에서도 안전하게 보호되도록 국외 이전 중단 명령권, 국외


재이전시 보호조치 의무 신설 등 제도를 정비
- 데이터 가치 사슬 전주기 혁신을 위하여 데이터 구축 개방(4차 산업혁명 핵심데이터 등, ~‘22) →
저장 유통(데이터 거래의 비즈니스화, ’18~) → 분석 활용(산업·사회 혁신 활용, ‘18~) 등 全과정에
걸쳐 실제데이터 기반 영역별(의료·교통 등) 국가 빅데이터 지원체계 마련

▪ 빅데이터 핵심기술 확보 및 전문인력 확보를 통한 기반 조성 목적

▪ 국회 4차 산업혁명특별위원회는 이와 관련하여, 개인정보보호법과 정보통신망법, 신용정보법 등


중복 조항 정비 및 강력한 사후규제를 도입하여 가공에 대한 활용의 안전성을 보장하도록 입법
권고안 발표

 ‘4차 산업혁명 대응계획’은 지능화 기반 산업 및 사회·공공 분야에 빅데이터 기술을 활용하여


지능화 혁신을 이루는 것으로 목적으로 함 [‘17,11]
▪ 의료기관 간 진료정보 전자교류 전국 확대 및 보건의료 데이터 구축·개방을 추진하여 데이터 인프라
확보, 신약개발주기 및 비용 단축을 위한 빅데이터 활용 등을 추진

▪ 제조업, 에너지, 농수산업, 스마트시티 등의 분야에 빅데이터 기술을 활용하거나, 빅데이터를 구축하여 지능화 혁신 추진

7
7
전략분야 현황분석

 정부의 4차 산업혁명 정책의 핵심인 빅데이터 산업 활성화를 체계적으로 지원하기 위해


‘민관합동 빅데이터 TF’ 회의 개최 [‘17.8]

▪ 민관합동 빅데이터 TF는 빅데이터 업무 추진현황을 종합적으로 파악하고, 공공과 민간 빅데이터


활성화를 지원하기 위해 출범

▪ 신정부 출범에 따라 4차 산업혁명을 지원하기 위해 부처별 빅데이터 추진방향과 계획을 공유하고,


빅데이터 산업 활성화를 위한 각종 진흥정책과 규제개선 필요 사항에 관해 논의

▪ 행정안전부는 2021년까지 112개 분야 지능·융합형 공공데이터 구축·개방을 확대하고 인공지능


의료영상 등 15개 분야 국가데이터 개방을 추진하는 등 민간에 필요한 새로운 공공데이터의
부문별 개방을 추진하고 있음

▪ 창업 콜라보 프로젝트, 창업 경진대회 등을 통해 공공데이터 활용기업을 육성하고 창업을


지원함으로써 새로운 사업모델 발굴 등을 위한 공공데이터 활용 확대

▪ 공공데이터 활용 민간 주도 협의체인 ‘오픈데이터포럼’을 운영하여 사회현안에 관한 유의미한


데이터를 상시 발굴하고, 사회문제 해결을 지원할 예정

▪ 고품질의 데이터 개방과 과학적인 정책결정 지원을 위하여, 데이터 관리체계 및 빅데이터 분석지원
등을 중점적으로 추진할 계획 발표

 빅데이터 분야 개인정보 규제혁신 방안 마련 및 빅데이터 분석 활용을 위한 ‘개인정보비식별 조치


가이드라인 발표’ [관계부처 합동, ‘16]

▪ 세계 최고 수준의 IT강국으로 자리매김한 우리나라에 빅데이터, IoT(사물인터넷) 등 새로운 IT


기술과 융합산업의 출현 또 다른 도약의 기회이나, 기술 활용과정에서 발생할 수 있는 개인정보
침해 우려가 존재

▪ 국무조정실, 행정안전부, 방송통신위원회, 금융위원회, 과학기술정보통신부, 보건복지부 등


관계부처가 합동으로 현행 개인정보 보호 법령의 틀 내에서 빅데이터가 안전하게 활용될 수
있도록 하는데 필요한 개인정보의 비식별 조치 기준과 비식별 정보의 활용 범위 등을 명확히
제시하여 기업투자와 산업 발전을 도모함과 동시에 국민의 개인정보인권 보호 목적

▪ 정보주체를 알아볼 수 없도록 비식별 조치를 적정하게 한 비식별 정보는 개인정보가 아닌 것으로
추정하여 빅데이터 분석에 폭 넓게 활용 가능하도록 허용

8
8
빅데이터

3. 생태계 분석

가. 시장 동향 및 전망

(1) 세계시장

 빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 2022년
900억 달러로 성장할 전망(’17, IDC)

[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 53,400 59,040 65,450 72,890 81,380 90,006 10.6

*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 세계 시장은 ‘23년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)

▪ 빅데이터 선진개발국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,


민간 데이터 시장에서는 중개업이 활성화되어 있음

▪ 미국의 경우 2016년 기준 데이터 브로커 기업은 약 650억 개로 150억 달러 규모의 시장 형성

9
9
전략분야 현황분석

 IoT(사물인터넷)의 상용화로, 대용량 실시간 데이터를 빠르게 처리·분석할 수 있는 빅데이터


기술개발이 활발하게 이뤄지고 있음

▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 2020년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정

 빅데이터 세계 시장은 빅데이터, 인프라, 빅데이터 소프트웨어, 빅데이터 서비스 시장으로


세분화 할 수 있으며, 빅데이터 소프트웨어 및 서비스에 대한 전 세계 빅데이터 매출액은
2018년 420억 달러에서 2027년 1,030억 달러로 증가
▪ 시장 변화는 연간 약 10.48%의 성장률을 보일 것으로 예측되며, Wikibon은 전세계 빅데이터
시장이 ‘17년과 ’27년에 각각 350억 달러, 1,030억 달러를 달성하여 연평균 11.4%의 성장률을
보일 것으로 추정

▪ ‘16년 기준, 빅데이터 인프라, 소프트웨어, 서비스 부문은 각각 51.4%, 22.4%, 26.2%의
비중으로 시장 형성

▪ 빅데이터 시장 중 인프라 시장의 점유율이 가장 높으며, 가장 높은 성장세를 보일 전망

▪ 인프라 시장의 경우, ’17년 177억 달러 규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장
형성 예측

[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ’17 ’18 ’19 ’20 ’21 ’22 CAGR(%)

인프라 17,700 21,700 26,000 30,700 36,200 43,900 19.60

소프트웨어 7,400 9,000 10,600 12,300 14,300 16,200 16.61

서비스 8,800 10,800 12,600 14,700 17,700 20,500 17.05

합계 33,900 41,500 49,200 57,700 68,200 80,600 18.26

*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, ‘19년 이후는 추정 치

 세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순

▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)

 빅데이터 애플리케이션 및 분석 시장은 ‘26년 194억 달러 규모로 성장 예상


▪ 빅데이터 애플리케이션 및 분석 시장은 2018년 50억 달러에서 2026년 194억 달러로 크게 증가하여
연평균 15.49%의 성장률을 달성할 전망

▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, ‘18년 165억 달러에서 ‘26년
213억 달러로 성장

10
10
빅데이터

*출처: Wikibon and reported by Statista, NIA 2018.6 재인용

[ 빅데이터 품목별 세계 시장 규모 및 전망]

 Hadoop 및 빅데이터 시장은 2022년 993억 달러 규모로 연평균 28.5% 성장

▪ ‘17년에는 171억 달러 수준에 그쳤으나, ’18년에는 243억 달러, ‘19년에는 346억 달러로 크게
성장할 것으로 전망되며, 성장추세는 매년 지속적이거나 더 큰 성장세를 보일 것으로 예측

▪ ‘21년에서 ’22년, 1년 간 300억 달러 규모 증가로 가장 큰 성장이 예상

[ Hadoop 및 빅데이터 시장 성장 추이 2017-2022]

120
99.3
100

80 69.8


60 49.1
달 34.6
40

24.3
17.1
20

0
2017 2018 2019 2020 2021 2022

*출처: Strategy MRC and reported by Statista, NIA 2018.6 재인용

11
11
전략분야 현황분석

 비관계형 분석 데이터 저장소 분야는 ‘15년과 ’20년 사이에 연평균 38.6%의 성장률로
빅데이터 분야에서 가장 빠르게 성장

▪ 인지적 소프트웨어 플랫폼(23.3%의 연평균 성장률)과 콘텐츠 분석(17.3)는 ‘15년에서 ’20년 사이


가장 빠르게 성장하는 상위 3대 기술에 해당할 것으로 전망

[ 2015-2020년의 성장세 높은 분야 ­ 연평균 성장률 순]

50
38.6
연 40

30 23.3

17.3 16.6
20 14.6
성 9.3
장 10

0
비관계형 인지적 콘텐츠 분석 탐색 시스템 IT 서비스 기타
% 분석 소프트웨어
데이터 플랫폼
저장소

*출처: Strategy MRC and reported by Statista, NIA 2018.6 재인용

 빅데이터 산업의 급성장과 함께 전 세계적 투자 붐 조성 중

▪ 문서 DB인 Mongo DB가 231억 달러, Hadoop 플랫폼을 제공하는 Cloudera가 141억 달러의
투자를 유치하는 등 신생 빅데이터 업체 중 상위 4개의 확보투자액이 ’14년 말 기준 약 700억
달러 기록

▪ 마스터카드는 클라우드 기반 데이터 분석 업체인 Applied Predictive Technology를, 오라클은


클라우드 기반 마케팅 서비스 업체인 Bluekai를 인수하는 등 글로벌 기업들은 우수 기술 보유
스타트업을 M&A 하면서 빅데이터 선도 기업으로 성장하고 있고, 막대한 자본과 기술을 투입해
빅데이터 분석 기술(프로그래밍, 컴퓨팅 인프라) 고도화 노력

12
12
빅데이터

(2) 국내시장

 빅데이터 국내 시장은 연평균 24.7% 성장하고 있어, ‘17년 2,442억 원에서 ’20년 4,468억
규모에 이를 것으로 기대. (’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망

[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 244.2 298.7 358.3 446.8 557.2 694.8 24.7

*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 시장은 빅데이터 인프라(서버, 스토리지), 빅데이터 소프트웨어, 빅데이터 서비스로


나누어 집계

▪ 빅데이터 시장은 인프라 시장이 55.9%로 가장 큰 부분을 차지하고 있으나, 소프트웨어(23.2%),


서비스(20.9%) 시장은 활성화되고 있지 못한 것으로 나타남

[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0

*출처: 2017년 빅데이터 시장현황 조사, 인사이트플러스

13
13
전략분야 현황분석

 국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억 원로 연평균 7.6% 성장 예상 [출처: 데이터 산업 활성화 전략, 2018.6]

▪ ’17년 부문별 시장 규모 : 데이터구축/컨설팅(2조 9,291억원), 데이터 서비스(1조 7,146억원),


데이터솔루션(1조 6,536억원) 순

 기업의 빅데이터 대한 인식 호전과 중견·대기업의 투자 증가, 정부의 강력한 빅데이터 산업 육성의지에


따라 성장세를 보이고 있으며, 결과적으로 시장이 확대 (한국데이터진흥원, 데이터산업백서 2017)

▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요 도출

▪ 국내 일반기업의 빅데이터 시스템 도입률은 2016년 기준 5.8%이나, 중견·대기업은 그 두 배가


넘는 12.3%의 도입률을 보여 기업 규모별 편차가 존재하는 것으로 나타남

▪ 산업별로는 금융(14%), 공공(6.9%), 통신미디어(6.5%), 의료(6.3%), 유통·서비스(5.5%), 제조(4.2%)


순으로 나타나 데이터 활용의 중요성이 높은 산업에서의 빅데이터 도입이 상대적으로 적극적인 것으로 분석

 국내 빅데이터 시장은 포털사, 통신사, IT 업체 등이 자사 보유 데이터를 바탕으로 빅데이터


서비스 제공을 시작하는 단계

▪ 국내 ICT 산업은 경쟁력이 높고 데이터 생산량이 많아 빅데이터 산업의 성장 잠재력이 크지만


도입의 필요성 인지 부족 및 개인정보법 등 법적 리스크로 그동안 활용은 상대적으로 저조한 상황

 업계별 빅데이터 시스템 도입률 증가 추이

▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름

▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고,


분석할만한 데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차
기반 마련 예상

▪ 업종별로 보면 제조업, 물류, 유통, 금융, 의료 분야에서 특히 높은 성장 예상

14
14
빅데이터

나. 가치사슬 분석

 빅데이터 분야는 하드웨어를 포함하는 인프라, 소프트웨어, 서비스 3개 세부분야로 구성되어


있으며, 인프라에 집중(74.5%)하고 있는 것으로 분석

▪ 인프라 세부분야의 중소기업 집중도가 특히 높아 전체의 67.6%를 차지하고 있으며, 참여 대·중견


기업 수가 가장 많은 분야로 다른 세부분야에 비해 평균 종업원 수, 평균 매출액에서 우위를 점하고
있음

▪ 참여 기업이 대부분 대·중견기업인 소프트웨어 분야는 수출액이 월등하게 높은 편

▪ 서비스 분야는 참여율에 비하여 중소기업의 매출액이 저조

[ 빅데이터 분야 생태계 현황 ]
(단위: 개, 명, 억 원)

기업 수 종업원 수 매출액 수출액


구분
(비중) 합계 평균 합계 평균 합계 평균

합계 102 (100.0) 13,669 169 40,014.7 645.4 69.8 23.3

빅데이터
중소기업 84 (82.4) 2,301 35 2,453.7 48.1 9.8 4.9
분야 전체

대・중견기업 18 (17.6) 11,368 711 37,561.0 3414.6 59.9 59.9

소계 76 (74.5) 8,916 156 29,789.9 620.6 7.8 7.8

인프라 중소기업 69 (67.6) 1,951 38 2,283.5 51.9 7.8 7.8

대・중견기업 7 (6.9) 6,965 1,393 27,506.3 6,876.6 0.0 0.0

소계 8 (7.8) 3,362 420 9,325.4 1,554.2 59.9 59.9

소프트웨어 중소기업 1 (1.0) 12 12 5.4 5.4 0.0 0.0

대・중견기업 7 (6.9) 3,350 479 9,320.0 1,864.0 59.9 59.9

소계 18 (17.6) 1,391 87 899.4 112.4 2.1 2.1

서비스 중소기업 14 (13.7) 338 28 164.8 27.5 2.1 2.1

대・중견기업 4 (3.9) 1,053 263 734.6 367.3 0.0 0.0

※ 기업의 주요 제품상품에서 아래와 같은 키워드로 검색하고, 한국빅데이터 학회 등의 회원사 정보 등을 토대로 대상기업을


선정하여 분석
- 검색키워드 : 빅데이터, 마이닝, 데이터분석, 데이터 처리, 데이터 분석 등

15
15
전략분야 현황분석

다. 주요 이슈

◎ 데이터 경제의 급부상

 데이터는 4차 산업혁명을 견인하는 핵심 동인


▪ 4차 산업혁명 시대 데이터가 모든 산업의 발전과 새로운 가치 창출의 촉매 역할을 하는 ‘데이터
경제(Data Economy)’로 패러다임 전환 중

▪ 데이터 경제는 데이터 생태계의 가치사슬(데이터의 수집·저장·유통·활용)을 기반으로 공급-중개-수요


시장을 통해 경제적 가치(신제품·서비스, 일자리 등) 창출

[ 데이터 경제의 가치창출 체계 ]

* 출처: 데이터 산업 활성화 전략, 2018.6]

▪ 4차 산업혁명의 진전에 따라 각종 IoT·센서 등에서 발생하는 대량의 데이터가 데이터 기반


산업·경제활성화를 견인하는 원동력으로 작용할 전망이며, 세계 데이터량은 ‘16년 16ZB에서 ’25년
163ZB로 10배 증가 전망(IDC, ’17)

 데이터 기반 가치창출은 국가·기업의 혁신성장 수단


▪ 선진국은 국가 경제의 지속성장 및 일자리 창출을 위해 빅데이터 접목을 통한 주력산업의 재도약과
혁신성장을 도모

▪ 데이터가 기존 생산요소(자본, 노동)를 능가하는 경쟁원천으로 부상, 대규모 데이터를 보유하고


활용을 잘하는 기업이 시장 혁신을 주도

▪ IBM은 약 3억 명의 환자데이터 보유, 구글 딥마인드는 환자 100만 명 안구검사 기록 확보, Air


B&B는 8년간 축적한 데이터분석, 알리페이는 5억 명의 스마트폰결제정보를 매초 2천 건씩 축적

16
16
빅데이터

 데이터 기반 기업 경쟁력 강화

▪ 세계 주요 기업들은 데이터 활용으로 제조 설비 과정 등을 최적화하거나 생산량을 증가시키고, 생산


유통 소비 전 과정에 생산비용 절감

기업 비용 절감 사례
- 매출액의 75%가 자사 제품에 부착한 센서데이터를 통한 유지보수에서 발생
GE - 자사가 취급하는 선박‧항공기엔진‧발전소터빈‧의료기기 등에서 수집한 데이터 분석 결과를
고객에게 제공, 연간 200억 달러의 이익 창출을 예상

지멘스 - 제조 설비에서 발생한 데이터 분석, 생산라인을 재조정, 생산량 8배 증가

인텔 - 칩 제조 과정에서 발생하는 데이터를 분석해 제조비용 300만 달러 절감

- 약 40만대의 건설장비 가동상황 데이터를 GPS 원격관리시스템으로 수집해 수요 예측과 수리,


코마츠
중고차 가격결정 등에 활용해 10%가 넘는 영업이익률 제고

테스코 - 냉장 데이터를 분석해 영국‧아일랜드 3,000개 점포에서 냉장비용 연 20% 절감

* 출처: 빅데이터 기반 산업 경쟁력 강화 사례, 출처: 데이터 산업 활성화 전략, 2018.6

 국내 데이터 산업 준비 부족

▪ 데이터의 구축·유통·활용 등 가치사슬 전반에 걸쳐 고품질 데이터 부족, 폐쇄적 유통구조,


산업·사회적 활용 저조 등 한계 노출

▪ 4차 산업혁명 시대 新제품 서비스 개발에 필수인 자율차·스마트시티 등 영역별 실제 데이터(Real


Data)와 AI 학습용 데이터 구축이 미흡

▪ 지속적인 공공데이터 개방 확대에도 불구, 활용도가 높은 고부가가치 공공데이터는 양적으로


부족하고, 품질 역시 낮은 수준

▪ 빅데이터의 핵심 인프라인 클라우드의 이용률은 OECD 회원국 중 최하위권으로, 조기확산을 위한


규제 개선과 투자확대 시급(‘17년 기준 12.9%로 OECD 33개국 중 27위)

▪ 데이터가 산업·사회 혁신의 촉매제로 역할이 기대되나 산업적 활용은 아직 초기단계로서 산업 전반의
경쟁력 제고에 한계에 봉착하고 있고, 국내 전체 사업체 빅데이터 이용률은 7.5%로 매우 낮음

▪ 산업 전반의 빅데이터 활용 확산으로 빅데이터 분석 수요가 크게 늘고 있으나, 기업이 필요로 하는


전문 인력과 인프라가 많이 부족한 상태이며, 전문인력의 경우 향후 3년간(’18∼’20) 빅데이터
분석가·개발자 등 전문 인력이 약 1.3만명이 필요할 것으로 전망되고 있고(KDATA, ’17), 인프라의
경우 빅데이터·AI 발전에 기반이 되는10PF급 이상 슈퍼컴퓨터를 한국은 0개, 중국은 2개, 일본은
3개, 미국은 4개 보유한 것으로 조사(과학기술정보통신부,’18)

17
17
전략분야 현황분석

 데이터 사슬가치 전주기 확산을 위한 양질의 데이터 구축 추진

▪ 산업별 활용도가 높은 주요 영역별로 기기·센서 등을 통해 수집·생성되는 현장 중심의 실제 데이터


구축 확산 추진(‘18)

분야 빅데이터 구축 방향
의료 의료 인공지능(AI) 개발을 위한 학습용 의료데이터셋 및 의료정보시스템 구축(’18)

제조 스마트공장 내 스마트센서 기반 제조공정 빅데이터 구축(‘18)

농·수산업 농식품 통합 데이터 지도 구축(‘18), 어선정보 등 수산정보 제공(’18)

도시 방범·방재, 3차원 공간정보 등 도시운영 통합 플랫폼 기반 도시데이터 수집 기반 마련(’18)

교통 자율차, 스마트도로 관련 차량·신호등 등 실시간 교통DB 구축(‘17)

환경 대기오염·수질오염 등 환경 빅데이터 통합·개방 플랫폼 구축(‘17)

* 출처: 산업별 실제 데이터 구축 추진 분야, 출처: 데이터 산업 활성화 전략, 2018.6

◎ 기술 인프라 현황

 기반 기술 개발 추이
▪ 빅데이터의 신속한 처리를 위해 Hadoop에서 Spark와 같은 인메모리 활용을 통해 처리 속도를
높이는 기술, 클라우드 상에서의 빅데이터 처리를 위해 VM 대신 컨테이너를 활용하는 기술,
NoSQL에서 ACID를 보장하는 NewSQL 기술로의 리턴, 빅데이터 기술과 AI 기술의 밀접한 결합,
빅데이터 처리를 위한 HPC 고성능 컴퓨팅과 고밀도 고집적 데이터센터 출현 등이 이슈화

▪ 관계형 모델, 키-밸류 모델, 문서 모델, 그래프 모델 등 이질적인 다양한 데이터 소스의 차이로 인한
데이터 활용 복잡성을 해소하여 손쉽게 융합 분석 결과를 얻는 크로스 모델 데이터 통합 처리
플랫폼 연구 개발 추진 예정

▪ 다양한 빅데이터 활용 시 부정확한 데이터셋 검색/선택으로 인한 분석오류를 해결하기 위해


빅데이터 처리 전 과정에서 빅데이터들에 프로파일링을 구성/제공함으로써 데이터 간 관계성 향상,
신뢰성 높은 빅데이터를 생성/구축하여 활용성을 높일 수 있는 기술 개발 추진 예정

 산업적 활용도가 높은 주요 영역별로 기기·센서 등을 통해 수집·생성되는 현장 중심의


실제데이터 구축 확산(’18~)
▪ 모든 공공데이터는 원시 데이터(raw data) 형태로 최대한 수집한 후, 이 중 민간 수요가 높은
데이터를 국가중점데이터로 선정(’17. 48개 분야→’22. 128개 분야) 및 조기 개방 확대

▪ 이미지·상식 등 범용 AI데이터셋을 우선 구축(‘17. 688만건→‘22. 1.1억건), 법률·특허·의료 등


전문분야 AI데이터셋을 수요 기반으로 단계적 구축·보급(‘17. 211만건→’22. 4,800만건)

18
18
빅데이터

 빅데이터 전문기업성장지원: 컴퓨팅자원, 맞춤형사업 등을 통한 100개사 육성 계획

▪ 글로벌 수준의 데이터 강소기업 육성을 위해 컴퓨팅 자원, 데이터 셋 등이 집적된 판교 글로벌 ICT
혁신 클러스터 고도화 및 맞춤형 성장 지원 강화

* 출처: 데이터 산업 활성화 전략, 2018.6

[ 데이터 스타트업 육성 HUB ]

 미래수요 대응 전문 인력 확충: 청년고급인재, 실무인력 중심 5만 명 양성

▪ 청년일자리 연계, 산업 수요기반 전문인력 양성을 위해 빅데이터 전문교육 프로그램을 지원하고


데이터 분석 국가기술자격제도 신설·운영

▪ 데이터 분석 고급인재 양성을 위해 대학의 전공, 연구센터 운영 확대, 데이터 인재 발굴 플랫폼


구축·운영

▪ 과학기술정보통신부 주도로 빅데이터 청년인재 일자리연계 사업, 데이터 아카데미, 교수·시간강사


연수, 고용부 주도로 4차 산업혁명 선도인력 양성사업, 국가인적자원개발 컨소시엄 등 시행

19
19
전략분야 현황분석

4. 기술 분석

가. 해외기술 동향

 (분석/시각화 상용 솔루션 개발) 하둡(Hadoop)에 의해 주도되었던 빅데이터 플랫폼에서,


스파크(Spark)로 대변되는 고속 메모리기반 분석등 분석/시각화를 강조한 상용 솔루션들이
부각되고 있으며, 기반 플랫폼은 오픈소스를 패키징한 상용솔루션으로 대치되고 있음
▪ 고속 분석을 보장하는 Apache Spark가 급격하게 자리 잡고 있으며, NFLab에서는 Spark용 분석
시각화 도구인 Zeppelin을 오픈소스로 공개하여 세계적으로 주목을 받고 있음

▪ 하둡 배포판 회사:클라우데라(Cloudera), 호튼웍스(Hortonworks), 맵알(MapR)

▪ 분산/시각화 솔루션:스팟파이어(Spotfire), 타블로(Tableau)

 (IoT 시스템) 급격하게 증가하고 있는 IoT 시스템들은 향후 빅데이터 소스로서 주요한 역할을
할 것으로 보임

▪ 국내에서도 IoT 플랫폼이 주요 서비스 사업자(SKT) 및 주요 연구기관(KETI, ETRI)에 의해서 개발되고


구축되고 있으며, 향후 IoT 센서들이 광범위하게 설치되어 데이터가 수집되면, 빅데이터 수요가
늘어날 전망

 (클라우드형 빅데이터 플랫폼 서비스) IoT의 증가로 특히 시계열 데이터에 대한 처리를


최적화하는 시계열 빅데이터 처리 전용 솔루션들의 증가하고 있고, 특히 클라우드형으로
빅데이터 플랫폼을 제공하는 서비스의 급격한 증가하고 있는 추세

▪ 시계열 빅데이처 처리:ParStream DB (상용솔루션), Influx-DB(오픈소스)

▪ 클라우드형 빅데이터 플랫폼 서비스:Google, Amazon AWS, Microsoft Azure, Oracle 등 거의


모든 글로벌 회사가 클라우드형 빅데이터 서비스 제공

 (빅데이터 지식처리 플랫폼) 딥러닝 및 인공지능과 결합된 형태의 빅데이터 분석 플랫폼이


등장하면서 심층 질의응답이 가능한 차세대 지능형 지식처리 플랫폼으로의 진화가 진행 중

▪ 구글:텐서플로(TensorFlow) 및 Knowledge Graph, IBM:Watson, Apple:Siri

▪ 데이터의 급증에 따라 수집되는 데이터의 기계학습(Machine Learning)의 수요도 같이 증가하고


있으며, 이미지 분석을 필두로 딥러닝(Deep Learning) 기술이 발전하여, 향후에는 IoT에 의해서
생성되는 시계열 계측 데이터에 대한 스트림 기계학습 등장이 예상

20
20
빅데이터

 주요 기술별 연구개발 현황

▪ 영상분석: 영상인식기술은 ObjectVideo, iOmni-Scient, AgentVi, Bosch 등 해외 업체들이 절대


강세를 보이고 있으며, 물체와 상황 인지 및 추적 기술 개발이 활발히 진행 중

▪ 공간분석: 미국을 중심으로 한 세계 각국의 공공 데이터 개방이 있고, 구글, 야후, 트위터 등
기업들과 연구기관 및 정부기관에서 다양한 플랫폼과 시스템을 구축 서비스 중

▪ 스트림분석: 스트림 분석 플랫폼으로는 Oracle, Microsoft, IBM, Streambase 등의 외산 상용 솔루션이


주를 이루고 있으며, 데이터 스트림 마이닝을 위한 오픈소스 SW인 RapidMiner, MOA도 있음

▪ 고급분석: 해외업체들이 예측분석 솔루션 분야에서 강세를 보이고 있으며, 특히 IBM, SAS는
포레스터가 선정한 가장 경쟁력 있는 솔루션 업체

▪ 시각화기술: IBM, SAS, SAP, 오라클 등 대형 IT 기업들과 타블로나 스팟파이어 등 시각화 전문


업체들이 솔루션 출시

▪ 빅데이터 서비스 기술(BDaaS): Amazon, Google, Oracle, Microsoft는 클라우드형 빅데이터 분석


플랫폼 제공

◎ 핵심플레이어 동향

 구글(Google)은 빅데이터 처리 관련 주요 기술을 보유하며, 클라우드 기반의 빅데이터 분석


서비스와 딥러닝 플랫폼 제공

▪ 빅데이터의 저장을 위한 분산 파일 시스템 GFS(Google File System), 빅데이터의 분산 처리를


위한 분산 프로그래밍 기술인 Map Reduce, 관계형 DB의 테이블 형태로 빅데이터를 저장하기
위한 BigTable 기술을 원천적으로 보유하고 있음

▪ 구글은 그래프 알고리즘의 처리를 지원하기 위한 기술인 Pregel, 대용량 데이터를 분산 처리로
빠르게 분석할 수 있는 기술인 Dremel, 검색 인덱스를 작성하기 위한 기술인 Percolator 등의
빅데이터 관련 기술 및 도구들을 직접 개발하여 사용하고 있으며, 대용량 데이터의 실시간 처리
기술인 Dremel을 BigQuery로 상용화하여 서비스를 제공 중

▪ 구글은 플랫폼 업체로서 오래 전부터 온라인, 오프라인에서 수많은 데이터를 모으고 있는 중이며
인터넷 상의 웹 페이지 수집뿐만 아니라, Gmail, 캘린더 등의 무료 서비스를 통해 사용자 데이터와
스트리트뷰, 북스 라이브러리 프로젝트 등을 통해 오프라인 데이터, 구글 플러스 등을 통한 SNS의
데이터, 안드로이드 기기를 통한 디바이스의 데이터까지 모으고 있음. 즉, 사용자가 구글이 제공하는
서비스를 이용하기만 하면 구글의 클라우드에 데이터가 자동으로 쌓이는 구조이며 구글은 이렇게
모은 데이터를 각종 광고 사업에 활용해 수익을 창출

▪ 구글이 공개 소스로 제공하는 딥러닝 플랫폼 TensorFlow도 딥러닝 관련 제반 도메인의 추론을


위한 기반 데이터를 구글의 클라우드로 수집하는 역할을 수행하고 있음

21
21
전략분야 현황분석

 페이스북(Facebook)은 SNS 데이터를 중심으로 빅데이터 분석을 통한 수익을 창출하고 있고,


방대한 사진 빅데이터 저장을 위한 효율적 스토리지를 개발

▪ 페이스북은 개인의 신상정보 및 관심사, 활동 내역에 대한 각종 데이터를 인터넷에서 뿐만 아니라


오프라인을 통해서도 끝없이 수집하고 있으며 이를 소셜 광고에 활용해 수익을 창출

▪ 페이스북에 업로드된 다양한 사진을 기반으로 영상 인식 기술, 앨범 자동 생성 기술 등을 개발

▪ 빅데이터의 저장 및 운용에 필요한 데이터센터 구축 기술을 오픈하기 위한 목적으로 OCP(Open


Compute Project) 프로젝트를 주도하고 있고, 상대적으로 사용 빈도가 낮은 방대한 사용자 사진
빅데이터를 효율적으로 보관하기 위해 에너지 효율적인 Open Vault Storage를 OCP 기반으로 개발

 아마존(Amazon)은 온라인 구매추천 및 예측에 빅데이터를 활용하고, 클라우드 기반의


빅데이터 분석 서비스 제공

▪ 아마존은 누적된 구매 빅데이터를 이용해 고객의 구매 패턴을 분석해 관심 있을 만한 상품을 추천하고


있으며, 이 서비스는 매우 효과적이어서 아마존 매출의 1/3 이상이 구매 추천 서비스에 의해 발생

▪ 고객이 구매 패턴 예측을 통해 고객이 구매할 것으로 예상되는 물품을 미리 포장해서 고객과 가까운
물류창고에 옮겨 놓음으로써 배달 시간과 물류비용을 절감

▪ 부정거래탐지, 요구예측, 콘텐츠 개인화, 사용자행동 예측, 소셜 미디어 분석, 텍스트 분석 등의


다양한 빅데이터 서비스를 클라우드 기반으로 제공

 클라우데라(Cloudera)는 Hadoop 플랫폼을 기반으로 머신 러닝 및 빅데이터 분석 기능을


클라우드 서비스로 제공

▪ CDH는 클라우데라가 제공하는 Hadoop의 오픈 소스 배포판이고, Cloudera Essentials는 Apache


Hadoop의 상용 지원 제품으로 구조화 데이터, 비구조 데이터를 모두 통합하여 처리하는 기능 제공

▪ Cloudera Data Science Workbench는 Apache Spark와 Apache Impala에 대한 안전한


온디맨드 원격 액세스를 통해 웹 브라우저에서 Python, R, Scala를 직접 사용할 수 있도록 셀프
서비스 기능을 제공

 Splunk는 머신 생성 빅데이터의 검색, 모니터링, 분석을 위한 소프트웨어를 제공

▪ IT분야에서 발생하는 로그 데이터, 실시간 이벤트 데이터 및 다양한 장비 데이터를 수집하고


모니터링하며 검색, 분류, 분석할 수 있는 엔진을 제공

▪ 실시간 데이터를 수집, 색인, 상관지어 검색 가능한 저장소에 저장하고, 그래프, 리포트, 경고,
대시보드, 시각화 등을 생성

22
22
빅데이터

[ Splunk 개념도 ]

 스팟파이어(TIBCO Spotfire)는 시각화 도구 Spotfire, 자연어 검색 및 AI 기반 인사이트를


제공하는 Spotfire X, 다양한 데이터 소스에 대한 스트리밍 분석을 제공하는 Spotfire Data
Streams 등의 솔루션 제공

 타블로 소프트웨어(Tableau Software)는 BI에 초점을 둔 대화식 시각화 도구 타블로(Tableau) 제공

 IBCO Spotfire는 다중 소스의 데이터에 대한 통합 분석과 시각화를 지원

▪ 데이터 시각화를 위해 사용자 친화적인 인터페이스와 대화형 대시 보드 및 포인트-앤드-클릭 방식의


데이터 탐색을 지원

▪ 스마트한 데이터 발견, 데이터 랭글링, 지리 공간 분석, 원 클릭 예측 분석을 통해 의사결정을


개선할 수 있도록 지원

 페이스북, 인스타그램, 트윗터 등의 SNS 서비스들은 그 자체로 이미 클라우드이자 빅데이터


플랫폼으로서 기능

 대표적 스토리지 업체인 EMC는 VM웨어, 인텔, 시스코와 함께 VCE(Virtual Computing


Environment)를 설립하고 상호 협력하여 프라이빗 클라우드 구축을 통한 빅데이터 플랫폼
제공 사업을 전개

 SAP는 기존의 ERP 엔진에 인메모리 데이터베이스와 데이터 분석 기능을 통합한 SAP
HANA를 중심으로 시장 점유율을 확대

 테라데이터(Teradata)는 10 기가바이트 이하의 작은 규모부터 수백 테라바이트에 달하는


대용량 데이터 웨어하우스 구축을 위한 테라데이타 데이터베이스를 제공

23
23
전략분야 현황분석

나. 국내기술 동향

 주요 기술별 연구개발 현황

▪ 텍스트 분석/음성 분석: ETRI에서는 웹데이터 및 대규모 코퍼스로부터 반자동으로 언어 분석에


필요한 지식 추출 방법을 개발하여 기술문서 자동번역 시스템에 탑재함

▪ 공간분석: Daum, NHN, 솔트룩스, SK 텔레콤 등과 같은 업체들이 자체 관련 기술들을 개발하여


공간 빅데이터 서비스를 제공하고 있지만 공간 빅데이터 시장에서 전문 인력 및 연구 역량을
체계적으로 확보하고 있지 않아 관련 연구는 아직 초기 단계에 머물러 있음

▪ 빅데이터 서비스 기술(BDaaS): 클라우드 환경에서 여러 사용자간의 데이터 공유와 분석을 지원하기
위해 업체 중심으로 멀티테넌트 Hadoop 개발이 진행중이나, 컴퓨팅 자원관리, 데이터보안 등의
국외 기술에 비해 성숙도가 낮은 모델

◎ 핵심플레이어 동향

 (빅데이터 분석 플랫폼) kt 넥스알(kt NexR)은 하둡 기반의 빅데이터 분석 플랫폼인 NDAP을


주력 솔루션으로 제공

▪ NDAP(NexR Data Analytic Platform)은 글로벌 빅데이터 표준기술로 부상한 Hadoop의 주요 핵심


기능들을 표준화하여 엔터프라이즈 환경에 최적화된 성능, 신뢰성, 사용편의성을 제공

▪ 빅데이터 배치 처리 및 근-실시간 검색 플랫폼으로 빅데이터 분석을 위한 모든 작업 (수집/저정/분석/검색/관리


등) 및 실시간 데이터 질의를 처리 가능

▪ 실시간으로 발생하는 다양한 형태의 머신/휴먼데이터를 수집하여 데이터에 기반한 신속한 비즈니스
의사 결정을 지원하는 Lean Stream 솔루션을 제공

[ NDAP 중심의 빅데이터 플랫폼 개념도 ]

24
24
빅데이터

 (데이터 통합 플랫폼) 데이터스트림즈(DataStreams)는 분산 메모리 기반 실시간 데이터 통합


플랫폼을 제공

▪ TeraONE은 Hadoop, HDFS, HBase, Hive 등을 기반으로 정형 데이터, 비정형 데이터, 빅데이터의
통합과 데이터 거버넌스를 종합적으로 구성한 One-Stop 데이터 처리 플랫폼 제공

▪ 다양한 데이터를 쉽고 빠르게 수집/저장하는 분산 메모리 기술을 적용한 순수 국산 솔루션으로 초기


도입 비용을 최소화한 고성능/고효율의 빅데이터 통합 처리 운영 아키텍처 제공

▪ TeraONE의 거버넌스 체계를 통하여 수집된 데이터(실시간/배치, 정형/비정형)의 품질을 개선한


양질의 데이터로 분석의 신뢰성 향상

▪ 데이터는 메모리 클러스터와 HDFS에 저장하며 높은 성능과 스케일아웃이 우수한 노드 확장성 제공

[ 데이터스트림즈의 TeraOne 시스템 아키텍처 ]

 (분산 데이터 처리) 선재소프트(Sunjesoft)는 인메모리 DB를 스케일아웃이 가능한 분산 DB로


확장한 Goldilocks(이전 명칭 SunDB)를 개발하고 국내 최초로 TPC 인증을 획득
▪ NewSQL DBMS의 선두 제품으로 In-Memory Architecture로 개발되어 극초고속으로 대용량
데이터 처리 서비스를 제공하고, 디스크 파일에 Redo log file 및 Checkpoint image 파일들을
주기적으로 저장해 데이터의 영구성을 보장

▪ 병렬 적재(parallel loading), 병렬 인덱스 구축(parallel index building) 등 고수준의 병렬 처리


기술로 모든 응용 애플리케이션 속도를 향상하고, 멀티 쓰레드 구조가 아닌 공유 메모리(shared
memory) 기반의 멀티 프로세스(multi process) 구조로 운영되어 뛰어난 안정성을 제공

▪ 골디락스 클러스터는 대용량 데이터 처리와 분산, 병렬 처리 등 스케일 아웃 클러스터 성능을


배가시키는 데이터 샤딩(database sharding) 전략을 수립하도록 해시(Hash), 레인지(Range),
리스트(List), 클론(Cloned) 등 다양한 샤딩 정책을 지원

▪ 중국 이동통신사인 차이나유니콤은 Goldilocks를 활용해 'cBSS' 시스템을 개설해 중국 32개성에서


분산 관리되던 비즈니스 지원 시스템(BSS)을 8개 그룹으로 구성된 중앙의 베이징으로 통합하고 1일
200억 건의 데이터를 지연 없이 처리하는데 성공

25
25
전략분야 현황분석

[ Goldilocks 아키텍처 ]

 (빅데이터 솔루션) 그루터(Gruter)는 하둡 관련 기술을 보유한 업체로서 빅데이터 관련


플랫폼, 기술, 솔루션 전문 기업

▪ 빅데이터 플랫폼 구축 및 컨설팅 서비스, 빅데이터 분석 및 데이터 제공 서비스, 빅데이터 분석


플랫폼 제공 서비스 구축 등의 사업 진행 중임

▪ 빅데이터 플랫폼 BAAS(Bigdata Analysis & Application System)는 다양한 오픈소스와 그루터
자체 기술로 구성된 소프트웨어 스택 솔루션 제공

 (데이터 처리) 데이터솔루션(Datasolution)은 데이터 예측, 데이터 인프라, 관련 서비스 사업 추진

▪ IT솔루션·서비스 전문기업인 오픈에스엔에스와 예측분석 소프트웨어 전문기업인 데이타솔루션이


2016년 합병해 출범

▪ 데이터 부문은 예측분석 소프트웨어 및 솔루션, 예측분석 컨설팅, 빅데이터 솔루션 사업, 교육 및
출판사업 등 데이터의 컨설팅, 분석, 구축 및 운영에 이르는 데이터 솔루션 사업을 진행하고 있고,
인프라 부문은 데이터의 수집 및 저장에 필요한 스토리지, 서버 및 네트워크, 가상화 플랫폼,
클라우드 포털 솔루션을 제공하고 있으며, 서비스 부문은 SI 서비스, SM, ICT 컨설팅과 IoT 솔루션
기반의 여러 서비스 사업을 수행

 (데이터 마이닝) 다음소프트(Daumsoft)는 소셜 네트워크 마이닝 분야의 전문 분석을 수행


▪ SNS 정보 기반 여론 진단 서비스, 소셜미디어 트위터, 블로그 트렌드 분석 등을 서비스하며, 소셜미디어 상의
데이터들에서 의미 있는 정보를 찾고, 조직화함으로써 정보간의 관계나 패턴, 트렌드 등을 분석하는 서비스를 제공

- 버즈량 분석: 특정 이슈 및 아이템 관련 문서의 발생 건수를 시간별, 일별, 월별, 연도별로


분석하여 화제가 된 지점을 포착
- 연관어 분석: 특정 이슈 및 아이템 관련 문서에서 사용된 단어를 텍스트 마이닝 기법으로 처리하여
통계적으로 분석

26
26
빅데이터

- 감성 분석: 특정 이슈 및 아이템 관련 문서에서 연관어 분석과 비슷한 방식으로 감정과 관련된


단어의 사용 비중을 분석
- 빅마우스 분석: 특정 이슈 및 아이템 관련 문서 중에서 영향력 있는 사람의 작성 여부를 파악
(예로, 트위터: 팔로워 수를 조회)

 사이람(Cyram)은 소셜 네트워크 분석 응용솔루션 및 컨설팅을 제공

▪ 대규모 소셜 네트워크 및 데이터 간의 관계를 계량적으로 분석해 패턴을 파악하고 시각화하는


기능을 제공하는 소셜 네트워크 분석 소프트웨어 넷마이너(NetMiner)를 개발

- 조직 네트워크 분석: 조직구성원, 부서, 업무, 역량 등 조직 내 인적자원 간의 공식적, 비공식적


관계를 분석하고 시각화할 수 있음
- 지식 네트워크 분석: 연구자, 저널, 키워드 등 지식의 구성요소 간 관계를 분석하고 시각화
- 범죄 네트워크 분석: 혐의자들 간의 드러나거나 숨은 관계를 분석하여 시각화
- 고객 네트워크 분석: 고객의 구매 및 활동이력, 고객간 관계 네트워크를 분석하여 다양한
마케팅활동에 활용
- 온라인 네트워크 분석: 트위터와 같은 온라인 소셜 미디어상에 형성되는 여론이나 네트워크 등을
분석하고 시각화

[ NetMiner의 분석 결과 리포트의 예 ]

 (비정형 데이터 분석) 솔트룩스는 비정형 빅데이터 분석 및 시맨틱 기술 전문기업


▪ 비정형 빅데이터 분석 플랫폼(truestory), 클라우드 기반 시맨틱 검색 플랫폼(IN2), 시맨틱 기반
빅데이터 추론 플랫폼(STORM), 빅데이터 분석 서비스 플랫폼(O2)을 서비스 중

▪ 비정형 빅데이터 분석 플랫폼인 트루스토리(truestory)는 클라우드 컴퓨팅과 인공지능 기술이 결합된


정형/비정형의 빅데이터 분석을 수행하며 솔트룩스 고유의 시맨틱 기술이 적용된 워크플로우 기반의
심층 분석이 가능

▪ 소셜 빅데이터 분석뿐 아니라 기업 빅데이터 분석, 통신 및 금융 빅데이터 분석 등 다양한 도메인에 활용 가능

27
27
전략분야 현황분석

 (빅데이터 활용 인공지능 서비스) 마인즈랩(MINDsLab)은 음성인식, 텍스트 마이닝 등 종합


인공지능 서비스 기업을 추구

▪ 음성, 텍스트 센서 데이터 등 비정형 고객의 소리를 최고 수준의 음성인식, 자연어처리,


텍스트마이닝, 데이터마이닝 기술을 통해 처리하고 이를 소셜 빅데이터 분석정보 및 기업 내부의
정형 데이터와 교차 분석하여 비즈니스 활동에 필요한 정보 제공

▪ 마음에이아이(maum.ai)는 최첨단 AI알고리즘이 반영된 언어, 시각, 사고지능 통합 플랫폼으로


다양한 인터페이스와 시각지능 솔루션, 스마트팩토리 프레임워크도 지원

▪ 텍스트 마이닝: 고품질 개체명 인식, 내용기반 자동분류, 이슈 군집분석 등 고난이도 고품질의
결과를 제공하는 텍스트 마이닝 서비스를 제공함

 (스마트 공장 최적화 빅데이터 솔루션) 비스텔(Bistel)은 반도체, 디스플레이, 자동차, 철강,


에너지 분야의 스마트 팩토리를 위한 빅데이터 솔루션 제공

▪ 산업 IoT, 클라우드, 빅데이터 기술을 기반으로 제조 환경의 실시간 데이터를 검출, 분석, 예측하여
고장 탐지, 데이터 분석, AI 기반의 운영 등을 실현하기 위한 솔루션 제공

▪ DFD(Dynamic Fault Detection)는 실시간 센서 추적 분석, 거짓 경보 제거 등을 통한 실시간


모니터링 기능 제공

▪ WQP(Wafer Quality Predictor)는 센서 추적 데이터를 평가해 각 웨이퍼에 대한 품질 점수를


부여하고 웨이퍼 재고 품질에 대한 요약 정보를 대화식 대시보드를 통해 제공

▪ CM(Chamber Matching)은 최고의 챔버를 자동 식별하고 모든 센서에 대해 완전 추적 분석을


수행하며 시간 기반으로 챔버 분석을 수행

 (빅데이터 분석) 네이버, 카카오 등 국내를 대표하는 포털, SNS 업체들도 자사에 누적된
빅데이터를 기반으로 다양한 빅데이터 분석을 수행하고 API 공개를 통해 빅데이터 활용
서비스 제공

 (빅데이터 분석 및 활용) KT, SK텔레콤 등의 통신사는 사용자의 통화 데이터(call data)를


중심으로 다양한 빅데이터 분석을 수행하고 있으며, 통화 데이터의 익명화(비식별화) 처리
및 가공을 통한 빅데이터 유통 사업을 추진하고 있고, SK텔레콤은 SNS, 소셜데이터,
검색키워드를 이용하여 고객, 사회 트렌드 파악 및 기업이미지 파악, 홍보에 자체 개발한
빅데이터 솔루션을 이용

 (빅데이터 활용 마케팅) 신용카드 등 금융권을 중심으로 소비자의 행동패턴을 분석하여


마케팅에 활용하고 신규상품 개발 및 상품추천에 빅데이터를 활용하는 경우가 확산되고
있으며, KB국민카드의 경우 빅데이터 분석을 통해 카드이용서비스 및 편의성을 제공

28
28
빅데이터

구분 빅데이터 처리/유통 빅데이터 분석/활용

Hadoop, HDFS, Map Reduce, Spark, Mahout, R, Spotfire, Tableau,


주요
데이터 수집, 분산 컴퓨팅, 분산 파일 시스템, 통계 분석, 데이터 마이닝, 자연어처리, 정보
제품/기술
NoSQL, 병렬 DBMS 검색, 기계학습, 시각화 도구

TIBCO Spotfire, Tableau Software,


클라우데라, 호튼웍스, 맵알, Splunk Inc.,
Fisher, Rosemount Systems,
해외기업 Teradata, Oracle, SAP Hana,
Tata, Consultancy Services,
IBM, Google, Microsoft, Amazon, EMC
IBM, Google, Microsoft, Amazon

다음소프트, 그루터, 사이람, 와이즈,


넥스알, 데이터스트림즈,
솔트룩스, 마이즈랩, 코난테크놀로지,
국내기업 선재소프트, 모비젠,
비스텔, 디지털팩토리, 리비, 바이텍시스템,
네이버, 카카오, KT, SK텔레콤
네이버, 카카오, KT, SK텔레콤

중소기업
참여정도
◔ ◔

중소기업
시장점유정도
◔ ◔

* 중소기업 참여정도와 점유율은 주요제품 시장에 참여하는 중소기업의 참여규모와 정도(업체수, 비율 등)를 고려하여 5단계로 구분
(낮은 단계: ○ ,중간 단계(◔, ◑, ◕) 높은 단계: ●)

29
29
전략분야 현황분석

다. 기술개발 시나리오

 빅데이터 내 데이터 품질 검사 자동화 시스템, 자연어 처리 기반 텍스트 마이닝, 빅데이터


분석 및 시각화 플랫폼 개발로 빅데이터 기술을 고도화하여 1차적으로 산업 분야별 현장
활용 가능한 실제 데이터 및 데이터 셋을 구축

 구축한 기반 기술을 바탕으로 4차 산업 융합 산업에 중 최근 각광받고 있는 3D 기술에


대응하여 빅데이터를 분석한 내용을 폭넓게 시각화 할 수 있는 데이터 3D 변환 시각화
도구를 개발

 최종적으로 감성정보 분석 서비스, 유통/물류 빅데이터 구축 및 분석 시스템과 같이


다변화되고 있는 빅데이터 솔루션 및 서비스 시장 공략을 통해 시장력 향상 및 생태계 구성

30
30
빅데이터

5. 중소기업 시장대응전략 도출

Factor 기회요인 위협요인

•중국 및 선진국의 전략적 투자 및 육성정책 추진


•정부의 적극적인 투자 의지
•국내 개발자, 사용자, 수요자의 협동연구 부족
정책 •정부의 빅데이터 산업 육성 의지(인력, 기술 등)
•개인정보 활용에 대한 국민 반감과 활용 등 관련
•정부의 데이터 중심 성장 전략
법, 제도 미비

•초고속 인터넷 보급 등 ICT 기반 환경이 세계 최고 수준 •대형 글로벌 회사들의 원천기술/특허 선점


•산업계의 빅데이터 도입에 따른 관련 지식, 역량 •4차 산업혁명 흐름의 국내 반영 지연
산업 축적 가속화 •글로벌 기업의 세계시장 기술 선점으로 인한 수출
•빅데이터 활용 분야 급속 확산(제조업, 공공, 의료, 시장의 초기 진입 애로
금융 등) •구글, 페이스북 등 글로벌 플랫폼 기업 부재

•글로벌 기업이 국내시장 장악 위협


•데이터 경제 확산에 따른 빅데이터 시장규모
•미국, 중국 등 주요 국가와 기업이 클라우드와
지속적 증가
시장 빅데이터 플랫폼에 상당한 투자 진행
•국내 IT 서비스기업 빅데이터 솔루션 및 서비스
•IBM, MS, Amazon 등 클라우드 기반 빅데이터
시장공략 본격화
플랫폼 기업의 시장 선점

•데이터/데이터셋 부족 및 데이터 품질 저조
•4차 산업에서 빅데이터 기반 및 실제 데이터 축적
•전문 인력 부족 및 개발 비용 부담으로 중소기업의 기술
필요성 증가
개발에 한계 발생
기술 •AI에서 데이터 및 지식 축적의 중요도 증가
•원천기술 분야에서 선도국가와의 기술격차
•스마트기기 및 IoT 센서 확산에 따른 비정형
•빅데이터 전문가 및 우수 인력 부족
데이터 폭증
•취약한 빅데이터 분석 기술(SW)

정부의 경쟁력 개발자, 고령화,


빅데이터 산업 4차 융·복합
있는 분야를 사용자, 핵가족화, 삶에
적극 지원 및 산업에 대응
기반으로 수요자의 협업 질 향상 소비자
생태계 조성 필요
기술적용 체계 수립 니즈 부합

중소기업의 시장대응전략

➜ 산업분야별 현장 중심의 실제 데이터 및 데이터셋 구축 참여


➜ 빅데이터 적극 활용을 통한 산업 경쟁력 강화
➜ 빅데이터 전문기업 성장 지원을 통한 데이터 강소기업으로 변화 추구
➜ 산학연 협업을 통한 우수 고급인력 육성 및 빅데이터 전문 인력 수급 개선
➜ 지원제도 정비를 통한 정부지원체계 개선

31
31
전략분야 현황분석

6. 전략품목

가. 전략품목 도출절차

전문가 위원회 전략품목 전략품목


분야 설정 전략품목 선정
구성 pool 구성 후보리스트 구성

è - 30개 분야별 è - 전문가 추천 품목 è - 전략품목 도출 è - 분야별 검토위원회


- 메가트렌드 - 기술수요조사
산・학・연 전문가 가이드라인 작성 - 전문가 워크샵
- R&D과제 수요 - 타부처 정책
- 산업계 중심 구성 - 적합성 검토/평가 - 품목 검토 및 조정
- 문헌 조사

 분야 설정
메가트렌드 분석, 핵심투자주제 발굴, 타부처 정책 분석, R&D 신청·지원과제 분석 등을 통해
중소기업 기술개발 전략분야 설정

 전문가위원회 구성
현장밀착형 기술로드맵 수립 및 전략 강화를 위해 30개 분야별 산・학・연 전문가 풀을 구성하여
분야별 전략품목 추천 및 검토 진행

 전략품목 Pool 구성
주요 제품·상품의 키워드 검색과 특허정보의 기술분류 매핑, R&D과제 지원기업 매핑을 통해
분야별 분석대상 기업 Pool을 구성하여 기술수요조사 및 품목이슈 발굴

- (분야별 기술수요조사) 유망 제품·기술과 분야별 이슈사항에 대한 설문조사 통해 전략품목


후보 및 정책사항 도출

- (전문가 품목 추천) 분야별 전문가 대상 후보 추천 의뢰 의견수렴

- (타부처 정책 및 문헌조사) 타 부처 정책사항 및 문헌조사를 통한 품목 발굴

 전략품목 후보리스트 구성
전략품목 후보 발굴 체크리스트를 통해 후보 적합성 평가를 실시해 상대적으로 적합성이 부족한
품목을 1차 제외하고, 분야별 전략품목 검토위원회의 검토 기초자료로 활용

 전략품목 선정
분석대상 기업 Pool을 활용한 생태계 분석과 1차 분야별 전략품목 검토위원회, 2차 전문가 워크샵을
통해 산・학・연 전문가 반복 검토로 전략품목 선정

- (검토위원회) 전략품목 선정을 위해 산・학・연 각 분야 전문가들의 의견수렴을 위한 분야별


전략품목 검토위원회 운영

- (전문가 워크샵) 전략품목 검토위원회를 통해 선정된 전략품목들에 대한 타당성 검증,


분야간 전략품목 조정 및 통합

32
32
빅데이터

나. 전략품목 도출결과

전략품목 개요 및 선정사유

· (개 요) 데이터의 품질에 대한 규칙을 찾고 그 값을 기준으로 이상치를 가진


데이터를 자동으로 검출, 제거하여 궁극적으로는 전반적 데이터의
빅데이터 내 데이터 품질 품질을 향상시키는 것을 목적으로 하는 시스템
검사 자동화 시스템 · (선정사유) 산업에서 이용되는 데이터양이 점점 증가하면서 양질의 데이터를
활용 니즈 증가. 특히 현재 중소기업들이 많이 연계되어 있는 방송
산업, 공공기관에서 수요가 있을 것으로 기대

· (개 요) 자연어로 구성된 비정형 텍스트 데이터에서 패턴 또는 관계를


추출하여 정보를 찾아내는 마이닝기법으로, 사람들이 말하는 언어를
이해할 수 있는 자연어처리(Natural Language Processing)
시스템을 기반으로 하는 기술
자연어 처리기반 텍스트 마이닝
· (선정사유) 고객대응 (Customer Service) 중 축적되는 VOC (Voice of
Customer)는 일정한 패턴이 있는 정보이기에 처리가 상대적으로
용이하며 다방면적 이용이 가능하여 향후 시장성이 높아질 것으로
예상, 중소기업이 개발 가능함과 동시에 경쟁력을 가질 수 있는 품목

· (개 요) 유통, 물류 등의 산업 전반에서 빅데이터가 그 흐름을 파악하여


최적화 할 수 있는 솔루션을 제시하는 시스템으로 POS 및 수·발주
데이터를 토대로 딥러닝(Deeplearning) 기반 인공지능을 이용해
과학적·합리적으로 물류를 유통, 상·하역시 효과적으로 적재할 수 있는
유통/물류 빅데이터 구축 및
방법 등을 제시하는 시스템
분석 시스템
· (선정사유) 유통/물류 프로그램은 전무한 상황. 특히 기업의 수익과 직결되는
상·하역 시 물품 배치 형태를 제시하는 시스템은 시장성이 높음, 이
외에 최적의 물류비와 경로를 실시간으로 확인할 수 있는 시스템
등은 중소기업 접근이 용이

· (개 요) 빅데이터를 분석하여 이용자가 필요로 하는 정보를 도출, 정보를


쉽게 이해할 수 있도록 텍스트 혹은 이미지 등 내용 전달에 적절한
시각적 형태로 전달하는 플랫폼
빅데이터 분석 및 시각화 플랫폼
· (선정사유) 신기술을 통한 빅데이터 축적과 타 산업에서의 수요 확대에 따라
빅데이터 분석 및 시각화 기술은 미래의 산업을 견인할 전망, 개발
시 중소기업의 시장 선점 가능

· (개 요) BIM (3D설계 도구)등에서 도출된 데이터를 3D로 변환 후 각각의


요소들을 대상화하여 시각화된 데이터를 이용자에게 제공하는 도구
데이터 3D 변환 시각화 도구 · (선정사유) 스마트 건설 등 데이터의 유기적 시각화가 필수적인 스마트 산업의
등장 또는 관련 서비스의 발전으로 현실을 반영한 3D로의 변환이
필요, 중소기업이 참여할 수 있는 역량이 충분한 품목

· (개 요) 축적된 인간의 감정 관련 빅데이터를 바탕으로 이용자의 감성 패턴을


분석, 이용자의 감성에 맞는 음악, 서비스 또는 현재 상태에서 필요한
정보를 추천·제공하는 서비스
감성정보 분석 서비스
· (선정사유) 감성정보 관련 품목들은 1인 가구의 증가에 따라 소통에 대한 니즈
증가와 함께 시장이 확장 될 것으로 기대, 소품종 다량 생산의
대표적인 서비스이기 때문에 중소기업의 시장 선도 가능

33
33
34
전략품목 현황분석

빅데이터 내
데이터 품질 검사
자동화 시스템

35
36
빅데이터 내 데이터 품질 검사 자동화 시스템

정의 및 범위

▪ 빅데이터 내 품질검사 자동화 시스템이란 고품질 데이터 확보 및 체계적인 관리를 위해 빅데이터의


품질 수준에 대한 측정 기준을 도출하고, 객관적인 평가를 수행함과 동시에 결과에 대한 원인 분석과
그에 따른 개선활동 수행을 자동화 해주는 시스템

▪ 데이터와 관련된 품질진단의 종류는 크게 데이터 값 진단, 데이터 구조 진단, 데이터 관리 프로세스
진단 등으로 구분

정부지원 정책

▪ 한국데이터진흥원에서는 ‘데이터품질관리 성숙모형’이라는 기술표준을 제정하고 배포 및 데이터


품질인증 제도를 실시하였으며, 행정안전부에서는 ‘공공기관의 데이터베이스 품질 관리 지침’을 배포

- 지표가 RDB위주로 작성되고, 비정형데이터에 대한 내용이 부재해 빅데이터의 다양성을 포괄하기


부족하며, 지침 또한 범용적 지표 가이드로 구성되어있고, 산업별 가이드의 부재로 인해 현장에서
지표의 적용이 어렵다는 한계

▪ ‘18년부터는 기존 DB단위의 품질 수준 평가에서 전 공공기관 대상 기관단위의 품질관리 활동 평가로


수준평가 범위를 늘려나가고 있음

▪ 통계청에서는 각 행정기관에서 보유한 행정 자료의 활용도를 높이기 위해 인구, 사업체 ·기업체,


고용, 주택 등 다양한 행정자료를 각 기관으로부터 확보해 종합통계등록부 구축

- 인구DB, 사업체·기업체 DB, 부동산DB 등 개별적으로 확보할 수 없는 새로운 정보를 제공

- 통계등록부를 구축하면서 비매치, 결측값 등 여러 데이터를 연계해 발생할 수 있는 품질 저하


요소에 대해서는 별도의 관리 및 평가
중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 4차산업혁명에 따른 빅데이터 시대 강조 •(환경) 빅데이터에 대한 낮은 신뢰성
•(기술) IoT, 클라우드, 빅데이터의 연계구조 확산 •(기술) 핵심 원천기술 미흡
•(정책) 인공지능 산업 활성화에 따른 관련 투자 증가 •(정책) 단기간 성과 도출 중심 투자

기회(Opportunity) 위협(Threat)
•(환경) 대기업의 빅데이터 도입 확산 •(환경) 빅데이터 분석 전문인력 부족
•(기술) 실시간 데이터 분석 기술의 발전 •(기술) 원천기술에 대한 기업경쟁력 미흡
•(정책) 빅데이터 활성화 정책 확대 •(정책) 개인정보유출 및 침해로 인한 정책마련 부족

중소기업의 시장대응전략
➜ 현재 기초적인 품질검사 솔루션들을 이용해 인공지능 엔진을 접목하여 자동화 시스템을 구축하고,
현재 품질검사 인력을 대체할 수 있도록 하여 데이터 품질을 향상

➜ 자동화 시스템 구축을 위한 적절한 인공지능 엔진 및 자동화 시스템 플랫폼 개발


전략품목 현황 분석

1. 개요

가. 정의 및 필요성

 빅데이터 내 품질검사 자동화 시스템이란 고품질 데이터 확보 및 체계적인 관리를 위해


빅데이터의 품질 수준에 대한 측정 기준을 도출하고, 객관적인 평가를 수행함과 동시에
결과에 대한 원인 분석과 그에 따른 개선활동 수행을 자동화 해주는 시스템을 의미

 데이터와 관련된 품질진단의 종류는 크게 데이터 값 진단, 데이터 구조 진단, 데이터 관리


프로세스 진단 등으로 구분
▪ 정형 데이터에 대한 데이터 값 진단은 운영 데이터베이스의 데이터 값에 대한 현상을 분석

▪ 데이터 값과 관련된 품질 기준을 적용하여 오류내역을 산출하고, 주요 원인을 분석하여 개선사항 제안

▪ 데이터 값 진단의 개선사항은 오류발생 원인 분석에 따라 값의 정제 외 구조 개선사항, 데이터흐름


통제, 관리 프로세스의 개선사항이 포함

▪ 비정형 데이터에 대한 데이터 값 진단은 비정형 콘텐츠 자체의 상태와 메타데이터에 대한 품질


진단으로 구성

▪ 비정형콘텐츠 자체의 상태에 대한 진단은 내용 자체의 합목적성 및 동영상, 이미지, 3D 등 유형에 따라


각기 다른 관점에서 작성된 콘텐츠의 상태를 시각이나, 청각 또는 자동화된 도구를 이용하여 진단

▪ 유형별로 관련된 품질기준을 적용하여 오류내역을 산출하고, 주요 원인을 분석하여 개선사항을


제안하는 절차가 포함

▪ 데이터 구조 진단은 데이터 모델링 관점에서 데이터 품질을 진단

▪ 구조진단의 주요 이슈는 데이터의 표준화 수준, 표준 코드, 표준 도메인, 테이블·컬럼 및 관계정의,


정규화 수준 등이 해당

▪ 데이터관리 프로세스 진단은 정형ㆍ비정형 데이터에 대한 현행 데이터 관리 프로세스를 분석하여


문제점을 도출하고, 이를 개선할 수 있는 핵심 업무 프로세스를 표준화하여 재설계

▪ 주요 이슈는 품질관리 정책 수립ㆍ업무 프로세스의 적절성 및 운영성 분석ㆍ프로세스별 오너쉽 등

▪ 데이터 값, 데이터 구조 및 데이터 관리 프로세스가 모두 검증되어야 데이터 품질이 보장됨

 빅데이터 시대가 시작되면서 무수히 많은 데이터들이 수집되고 있지만, 품질에 대한 검증이


제대로 이뤄지지 않고 무분별하게 저장되어 여러 문제 발생
▪ 저품질 데이터의 발현으로 인한 여러 사회적 문제점 발생

▪ 잘못된 정보와 의사결정으로 인한 경제적, 사회적 손실 발생

▪ 데이터 품질이 보장되지 않은 빅데이터 분석은 무의미함

38
38
빅데이터 내 데이터 품질검사 자동화 시스템

 데이터의 불균형 및 현존하는 품질관리시스템의 문제

▪ 데이터 품질 검사가 필수적인 비정형 데이터가 전체 정보량의 92%를 차지하고 있고, 정형 텍스트
데이터는 8%에 불과하여 비정형 데이터가 디지털정보에서 압도적인 비중을 차지하고 있음

▪ 현재까지 데이터에 대한 품질 관리는 정형화된 텍스트 데이터에 편중되어있고, 동영상, 이미지, 3D


등 비정형·멀티미디어 콘텐츠에 대해서는 매우 취약하며, 데이터의 품질을 일관성 있게 통합적으로
관리할 수 있는 방법이 부재

▪ 산업별 가이드에 대한 부재로 현장에서 지표의 적용이 어렵고, 범용적 지표만 가이드

▪ 정형·비정형 데이터를 모두 아우를 수 있는 통합적인 품질관리 시스템이 필요하고, 이 시스템을


통해 전체데이터의 품질 향상을 도모

▪ 데이터 품질 측정을 위한 사전분석 작업을 인적 자원에 의존하기 때문에 진단에 시간과 인적 자원이
과다 소요

▪ 현재는 금융이나 공공분야 대규모 사이트 위주로 품질관리시스템이 도입되고 있으며, SQL기반의
측정방식으로 비정형 데이터에 대한 측정이 어려움

39
39
전략품목 현황 분석

나. 범위

(1) 제품분류 관점

 빅데이터 내 품질검사 자동화 시스템은 무수히 많은 데이터를 효율적으로 분류하고


체계적으로 보관하여 활용하기 위해 데이터의 품질을 측정 및 평가를 통해 품질 저하요인을
분석하여 개선 사항을 제안해주는 자동화 시스템

▪ 정형·비정형 데이터에 따라 진단방법이 구분

 빅데이터 내 품질검사 자동화 시스템에 사용되는 주 핵심 기술은 데이터 품질 진단 및 평가,


패턴분석, 데이터 전처리 기술, 데이터 이상 값 탐지 기술 등이 있음

[ 제품분류 관점 기술범위 ]

전략품목 제품분류 관점 세부기술

데이터품질 이상값 탐지, 텍스트 매칭, 텍스트 클러스터링, 명칭오류 탐지, 품질오류
진단 및 평가 패턴 분류, 데이터품질 Scoring 등

데이터마이닝, Linear Regression, Decision Tree, Clustering,


패턴분석
인공신경망기법, SVM 등

데이터셋 확인, 변수 확인 및 분석,


데이터
결측값처리(Missing value treatment),
전처리기술
이상값 처리, Feature Engineering 등
기반
기술 데이터
빅데이터 내 비지도학습 및 반지도학습, 시계열분석, 아웃라이어 판별, 확률모델,
이상값 탐지
데이터 품질 이상패턴 감지기술 등
기술
검사 자동화
시스템
명칭 오류
텍스트 마이닝기법, 자연어처리, 정보검색기술, 데이터마이닝 등
탐지기술

데이터 품질 군집도분석, 데이터탐색, 도메인판별, 이상값탐지, 텍스트분석,


개선 기술 데이터 추천 등

품질검사 자동화 인공지능 기술, 자연어처리(NLP), 서포트벡터머신(SVM),


시스템 클러스터링 기법, 의사결정 트리 등

40
40
빅데이터 내 데이터 품질검사 자동화 시스템

(2) 공급망 관점

 빅데이터 내 품질검사 자동화 시스템은 4차산업혁명 시대에서 가치 있는 정보를 생산하고,


신뢰성 있는 결과물을 얻기 위해 반드시 필요한 시스템
▪ 빅데이터는 보건의료, 교통, 금융, 통신, 도시, 에너지, 문화, 제조, 유통, 농수산업 등 모든 산업에서
수집되어 체계 구축

▪ 4차 산업혁명의 핵심 기반인 산업별 실제 데이터, AI학습 데이터를 조기구축하고, 공공·민간


데이터의 획기적 개방을 추진 중

[ 공급망 관점 기술범위 ]

전략품목 공급망 관점 세부기술

•공공데이터포털에 존재하는 개방데이터


공공데이터 •모든 산업분야를 아우르는 포털에서 개방된 정보의 품질 검사
자동화

•고객현황, 구매이력, 배송이력, 식자재내역 등


유통·제조
•자재관리, 구매, 생산, 설비관리, 품질관리 정보 등

•환자 인적사항, 진료과목, 병명, 급여비용, 투약정보


의료
•환자진료기록부, 의료영상정보, 처방원무 정보 등

빅데이터 내
데이터 품질 •농·축·수산물품목,가격, 생산액, 시설제원, 수출입통계, 귀농,귀촌인
농·축·수산업
검사 자동화 현황, 수산통계연보, 농업관측정보 등
시스템

•도로/가로등 위치, 전력/가스공급 체계, CCTV, 주차/횡단보도 정보


도시·공간 등
•지형, 산업입지, 택지, 부동산거래, 3차원공간정보 등

•전력판매, 시설물, 계량, 과금, 태양광정보, 소비패턴 등


에너지·환경
•기상정보, 도로날씨, 기후변화, 자연재해, 가뭄정보 등

•도로현황, 도로시설물관리, 교통량, 사고지점, 피해상황,


교통
시간/지역별 이동수단, 승·하차 인원 등

41
41
전략품목 현황 분석

2. 외부환경 분석

가. 산업환경 분석

(1) 산업의 특징

 데이터는 4차 산업 혁명을 견인하는 핵심 동인으로 데이터가 모든 산업의 발전과 새로운


가치를 창출하는데 촉매역할을 하는 데이터경제 시대로 패러다임이 전환

▪ 세계 데이터 시장 규모는 매년 약 200억 달러씩 증가하고 있으며, 데이터의 양 또한 빠른 속도로 증가

▪ 4차 산업혁명의 진전에 따라 각종 산업 분야에서 사용되는 IoT장비와 센서에서 발생하는 많은


데이터가 데이터기반 산업·경제를 활성화하는데 원동력으로 작용

▪ 선진국에서는 국가경제의 지속적인 성장과 일자리창출을 위해 빅데이터를 접목하여 주력산업의


재도약과 혁신성장을 도모

▪ 데이터가 자본이나 노동을 능가할 경쟁의 원천으로 부상하였고, 대규모 데이터를 보유하고 이를 잘
활용하는 기업이 시장을 주도하는 추세

 데이터 경제 시대에 상응하는 데이터 산업정책 요구

▪ 주요국에서는 데이터의 중요성을 인식하고 이미 데이터 산업 활성화를 위한 전략을 수립하고


투자확대 진행 중

▪ 미국은 빅데이터 R&D전략을, 유럽연합은 데이터경제 육성 전략을 수립하였고, 일본과 중국에서도


각각 빅데이터 전략을 추진하고 있음

▪ 한국 정부에서도 국민의 삶의 질 향상 및 혁신성장을 위해 보다 더 많은 투자 요구

 우리나라는 개인정보 규제로 인해 데이터 활용이 다른 나라에 비해 크게 위축되어 있으며,


그로 인한 개인정보 활용에 대한 인식이 부족하고, 법적 근거 또한 미흡

▪ 개인정보가 포함된 빅데이터를 안전하게 활용할 수 있도록 가이드라인을 마련하였으나, 절차가


지나치게 복잡하고, 엄격하며 법적 면책이 보장되지 않음

- 시민단체에서는 법적 근거가 없고, 재식별 가능성이 있다는 이유로 가이드라인 활용 기관을 고발한
사례도 있음

▪ 해외에서는 4차 산업혁명의 시작과 함께 개인정보 보호와 활용이 동시에 가능하도록 제도적인


변화를 시행하여 데이터 활용 지원

42
42
빅데이터 내 데이터 품질검사 자동화 시스템

 데이터의 구축·유통·활용을 위한 고품질 데이터 부족, 폐쇄적 유통구조, 산업·사회적 활동


저조와 같은 문제점 노출

▪ 영역별 실제 데이터(Real Data)와 학습용 데이터 구축이 미흡하며, 공공데이터 개방이 확대


되었음에도 불구하고, 고부가가치 공공데이터는 양적으로나 질적으로 품질이 매우 낮음

▪ 빅데이터의 핵심 인프라인 클라우드의 이용률 또한 OECD 회원국 중 최하위권에 머무르고 있으며,


규제 개선과 투자확대가 시급

▪ 개별기업 중심의 제한적 데이터 유통이 이뤄지고 있으며, 거래제도가 확립되어있지 않는 등으로
인해 질 좋은 데이터의 유통을 제한

▪ 공공데이터 통합관리체계 마련을 통해 공공 및 민간 데이터의 획기적인 개방이 필요하며, 품질 관리


고도화를 통한 데이터의 품질 개선이 요구

(2) 산업의 구조

 세계 데이터 시장 규모는 ‘17년 1,508억 달러에서 ’20년 2,100억 달러까지 성장할 것으로
전망되며, 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문 서비스 분야 순으로 데이터 시장의
영역을 차지

▪ 미국은 전체 데이터 시장 규모의 절반정도를 차지할 만큼 많은 시장 규모가 형성되어 있으며, 뒤를


이어 서유럽, 아시아태평양 순으로 세계 시장이 형성

▪ 국내 데이터시장 규모는 6조 3천억 원(‘17년)에서 7조 8천억 원(’20년)까지 성장할 것으로


전망되며, 분야별로는 데이터구축/컨설팅, 데이터 서비스, 데이터 솔루션 순으로 시장이 형성

 빅데이터 분야는 다른 ICT산업과 마찬가지로 크게 하드웨어와 소프트웨어 그리고 서비스


부문으로 구분
▪ 세부적으로는 서버, 스토리지, 네트워크, 운영체제 등을 제공하는 장비 산업과 빅데이터 전문
소프트웨어와 플랫폼을 제공하는 소프트웨어 산업, 빅데이터 솔루션을 이용하기 위하여 요구되는
유지보수, 교육 훈련 및 비즈니스 분석에 활용하는 컨설팅 등을 포함하는 서비스 산업으로 분류
가능하며 특히, 소프트웨어 부문에 있어서는 빅데이터 수집 및 관리 부문과 빅데이터 분석
부문으로 세분화

▪ 빅데이터 산업 구조상 각 세부 산업별 비중을 살펴보면, 시장 조사 기관별로 다소 차이는 있으나


빅데이터 서비스 부문이 41.5~44%, 하드웨어 부문이 28.9~31%, 소프트웨어 부문이
25~29.7%의 비중을 차지하고 있어 빅데이터 서비스 부문이 가장 높은 비중을 차지하고 있음을 알
수 있으며 이를 통해 빅데이터의 주요 기술들이 구현되어 적용되는 서비스 영역이 전체 빅데이터
시장에서 매우 중요한 비중을 차지하고 있음 파악 가능

43
43
전략품목 현황 분석

[국내 빅데이터 시장 전망]

▪ IDC는 빅데이터 시장 내 소프트웨어가 ‘19년 550억 달러의 시장을 형성할 것으로 전망하며, 특히
최종 사용자 쿼리, 보고, 분석 도구 및 데이터 웨어하우스 관리 툴이 이 중절반 이상을 점유할
것으로 예상

▪ 빅데이터 하드웨어 시장은 2019년 280억 달러 규모를 형성할 것이라 예측, 산업별로는 다음 3가지
업종이 두드러짐

[ 산업별 예상 시장 규모 ]

산 업 시장규모

개별 제조(Discrete Manufacturing) ‘19년 228억 달러

은행(Bank) ‘19년 221억 달러

공정 제조(Process Manufacturing) ‘19년 14억 달러

*출처: ciokorea

▪ 빅데이터 및 비즈니스 애널리틱스를 성장시키는 주요 견인 요인은 500인 이상의 대기업으로 ‘19년


1,400억 달러의 매출이 발생할 것으로 전망되지만 500인 이하의 중·소규모 기업 또한 비중이 작지
않아 전 세계 매출의 1/4 정도를 담당할 것으로 관측

44
44
빅데이터 내 데이터 품질검사 자동화 시스템

 빅데이터 산업은 데이터의 생성과 분석, 재가공의 과정에서 데이터를 둘러싼 많은 개체가
활동을 하고, 빅데이터 서비스 제공을 위하여 여러 산업과 기업이 상호작용하는 복잡한
구조이며 빅데이터 산업의 구성은 빅데이터 자체와 행위자, 가치 생산자, 외부 환경으로 볼
수 있음

▪ 빅데이터는 개인, 기업, 공공의 서로 다른 분야에서 생산되고 있는 데이터를 의미함과 동시에


데이터와 데이터 간의 관계를 포함하는 개념

▪ 빅데이터 생산자는 서비스를 이용하고, 기업 활동을 통한 원시 데이터를 생산하는 개체를 말함

▪ 생산자의 범위와 역할로 개인의 경우 일상생활 활동, 기업은 단순 비즈니스 활동, 정부의 경우에는
공공 빅데이터 생산

▪ 가치 생산자는 빅데이터 제공자와 빅데이터 서비스 제공자, 빅데이터 유통업자로 나눌 수 있으며,


빅데이터 제공자는 빅데이터 확보를 위한 수집, 저장, 가공 활동을 담당

▪ 기업의 경우 빅데이터 확보 및 활용을 위한 일련의 프로세스 과정에 연관되며, 정부는 빅데이터


제공자 역할을 수행하며 빅데이터 서비스 제공자는 빅데이터를 분석, 추론 및 빅데이터 서비스
기획, 제공, 빅데이터 유통 활동 등의 과정에 관련되며 빅데이터 유통업자는 새로운 가치 창출을
위한 빅데이터 공유, 재가공을 통한 빅데이터와 서비스의 재생산을 수행

▪ 외부 환경으로는 빅데이터 산업을 둘러싼 다양한 산업, 문화, 기술적 환경을 말하며 외부 환경의
예로는 클라우드, 사물인터넷(IoT), 스마트 공장(Smart Factory) 등이 있음

45
45
전략품목 현황 분석

나. 시장환경 분석

(1) 세계시장

 빅데이터와 관련하여 데이터 품질 검사 자동화 시스템에 대한 개별 시장 환경은 파악하기


어려우나, 빅데이터의 양이 증가하며 잘못된 데이터를 추출하여 데이터 질을 유지하는
시스템의 중요도가 높아짐을 고려하였을 때, 빅데이터 전체 시장의 동향을 통해 빅데이터 내
데이터 품질 검사 자동화 시스템의 전망을 추측할 수 있을 것으로 보임

 빅데이터 세계 시장은 연평균 10.6% 성장하여, ‘17년 534억 달러에서 ’22년 900억 달러로
성장할 전망(’17, IDC)

[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 53,400 59,040 65,450 72,890 81,380 90,006 10.6

*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 세계 시장은 ‘23년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점할
것으로 전망 (‘16, 지식산업정보원)
▪ 빅데이터 개발 선진국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,
민간 데이터 시장에서는 중개업이 활성화되어 있음

▪ 미국의 경우 ‘16년 기준 데이터 브로커 기업은 약 650억 개로 150억 달러 규모의 시장 형성

46
46
빅데이터 내 데이터 품질검사 자동화 시스템

 IoT(사물인터넷)의 상용화로, 대용량 실시간 데이터를 빠르게 처리·분석할 수 있는 빅데이터


기술개발이 활발하게 이뤄지고 있음

▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 2020년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정

 빅데이터 세계 시장은 빅데이터, 인프라, 빅데이터 소프트웨어, 빅데이터 서비스 시장으로


세분화 할 수 있으며, 빅데이터 소프트웨어 및 서비스에 대한 전 세계 빅데이터 매출액은
‘18년 420억 달러에서 ’27년 1,030억 달러로 증가
▪ ‘17년 기준, 빅데이터 인프라, 소프트웨어, 서비스 부문은 각각 52.2%, 21.8%, 26.0%의
비중으로 시장 형성

▪ 빅데이터 시장 중 인프라 시장의 점유율이 가장 높으며, 또한, 가장 높은 성장세를 보일 전망

▪ 인프라 시장의 경우, ’16년 136억 달러 규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장
형성을 예측

[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ’17 ’18 ’19 ’20 ’21 ’22 CAGR(%)

인프라 17,700 21,700 26,000 30,700 36,200 43,900 19.60

소프트웨어 7,400 9,000 10,600 12,300 14,300 16,200 16.61

서비스 8,800 10,800 12,600 14,700 17,700 20,500 17.05

합계 33,900 41,500 49,200 57,700 68,200 80,600 18.26

*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용

 세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순

▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)

 빅데이터 애플리케이션 및 분석 시장은 ‘26년에 194억 달러 규모로 성장할 전망


▪ 빅데이터 애플리케이션 및 분석 시장은 ‘18년 50억 달러에서 ’26년 194억 달러로 크게 증가하여 연평균
15.49%의 성장률을 달성할 전망

▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, ‘18년 165억 달러에서 ’26년 213억
달러로 성장

47
47
전략품목 현황 분석

[ 빅데이터 품목별 세계 시장 규모 및 전망 ]

*출처: Wikibon and reported by Statista, NIA 2018.6 재인용

 빅데이터를 산업 내에서 활용하기 위해서는 양 뿐 아니라 데이터의 질도 고려해야 할 중요한


변수로 작용, 따라서 빅데이터의 품질을 관리할 수 있는 빅데이터 내 데이터 품질 검사
자동화 시스템도 향후 꾸준한 성장세를 보일 것으로 전망

48
48
빅데이터 내 데이터 품질검사 자동화 시스템

(2) 국내시장

 빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 ’20년
4,468억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 244.2 298.7 358.3 446.8 557.2 694.8 24.7%

*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 시장은 빅데이터 인프라(서버, 스토리지), 빅데이터 소프트웨어, 빅데이터 서비스로


나누어 집계

▪ 빅데이터 시장은 인프라 시장이 55.9%로 가장 큰 부분을 차지하고 있으나, 소프트웨어(23.2%),


서비스(20.9%) 시장은 활성화되고 있지 못한 것으로 나타남

[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0

*출처: 2017년 빅데이터 시장현황 조사, 인사이트플러스

49
49
전략품목 현황 분석

 국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억원로 연평균 7.6% 성장 예상 [출처: 데이터 산업 활성화 전략, 2018.6]

▪ ’17년 부문별 시장 규모 : 데이터구축/컨설팅(2조 9,291억원), 데이터 서비스(1조 7,146억원),


데이터솔루션(1조 6,536억원) 순

 기업의 빅데이터 대한 인식 호전과 중견·대기업의 투자 증가, 정부의 강력한 빅데이터 산업 육성의지에


따라 성장세를 보이고 있으며, 결과적으로 시장이 확대 (한국데이터진흥원, 데이터산업백서 ‘17)

▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출

▪ 국내 일반기업의 빅데이터 시스템 도입률은 ‘16년 기준 5.8%이나, 중견·대기업은 12.3%의


도입률을 보여 기업 규모별 편차가 존재하는 것으로 나타남

▪ 산업별로는 금융(14%), 공공(6.9%), 통신미디어(6.5%), 의료(6.3%), 유통·서비스(5.5%), 제조(4.2%)


순으로 나타나 데이터 활용의 중요성이 높은 산업에서의 빅데이터 도입이 상대적으로 적극적인 것으로 분석

 국내 빅데이터 시장은 포털사, 통신사, IT 업체 등이 자사 보유 데이터를 바탕으로 빅데이터


서비스 제공을 시작하는 단계

▪ 국내 ICT 산업은 경쟁력이 높고 데이터 생산량이 많아 빅데이터 산업의 성장 잠재력이 크지만


도입의 필요성 인지 부족 및 개인정보법 등 법적 리스크로 인해 그동안 활용은 상대적으로 저조

 업계별 빅데이터 시스템 도입률 증가 추이

▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름

▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고,


분석할만한 데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차
기반 마련 예상

▪ 업종별로 보면 제조업, 물류, 유통, 금융, 의료 분야에서 특히 높은 성장 예상

 국내에서는 개인정보보호법 등 정보 활용을 제한하는 법, 규제들이 상대적으로 다수 존재,


정책적으로 지원이 이루어지더라도, 한정된 자원에서 의미있는 데이터를 추출하기 위해서는
양질의 빅데이터를 활용한 분석이 필수적일 전망

50
50
빅데이터 내 데이터 품질검사 자동화 시스템

3. 기술 분석

가. 기술개발 이슈

 전 세계적으로 데이터를 활용한 다양한 비즈니스 사례가 늘어나면서 기업, 공공기관은


하드웨어가 허용하는 한 생산하고 데이터를 삭제하지 않고 축적하고 있으며, 이에 따라
데이터가 급속도로 늘어나고 있지만, 데이터 축적과 별개로 데이터 품질관리 활동이 미흡해
오히려 저 품질 데이터의 활용에 따른 다양한 문제도 발생하고 있는 상황

 데이터품질 검사를 통한 데이터 모델 현행화, 데이터 표준점검, 데이터 표준 관리체계 수립을


통해 데이터 품질 수준을 확보하고, 유지해 나가야 함

 공공 데이터 측면

▪ 정부의 적극적인 정책으로 인해 공공데이터는 양적인 측면에서 많은 성과가 있었지만 질적인


측면에서 부족한 면이 많음

▪ 이러한 부분을 개선하기 위해 기존 개방 DB 위주로 시행된 공공데이터 품질관리 수준평가가


2018년부터는 기관의 전사적 품질관리 활동 평가로 전환되고 대상도 600여개 기관으로 확대 실시

▪ 일부 공공기관에서도 별도의 데이터품질 컨설팅 용역 사업을 추진하고 있으며, 정보시스템 사업과


함께 데이터 품질 개선 사업을 병행하는 기관도 증가 추세

▪ 데이터 품질관리 활동 및 품질 고도화와 관련해서는 공공이 민간에 비해 앞서 있는 것으로 추정

▪ 데이터 품질 개선 업무가 지속적인 투자 및 리소스 투입이 필요한 업무 영역으로 공공이 민간에


비해 비교적 재원 마련이 용이하기 때문

▪ 법으로 규정한 공공데이터 개방 이슈에 따라 데이터 품질 고도화에 대한 인식 역시 공공분야에 더


확산되어 있으며 이에 따라 당분간 데이터 품질 컨설팅 시장은 공공분야에서 더 커질 것으로 예상

 민간 데이터 측면

▪ 4차 산업혁명 이슈는 민간기업의 데이터 품질에 대한 인식 전환을 가져오는 주요 요인

▪ 기존 데이터는 IT기업의 비즈니스 전유물이었으나 4차 산업혁명과 ICT산업의 발전은 데이터 활용


업종의 벽을 허무는 계기가 됐으며, 2016년부터 빅데이터, 인공지능, IoT와 같은 비즈니스가
본격화되고 기업들은 관련 비즈니스 부서 신설과 함께 데이터 품질에 대한 업무를 추가

▪ 기업의 특성상 데이터 품질관리를 위한 지속적인 투자와 리소스 투입이 어려운 것이 사실이지만,
ICT 비즈니스 추진에 따라 데이터품질 관리 활동은 기업 경쟁력 강화를 위해 반드시 필요한 업무
영역이라는 인식이 점차 확산 중

51
51
전략품목 현황 분석

◎ 연구 개발 동향

 빅데이터 내 품질검사 자동화 시스템은 데이터품질 진단과 평가기술, 패턴분석 기술, 데이터
전처리 기술, 데이터 이상값 탐지 기술, 명칭 오류 탐지 기술, 데이터 품질 개선 기술 등의
복합적인 기술 요구

 데이터 품질 진단 및 평가 기술

▪ 한국데이터진흥원 DQC-V는 공공, 민간의 데이터베이스 품질 확보를 위해 데이터 품질, 관리, 보안


등 DB 품질 요소별 심사 기준을 평가하고 인증

▪ 공공 데이터 부문에서는 진단대상 데이터베이스 테이블의 전체 컬럼 중 진단항목에 해당하는 컬럼과


CSV 등 오픈 포맷에 해당하는 개방 데이터 파일을 평가지표와 품질관리 수준에 따라 나누어 데이터
품질을 평가

▪ 데이터 품질 관리 자동화 도구로는 다양한 데이터의 품질 측정 기술 자동화 수준을 향상시킨


Automated Data Quality Management Tool with Machine Learning이 있음

▪ 데이터 품질 진단 및 평가 기술에는 이상값 탐지, 텍스트 매칭, 텍스트 클러스터링, 명칭오류 탐지,
품질오류 패턴 분류, 데이터품질 Scoring 방법이 사용

 패턴분석 기술

▪ 대량의 데이터로부터 숨겨진 패턴과 알려지지 않은 정보를 찾아내기 위한 과정으로 데이터


사이언티스트들에 의해 분석된 정보를 토대로 각 분야의 의사결정을 수행

▪ 대용량의 데이터베이스에 저장된 데이터에 숨겨진 중요한 정보와 지식을 추출하는 데이터 마이닝
기술과 예측정보를 제공할 수 있는 예측 분석 등이 빅데이터 분석에 사용되고, NoSQL, 하둡과
맵리듀스 등의 기술을 사용하여 분석

▪ 현재의 현상과 결과적인 관점을 제시하는데 초점을 둔 비즈니스 분석과 대용량의 데이터로부터
숨겨진 패턴을 발견하고 상황을 예측하며, 구조화 및 비구조화된 복잡한 형태의 데이터 요인들 간의
상관관계를 확인하는 고급 분석이 있으며 이는 의미 있는 데이터의 패턴을 식별하고 예측하기 위한
모든 기법과 기술들을 포괄

 데이터 전처리기술

▪ 데이터 분석 단계 중 가장 많은 시간이 소요 되는 단계로, 데이터 전처리 Task는 데이터셋 확인 ­


결측값 처리 ­ 이상값 처리 ­ Feature Engineering 순서로 진행

▪ 데이터 셋 확인은 변수확인 및 RAW 데이터를 확인 하는 단계로, 독립/종속 변수의 정의, 변수의
유형, 변수의 데이터 타입을 확인하여 잘못 설정된 변수를 변경해주고, 단변수, 이변수, 다변수에
대한 기술 통계를 확인하고, 변수간의 관계를 시각화를 통해 확인

▪ 결측값 처리 방법의 종류로는 삭제, 다른 값으로 대체, 이상값 처리 방법이 있음

- 삭제는 결측값이 발생한 모든 관측지를 삭제하거나 데이터 중 모델에 포함시킬 변수들 중


결측값이 무작위로 발생한 경우 모든 관측지를 삭제하는 부분삭제 방법이 있음

52
52
빅데이터 내 데이터 품질검사 자동화 시스템

- 다른 값으로 대체는 결측값이 발생한 경우 다른 관측지의 평균, 최빈값, 중간값 등으로 대체할 수
있으며, 결측값 발생이 다른 변수와 관계가 있는 경우 대체 방법이 유용한 측면은 있지만, 모델이
왜곡될 가능성이 존재
- 예측값 삽입은 결측값이 없는 관측치를 트레이닝 데이터로 사용해서 결측값을 예측하는 모델을
만들고, 이 모델을 통해 결측값이 있는 관측 데이터의 결측값을 예측하는 방법으로,
Regression이나 Logistic Regression을 주로 사용

▪ 이상값 처리(Outlier Treatment)는 데이터/샘플과 동떨어진 관측치로 모델을 왜곡할 가능성이 있는


관측치를 처리하는 기술

- 이상값을 찾아내기 위해서는 변수의 분포를 시각화하고, 이상값이 Human Error에 의해 발생한
경우 관측치를 삭제하면 됨
- 절대적인 관측치의 숫자가 작은 경우, 삭제의 방법으로 이상치를 제거하면 관측치의 절대량이
작아지는 문제가 발생하기 때문에 이를 다른 값으로 대체하거나 예측모델을 만들어 대체하는
방법도 사용 가능
- 이 밖에 이상값을 처리하기 위해 변수화, 리샘플링, 케이스 분리 분석 등이 있음

▪ Feature Engineering은 기존의 변수를 사용해서 데이터에 정보를 추가하는 일련의 과정으로, 새로
관측치나 변수를 추가하지 않고도 기존의 데이터를 보다 유용하게 만드는 방법론

▪ 변수의 단위를 변경하거나 변환하는 Scaling과 연속형 변수를 범주형 변수로 만드는 Binning,
변수의 성질을 이용해 다른 변수를 만드는 Transform, 범주형 변수를 연속형 변수로 변환하는
Dummy 등의 방법이 있음

 데이터 이상값 탐지 기술
▪ 이상탐지(Anomaly Detection)는 데이터마이닝의 일부로, 분석 목적으로 분류한 것 중 하나이며,
시계열 데이터에서 과거 또는 비슷한 시점의 보편적인 패턴에서 벗어나거나 벗어나려는 징후가
있는 패턴이나 사실, 대상개체를 찾아내는 데이터 분석의 한 분야

▪ 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 반지도학습(Semi- supervised


Learning)을 이용하거나 통계적 방법을 이용해 이상 감지가 가능하며, 데이터의 형태나 종류, 개수에
따라 적합한 방법을 이용해 탐지

 명칭 오류 탐지기술

▪ 명칭오류 탐지 기술은 텍스트 데이터에서 잘못된 이름이나 명칭들을 탐지해내는 기술로서


텍스트마이닝을 통해 이를 찾아낼 수 있음

▪ 텍스트마이닝을 위해서는 형태소분석기, 구문분석기, 각종 테스트 처리 도구, 대용량 데이터 처리


플랫폼이 필요하며, 대량의 텍스트데이터를 가지고 수행해야 쓸만한 정보를 찾아낼 수 있고
활용하기 쉬움

▪ 텍스트마이닝은 자연어처리기술(NLP, Natural Language Process)와 정보검색기술(Information


Retrieval), 데이터마이닝 기술(Data Mining)이 사용

53
53
전략품목 현황 분석

 데이터 품질 개선 기술

▪ 데이터 품질 개선 기술은 다양한 관점별로 데이터의 품질진단 및 수준을 평가하고, 오류유형 분류 및


개선가이드를 제시 및 개선 데이터를 추천해주며 개선결과의 피드백을 통해 데이터의 품질을 개선

 데이터 품질검사 자동화 시스템

▪ 각 요소기술을 통해 데이터 품질검사를 자동화하는 시스템으로 데이터품질의 진단, 평가 및 개선이


이루어지도록 인공지능 엔진을 통해 자동화 한 SW로 정의

◎ 기술환경분석

 국내 빅데이터 관련 통계제도의 동향

▪ 통계청에서는 각 행정기관에서 보유한 행정 자료의 활용도를 높이기 위해 인구, 사업체 ·기업체,


고용, 주택 등 다양한 행정자료를 각 기관으로부터 확보해 종합 통계 등록부 구축

▪ 인구DB, 사업체·기업체 DB, 부동산DB 등 개별적으로 확보할 수 없는 새로운 정보를 제공

▪ 통계등록부를 구축하면서 비매치, 결측값 등 여러 데이터를 연계해 발생할 수 있는 품질 저하


요소에 대해서는 별도의 관리 및 평가

▪ 하지만 각 기관으로부터 수집된 행정통계의 품질을 평가하기는 상대적으로 어려움

▪ 빅데이터 품질 검증을 통한 국가통계활용도 제고를 위해 데이터 수집, 정제, 분석 등의 과정을


검증할 수 있는 국내 빅데이터 보유 실정을 반영한 품질 검증 기준에 대한 연구가 필요

 한국데이터진흥원과 행정안전부에서는 빅데이터 품질 지표 및 평가방법에 대한 제정과 지침을 배포

▪ 한국데이터진흥원에서는 ‘데이터품질관리 성숙모형’이라는 기술표준을 제정하고 배포 및 데이터


품질인증 제도를 실시하였으며, 행정안전부에서는 ‘공공기관의 데이터베이스 품질 관리 지침’을 배포

▪ 지표가 RDB위주로 작성되고, 비정형데이터에 대한 내용이 부재해 빅데이터의 다양성을 포괄하기 부족

▪ 지침 또한 범용적 지표 가이드로 구성되어있고, 산업별 가이드의 부재로 인해 현장에서 지표의


적용이 어려움

▪ ‘18년부터는 기존 DB단위의 품질 수준 평가에서 전 공공기관 대상 기관단위의 품질관리 활동


평가로 수준평가 범위를 늘려나가고 있음

54
54
빅데이터 내 데이터 품질검사 자동화 시스템

[ 품질관리 수준평가 추진 방향 ]

* 출처: 행정안전부, 공공데이터 품질관리 수준평가 소개

 현재 존재하는 빅데이터 품질 평가도구는 정형데이터의 품질진단과 데이터거버넌스 구축에


초점이 맞춰져 있으며, 금융기관과 공공분야 등 대규모 사이트 위주로 도입

▪ 데이터 품질 측정을 위한 사전분석 작업을 인적 자원에 의존하여 데이터 품질 진단에 시간과 인적


자원이 과다 소요

▪ SQL 기반의 측정방식으로 비정형데이터 측정이 불가한 등, 진단 기능의 한계

55
55
전략품목 현황 분석

나. 주요기업 동향

(1) 해외기업 동향

 인포매티카의 IDQ(Informatica DataQuality)

▪ 10년 연속 가트너 데이터 품질 관리 툴 부문의 리더로 선정된 솔루션으로 현업부서 사용자가 IT에
의존하지 않고 비즈니스 규칙을 신속하게 개발할 수 있도록 지원

▪ IoT, 대용량 데이터 분석, 데이터 거버넌스 및 콘텐츠 중심의 데이터 분석과 같은 새로운
시나리오를 해결하기 위해 머신러닝(Machine Learning)과 예측 분석 알고리즘을 사용

 IBM InfoSphere Information Server

▪ 데이터를 이해, 정리, 모니터링, 변환 및 제공할 수 있도록 지원하는 IBM의 정보통합 플랫폼으로
빅데이터, 충돌점 분석, 비즈니스 인텔리전스, 데이터 웨어하우징, 마스터데이터 관리, 애플리케이션
통합 및 마이그레이션 등 신뢰할 수 있는 정보를 생성 후 유지 관리해 전략적 비즈니스
이니셔티브를 지원

▪ 데이터 품질을 클라우드 환경으로 확장하고, 단순한 데이터 구조에서 복잡한 데이터 구조에
이르기까지 대용량 데이터 정제를 지원하며, 제품 전반에 머신러닝 알고리즘을 적용하고, IoT
데이터를 지원

 SAS의 SAS Data Quality

▪ 다양한 소스의 ETL(Extract, transform and load) 및 ELT(Extract, load and transform) 활동에
데이터 품질을 추가할 수 있고, 기본적인 마스터데이터 관리 뷰를 지원

▪ 통합된 웹 기반 콘솔을 통해 데이터 품질 작업을 모니터링하고 데이터 문제 및 거버넌스 활동을


확인할 수 있음

 NineHertz
▪ 2008년 설립된 기업으로 세계 여러 곳에 지점을 두고 있으며, 모바일앱 및 웹 개발, CMS, 디지털
마케팅, 빅데이터, IoT 등 다양한 부분의 제품 및 솔루션을 개발하는 기업

▪ 빅데이터 평가 컨설팅 서비스를 제공해주고, 각종 빅데이터 관련 솔루션을 제공하며, 데이터 품질


유지 모수 및 최적화 서비스도 제공

 Brewed @ The Lab Technologies


▪ 전세계 연구 및 개발 연구소 네트워크를 통해 IT 서비스, 컨설팅, 기술, 비즈니스 프로세스 관리,
마케팅 및 디지털 솔루션 분야에 우수한 법인 연구소

▪ 빅데이터 생산에 들어가기 전 데이터 모델을 작성하고 다양한 검증 방법을 적용하여 모델을
확인하고, 시간 경과에 따라 모델을 다시 검증하는 맞춤형 분석 솔루션 제공

56
56
빅데이터 내 데이터 품질검사 자동화 시스템

 IIH 노르딕

▪ 2005년 덴마크에 설립되었으며 마케팅 및 디지털 전략, 데이터 통계 등의 서비스를 제공하는


업체로, 제공하는 데이터 관리 플랫폼은 데이터가 높은 수준을 유지하도록 모니터링 및 품질
보증을 도와주고 데이터 거버넌스 전략 수립에 도움을 줌

▪ 예측 분석을 통해 기존 데이터를 기반으로 결과 또는 작업을 예측할 수 있는 기회를 제공

 Hitachi
▪ 품질 관리 솔루션(HCI, Hitachi Content Intelligence)은 100% 완전성과 정확성을 보장하는
데이터 확보가 어렵기 때문에 둘 중 하나를 선택하는 것이 아닌 적절한 균형을 확보하고자 개발된
품질관리 솔루션

*출처: www.HitachiVantara.com, Why Data Quality is Essential for Content Analytics

[목적에 부합하는 데이터를 지원하는 HCI]

 글로벌 제품의 경우 관계형 데이터베이스(RDB)만을 대상으로 하는 데이터 품질관리를 넘어서


하둡, 클라우드, 하이브리드 등 다양한 환경을 지원하고, 사물인터넷(IoT) 데이터 등 다양한
유형의 데이터, 즉 빅데이터의 품질 관리로 나아가고 있음

 해외 빅데이터 품질 검증 관련 현황은 미국 정보기술 연구 및 자문 회사인 가트너(Gartner)의


「2017 Gartner Magic Quadrant for Data Quality Tools」 자료로 확인 가능

57
57
전략품목 현황 분석

[빅데이터 품질 관리 도구 시장 내 각 업체별 위치]

▪ 가트너에서는 각 업체별 위치를 위 그림과 같이 사분면으로 분류

▪ Leaders는 모든 데이터 품질 기능에 걸쳐 깊이있는 강점을 보여주고, 데이터 품질 시장의 역동적인


경향에 대한 명확한 이해가 있음을 뜻함

▪ Challengers는 강력한 제품기능과 견고한 영업·마케팅 실행과 함께 존재감, 신뢰성 및 생존력을


확립하고 있지만, Leaders와 같이 넓은 분야에서는 지도력과 혁신을 보여주지 못할 수 있음

▪ Visionaries는 훌륭한 고객경험을 제공할 수 있지만, 규모 · 시장존재 · 브랜드인지도 · 고객기반 ·


회사자원이 부족할 수 있음

▪ Niche Players는 제한된 수의 산업 또는 데이터 영역 등을 전문으로 하지만, 일반적으로 시장


점유율이나 존재감과 기능이 제한적이거나, 재무 건전성이 부족

(2) 국내업체 동향

 현재 시중에는 데이터 품질관리 전문 기업의 다양한 품질관리 도구 상품이 출시

▪ 대부분의 데이터 품질 관리 도구는 회사마다 기능 및 인터페이스가 다소 차이는 있지만, 데이터


품질 관리 기능의 핵심이라고 할 수 있는 데이터에 대한 정보수집, 통계정보를 제공하는 데이터
프로파일링, 메타데이터 관리 등의 기능과 세부적으로는 업무규칙 관리, 스케줄관리, 결과분석,
보고서 산출 기능은 유사

▪ 기본적으로 데이터 품질 관리 기능은 우수하나 데이터 품질 관리 도구들이 지원하는 DB관리


시스템(DBMS, Database Management System)과 처리되는 DB가 적다는 단점이 발견

58
58
빅데이터 내 데이터 품질검사 자동화 시스템

 국내 데이터 품질 관리 솔루션은 데이터 거버넌스 구축 수요가 있는 고객 군을 위주로


강세를 보이고 있음

▪ 국내 데이터 품질 관리 솔루션을 제공하는 국내 기업으로는 데이터스트림즈, 엔코아, 위세아이텍


등이 있으며 여러 기업에서 솔루션 외에도 자체 개발한 데이터 품질 관리 방법론을 보유 중

[ 국내외 중요 기업 동향 ]

회사명 국가 제품명 특징

• 분석 대상 데이터베이스를 프로파일링해 현재 상태의 품질 수준을


Quality
데이터 한국 분석한 후 비즈니스 룰을 스케줄링해 결과를 분석하고 오류사항에
Stream
스트림즈 대한 정비 프로세스를 활용해 관리

• 데이터 품질 관리 기준 정의 기능, 프로파일 및 업무규칙 관리 기능,


DATAWARE
한국 품질진단 실행 기능, 측정 결과 분석 기능, 오류 원인 개선 관리
DQ#
엔코아 기능 제공

• 데이터 프로파일링, 데이터 오류 감시, 데이터 규칙 관리, 스케줄링


기능, 측정 결과의 다양한 분석 현황 제공
한국 WISE DQ
위세아이텍 • 인공지능 알고리즘을 통해 비표준 데이터의 도메인 자동 판별, 이상
값 탐지, 텍스트 데이터의 개선 데이터 추천 기능 제공

• 자동 데이터 프로파일링, 데이터 오디팅, 데이터 룰 관리, 데이터


한국 DQMiner
지티원 품질 분석, 데이터 품질 분석 결과 보고 등 제공

• 수동 작업을 위한 워크플로, 예외 처리를 위한 검토, 수정 및 승인


Informatica 기능 지원
미국 Data • 데이터 품질 규칙을 다양한 환경에서 재사용, 비즈니스 규칙
인포매티카 Quality 가속화를 위한 템플릿을 통해 신속한 데이터 검색과 프로파일링,
구조 및 컨텍스트 검사 기능 제공

• 소스 데이터 조사, 정보 표준화의 자동화, 비즈니스 규칙 측정,


InfoSphere 데이터 분석, 정리, 모니터링 기능 제공.
미국 Information
Server • 데이터 거버넌스 지원, 데이터 유효성 검사 규칙, 시퀀싱 및 영향도
IBM 분석 기능 제공

• 데이터 프로파일링, 모니터링 및 프로세스의 통합, 비표준적인


SAS Data 기록이나 중복 기록과 알려지지 않은 데이터 유형을 수정할 수 있는
미국
Quality 데이터 정리, 테이블, 데이터베이스, 소스 애플리케이션에서
SAS
나타나는 관계를 파악할 수 있는 데이터 프로파일링 기능 제공

• 100% 완전성과 정확성을 보장하는 데이터 확보가 어렵기 때문에


둘 중 하나를 선택하는 것이 아닌 적절한 균형을 확보하고자 개발
일본 HCI • 데이터의 위치나 형태와 상관없이 기업 내 모든 데이터를 연계 및
히타치
통합할 수 있도록 지원하며 데이터가 다양한 목적으로 사용되도록
데이터를 준비

출처: 한국데이터진흥원, 데이터산업백서

59
59
전략품목 현황 분석

다. 특허동향

◎ 빅데이터 내 데이터 품질검사 자동화시스템 기술 분야 특허상 주요 기술

 주요 기술
▪ 데이터품질 진단 및 평가, 패턴 분석, 데이터 전처리 기술, 데이터 이상값 탐지 가술, 명칭 오류
탐지 기술, 데이터 품질 개선 기술 등이 포함됨

요소기술 코드 설명

누적된 데이터를 이용하여 이상 데이터를 검출하여


데이터품질 진단 및 평가 A
데이터의 품질은 진단하고 평가가 가능하도록 하는 기술

주어진 데이터의 집합에 대해 입력 값을 바탕으로 특정


패턴 분석 B
기준에 따라 여러 개의 그룹으로 분류 또는 인식하는 기술

기본 메타데이터를 수집/분석하고, 데이터 유형 분류 및


데이터 전처리 기술 C
지표 및 평가방법을 매칭하는 기술

다양한 머신러닝 알고리즘을 적용해서 데이터의 이상값을


데이터 이상값 탐지 기술 D
탐지하는 기술

텍스트 데이터 클러스터링 등의 방법을 이용한 명칭 오류


명칭 오류 탐지 기술 E
탐지 기술

오류 및 개선 결과에 대한 기계학습을 통하여 데이터


데이터 품질 개선 기술 F
품질을 개선하는 기술

60
60
빅데이터 내 데이터 품질검사 자동화 시스템

◎ 세부 분야별 특허동향

 주요 기술별 출원인 국적별 특허동향

▪ 빅데이터 내 데이터 품질검사 자동화시스템 기술의 요소기술별 주요출원인 국적별 특허정보 데이터
입수하였으며, 최근 10년간의 특허 데이터를 비교 분석

요소기술 한국 미국 일본 유럽 ETC 계

데이터품질 진단 및 평가 0 1 0 0 0 1

패턴 분석 288 58 11 15 34 406

데이터 전처리 기술 15 1 1 0 0 17

데이터 이상값 탐지 기술 3,661 33,486 10,030 17,701 10,932 75,810

명칭 오류 탐지 기술 8 16 9 0 1 34

데이터 품질 개선 기술 131 1,542 104 315 315 2,407

합계 4,103 35,104 10,155 18,031 11,282 78,675

▪ 요소기술별 출원인 국적별 특허동향에서 미국국적의 출원인이 가장 활발한 연구개발을 하고 있으며,


그 다음으로는 유럽, 한국, 일본 국적 출원인 순으로 나타남

▪ 데이터품질 진단 및 평가기술은 전체적으로 관련 특허 출원 실적이 미미

▪ 패턴 분석 기술 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고 있으며, 그 다음으로는


미국, 일본, 유럽국적 출원인 순으로 특허를 많이 출원

▪ 데이터 전처리 기술 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고 있으며, 미국,


일본, 유럽국적의 출원인이 상대적으로 출원량을 보유하고 있지 않음

▪ 데이터 이상값 탐지 가술 분야에서는 미국국적의 출원인이 가장 많은 비중을 차지하고 있으며, 그


다음으로는 유럽, 한국, 일본국적 출원인 순으로 특허를 많이 출원

▪ 명칭 오류 탐지 기술 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고 있으며, 그


다음으로는 일본, 미국국적의 출원인 순으로 특허를 많이 출원

▪ 데이터 품질 개선 기술 분야에서는 미국국적의 출원인이 가장 많은 출원을 하고 있으며, 그


다음으로는 일본, 한국, 유럽국적 출원인 순으로 특허를 많이 출원

61
61
전략품목 현황 분석

▪ 관점을 국내·외 출원인으로 바꾸어 보면 한국국적의 출원인은 외국국적의 출원인에 비해 패턴 분석


기술(B), 데이터 품질 개선 기술(F) 분야의 출원 비중이 상대적으로 높게 나타남

▪ 반면, 한국국적의 출원인은 외국국적의 출원인에 비해 데이터 이상값 탐지 기술(D) 분야에


상대적으로 특허 출원 비중이 상대적으로 낮은 것으로 나타남

▪ 한국국적 출원인의 특허 출원량은 거의 변동 없이 출원량이 미미하며 데이터 이상값 탐지 가술


분야에서 비교적 꾸준히 출원량이 높아지는 경향

▪ 외국국적 출원인의 특허 출원량도 한국국적 출원인과 유사하게 출원량이 미미하게 출원되고 있으며,
데이터 이상값 탐지 가술 분야에서 급격히 출원량이 높아지는 경향

62
62
빅데이터 내 데이터 품질검사 자동화 시스템

 주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도

데이터품질 진단 및 평가 ◯ •Dennis Van Dusen •국내출원 없음

•IBM • 공공연구기관 중심
패턴 분석 ● •삼성전자 •한국전자통신연구원,
•ABB Technology 에스케이텔레콤 등

•공공연구기관 중심
•IBM
데이터 전처리 기술 ◔ •Apple
•아주대학교산학협력단,
한국전자통신연구원 등

•IBM
•The Boeing Company •대기업 중심
데이터 이상값 탐지 기술 ● •GE Company •삼성전자, 현대자동차, LG전자 등
•Ford

•IBM
•대기업 중심
명칭 오류 탐지 기술 ◯ •Google
•삼성전자, 전자부품연구원 등
•Intel

•IBM •대기업 중심
데이터 품질 개선 기술 ● •GE Company •삼성전자, 현대자동차,
•The Boeing Company 동국대학교 산학협력단 등

※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

63
63
전략품목 현황 분석

 데이터품질 진단 및 평가 기술 분야 주요 출원인 동향

▪ 데이터품질 진단 및 평가 기술 분야는 각 국가에서 출원량이 거의 없기 때문에 출원인 동향을 하지 않음

 패턴 분석 기술 분야 주요 출원인 동향

▪ 패턴 분석 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며 그 다음으로는 삼성전자, ABB


Technology 등이 일부 특허를 출원

 데이터 전처리 기술 분야 주요 출원인 동향

▪ 데이터 전처리 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며 그 다음으로는 Apple 등이


일부 특허를 출원

 데이터 이상값 탐지 기술 분야 주요 출원인 동향

▪ 데이터 이상값 탐지 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며 그 다음으로는 The


Boeing Company, GE Company, Ford 순으로 다수의 특허를 보유함

 명칭 오류 탐지 기술 분야 주요 출원인 동향

▪ 명칭 오류 탐지 기술 분야는 출웡량은 거의 미미하며 IBM, Google, Intel 등이 일부 출원

 데이터 품질 개선 기술 분야 주요 출원인 동향

▪ 데이터 품질 개선 기술 분야는 IBM이 가장 많은 특허를 보유하고 있으며 그 다음으로는 GE


Company, The Boeing Company 순으로 다수의 특허를 보유

64
64
빅데이터 내 데이터 품질검사 자동화 시스템

◎ 국가별 특허활동지수(AI) 비교

 특허활동지수(Activity Index)는 상대적 집중도를 살펴보기 위한 지표로서, 그 값이 1보다 큰


경우에는 상대적 특허활동이 활발함을 나타냄

 한국은 데이터품질 진단 및 평가 기술, 데이터 이상값 탐지 가술 분야에서는 특허활동이


부진하나, 패턴 분석 기술, 데이터 전처리 기술, 명칭 오류 탐지 기술, 데이터 품질 개선
기술 분야의 특허출원은 활발한 것으로 나타남

 미국은 패턴 분석 기술, 데이터 전처리 기술, 데이터 이상값 탐지 기술 분야에서는


특허활동이 부진하나, 데이터품질 진단 및 평가 기술, 명칭 오류 탐지 기술, 데이터 품질
개선 기술 분야의 특허출원은 활발한 것으로 나타남

 일본은 데이터품질 진단 및 평가 기술, 패턴 분석 기술, 데이터 전처리 기술, 데이터 품질


개선 기술 분야에서는 특허활동이 부진하나, 데이터 이상값 탐지 기술, 명칭 오류 탐지 기술
분야의 특허출원은 활발한 것으로 나타남

 유럽은 데이터품질 진단 및 평가 기술, 패턴 분석 기술, 데이터 전처리 기술, 명칭 오류 탐지


기술 분야에서는 특허활동이 부진하나, 데이터 이상값 탐지 기술 분야의 특허출원은 활발한
것으로 나타남

65
65
전략품목 현황 분석

◎ 질적 수준을 고려한 각국의 시장력 분석

 시장력이 전체 평균 1.3을 상회하는 국가로는 미국 외에 호주, 오스트리아, 스위스, 아일랜드,


이스라엘, 노르웨이가 있으며, 질적인 수준이 높은 특허 보유국은 미국

▪ 질적인 측면을 같이 고려한 시장력에 있어서 오스트리아, 스위스, 아일랜드, 이스라엘, 노르웨이는
질적 수준은 높지만 시장성은 낮은 국가 쪽으로 조사

▪ 미국은 시장력 면에선 유럽국가와 유사 혹은 다소 뒤지지만 질적 수준은 가장 높은 것으로 나타남

▪ 한국과 일본은 시장성이 낮고 질적 수준도 낮은 국가에 속하는 것으로 조사됨

PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)

ETC 11282 1.372009 1.264159

EU 18031 1.297654 0.932599

JP 10155 1.173511 0.998873

KR 4103 1.196685 0.679245

US 35104 1.317514 2.630543

전체평균 666 1.30 1.92

◎ 빅데이터 내 데이터 품질 검사 자동화 시스템 기술 분야의 주요 경쟁기술 및 공백기술

 빅데이터 내 데이터 품질 검사 자동화 시스템 기술 분야의 주요 경쟁기술은 패턴 분석 기술,


데이터 이상값 탐지 기술, 데이터 품질 개선 기술이, 공백기술은 데이터품질 진단 및 평가
기술과 명칭 오류 탐지 기술로 나타남

▪ 빅데이터 내 데이터 품질 검사 자동화 시스템 기술 분야에서 데이터 이상값 탐지 기술이 가장


경쟁이 치열한 분야이고, 데이터품질 진단 및 평가 기술, 명칭 오류 탐지 기술 분야는 아직까지
출원이 활발하지 않은 공백기술 분야로 나타남

요소기술 기술 집중도

데이터품질 진단 및 평가 ◯
패턴 분석 ●
데이터 전처리 기술 ◔
데이터 이상값 탐지 기술 ●
명칭 오류 탐지 기술 ◯
데이터 품질 개선 기술 ●
※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

66
66
빅데이터 내 데이터 품질검사 자동화 시스템

◎ 최신 국내 특허기술 동향

요소기술 최근 핵심기술 동향
•네트워크의 데이터 관리 기술 및 이를 이용한 응용
데이터품질 진단 및 평가
서비스 제공 기술

•인공 지능 원인 분석 패턴 생성과 네트워크 패킷의


패턴 분석
패턴 분석 및 이를 이용한 응용 서비스 제공 기술

•머신 러닝 알고리즘을 이용하고 인공지능 기반


데이터 전처리 기술 역공학을 이용한 공장 자동화 시스템 및 이를 이용한
응용 서비스 제공 기술

•AI 딥러닝 기반의 악성코드 탐지 및 대량 데이터 기반


데이터 이상값 탐지 기술
의미 오류 교정 규칙 생성 기술

•기계 학습 데이터셋에 대한 레이블링 방법 및 대용량


명칭 오류 탐지 기술
데이터의 클러스터 결과 분석 시스템 기술

•기계 학습을 이용한 신호의 처리 및 뉴럴 네트워크를


데이터 품질 개선 기술
이용한 인식 방법과 딥 러닝을 이용한 룰 생성 기술

 국내 특허동향을 살펴보면 대기업은 데이터 이상값 탐지 기술, 명칭 오류 탐지 기술, 데이터


품질 개선 기술을, 공공연구기관은 패턴 분석 기술과 데이터 전처리 기술을 집중적으로
연구개발하고 있는 것으로 나타남

▪ 데이터품질 진단 및 평가 기술 분야는 전체적으로 관련 특허가 거의 없는 분야로서 관련 한국 특허


역시 없음

▪ 패턴 분석 기술 분야는 인공 지능 원인 분석 패턴 생성 장치 기술, 실시간 영상 스트리밍의 네트워크


패킷의 패턴 분석 기반 영상 분석 기술 등이 공공연구기관을 중심으로 연구개발 되고 있음

▪ 데이터 전처리 기술 분야는 머신 러닝 알고리즘을 이용하는 방법 기술, 빅데이터와 기계학습을 이용한


타겟 정보 예측 시스템 기술, 인공지능 기반 역공학을 이용한 공장 자동화 시스템의 분석 기술,
하이브리드 방식의 영상 데이터 전처리 기술 등이 공공연구기관을 중심으로 연구개발 되고 있음

▪ 데이터 이상값 탐지 기술 분야는 AI 딥러닝 기반의 악성코드 탐지 시스템 기술, 대량 데이터 기반


의미 오류 교정 규칙 생성 기술, 소프트웨어 정의 네트워크에서의 악성 프로그램 탐지 장치 기술
등이 대기업을 중심으로 연구개발 되고 있음

▪ 명칭 오류 탐지 기술에서는 기계 학습 데이터에 대한 레이블링 장치 기술, 인공지능에 기반한


개인별 맞춤형 광고 기술, 대용량 데이터의 클러스터 결과 분석 시스템 기술 등이 대기업을
중심으로 연구 개발되고 있음

▪ 데이터 품질 개선 기술 분야는 기계 학습을 이용한 전자기 간섭 신호의 처리 기술, 뉴럴 네트워크를


이용한 인식 기술, 딥러닝을 활용한 개인화 기술 등이 대기업을 중심으로 연구개발 되고 있음

67
67
전략품목 현황 분석

◎ 중소기업 특허전략 수립 방향 및 시사점

 빅데이터 내 데이터 품질검사 자동화시스템 기술 분야의 공백기술 분야는 데이터품질 진단 및


평가 기술, 명칭 오류 탐지 기술 기술이고 중소기업의 시장진입 상대적으로 수월한 분야는
데이터품질 진단 및 평가 기술로 나타남

▪ 빅데이터 산업은 기존의 데이터베이스 관리도구가 처리할 수 있는 역량을 넘어서는 정형·반정형·비정형


데이터세트(data set)의 집적물, 그리고 이로부터 경제적으로 필요한 가치를 추출 및 분석할 수 있는
기술로 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 폭발적으로 생성되는 웹 문서, 이메일, 소셜
데이터(소셜 네트워크 서비스 텍스트 데이터, 유튜브 비디오 데이터 등) 등을 활용하여 빅데이터
분석에 기반한 마케팅, 전자상거래, SNS 정보, 인적 네트워크 정보와 연계해 다양한 개인 맞춤형
서비스를 제공할 수 있으므로, IoT 시대의 도래에 따라 산업적 활용도는 대폭 증가할 전망

▪ 향후 중소기업은 대기업들의 경쟁이 치열한 데이터 이상값 탐지 기술, 명칭 오류 탐지 기술, 데이터


품질 개선 기술 보다는 시장진입이 상대적으로 용이한 데이터품질 진단 및 평가 기술 분야에
집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한 패턴 분석 기술과 데이터 전처리
기술 분야에서는 기술 매입이나 라이센싱 등을 통해 부족한 연구개발능력을 보완하는 것이 바람직할
것으로 사료됨

4. 연구개발 네트워크

가. 연구개발 기관/자원

◎ 연구개발 기관

 빅데이터 품질검사 자동화 관련 연구개발 기관

▪ 행정안전부 공공데이터 정책과

- 공공데이터 품질관리 수준 평가제도 정책 총괄


- 평가계획 수립 및 평가결과의 공표

▪ 한국정보화진흥원 공공데이터 활용지원센터

- 공공데이터 품질관리 수준 평가제도 실무 전담 관리


- 공공데이터 품질관리 수준평가 실시 및 종합결과보고서 작성

▪ 한국데이터산업진흥원 KDATA

- 각종 데이터 산업 지원 및 인력양성 지원
- 공공/민간 데이터의 품질,관리, 보안에 관한 인증을 진행

68
68
빅데이터 내 데이터 품질검사 자동화 시스템

◎ 연구개발 자원

 국가 연구개발 지원사업

▪ 공공 데이터 포털

- 공공데이터 품질관리 표준 및 수준 평가

▪ 농촌진흥청

- 공공데이터 품질관리 개선 사업

▪ 한국 데이터 진흥원

- 빅데이터 품질 인증 모델 개발을 위한 사업화 진행


- 데이터 품질인증, 관리인증, 보안 인증과 관련된 데이터 인증(DQC) 진행 및 실무 교육
- 데이터 인공지능, IoT, 빅데이터, 품질 및 블록체인과 관련된 그랜드 컨퍼런스 진행

나. 연구개발 인력

 빅데이터 품질 검사 분야는 행정안전부 공공데이터 정책과 산하 한국정보화 진흥원


공공데이터 활용 지원센터, 한국데이터산업진흥원에서 표준 재정 및 평가와 연구를 진행 중

[ 빅데이터 내 품질검사 자동화 분야 주요 연구조직 현황 ]

기관 소속 연구분야

•공공데이터 개방 추진 및 제공
•공공데이터품질관리 수준평가
행정안전부 공공데이터정책과
•개방표준 고시 제정 및 확대
•기업지원정책

•공공데이터의 제공 및 이용 정책, 제도의 조사·연구


•공공데이터의 제공 및 이용과 관련한 통계의 조사·분석
•공공데이터 목록의 등록 및 등록정보의 관리
•공공데이터포털의 구축·관리 및 활용 촉진
•공공데이터의 품질진단·평가 및 개선, 표준화 지원
•공공데이터의 제공형태 정비 및 제공방안 구축 지원
한국정보화진흥원 공공데이터활용지원센터
•공공데이터의 제공 및 이용 상담, 제공 대행
•공공데이터 활용 서비스모델 발굴 및 이용활성화 지원
•공공데이터의 제공·이용 홍보 및 교육·훈련
•공공데이터 민간협력 및 국제협력 지원
•공공데이터전략위원회, 분쟁조정위원회 운영 지원
•그 밖에 공공데이터의 효율적 제공 및 이용 활성화 지원

•사업·예산 총괄 조정 및 데이터 관련 법·제도


경영기획실 •정책기획 및 중장기 전략 수립
한국데이터산업진흥원 산업지원실 •데이터 품질진단 및 인증
품질표준팀 •데이터품질시험체계 구축 및 운영
•데이터 표준 개발 및 관련 국내외 협력

69
69
전략품목 현황 분석

다. 기술이전가능 기술

◎ 기술이전가능 기관 및 세부내용

 빅데이터 내 품질검사 자동화 시스템의 요소기술은 크게 기반기술, 자동화시스템의 두 개의


분류로 구분

 기술이전이 가능한 기관은 한국전자통신연구원 등이 있음

[ 빅데이터 내 품질검사 자동화 시스템 분야 관련 이전 기술 ]

기관 이전 기술 내용

•응용 장비들로부터의 정보, SNS/포털사이트 등에서의


정보, 공공기관에서 제공하는 정보 등 빅데이터의 수집
한국전자통신 기능과 수집된 정보의 전처리, 전처리 정보의 저장 및
빅데이터 정보 자율제어 기술
연구원 조회,전달을 자율적으로 제어하는 기술에 관한 것으로
품질검사 자동화 시스템 구축을 위한 기초 플랫폼으로
활용 가능

70
70
빅데이터 내 데이터 품질검사 자동화 시스템

5. 기술개발로드맵

가. SWOT 분석

중소기업 시장대응전략

강점(Strength) 약점(Weakness)

•(환경) 4차산업혁명에 따른 빅데이터 시대 강조 •(환경) 빅데이터에 대한 낮은 신뢰성


•(기술) IoT, 클라우드, 빅데이터의 연계구조 확산 •(기술) 핵심 원천기술 미흡
•(정책) 인공지능 산업 활성화에 따른 관련 투자 증가 •(정책) 단기간 성과 도출 중심 투자

기회(Opportunity) 위협(Threat)

•(환경) 대기업의 빅데이터 도입 확산 •(환경) 빅데이터 분석 전문인력 부족


•(기술) 실시간 데이터 분석 기술의 발전 •(기술) 원천기술에 대한 기업경쟁력 미흡
•(정책) 빅데이터 활성화 정책 확대 •(정책) 개인정보유출 및 침해로 인한 정책마련 부족

중소기업의 시장대응전략

➜ 현재 기초적인 품질검사 솔루션들을 이용해 인공지능 엔진을 접목하여 자동화 시스템을 구축하고,
현재 품질검사 인력을 대체할 수 있도록 하여 데이터 품질을 향상
➜ 자동화 시스템 구축을 위한 적절한 인공지능 엔진 및 자동화 시스템 플랫폼 개발

나. 중소기업 핵심요소기술

(1) 핵심요소기술 도출절차

 특허/논문 분석을 통한 요소기술과 기술수요와 각종 문헌을 기반으로 한 요소기술, 전문가


추천 요소기술을 종합하여 품목별 전문가를 통해 분류조정한 후, 전문가 평가과정을 거쳐
핵심요소기술을 선정
- 기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업 적합성(10)을 고려하여 평가

요소기술 요소기술 핵심요소기술 핵심요소기술


Pool 구성 분류 조정 선정평가 선정

- 특허/논문 분석 è - 품목별 전문가 è - 산학연 전문가 검토 è - 평가결과 반영


- 기술수요 및
요소기술 분류 - 평가항목별 요소기술 로드맵 기획 대상
문헌분석
조정·재정의 선정평가 핵심요소기술 도출
- 전문가 추천

71
71
전략품목 현황 분석

(2) 요소기술

 산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처 로드맵, 중소기업 기술수요를 바탕으로
로드맵 기획을 위하여 요소기술 도출

 요소기술을 대상으로 전문가를 통해 기술의 범위, 요소기술 간 중복성 등을 조정·검토하여


최종 요소기술 확정

[ 빅데이터 내 품질검사 자동화 시스템 분야 요소기술 ]

요소기술 출처

데이터품질 진단 및 평가 특허/논문 분석, 전문가추천

유사도 측정 특허/논문 분석, 전문가추천

패턴 분석 특허/논문 분석, 전문가추천

전처리 기술 특허/논문 분석, 전문가추천

데이터 이상값 탐지 가술 특허/논문 분석, 전문가추천

명칭 오류 탐지 기술 특허/논문 분석, 전문가추천

비정형 텍스트 분석 기술 특허/논문 분석, 전문가추천

이미지 분석 기술 특허/논문 분석, 전문가추천

품질 수준 평가 기술 특허/논문 분석, 전문가추천

데이터 품질 개선 기술 특허/논문 분석, 전문가추천

72
72
빅데이터 내 데이터 품질검사 자동화 시스템

(3) 핵심요소기술 도출

 확정된 요소기술을 대상으로 산․학․연 전문가로 구성된 핵심요소기술 선정평가를 통하여


중소기업에 적합한 핵심요소기술 선정

[ 빅데이터 내 품질검사 자동화 시스템 분야 핵심요소기술 ]

분류 핵심요소기술 설명

누적된 데이터를 이용하여 이상 데이터를 검출, 데이터의 품질을


데이터품질 진단 및 평가
진단하고 평가가 가능하도록 하는 기술

주어진 빅데이터의 집합에 대해 입력 값을 바탕으로 특정 기준에


패턴 분석
따라 여러 개의 그룹으로 분류 또는 인식하는 기술

기본 메타데이터를 수집/분석하고, 데이터 유형 분류 및 지표 및


전처리 기술
빅데이터 평가방법을 매칭하는 기술
품질 검사
전처리 기술

다양한 머신러닝 알고리즘을 적용해서 데이터의 이상값을


데이터 이상값 탐지 가술
탐지하는 기술

텍스트 데이터 클러스터링 등의 방법을 이용한 명칭 오류 탐지


명칭 오류 탐지 기술
기술

빅데이터
오류 및 개선 결과에 대한 기계학습을 통하여 데이터 품질을
품질 검사 데이터 품질 개선 기술
개선하는 기술
후처리 기술

73
73
전략품목 현황 분석

다. 기술개발전략

(1) 우리의 현황

 국내 빅데이터 내 데이터 품질 검사 자동화 시스템 분야에서의 시장 규모는 2,987억 원이며


세계 시장은 590억 400만 달러 규모인 것으로 파악

 국내 시장 성장률은 24.7%로 세계 시장 성장률인 10.6%보다 높은 수치를 보임

 국내 중소기업의 빅데이터 내 데이터 품질검사 자동화 시스템 분야 기술 수준은 세계 최고수준을


보유(100%)한 미국을 기준으로 48.7%, 7.17년의 기술격차를 보이는 것으로 조사됨

 특허 출원량은 4,103건으로 미국의 35,104건에 비해 낮은 수치

 특허 피인용지수는 미국이 2.6으로 가장 높은 수치이며 국내는 0.7로 분석됨

[ 빅데이터 내 데이터 품질검사 자동화 시스템 전략 캔버스(Strategy Canvas) ]

* 기술수준은 응답자 평균치

74
74
빅데이터 내 데이터 품질검사 자동화 시스템

(2) 기술개발로드맵

 국내 중소기업은 빅데이터 획득이 어려워 독자적으로 빅데이터 내 데이터 품질 검사 자동화


시스템을 구축하는데 어려움이 있을 것으로 판단

 해외 기업 또는 국내 선두 기업들의 플랫폼을 차용하여 이를 활용한 서비스를 개발하는 것이


시장성을 갖추는데 효과적일 전망, 또한 정부에서 공개하는 공공 데이터를 활용하는 것이
한정적인 재화라는 문제 해결에 도움이 될 것으로 전망

 국내 관련 시장의 규모는 작으나, 성장률은 세계 시장 성장률을 웃도는 수치를 나타내어,


발전 가능성이 있는 품목으로 분석

75
75
※ 참고 : 핵심요소기술 평가결과

지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성

데이터품질 진단 및 평가 8.4 7.6 7.8 8.6 32.4 선정

유사도 측정 6.4 7.6 7.6 6.8 28.4

패턴 분석 7.8 8 7.4 8.2 31.4 선정

전처리 기술 7.8 7.8 7.2 8.6 31.4 선정

데이터 이상값 탐지 가술 7.6 8.4 7.4 8.2 31.6 선정

명칭 오류 탐지 기술 7.6 8.2 7.4 8.2 31.4 선정

비정형 텍스트 분석 기술 7.6 7.6 7 8.6 30.8

이미지 분석 기술 8.2 7.2 7.4 8.2 31

품질 수준 평가 기술 8.2 7.8 7 8 31

데이터 품질 개선 기술 8.8 8.2 7.4 8.4 32.8 선정

76
전략품목 현황분석

자연어 처리기반
텍스트 마이닝

77
78
자연어 처리기반 텍스트 마이닝

정의 및 범위

▪ 자연어 처리기반 텍스트 마이닝은 사람들이 말하는 언어를 이해할 수 있는 자연어처리(Natural Language
Processing) 시스템을 기반으로 자연어로 구성된 비정형 텍스트 데이터에서 패턴 또는 관계를 추출하여 정보를
찾아내는 마이닝 기법

▪ 텍스트 마이닝 (Text mining)은 데이터 마이닝의 일부로, 데이터 마이닝이 수치 데이터를 다루는 것과는 달리
자연어처리 도구 활용을 통하여 비정형 데이터의 수치데이터화 과정까지를 포함하는 개념

▪ 비정형 텍스트의 다양한 의미 분석 기술을 활용하여 유의미한 정보들을 추출하고 패턴을 도출하여 다양한 서비스에
활용하거나 다양한 서비스를 위한 핵심 정보들을 추출하는 응용 기술

정부지원 정책

▪ ‘I-Korea 4.0 실현을 위한 인공지능 R&D 전략’을 수립(’18. 5)하여 세계적 수준의 인공지능 기술력 및 R&D 생태계
확보를 목표로 2018년부터 5년간 2.2조원 투자 추진
- 2022년까지 6개의 대학원을 설립하여 5,000명의 인공지능 전문가를 육성하고, 단기적 인공지능 인력의
필요에 대비하여 600명의 예비 인력 훈련 추진

- 인공지능대학원 신설, 대학연구센터의 AI 분야 지원 확대, 글로벌 기업과의 공동연구 지원 등을 통해


핵심·차세대 원천 기술 개발을 위한 고급 인재 양성 목적

▪ ‘17년~’23년에 거쳐 인공지능관련 국가전략프로젝트를 실행, ‘딥뷰’, ‘엑소브레인’ 등 인공지능 차세대 기술개발 장기


프로젝트에 중점을 둔 추진 사업으로 90억원의 사업비를 투자한 것으로 알려짐

▪ 활용가치가 높은 공공, 민간 데이터를 인공지능 학습용(Machine Learning) 데이터로 가공하여 제식 베이스 구축 및


제공 목적으로 ‘17년부터 5년 간 지능정보산업인프라 조성 R&D 정책을 집행, 언어처리에 활용될 수 있는 데이터의
양 또한 증가할 것으로 보여, 텍스트 마이닝 기술 발전에 보탬이 될 전망

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 세계시장 대비 한글 음성인식 수요 미미
•(환경) 응용서비스 기술 및 산업 환경 등 잘 구축된 인프라
•(기술) 다국어 음성데이터 확보 및 원천기술력 부족에 따른
•(기술) 다양한 영역의 우수한 IT 인프라
기술 장벽 극복
•(정책) 언어 및 음성인식 SW분야의 기업차원 대규모 투자
•(정책) 산ㆍ학ㆍ연ㆍ정부 연계 미흡

기회(Opportunity) 위협(Threat)
•(환경) 클라우드 컴퓨팅 및 스마트 모바일 기기 확산에 따른 •(환경) 원천기술 보유 외국 기업이 국내 기업과 기술제휴를
정보통신 패러다임의 변화 통한 국내 시장 잠식
•(기술) 복잡한 기능의 디지털화된 기기의 제어를 위한 자연어 •(기술) 글로벌 선두 업체 국내진출과 기술격차
인식 기술개발 초기단계 •(정책) 자체적인 기술 개발력을 가진 대기업의 첨단투자 집중
•(정책) 정부와 업계의 높은 니즈 및 시장 지배력 증가

중소기업의 시장대응전략
➜ 자연어 처리 텍스트 마이닝 주변 기술에 대한 인프라 구축 등 비용절감 전략 수립
➜ 기관에서 무료나 유료로 제공되는 대규모 데이터와 오픈 API를 적극적으로 활용한 기술개발
➜ 자연어 처리기반 텍스트 마이닝 응용환경을 고려한 독자적인 핵심 기술과 고급 개발 인력 확보
전략품목 현황분석

1. 개요

가. 정의 및 필요성

 자연어 처리기반 텍스트 마이닝은 사람들이 말하는 언어를 이해할 수 있는 자연어처리(Natural


Language Processing) 시스템을 기반으로 자연어로 구성된 비정형 텍스트 데이터에서 패턴
또는 관계를 추출하여 정보를 찾아내는 마이닝 기법

 텍스트 마이닝 (Text mining)은 데이터 마이닝의 일부로, 데이터 마이닝이 수치 데이터를
다루는 것과는 달리 자연어처리 도구 활용을 통하여 비정형 데이터의 수치데이터화
과정까지를 포함하는 개념

 비정형 텍스트의 다양한 의미 분석 기술을 활용하여 유의미한 정보들을 추출하고 패턴을


도출하여 다양한 서비스에 활용하거나 다양한 서비스를 위한 핵심 정보들을 추출하는 응용
기술 요구

▪ 정보 서비스에 활용하기 위한 의미 정보를 텍스트에서 추출하기 위한 다양한 응용기술들을 포함

 모바일과 웹을 통해 기하급수적으로 증가하고 있는 비정형 텍스트 데이터를 적극적으로


활용하는 다양한 신규 서비스와 시장 확대 요구
▪ 비정형 데이터의 생산량은 매년 증가하고 있으며, 그 속도 또한 점차 증가

▪ 전 세계에서 매일 하루에 생성되는 데이터의 양은 약 2.5EB(ExaByte) 이상이며, ‘20년에는 데이터의


양이 40ZB(Zetabyte) 생성 될 것으로 추정

 빅데이터 분석 및 인공지능 활용 확대에 따른 기업과 시장의 변화

▪ 포레스터리서치의 보고서(Predictions 2018: The Honeymoon For AI Is Over)에서 전세계 기업들은


빅데이터 분석 및 AI 기술을 도입하겠다는 단순한 의사 표시를 지나 본격적인 도입 계획을 가지고 있는
것으로 분석

 향후 보다 향상된 인터페이스를 기반으로 하는 인간-기계(HCI, Human-Machine Interface)의 공동


업무 활동이 일반화 될 것으로 전망하였으며, 특히 비즈니스 인텔리전스 및 분석 솔루션의
향상으로 빅데이터의 관리 및 재설계를 용이하게 하여 서비스로서의 기업 인사이트(Insight as a
Service) 시장이 크게 확대될 것으로 예측

80
80
자연어 처리기반 텍스트 마이닝

*출처: Annu297
[ 인간 수준에 도달한 컴퓨터의 인공지능 ]

 전 세계 주요 기업의 70%는 앞으로 1년 동안 빅데이터 재설계 및 AI 기반 시스템을 구현하게 될


것이며, 이는 ‘16년 40%에서 ‘17년 51%로 증가했던 수치를 ’18년에는 크게 뛰어넘을 것으로
전망, 이에 따라 포레스터리서치는 ‘18년에 나타날 현상을 10가지로 정의
▪ 첫째, 기업의 25%는 대화형 인터페이스와 포인트별 방안 제시를 통해 의사결정의 품질을 크게
높일 것으로 예측

- 자연어를 사용하여 데이터를 쿼리하고 그 결과로 시각화된 정보를 실시간으로 확보하는 것이


빅데이터 분석의 표준이 될 것으로 예측

▪ 둘째, 기업의 33%는 데이터레이크가 기업 생존에 중요한 역할을 차지할 것으로 예측

- 비즈니스 변화에 대한 명확한 연결고리가 없다면 기업들은 자금에 대한 비용을 지불할 수밖에 없을
것이며 살아남기 어려운 상황에 직면할 것으로 예측

▪ 셋째, 기업의 50%는 빅데이터 분석을 위한 Cloud-First 전략을 채택할 예정

- ‘18년에 기업의 50%는 빅데이터 분석을 위해 클라우드 우선 전략을 채택할 것으로 예측되며, 그
중 클라우드 우선 정책을 채택할 것으로 예상

▪ 넷째, 기업의 66%는 조직의 불균형의 해결 수단으로 통합 Insight Center를 구축할 예정

- 고객의 목소리를 통일된 방식으로 분석하고 있거나 빅데이터 기반의 비즈니스 의사결정에 반영한
기업의 56%는 이미 이를 달성하기 위해 분산된 모델보다는 중앙 집중식 또는 통합 Insight
center를 구축하겠다는 의사를 표시

▪ 다섯째, 대다수의 최고 데이터 책임자(CDOs)는 공격적인 형태로 기업 혁신에 집중

- 빅데이터 시대의 새로운 비즈니스 중심 인력 중 하나인 CDO는 비즈니스 경쟁력을 위해 내부


데이터뿐만 아니라 외부의 데이터 분석이 가능한 영역을 찾고 빅데이터 분석 시스템을 통해 데이터
분석 시스템을 혁신할 수 있는 기회를 모색할 것으로 예측되며 이러한 응답률은 ‘16년 34%,
‘17년에 40%, ’18년에는 CDO의 50%이상이 이러한 계획을 CEO에 보고할 것으로 예측

81
81
전략품목 현황분석

▪ 여섯째, ‘18년, 빅데이터 엔지니어가 가장 각광받게 될 것으로 예측

- Indeed.com에서 밝힌 데이터 관련 채용 정보 중 13%는 빅데이터 및 데이터 엔지니어를 타깃으로


하고 있으며 빅데이터 도입 추세가 업무에 중요한 영향을 미치고 있는 것으로 나타남
- 특히 비즈니스 분석가와 빅데이터 엔지니어에게는 폭 넓은 지원을 제공해야한다는 필요성이 나타남

▪ 일곱째, Insights-as-a-Service 시장은 구독 형태의 도입 증가로 인해 2배로 성장

- 전 세계 기업의 66%는 이미 비즈니스 인텔리전스 솔루션의 11%에서 75%를 아웃소싱하고 있으며


‘18년에는 기업의 80%가 Insight 역량의 일부를 Insight-as-a-Service 업체에 의존할 것으로 예측

▪ 여덟째, 세계 주요 기업의 20%는 실시간 지침을 내려주는 인공지능 시스템을 구축할 것으로 예측

- 기업의 20%는 빅데이터 기반의 인공지능(AI)시스템이 의사 결정을 내리고 실시간 지침을 제공하게
될 것이며 빅데이터 분석을 통해 AI는 고객에게 무엇을 제공할지, 공급 업체에게는 어떤 조건을
제안할지, 직원들에게는 무엇을 말하고 행동할지를 실시간으로 알려주게 될 것으로 예측

▪ 아홉째, 빅데이터 기술과 AI는 비정형 데이터와 정형데이터의 경계를 지워줄 것으로 예측

- 포레스터리서치의 조사에서 100테라바이트 이상의 비정형 데이터를 보유한 기업의 글로벌 설문


응답자의 수는 ‘16년 대비 2배가 되었으나 기존의 텍스트 분석 플랫폼이 다소 복잡하고 일부
기업만 이용할 수 있었으나 AI를 통해 빅데이터 분석은 보다 완성형으로 진화할 것이라고 예측

▪ 열째, 학계는 문제를 해결해야 하는 기업의 새로운 Insight파트너가 될 것으로 예측

- 학계뿐만 아니라 비영리 단체인 Open AI와 같은 조직에서는 기업이 가지는 어려운 분석 문제나 AI
관련 문제를 해결할 가장 우선적으로 고려해볼 만한 파트너가 될 것으로 예측

82
82
자연어 처리기반 텍스트 마이닝

나. 범위 및 분류

(1) 제품 분류 관점

 비정형 텍스트 데이터 서비스를 형태별로 분류해보면 비정형 데이터 정규화 및 분석


(Normalization / Analysis), 검색 및 재구성 (Search / Generation), 시각화 및 표현
(Visualization / Representation)으로 구분

▪ 도메인/서비스 별 의미정보 추출/분석 기술

▪ 텍스트 데이터 자동 검색/추출/분류 관련 응용 기술

▪ 자동 분석 빅데이터 자동 시각화 기술

▪ 빅데이터 기반 서비스/인공지능 학습용 데이터 구축 기술

(2) 공급망 관점

 비정형 텍스트 데이터 처리 프로세스는 서비스의 활용 데이터 종류에 따라 특정 데이터


공급자를 기반으로 분류 가능

▪ 정형데이터 (사용자 로그, 내부 저장 정보 등) 분석/활용 기술

▪ 비정형데이터 (웹, SNS 등) 분석/활용 기술

[ 다양한 데이터 시각화 도구 ]

구분 도구
Excel, CVS/JSON, Gooogle, Chart API, Flot, Raphael, D3(Data-Driven
Basic Tools
Documents), Visually, infogram

Interactive GUI Control Crossfilter, Tangle

Mapping Modest Maps, Leaflet, Polymaps, OpenLayers, Kartograph, CartoDB

Professional Tools Processing, NodeBox, R, Weka, Gephi

*출처 : 한국데이터베이스진흥원의 데이터 분석 전문가 가이드 도서, LG CNS 재구성

83
83
전략품목 현황분석

(3) 빅데이터 분석기법 관점

 빅데이터 분석은 여러 첨단 기술들이 통합 적용되어야 하는 매우 복잡하고, 섬세한 작업이며


분석해야 할 데이터양이 방대하고 비정형 데이터의 비중이 높기 때문에 정확한 정보 추출을
위해서는 무엇보다 기술력 확보가 중요

 대용량 데이터의 실시간 처리를 위해 클라우드 컴퓨팅 기술은 기본이며, 자연어처리, 텍스트
마이닝, 기계학습, 시맨틱 기술과 같은 인공지능 기술이 폭넓게 활용되어야 함

▪ 자연어처리(NLP; Natural Language Processing)는 글로 된 인간 언어를 컴퓨터를 통해 처리하기


위한 기술이며 이에는 형태소 분석, 구문 분석, 개체명 인식 등의 기술을 포함하며, 주위에서 가장
쉽게 만날 수 있는 자연어처리 예로는 구글 번역기가 존재

▪ 정보 검색(IR; Information Retrieval)은 빅데이터 처리를 위한 필수 기술이며 대규모 데이터를


색인하고, 이 중에서 주제와 관련된 데이터를 빠르게 찾아 분석에 적용하는 기법으로 기존의 검색과
다른 점은 기존 검색은 인간을 위한 정보 검색이라면, 빅데이터 분석에서의 정보 검색은 컴퓨터가
검색 시스템을 사용하는 수요자

▪ 기계 학습(Machine Learning)은 빅데이터 분석의 핵심 기술 중 하나이며 기계 학습은 충분한 학습


데이터로부터 모델을 생성하고, 해당 모델을 통해 대용량 데이터를 자동 분석, 귀납 추론하는
시스템을 의미하며 통상 SVM과 같은 통계 이론에 기반하며, 자동 분류, 자동 군집, 베이지안
네트워크 기반 추론 등 강력한 데이터 분석 기능 제공

▪ 텍스트 마이닝(Text mining)은 대규모 텍스트 말뭉치로부터 의미 있는 정보를 추출, 분석하는


기술로서 기계 학습 기반의 통계적 방법과 규칙 기반의 방법이 있으며, 최근에는 이들이 하이브리드
형태로 결합되어 기존의 분류, 군집 기능 외에 감성(평판) 분석과 같은 기능 구현을 할 수 있는 기술.
특히, 텍스트 마이닝은 소셜 네트워크 분석(Social Network Analysis)의 핵심적인 기술

▪ 시맨틱(Semantic) 기술은 데이터에 대한 의미적 분석이 매우 중요하며 시맨틱 메타데이터 자동추출,


시맨틱 네트워크 생성, 지식 베이스 구축, 온톨로지의 활용, 논리 및 통계적 추론 등을 통하여
비정형 데이터와 정형 데이터를 의미적으로 연결하고, 분석하기 위한 핵심 기술임. 왓슨 컴퓨터,
애플의 시리, 울프람 알파 등이 이런 사실 증명

▪ 데이터 마이닝(Data Mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적
규칙이나 패턴을 찾아내는 기법을 의미하며 다른 말로는 KDD(데이터베이스 속의 지식 발견,
knowledge-discovery in databases)라고도 함

▪ 웹 마이닝(web mining)은 인터넷을 이용하는 과정에서 생성되는 웹 로그(web log) 정보나 검색어로부터
유용한 정보를 추출하는 웹 대상의 데이터 마이닝기법으로 웹 마이닝에선 웹 데이터의 속성이 반정형 혹은
비정형이고, 링크 구조를 형성하고 있기 때문에 별도의 분석기법이 필요. 웹마이닝은 분석 대상에 따라 웹
구조 마이닝(web structure mining)과 웹 유시지 마이닝(webusage mining), 그리고 웹 콘텐츠
마이닝(web contents mining)으로 구분하며 이 중 웹 콘텐츠 마이닝은 웹 페이지에 저장된
콘텐츠로부터 웹 사용자가 원하는 정보를 빠르게 찾는 기법으로 검색엔진에 많이 사용

84
84
자연어 처리기반 텍스트 마이닝

2. 외부환경 분석

가. 산업환경 분석

(1) 산업의 특징

 웹/모바일의 대중화/일상화로 기하급수적인 비정형데이터가 생성되고 있음

▪ 주요 통신사는 CDR 분석, 네트워크 및 시스템 관리 등에 빅데이터 기술을 적용해 서비스 품질


강화에 활용하고 있으며 내부 빅데이터 적용 성과를 사업모델화해 클라우드 기반 빅데이터 분석
플랫폼을 제공하고 있으며, 공공 분야에 적용해 공익사업에 참여하는 추세

▪ 앞으로 몇 년간 3세대 플랫폼에 기반한 혁신과 가치 창조가 크게 증가할 것으로 전망되며 새로운
핵심 기술이 혁신 가속기로 작용하면서 이 단계를 견인할 것이고 그러면 전 산업에 걸쳐 3세대
플랫폼의 힘과 애플리케이션이 확대될 전망

 빅데이터/DB 시스템의 보급과 언어처리 기술의 발달로 다양한 기업에서 다양한 형태의
비정형데이터들이 정형화되어 기록

▪ 제조 분야에서 머신 데이터 분석을 통한 품질 관리에 투자를 확대하고 있으며, IoT와 연계한 센서


데이터의 활용 방안을 모색하는 등 아직 전사적이진 않지만 부분적으로 빅데이터 분석 기술을
활용하는 사례들이 꾸준히 증가하는 추세

▪ 대형 제조사를 중심으로 소셜 분석이나 텍스트 마이닝과 같은 빅데이터 분석 기술을 적용해


제품개발 및 고객 관계 강화에 활용하고 있으며, 제조 공정의 기계 설비, 장비들에서 나오는 머신
데이터 분석을 통해 제품 공급 관리나 품질 관리의 효율성을 제고

▪ 유통 분야는 오프라인, 온라인, 모바일, 콜센터 등 폭넓은 옴니 채널의 활용과 온오프라인을 넘나드는
고객과 소통 강화를 위해 빅데이터 분석에 투자를 확대하고 있는 추세

▪ 가트너는 불과 몇 년 전만 하더라도 분석을 위해 고객이나 직원의 데이터를 가능한 많이 수집하는


기업들이 많았으나, 앞으로는 기업이 추구하는 비즈니스 성과와 관련이 있는 부분에 초점이 맞춰질
것이며, 과거에는 확보하지 못했던 통찰력을 주는 데이터를 더욱 추구하게 될 것이라 예측

 많은 머신 데이터를 입수하고, 교통망, 분산형 발전 및 공급, 의료, 비재생 자원의 재사용,


산업자동화, 농업 등에 있어 복잡한 최적화 문제를 해결할 때 빅데이터의 잠재력이 실현될
것이며, 빅데이터는 머신 생성 데이터에 기반을 두고 있는 모든 경제 부문의 새로운 자동화,
파괴적인 혁신의 형태로 가시화 된 혜택을 가져올 전망

85
85
전략품목 현황분석

(2) 산업의 구조

 다양하고 방대한 데이터들의 융합을 통해 지속적인 신규 서비스 발굴이 중소기업의 활성화를


위해 필수 요소
▪ 세계적으로 사물인터넷과 웨어러블 기기가 부상하면서 기업들이 이용할 수 있는 머신 데이터가 더욱
많아지게 되었으며, 가능한 많은 정보와 통찰력을 획득하기 위해 머신 데이터를 인간이 생성하는
데이터와 통합해 이를 활용한 방법이 가져다주는 가치와 기회를 평가하는 기업들이 늘어날 것으로 전망

[ 산업별 예상 시장 규모 ]

산 업 시장규모

개별 제조(Discrete Manufacturing) ‘19년 228억 달러

은행(Bank) ‘19년 221억 달러

공정 제조(Process Manufacturing) ‘19년 14억 달러

*출처: ciokorea

▪ 빅데이터 및 비즈니스 애널리틱스를 성장시키는 주요 견인 요인은 500인 이상의 대기업. 여기에서


2019년 1,400억 달러의 매출이 발생한다는 전망되지만 500인 이하의 중소규모 기업 또한 비중이
작지 않아서 전 세계 매출의 1/4 정도를 담당할 것으로 관측

86
86
자연어 처리기반 텍스트 마이닝

나. 시장환경 분석

(1) 세계 시장

▢ 자연어 처리 기반 텍스트 마이닝은 자연어 처리 시장의 성장을 통해 앞으로의 전망을 예측 가능

▢ Tractica 예측에 따르면 인공지능 기술의 발달로 자연어 처리 소프트웨어 시장(NLP SW


market)이 ‘16년 1억 3,600만 달러에서 ’25년 54억 달러 규모로 성장할 것으로 예측

[ 자연어 처리 소프트웨어 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 25,119 46,395 85,692 158,273 292,330 540,000 84.7

*출처: Tractica, NLP SW market

▢ 또한 자연어 처리 소프트웨어의 발달로 관련 하드웨어, 지능형 전문 서비스에 대한 추가


수요가 증가하여, 자연어 처리 소프트웨어, 하드웨어뿐만 아니라 서비스 시장 또한 ‘25년까지
223억 규모로 성장할 것으로 전망

[ 분야별 자연어 처리 시장 규모 ]

87
87
전략품목 현황분석

▢ NLP 시장의 확장은 확장 가능하고 저렴한 연산력, 모든 데이터의 디지털화 증가,


기계학습(ML)과 심층학습(DL)을 이용한 NLP의 융합 등으로 인해, 지난 2-3년간 가속화
추세이며 앞으로도 빠르게 확장될 것으로 기대

▢ 세계적 시장 조사기관인 Statista에 따르면 자연어 처리 시장은 ’16년부터 ‘25년까지 연평균


44.1% 성장하여 ’25년에는 222억 5,000만 달러 규모에 이를 것으로 전망
▪ 기간 내 가장 많이 성장하는 분야는 자연어 처리 기반 서비스 분야로 48.7%이 연평균 성장률을 보일 전망

[ 분야별 자연어 처리 시장 규모 ]
(단위: 백만 달러, %)

구 분 ‘16 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 ‘23 ‘24 ‘25 CAGR
하드
100 500 650 1,050 1,550 2,200 3,000 3,900 4,950 6,250 37.1%
웨어

소프트
150 250 450 650 1,000 1,550 2,300 3,200 4,300 5,250 46.3%
웨어

서비스 250 450 800 1,350 2,300 3,400 4,900 6,750 8,600 10,750 48.7%

합 계 500 1,200 1,900 3,050 4,850 7,150 10,200 13,850 17,850 22,250 44.1%

* 출처: Revenues from the natural language processing (NLP) market worldwide from 2016 to 2025, by segment (in
million U.S. dollars), Statista, ‘19

 빅데이터 시장 내에서 자연어를 포함한 비정형 데이터가 전체의 90% 이상을 차지, 사물인터넷,
웨어러블 디바이스의 이용 증가와 미디어 매체의 증가에 따라 하루 수집되는 빅데이터의 양은 약
1,000만건을 상회할 것으로 예측 (1년이면 약 40억 건 이상의 데이터 수집)

 빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 ’21년 814억
달러로 성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 53,400 59,040 65,450 72,890 81,380 90,006 10.6

*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 세계 시장은 ‘23년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)
▪ 빅데이터 선진개발국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,
민간 데이터 시장에서는 중개업이 활성화되어 있음

▪ 미국의 경우 2016년 기준 데이터 브로커 기업은 약 650억개로 150억불 규모의 시장을 형성

88
88
자연어 처리기반 텍스트 마이닝

 IoT(사물인터넷)의 상용화로, 대용량 실시간 데이터를 빠르게 처리·분석할 수 있는 빅데이터


기술개발이 활발하게 이뤄지고 있음

▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 ‘20년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정

 빅데이터 세계 시장은 빅데이터, 인프라, 빅데이터 소프트웨어, 빅데이터 서비스 시장으로


세분화 할 수 있으며, 빅데이터 소프트웨어 및 서비스에 대한 전 세계 빅데이터 매출액은
‘18년 420억 달러에서 ’27년 1,030억 달러로 증가
▪ 시장 변화는 연간 약 10.48%의 성장률을 보일 것으로 예측되며, Wikibon은 전세계 빅데이터
시장이 2017년과 2027년에 각각 350억 달러에서, 1,030억 달러를 달성하여 연평균 11.4%의
성장률을 보일 것으로 추정

▪ 빅데이터 시장 중 인프라 시장의 점유율이 가장 높으며, 또한, 가장 높은 성장세를 보일 전망

▪ 자연어 처리 기반 텍스트 마이닝에 활용될 수 있는 인프라 시장의 경우, ’16년 136억 달러


규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장 형성을 예측

[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ’16 ’17 ’18 ’19 ’20 ’21 ’22 CAGR(%)

인프라 13,600 17,700 21,700 26,000 30,700 36,200 43,900 19.60

소프트웨어 6,000 7,400 9,000 10,600 12,300 14,300 16,200 16.61

서비스 7,100 8,800 10,800 12,600 14,700 17,700 20,500 17.05

합계 26,700 33,900 41,500 49,200 57,700 68,200 80,600 18.26

*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용

[ 빅데이터 품목별 세계 시장 규모 및 전망]

*출처: Wikibon and reported by Statista, NIA 2018.6 재인용

89
89
전략품목 현황분석

 세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)

▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순

▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)

 빅데이터 애플리케이션 및 분석 시장은 ‘26년 194억 달러로 증가 예상

▪ 자연어 처리기반 텍스트 마이닝을 포함한 빅데이터 애플리케이션 및 분석 시장은 ‘18년 50억 달러에서
‘26년 194억 달러로 크게 증가하여 연평균 15.49%의 성장률을 달성할 전망

▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, ‘18년 165억 달러에서 ‘26년
213억 달러로 성장

(2) 국내시장

▢ 국내 자연어처리 관련 시장 규모는 아직 준비단계로 ’20년 약 3,700억에 이를 것으로 전망


▪ 국내 통,번역 현지화 시장(약 700억)과 국내 음성인식 처리 시장(약 3,000억) 규모를 합산한 추정치

 빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 ’20년
4,468억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망

[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 244.2 298.7 358.3 446.8 557.2 694.8 24.7%

*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 시장은 빅데이터 인프라(서버, 스토리지), 빅데이터 소프트웨어, 빅데이터 서비스로


나누어 집계

▪ 빅데이터 시장은 인프라 시장이 55.9%로 가장 큰 부분을 차지하고 있으나, 소프트웨어(23.2%),


서비스(20.9%) 시장은 활성화되고 있지 못한 것으로 나타남

90
90
자연어 처리기반 텍스트 마이닝

[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0

*출처: 2017년 빅데이터 시장현황 조사, 인사이트플러스

 국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억 원에서 ’20년
7조 8,450억 원로 연평균 7.6% 성장 예상 (데이터 산업 활성화 전략, 2018.6)

▪ ’17년 부문별 시장 규모 : 데이터구축/컨설팅(2조 9,291억원), 데이터 서비스(1조 7,146억원),


데이터솔루션(1조 6,536억 원) 순

 기업의 빅데이터 대한 인식 호전과 중견·대기업의 투자 증가, 정부의 강력한 빅데이터 산업 육성의지에


따라 성장세를 보이고 있으며, 결과적으로 시장이 확대 (한국데이터진흥원, 데이터산업백서 2017)

▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출

▪ 국내 일반기업의 빅데이터 시스템 도입률은 2016년 기준 5.8%이나, 중견·대기업은 12.3%의


도입률을 보여 기업 규모별 편차가 존재하는 것으로 나타남

▪ 산업별로는 금융(14%), 공공(6.9%), 통신미디어(6.5%), 의료(6.3%), 유통·서비스(5.5%), 제조(4.2%)


순으로 나타나 데이터 활용의 중요성이 높은 산업에서의 빅데이터 도입이 상대적으로 적극적인 것으로 분석

 국내 빅데이터 시장은 포털사, 통신사, IT 업체 등이 자사 보유 데이터를 바탕으로 빅데이터


서비스 제공을 시작하는 단계

▪ 국내 ICT 산업은 경쟁력이 높고 데이터 생산량이 많아 빅데이터 산업의 성장 잠재력이 크지만


도입의 필요성 인지 부족 및 개인정보법 등 법적 리스크로 그동안 활용은 상대적으로 저조한 상황

 업계별 빅데이터 시스템 도입률 증가 추이


▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름

▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고, 분석할만한
데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차 기반 마련 예상

▪ 업종별로 보면 제조업, 물류, 유통, 금융, 의료 분야에서 특히 높은 성장 예상

91
91
전략품목 현황분석

3. 기술 분석

가. 기술개발 이슈

 고성능 언어 이해 (Natural Language Understanding) 기술

▪ 한국어 형태소 분석

▪ 한국어 개체명 인식

▪ 한국어 구문 분석

▪ 대화 의도 분석

▪ 대화 주제 분석

▪ 대화 처리

- 끊기지 않는 일상 대화
- 대화 기반 업무 지원

 도메인 별 NLU 고도화 기술

▪ 다중 업무 지원

▪ 콜센터 지원 등 특화 서비스 기반 대화처리 고도화

▪ 업무 처리를 위한 slot 정보 추출 기술

▪ 업무 지원을 위한 정확도 높은 텍스트 분류

▪ 업무 지원을 위한 질의 분석 및 정답 생성 기술 (Questin & Answering)

 인공지능 학습용 데이터 구축 기술


▪ 자동/반자동 태깅 지원

▪ 전문 저작도구

▪ 구축 현황/결과 시각화

 워드임베딩 구축/최적화

▪ 도메인 데이터 수집 기술

▪ 임베딩 시각화 기술

 기계학습 알고리즘 활용 기술

92
92
자연어 처리기반 텍스트 마이닝

 시각화 라이브러리 고속화 및 정교화 기술

▪ 동적 시각화를 지원하는 라이브러리

▪ 웹 기반 동적 시각화 기반 서비스

◎ 기술개발트렌드

 빅데이터와 클라우드의 접목으로 클라우드는 어디에서든 찾아볼 수 있을 정도로 확산 중에


있으며 또한 기업에서 역시 클라우드를 채택하는 사례가 증가, 빅데이터가 이와 같은
클라우드의 성장에 한층 더 박차를 가하고 있음

 공개되는 기술들을 빠르게 융합하고 새로운 형태의 데이터 서비스를 고안하여 모바일/웹
환경에서 특화된 서비스를 빠르게 제안하는 융합형 서비스 기술이 필요

 중소기업의 경우 공개되는 원천기술을 빠르게 습득하고 특정 도메인과 서비스에 최적화된


기술로 형상화하는 고도화 및 응용 기술 위주의 접근이 필요한 상황

◎ 기술환경 분석

 방대한 데이터를 기반으로 하는 인공지능 분석 기술이 적극적으로 연구개발되고, 일부 기술은


성공적으로 서비스되고 있으나 원천기술의 경우 천문학적인 연구비용으로 일부
대기업/대국적기업이 독점하고 있지만, 일부 연구결과들은 공개 SW와 API 형태로 제공되는 추세

▪ Google/Facebook/MS 같은 최첨단 기업들은 고비용의 연구개발을 장기간 수행하여 이미 다국어


기반의 언어처리 및 텍스트 마이닝 기술을 효율적으로 활용하는 방안을 수립한 상태임

▪ 중소기업의 경우 유사한 규모의 연구개발 투자가 현실적으로 힘든 상황이므로, 이에 따른 원천


기술의 연구와 결과물 공개는 정부 차원에서 주도할 필요가 있음

▪ 공개되는 원천 기술들을 서비스에 녹아내리기 위한 서비스 활용 기술의 경우 중소기업에서 특화하여


확보해야 하는 중요한 응용기술

93
93
전략품목 현황분석

나. 주요기업 동향

 구글은 ‘16년 인공지능 비서 ’구글 어시스턴트‘ 공개, 이 서비스는 머신러닝을 통해


음성인식의 정확도 높으며, 사용자 간의 대화 맥락 이해를 통해 실시간 답변이 가능

 IBM은 왓슨의 응용애플리케이션 인터페이스(API)를 통해 번역, 문맥분석, 음성인식, 이미지


인식 등의 기능을 제공

 Microsoft는 인공지능 소프트웨어로 음성 비서 서비스를 제공하는 가상 비서 ‘코타나’를 공개,


일대일 스카이프영상, 음성통화 통역, 통화 시 화면에 번역문 표시 및 저장, 언어를 실시간
통역, 번역 해주는 스카이프 트랜스레이터(Skype Transrator) 또한 개발

 ㈜ 셀바스 AI는 인공지능 원천 및 서비스 기술을 보유한 국내 대표 중소기업으로 음성인식,


언어처리, 영상처리, 문자인식 기술 및 자체 서비스 솔루션 보유

 ㈜ 와이즈넛는 보유하고 있는 웹/텍스트 기반 빅데이터 구축 솔루션을 활용하여 콜센터


데이터 분석 등을 기반으로 한국어 언어처리 기술 연구에 집중 투자

 ㈜ 코난테크놀로지는 독자적 검색엔진 기술로 태동한 국내 기업으로 한국어 자연어


처리능력을 갖추고 있고 인공지능 데이터 구축 전문 기술에 특화된 기업

▪ 언어 및 영상처리 관련 데이터 고속 저작도구 및 구축 노하우 보유

 (주)솔트룩스는 자연어처리에서 기계학습과 온톨로지 추론, 심층 질의응답과 가상비서 등 AI


기술 개발업체로 지난 20년간 자연언어처리와 시맨틱, 추론을 포함한 인공지능 원천 기술을
확보해 왔으며 빅데이터 기반의 기계학습과 온톨로지 기반의 추론을 융합한 탁월한 성능과
기능의 기술개발과 산업화. ADAMs는 국내 최초로 상용화된 인공지능 플랫폼으로, 아시아
최대 규모의 지식베이스를 내장하고 지식, 언어, 시각 인지 등 50여 APIs를 제공

 마인즈랩은 음성, 텍스트 센서 데이터 등 비정형 고객의 소리를 State-of-the-art 수준의


음성인식, 자연어처리, 텍스트마이닝, 데이터마이닝 기술을 통해 처리하고 이를 소셜 빅데이터
분석정보 및 기업 내부의 정형 데이터와 교차 분석하여 비즈니스 활동에 필요한 정보 제공
▪ 음성인식: 심층신경망(Deep Neural Network) 기술을 활용한 높은 인식 정확도 제공

▪ 텍스트 마이닝: 고품질 개체명 인식, 내용기반 자동분류, 이슈 군집분석 등 고난이도 고품질의
결과를 제공하는 텍스트 마이닝 서비스를 제공

▪ 분석확장성: 다양한 형태의 내 외부 데이터 및 분석모델 적용을 지원하는 유연성 제공

94
94
자연어 처리기반 텍스트 마이닝

다. 특허 동향

◎ 자연어 처리기반 텍스트 마이닝 기술 분야 특허상 주요 기술

 주요 기술
▪ 분석 정보 시각화, 빅데이터 지원 고속 키워드 추출 기술, 시맨틱 검색 지원을 위한 한국어
워드임베딩, 문서 분류, 문서/데이터 이해 기반 요약, 빅데이터 고속 분석을 통한 사전/브로셔/검색
시스템 구축, 담화 분석 데이터 구축 기술 등이 포함

요소기술 코드 설명
텍스트 마이닝을 통해 획득한 빅데이터 분석 결과를 쉽게
분석 정보 시각화 A
이해할 수 있도록 시각적으로 표현하여 전달하는 기술

빅데이터 지원 고속키워드 보다 효율적으로 정보 전달을 위해 시각, 청각, 촉각, 미각,


B
추출 기술 후각의 감각 기관에 최적의 자극을 제시하는 방법 제시

시맨틱 검색 지원을 위한 딥러닝 언어처리의 요소기술로 도메인 별로 응용/최적화


C
한국어 워드임베딩 기술이 전망 있음

언어처리 응용기술로 처리에 용의하도록 문서를 항목에


문서 분류 D
맞게 분류하는 기술

문서/데이터 이해 기반 언어처리 응용기술로 문서/데이터를 이해하고 그를


E
요약 이용하여 요약하는 기술

빅데이터 고속 분석을 통한 언어처리 응용기술로 빅데이터 분석의 고속화를 위한


F
사전/브로셔/검색 시스템 구축 기반 기술

담화 분석은 주로 문서단위로 이루어지는 것이


보편적이며, 여러 문장 간의 연관관계 및 전후 문맥을
담화 분석 데이터 구축 G
고려하여 문장 간의 의미관계를 분석하는 기술 / 관련
저작도구 구축 및 데이터 품질 평가를 포함

95
95
전략품목 현황분석

◎ 세부 분야별 특허동향

 주요 기술별 출원인 국적별 특허동향

▪ 자연어 처리기반 텍스트 마이닝 기술의 요소기술별 주요 출원인 국적별 특허정보 데이터를
입수하였으며, 최근 10년간의 특허데이터를 비교 분석함

요소기술 한국 미국 일본 유럽 ETC 계

분석 정보 시각화 10 4 0 0 0 14

빅데이터 지원 고속키워드
10 2 0 0 3 15
추출 기술
시맨틱 검색 지원을 위한
17 506 3 63 106 695
한국어 워드임베딩

문서 분류 21 495 9 47 81 653

문서/데이터 이해 기반
18 71 1 2 4 96
요약
빅데이터 고속 분석을 통한
25 14 0 0 4 43
사전/브로셔/검색 시스템 구축

담화 분석 데이터 구축 74 270 7 28 42 421

합계 175 1,362 20 140 240 1,937

▪ 요소기술별 츨원인 국적별 특허동향에서 미국국적의 출원인이 가장 활발한 연구개발을 하고 있으며,


그 다음으로는 한국, 유럽, 일본국적 출원인 순으로 나타남

▪ 분석 정보 시각화 기술 및 빅데이터 지원 고속 키워드 추출 기술 기술 분야에서는 한국 국적


출원인이 가장 많은 비중을 차지하고 있으며, 일본, 유럽국적 출원인이 상대적으로 출원이 없음

▪ 시맨틱 검색 지원을 위한 한국어 워드임베딩 기술, 데이터 이상값 탐지 기술 분야에서는 미국 국적


출원인이 가장 많은 비중을 차지하고 있으며, 일본국적 출원인이 상대적으로 적은 출원량을 보유

▪ 문서 분류 기술은 미국 국적 출원인이 가장 많은 비중을 차지하고 있으며, 그 다음으로는 유럽,


한국국적 출원인 순으로 특허를 많이 출원

▪ 빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 기술 분야에서는 한국국적 출원인이 가장


많은 출원을 하고 있으며, 그 다음으로는 미국, 유럽국적 출원인 순으로 특허를 많이 출원

▪ 담화 분석 데이터 구축 기술 분야에서는 미국 국적 출원인이 가장 많은 출원을 하고 있으며,


일본국적 출원인이 상대적으로 적은 출원량을 보이고 있음

96
96
자연어 처리기반 텍스트 마이닝

▪ 관점을 국내·외 출원인으로 바꾸어 보면 한국국적의 출원인은 외국국적의 출원인에 비해 빅데이터


고속 분석을 통한 사전/브로셔/검색 시스템 구축 기술(F)과 담화 분석 데이터 구축 기술(G) 분야의
출원 비중이 상대적으로 높게 나타남

▪ 반면, 한국국적의 출원인은 외국국적의 출원인에 비해 시맨틱 검색 지원을 위한 한국어 워드임베딩


기술(C)과 문서 분류 기술(D) 분야에 상대적으로 특허 출원 비중이 상대적으로 낮은 것으로 나타남

▪ 한국국적의 출원인의 특허 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는
경향을 보이고 있음

* 2017~2018년은 미공개 출원이 존재하여 출원 수가 적게 보이는 구간으로, 시계열 동향을 파악할


때 이 점을 유의해야 함

▪ 외국국적 출원인의 특허 출원량도 한국국적 출원인과 유사하게 2000년 중반 이후 꾸준히 출원량이


높아지는 경향

97
97
전략품목 현황분석

 주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•WORLD AWARD
•중소기업 중심
분석 정보 시각화 ◔ ACADEMY
•강원오픈마켓, 주식회사 로보러스 등
•GM GLOBAL

•Tata Consultancy Services


빅데이터 지원 고속키워드 Limited •중소기업 중심
추출 기술
◔ •WORLD AWARD •강원오픈마켓, 김광호 등
ACADEMY

•IBM
•공공연구기관 중심
시맨틱 검색 지원을 위한 •Microsoft
한국어 워드임베딩
● •FREE STREAM MEDIA
•포항공과대학교 산학협력단,
한국전자통신연구원 등
CORP.

•IBM •공공연구기관 중심
문서 분류 ● •Microsoft •한국전자통신연구원,
•Google 강원대학교산학협력단 등

•IBM •공공연구기관 중심
문서/데이터 이해 기반
요약
● •Microsoft •고려대학교산학협력단,한국과학기
•Amazon 술정보연구원 등

•Hartford Fire Insurance


Company
빅데이터 고속 분석을 통한 •WORLD AWARD •중소기업 중심
사전/브로셔/검색 시스템 구축
◕ ACADEMY •강원오픈마켓, (주)씽크포비엘 등
•Tata Consultancy Services
Limited

•IBM •대기업 중심
담화 분석 데이터 구축 ● •Microsoft •삼성전자, ㈜머니브레인,
•Apple Inc. 포항공과대학교산학협력단 등

※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

98
98
자연어 처리기반 텍스트 마이닝

 분석 정보 시각화 및 빅데이터 지원 고속 키워드 추출 기술패턴 분석 기술 분야 주요 출원인 동향

▪ 분석 정보 시각화 및 빅데이터 지원 고속 키워드 추출 기술패턴 분석기술 분야는 WORLD AWARD


ACADEMY 가 가장 많은 특허를 보유하고 있으며 그 다음으로는 GM GLOBAL 등이 일부 특허를 보유

 빅데이터 지원 고속키워드 추출 기술 분야 주요 출원인 동향

▪ 빅데이터 지원 고속키워드 추출 기술 분야는 출원량이 적으며 Tata Consultancy Services Limited,


WORLD AWARD ACADEMY 등이 일부 특허를 보유하고 있음

 시맨틱 검색 지원을 위한 한국어 워드임베딩 기술 분야 주요 출원인 동향

▪ 시맨틱 검색 지원을 위한 한국어 워드임베딩 기술 분야는 IBM 이 가장 많은 특허를 보유하고


있으며 그 다음으로는 Microsoft, FREE STREAM MEDIA CORP. 등이 많은 특허를 출원

 문서 분류 기술 분야 주요 출원인 동향

▪ 문서 분류 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며, 그 다음으로는 Xerox


Corporation , Microsoft 등이 많은 특허를 보유

 문서/데이터 이해 기반 요약 기술 분야 주요 출원인 동향

▪ 문서/데이터 이해 기반 요약 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며, 그


다음으로는 Microsoft, Amazon 등이 일부 특허를 보유

 빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 기술 분야 주요 출원인 동향

▪ 빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 기술 분야는 출원량이 적으며 Hartford


Fire Insurance Company, WORLD AWARD ACADEMY, Tata Consultancy Services Limited
등이 일부 특허를 보유

 담화 분석 데이터 구축 기술 분야 주요 출원인 동향

▪ 담화 분석 데이터 구축 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며, 그 다음으로는


Microsoft 및 Apple Inc.. 등이 일부 특허를 보유

99
99
전략품목 현황분석

◎ 국가별 특허활동지수(AI) 비교

 특허활동지수(Activity Index)는 상대적 집중도를 살펴보기 위한 지표로서, 그 값이 1보다 큰


경우에는 상대적 특허활동이 활발함을 나타냄

 한국은 시맨틱 검색 지원을 위한 한국어 워드임베딩 기술, 문서 분류 기술 분야에서는


특허활동이 부진하나, 분석 정보 시각화 기술 및 빅데이터 지원 고속 키워드 추출 기술
분야의 특허출원은 활발한 것으로 나타남

 미국은 빅데이터 지원 고속 키워드 추출 기술 분야에서는 특허활동이 부진하나, 문서 분류 및


문서/데이터 이해 기반 요약 기술 분야의 특허출원은 활발한 것으로 나타남

 일본은 분석 정보 시각화 기술 및 빅데이터 지원 고속 키워드 추출 기술, 빅데이터 고속


분석을 통한 사전/브로셔/검색 기술 분야에서는 특허활동이 부진하나, 문서 분류 기술 분야의
특허출원은 활발한 것으로 나타남

 유럽은 분석 정보 시각화 기술 및 빅데이터 지원 고속 키워드 추출 기술, 빅데이터 고속


분석을 통한 사전/브로셔/검색 기술 분야에서는 특허활동이 부진하나, 시맨틱 검색 지원을
위한 한국어 워드임베딩 기술 분야의 특허출원은 활발한 것으로 나타남

100
100
자연어 처리기반 텍스트 마이닝

◎ 질적 수준을 고려한 각국의 시장력 분석

 시장력이 전체 평균 1.41을 상회하는 국가로는 유럽 외에 독일, 스페인, 이스라엘, 인도,


러시아가 있으며, 질적인 수준이 높은 특허 보유국은 미국과 인도

▪ 질적인 측면을 같이 고려한 시장력에 있어서 독일과 이스라엘, 스페인, 러시아는 시장력은 높으나
질적 수준은 낮은 국가 쪽으로 조사됨

▪ 인도는 시장력도 높고 질적 수준도 높은 국가 쪽으로 조사됨

▪ 미국은 시장력 면에선 유럽국가와 유사 혹은 다소 뒤지지만 질적 수준은 높은 국가로 나타남

PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
KR 175 1.154286 0
US 1362 1.389868 3.532836
JP 20 1.4 0
EU 140 1.664286 2.843137
ETC 240 1.5375 4.26087
전체평균 49.6 1.41 3.51

◎ 자연어 처리기반 텍스트 마이닝 기술 분야의 주요 경쟁기술 및 공백기술

 자연어 처리기반 텍스트 마이닝 기술 분야의 주요 경쟁기술은 시맨틱 검색 지원을 위한


한국어 워드임베딩 기술, 문서 분류 기술, 문서/데이터 이해 기반 요약 기술, 담화 분석
데이터 구축 기술이, 공백기술은 분석 정보 시각화, 빅데이터 지원 고속 키워드 추출 기술로
나타남
▪ 자연어 처리기반 텍스트 마이닝 기술 분야에서 시맨틱 검색 지원을 위한 한국어 워드임베딩 기술이
가장 경쟁이 치열한 분야이고, 분석 정보 시각화 기술 분야는 아직까지 출원이 활발하지 않은
공백기술 분야로 나타남

요소기술 기술 집중도
분석 정보 시각화 ◔
빅데이터 지원 고속키워드 추출 기술 ◔
시맨틱 검색 지원을 위한 한국어 워드임베딩 ●
문서 분류 ●
문서/데이터 이해 기반 요약 ●
빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 ◕
담화 분석 데이터 구축 ●
※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

101
101
전략품목 현황분석

◎ 최신 국내 특허기술 동향

요소기술 최근 핵심기술 동향

•빅데이터 플랫폼을 이용한 스마트 공장 운영 관리 와 빅데이터를 처리하기


분석 정보 시각화
위한 모바일 소셜 네트워크 이를 이용한 응용 서비스 제공 기술

•자동으로 텍스트의 의미를 검출하고 언어 및/또는 그래픽을 아이콘 기반


빅데이터 지원 고속키워드
디스크립터를 채택한 자동화된 음악 작곡 및 생성 시스템 및 이를 이용한 응용
추출 기술
서비스 제공 기술

시맨틱 검색 지원을 위한 •질문 형태 , 도메인 인식 등 자연어 대화 시스템을 위한 다중 도메인 식별


한국어 워드임베딩 장치 및 이를 이용한 응용 서비스 제공 기술

•텍스트 마이닝을 이용한 키워드 도출 기술 및 이를 이용한 응용 서비스 제공


문서 분류
기술

문서/데이터 이해 기반 •자연어 대화 기술을 이용한 외국어 학습 게임 시스템 및 이를 이용한 응용


요약 서비스 제공 기술

빅데이터 고속 분석을 통한 •대용량 데이터의 텍스트 마이닝을 위한 의미기반 분류 추출 기술 및 지능형


사전/브로셔/검색 시스템 구축 분산처리 시스템 제공 기술

•음성 인식을 이용한 코딩시스템 및 사용자의 발화의도를 파악하는 음성 대화


담화 분석 데이터 구축
처리장치 제공 기술

102
102
자연어 처리기반 텍스트 마이닝

 국내 특허동향을 살펴보면 대기업은 담화 분석 데이터 구축 기술을, 공공연구기관은 시맨틱


검색 지원을 위한 한국어 워드임베딩 기술, 문서 분류 기술, 문서/데이터 이해 기반 요약
기술을 집중적으로 연구개발하고 있는 것으로 나타남

▪ 분석 정보 시각화 기술에서는 빅데이터 플랫폼을 이용한 스마트 공장 운영 관리 기술, 자연어 텍스트로부터


학습된 객체 표상에 포함된 특성 해석 및 시각화 시스템 기술, 위치 기반의 여행용 빅데이터를 처리하기
위한 모바일 소셜 네트워크 서비스 시스템 기술 등이 중소기업을 중심으로 집중 연구개발

▪ 빅데이터 지원 고속 키워드 추출 기술 분야는 자동으로 텍스트의 의미를 검출하고 텍스트의 일의성을


측정하기 위한 방법 기술, 언어 및/또는 그래픽 아이콘 기반 음악적 경험 디스크립터를 채택한
자동화된 음악 작곡 및 생성 장치 기술 등이 중소기업을 중심으로 연구개발

▪ 시맨틱 검색 지원을 위한 한국어 워드임베딩 기술 분야는 질문 형태 및 도메인 인식 장치 기술,


자연어 대화 시스템을 위한 다중 도메인 식별 방법 기술, 다중 소스 하이브리드 질의응답 방법 기술
등이 공공연구기관을 중심으로 연구개발

▪ 문서 분류 기술 분야는 텍스트 마이닝을 활용한 순수 기업 선정 장치 기술, 텍스트 마이닝을 이용한


키워드 도출 기술, 비구조화 임상 문서의 치환 기반 패턴 검색 장치 및 검색 기술 등이
공공연구기관을 중심으로 연구개발

▪ 문서/데이터 이해 기반 요약 기술에서 텍스트 마이닝을 활용한 순수 기업 선정 장치 기술, 자연어


대화 기술을 이용한 외국어 학습 게임 시스템 기술 등이 공공연구기관을 중심으로 연구개발

▪ 빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 기술 분야는 대용량 데이터의


텍스트마이닝을 위한 의미기반 분류 추출 기술, 지능형 분산처리 시스템 기술 등이 중소기업을
중심으로 연구개발

▪ 담화 분석 데이터 구축 기술 분야에서 음성 인식을 이용한 코딩시스템 및 코딩 기술, 사용자의


발화의도를 파악하는 음성 대화 처리장치 및 음성 대화 처리 기술 등이 대기업을 중심으로 연구개발

◎ 중소기업 특허전략 수립 방향 및 시사점

 자연어 처리기반 텍스트 마이닝 기술 분야의 공백기술 분야는 분석 정보 시각화 기술과


빅데이터 지원 고속 키워드 추출 기술이고 중소기업의 시장진입 상대적으로 수월한 분야는
분석 정보 시각화 기술, 빅데이터 지원 고속 키워드 추출 기술, 빅데이터 고속 분석을 통한
사전/브로셔/검색 시스템 구축 기술로 나타남

▪ 자연어 처리기반 텍스트 마이닝 산업은 인간의 언어 현상을 컴퓨터와 같은 기계를 이용해서 모사
할수 있도록 이를 구현하는 인공지능의 주요 분야 중 하나로 반정형/비정형 텍스트 데이터를
정형화하고, 특징을 추출하기 위한 기술과 추출된 특징으로부터 의미 있는 정보를 발견할 수 있도록
하는 텍스트 마이닝 기술이며 이러한 텍스트 마이닝 기술은 데이터를 다루는 산업 전반에 활용되고
있으며, IoT 시대의 도래에 따라 산업적 활용도는 대폭 증가할 전망

▪ 향후 중소기업은 대기업들의 경쟁이 치열하지 않은 분석 정보 시각화 기술, 빅데이터 지원 고속


키워드 추출 기술, 빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 기술 분야에 집중하여
연구개발하고 특히 공공연구기관의 연구개발이 활발한 시맨틱 검색 지원을 위한 한국어 워드임베딩
기술, 문서 분류 기술, 문서/데이터 이해 기반 요약 기술 분야에서는 기술 매입이나 라이센싱 등을
통해 부족한 연구개발능력을 보완하는 것이 바람직할 것으로 사료됨

103
103
전략품목 현황분석

4. 연구개발 네트워크

가. 연구개발 기관/자원

(1) 연구개발 기관

 한글 및 한국어 정보처리 학술대회

▪ 한국어 자연어처리 기술 연구 및 서비스 기업 네트워크 보유

 대학 연구소

▪ 서강대학교 자연어처리 연구실 (서정연 교수)

- 언어 처리 기반 기술 보유
- 대화처리 관련 요소 기술 보유
▪ KAIST 자연어처리 연구실
- 최기선 교수: 지식베이스 관련 기술 보유 (자동 구축, 활용 언어처리 서비스 기술)
- 맹성현 교수: 정보 검색 (Information Retrieval) 관련 기술 보유
- 박종철 교수: Grammar 기반 언어 분석/표현 기술 보유

▪ 고려대학교 (임희석 교수)

- 언어 처리 기반 기술 보유 (구문 분석)
- 딥러닝 기반 언어처리 기술

▪ 창원대학교 (차정원 교수)

- 언어 처리 기반 기술 보유 (형태고 분석, 개체명인식, 구문 분석, 의미역 분석, 의미망)


- 딥러닝 기반 언어처리 기술
- 한국어 대화처리 기술
- 대용량 데이터 고속 구축 및 데이터 자가 증식 기술

 연구소

▪ KETI 인공지능연구센터

- 한국어 처리 기반 기술 보유
- 대화 기반 서비스 기술 보유
- 멀티모달 데이터 통합 분석 기술
- 멀티모달 대화 서비스 기술

104
104
자연어 처리기반 텍스트 마이닝

▪ ETRI

- 한국어 처리 기반 기술 보유
- 전문지식 QA 기술

 기업

▪ 다음카카오

- 인공지능 대화기술과 자연어 처리 기술을 보유하고 있으며, 이를 기반으로 데이터 수집, 정보검색,
텍스트 마이닝, e-비즈니스, 소셜분석 등의 솔루션과 서비스 제공
- KB국민카드의 소셜미디어 수집/분석, SBS 통합리스닝 플랫폼, 국민건강보험공단 국민건강알람서비스,
KT 고객 니즈 관리 시스템 등을 개발하여 서비스 중
- 인공지능 스피커 서비스 운영으로 대화 기반 서비스 처리 기술 보유

▪ NHN

- 정보검색 및 한국어 처리 관련 기술
- 인공지능 스피커 서비스 운영으로 대화 기반 서비스 처리 기술 보유

▪ SKT

- 인공지능 스피커 서비스 운영으로 대화 기반 서비스 처리 기술 보유


- 대화 기반 QA 서비스를 위한 요소 기술 보유

(2) 연구개발 자원

 AI 오픈 이노베이션 허브 (http://www.aihub.or.kr/)

▪ 정부 인공지능 관련 R&D 사업 결과물의 통합 공개

- 지식베이스 (법률, 특허, 관광, 농업, 일반상식)


- AI데이터 (이미지, 헬스케어, Q&A)
- AI 소프트웨어 (형태소분석, 개체명 dsltlr, 동음이의어/다의어 분석, 의존구문분석, 의미역 인식,
어휘관계, 질의분석, 음성인식, 객체 검출, 대화처리 API 혹은 SW)
- AI 컴퓨팅 (GPU 기반 고성능 틀라우드 컴퓨팅 서비스 제공)

105
105
전략품목 현황분석

나. 연구개발 인력

[ 자연어 처리기반 텍스트 마이닝 분야 주요 연구인력 현황 ]

기관 부서 대표 전화번호
서강대학교 자연어처리 연구실 02-706-8954

KAIST 시맨틱웹 연구센터 042-350-3525

KAIST 정보검색 및 자연어처리 연구실 042-350-7753

KAIST 자연어처리 및 전산언어학 연구실 042 350 7741

고려대학교 자연어처리 및 인공지능 연구실 02-3290-2396

창원대 적응지능연구실 055-213-3818

다. 기술이전가능 기술

(1) 기술이전가능 기관

[ 자연어 처리기반 텍스트 마이닝 분야 요소기술 연구기관 ]

분류 요소기술 기관

㈜ 코난 테크놀로지 (대화, 비전, 멀티모달)


인공지능 데이터 구축
㈜ 데이터리 (언어)

수집 형태소분석, 개체명인식, 구문분석, 의미역분석:


창원대학교, ETRI
한국어 처리용 요소 기술
의미망: KAIST, 창원대
서비스 특화 언어처리 시스템: KETI

106
106
자연어 처리기반 텍스트 마이닝

5. 기술개발로드맵

가. SWOT 분석

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 세계시장 대비 한글 음성인식 수요 미미
•(환경) 응용서비스 기술 및 산업 환경 등 잘 구축된 인프라
•(기술) 다국어 음성데이터 확보 및 원천기술력 부족에 따른
•(기술) 다양한 영역의 우수한 IT 인프라
기술 장벽 극복
•(정책) 언어 및 음성인식 SW분야의 기업차원 대규모 투자
•(정책) 산ㆍ학ㆍ연ㆍ정부 연계 미흡

기회(Opportunity) 위협(Threat)

•(환경) 클라우드 컴퓨팅 및 스마트 모바일 기기 확산에 따른 •(환경) 원천기술 보유 외국 기업이 국내 기업과 기술제휴를
정보통신 패러다임의 변화 통한 국내 시장 잠식
•(기술) 복잡한 기능의 디지털화된 기기의 제어를 위한 자연어 •(기술) 글로벌 선두 업체 국내진출과 기술격차
인식 기술개발 초기단계 •(정책) 자체적인 기술 개발력을 가진 대기업의 첨단투자 집중
•(정책) 정부와 업계의 높은 니즈 및 시장 지배력 증가

중소기업의 시장대응전략

➜ 자연어 처리 텍스트 마이닝 주변 기술에 대한 인프라 구축 등 비용절감 전략 수립


➜ 기관에서 무료나 유료로 제공되는 대규모 데이터와 오픈 API를 적극적으로 활용한 기술개발
➜ 자연어 처리기반 텍스트 마이닝 응용환경을 고려한 독자적인 핵심 기술과 고급 개발 인력 확보

나. 중소기업 핵심요소기술

(1) 핵심요소기술 도출절차

 특허/논문 분석을 통한 요소기술과 기술수요와 각종 문헌을 기반으로 한 요소기술, 전문가


추천 요소기술을 종합하여 품목별 전문가를 통해 분류조정한 후, 전문가 평가과정을 거쳐
핵심요소기술을 선정
- 기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업 적합성(10)을 고려하여 평가

요소기술 요소기술 핵심요소기술 핵심요소기술


Pool 구성 분류 조정 선정평가 선정

- 특허/논문 분석 è - 품목별 전문가 è - 산학연 전문가 검토 è - 평가결과 반영


- 기술수요 및
요소기술 분류 - 평가항목별 요소기술 로드맵 기획 대상
문헌분석
조정·재정의 선정평가 핵심요소기술 도출
- 전문가 추천

107
107
전략품목 현황분석

(2) 요소기술

 산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처로드맵, 중소기업 기술수요를 바탕으로


로드맵 기획을 위하여 요소기술 도출

 요소기술을 대상으로 전문가를 통해 기술의 범위, 요소기술 간 중복성 등을 조정·검토하여


최종 요소기술 확정

[ 자연어 처리기반 텍스트 마이닝 분야 요소기술 ]

요소기술 출처

정형데이터 정규화 특허/논문 분석, 전문가추천

분석 정보 시각화 특허/논문 분석, 전문가추천

빅데이터 지원 고속 키워드 추출 기술 특허/논문 분석, 전문가추천

시맨틱 검색 지원을 위한 한국어 워드임베딩 특허/논문 분석, 전문가추천

문서 분류 특허/논문 분석, 전문가추천

문서/데이터 이해 기반 요약 특허/논문 분석, 전문가추천

빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 특허/논문 분석, 전문가추천

형태소 분석 데이터 구축 특허/논문 분석, 전문가추천

구문 분석 데이터 구축 특허/논문 분석, 전문가추천

의미 분석 데이터 구축 특허/논문 분석, 전문가추천

담화 분석 데이터 구축 특허/논문 분석, 전문가추천

마이닝 기술 특허/논문 분석, 전문가추천

108
108
자연어 처리기반 텍스트 마이닝

(3) 핵심요소기술 도출

 확정된 요소기술을 대상으로 산․학․연 전문가로 구성된 핵심요소기술 선정평가를 통하여


중소기업에 적합한 핵심요소기술 선정

[ 자연어 처리기반 텍스트 마이닝 분야 핵심요소기술 ]

분류 핵심요소기술 개요

빅데이터 지원 고속 키워드 빅데이터 내에서 분석에 필수적인 텍스트 키워드를 빠른


추출 기술 시간내에 추출할 수 있도록 하는 기반 기술
도메인/서비스
별 의미정보
추출 및 분석
딥러닝 언어처리의 요소기술로 한국어를 이용한 검색에
시맨틱 검색 지원을 위한
최적화된 워드 임베딩 기술로 특히 도메인 별 응용/최적화
한국어 워드 임배딩
기술에 전망이 있는 기술

언어처리 응용기술로 처리에 용의하도록 문서를 항목에 맞게


문서 분류
분류하는 기술
텍스트 데이터
처리
언어처리 응용기술로 문서/데이터를 이해하고 그를 이용하여
문서/데이터 이해 기반 요약
요약하는 기술

빅데이터 고속 분석을 통한 자연어 처리기반의 빅데이터 분석 고속화를 위한 시스템 구축


사전/브로셔 검색 시스템 기술
자동 빅데이터
분석 및 시각화
텍스트 마이닝을 통해 획득한 빅데이터 분석 결과를 쉽게
분석 정보 시각화
이해할 수 있도록 시각적으로 표현하여 전달하는 기술

인공지능 학습용 문서단위의 분석으로, 여러 문장 간의 연관관계 및 전후 문맥을


담화 분석 데이터 구축
데이터 구축 고려하여 문장 간의 의미관계를 분석하는 기술

109
109
전략품목 현황분석

다. 기술개발전략

(1)우리의 현황

 국내 자연어 처리기반 텍스트 마이닝 분야 관련 빅데이터 시장 규모는 2,987억 원이며 세계


시장은 590억 400만 달러 규모인 것으로 파악

 국내 시장 성장률은 24.7%로 세계 시장 성장률인 10.6%보다 높은 수치를 보임

 국내 중소기업의 자연어 처리기반 텍스트 마이닝 기술 수준은 세계 최고수준을 보유한


미국(100%)를 기준으로 59.1%, 6.26년의 기술격차를 보이는 것으로 조사됨

 특허 출원량은 175건으로 미국의 1,362건에 비해 낮은 수치

 특허 피인용지수는 미국이 3.5로 가장 높은 수치이며 국내는 0으로 분석됨

[ 자연어 처리기반 텍스트 마이닝 전략 캔버스(Strategy Canvas) ]

* 기술수준은 응답자 평균치

110
110
자연어 처리기반 텍스트 마이닝

(2) 기술개발로드맵

 정보 서비스에 활용하기 위한 의미 정보를 텍스트에서 추출하기 위한 다양한 응용기술들을


포함하는 품목으로 모바일과 웹을 통해 기하급수적으로 증가하고 있는 비정형 텍스트
데이터를 적극적으로 활용하는 다양한 신규 서비스와 시장 확대가 필요

 장기적인 고비용의연구개발과 충분한 전문 연구 인력이 필요한 자연어처리 원천기술 연구는


중소기업의 여건 상 불가능하므로, 최근 인공지능 기술의 발달과 공개 기술의 확대를 최대한
활용하여 응용기술 및 관련기술 도메인 별 고도화에 집중하는 것이 시장에 대응하기 위한
최적의 전략인 것으로 분석

 기술 시장의 니즈는 데이터 검색, 분류 및 지식화, 동적 생성 데이터의 실시간 활용 플랫폼


구성, 비정형 데이터의 자동/반자동 정형화로 요약 가능

111
111
* 참고 : 핵심요소기술 평가결과

지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성

정형데이터 정규화 7.2 7.6 7.4 7.8 30

분석 정보 시각화 7.4 8 7.6 8.2 31.2 선정

빅데이터 지원 고속 8 7.4 7 8.2 30.6 선정


키워드 추출 기술

시맨틱 검색 지원을 위한 8 7.6 8 8.4 32 선정


한국어 워드임베딩

문서 분류 7.6 8 7.4 7.8 30.8 선정

문서/데이터 이해 기반
요약 8.2 7.4 7 8.2 30.8 선정

빅데이터 고속 분석을
통한 사전/브로셔/검색 8.4 8 7 8.8 32.2 선정
시스템 구축

형태소 분석 데이터 구축 6.6 7.4 6.6 7.8 28.4

구문 분석 데이터 구축 6.8 7.8 6.2 7.8 28.6

의미 분석 데이터 구축 7 7.8 6.4 8.6 29.8

담화 분석 데이터 구축 7.8 8 6.4 8.6 30.8 선정

마이닝 기술 7.2 8.4 6.8 8 30.4

112
전략품목 현황분석

유통/물류 빅데이터
구축 및 분석 시스템

113
114
유통/물류 빅데이터 구축 및 분석 시스템

정의 및 범위

▪ 유통/물류 빅데이터 구축 및 분석시스템은 POS및 수·발주 데이터를 토대로 딥러닝(Deep learning)기반


인공지능을 이용해 과학적·합리적으로 물류를 분산시킬 수 있는 물류 관리 시스템

▪ 유통 4.0과 리테일 테크의 발달로 기존 유통 빅데이터를 이용, 물류시스템 특히 출하지원 관련


시스템(SCM, WMS)에 응용할 수 있도록 지원하는 인공지능 시스템의 개발 니즈 증가

정부지원 정책

▪ 새 정부의 4차 산업혁명 정책의 핵심인 빅데이터 산업 활성화를 체계적으로 지원하기 위해


2017년 8월 ‘민관합동 빅데이터 TF’ 회의를 개최하여 빅데이터 업무 추진현황을 종합적으로
파악하고, 공공과 민간 빅데이터 활성화를 지원

▪ 4차 산업혁명위원회는 새 정부 출범 이후 2017년 8월 대통령 직속기구로 4차 산업혁명 시대를


대비한 종합적인 국가전략을 마련하고 부처 간 정책을 조정하기 위하여 설립

▪ 동 위원회는 초연결ㆍ초지능 기반의 4차 산업혁명 도래에 따른 과학기술ㆍ인공지능 및 데이터 기술


기반을 확보하고, 신산업ㆍ신서비스 육성 및 사회 변화 대응에 필요한 주요 정책 등에 관한 사항을
효율적으로 심의ㆍ조정하는 기능을 수행

▪ 우리나라가 개방하고 있는 공공데이터는 공공데이터포털(www.data.go.kr)을 기준으로 2018년


4월 현재 24,962개로 조사됨

▪ 통계청은 공공 및 민간 빅데이터를 연계ㆍ분석하고 민간 빅데이터를 활용한 정책지원을 강화하기


위하여 통계데이터센터 구축 사업을 추진

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•이미 개발된 기술 활용 시 글로벌 대기업과의 경쟁
•물류 구축 및 분석시스템의 기반이 되는 국내 빅데이터
불가피
기술의 빠른 발전
•개별 기술을 넘어 전체적인 기술의 연계를 통한 빅데이터
•GPS 등의 맵핑 기술에 강점 보유
활용의 어려움
•정부의 빅데이터 지원 정책의 확대
•유통,물류에 최적화된 빅데이터 활용 지원 정책의 부재

기회(Opportunity) 위협(Threat)
•빅데이터의 중요성 부각에 따른 정부차원의 지원 확대 •개인정보보호로 인한 빅데이터 활용 규제
•다양한 산업분야로의 시장 확대 •글로벌 기업의 국내 진출에 따른 국내 시장 잠식
•유통 및 물류량의 증가로 효율적인 프로세스를 찾는 가능성
업체의 증가 •유통, 물류 업체간의 원할한 소통 플랫폼의 부재

중소기업의 시장대응전략
➜ 글로벌 플랫폼에 제공하기 어려운 실시간 데이터 수집 및 연계기술의 개발
➜ 각 산업 분야에 적합한 다양한 데이터 분석 기술의 개발로 중소기업의 경쟁력 강화
➜ 플랫폼이 아닌 빅데이터를 활용한 서비스 개발과 유료 수익 모델 개발을 통한 수익 창출
전략품목 현황분석

1. 개요

가. 정의 및 필요성

 유통/물류 빅데이터 구축 및 분석시스템은 유통, 물류 등의 산업 전반에서 빅데이터가 그


흐름을 파악하여 최적화 할 수 있는 솔루션을 제시하는 시스템으로 POS 및 수·발주 데이터를
토대로 딥러닝(Deeplearning) 기반 인공지능을 이용해 과학적·합리적으로 물류를 유통,
상·하역시 효과적으로 적재할 수 있는 방법 등을 제시하는 시스템을 의미

 빅데이터는 기술의 발달로 유통/물류 분야를 포함한 다양한 산업에 영향력이 높아지고 있는
추세

▪ 최근 대표적인 글로벌 물류기업인 DHL에서 발간한 Logistics Trend Radar 2016에서는 아래


그림과 같은 기술적 트렌드(Technology Trend)와 사회경영 분야 트렌드(Social & Business
Trend)를 제시하고 있는데 이중 기술 트렌드 부분에서 가장 그 시급성과 기술파급력이 높은 것은
빅데이터로 나타남

*출처: DHL

[ 물류 동향 레이더 ]
 인공지능(AI), 사물인터넷(IoT), 빅데이터 등 4차 산업혁명의 기반 기술을 백화점, 대형 마트,
편의점, 홈쇼핑, 소셜 커머스 등 다양한 리테일 산업에 활용해 초지능, 초실감, 초연결화를
구현하는 현상을 지칭하는 ‘리테일 4.0’ 개념이 등장
▪ 오프라인/온라인 유통 채널과 점포가 4차 산업혁명 신기술과 만나 진화함에 따라 유통(Retail)과
기술(Technology)이 융합된 ‘리테일 테크’ 개념 등장

116
116
유통/물류 빅데이터 구축 및 분석 시스템

 최근 물류업계는 E-Commerce의 폭발적인 성장과 고객 서비스의 요구 증가로 운영의


복잡성과 난이도가 높아지고 있으며, 고령화, 임금인상의 사회적 환경요인으로 많은 어려움에
봉착

▪ 이에 업무환경의 자동화와 운영의 최적화에서 해법을 찾고자 많은 노력을 기울이고 있으며, 이는


인력 의존도를 최소화하고 공정별 정확도 제고 및 Human Error 감축, Time Loss의 제거를 통한
생산성 향상에 직접적인 효과

 물류 유통 분야에서 빅데이터의 활용에 대한 기대가 높음


▪ 물류 시스템 개선으로 인한 생산성 개선과 IoT 데이터 분석 시장에 대한 기대수요가 높으며, 고객
관리 및 마케팅 기법에 대한 수요도 존재하며, 다음의 세 가지 측면에서 활용될 것으로 나타남

1) 기업 내 간의 물류의 제기능을 고도화하는 것과 동시에 조달, 생산, 판매, 회수 등 분야 간


정보의 상호 활용을 촉진함

2) 기업 간 수요와 공급의 동기화를 향해서, 관련하는 기업끼리가, 서플라이 체인(supply-chain)을


형성해, 생산성 향상과 수익 확대에 이용함

3) 기업이 사회적 책임을 완수하는데 있어서, 공공적 문제를 해결하기 위한 효율적인 경영 전략의
도입을 목표로 활용함

▪ 다만 물류와 유통은 전통적인 분야인 만큼 데이터의 공유와 거래에도 보수적인 입장을 취하는 민간
기업이 많아 빅데이터 적용 성공사례가 선행되어야 민간 기업을 빅데이터 시장으로 끌어들이는
유인책이 될 수 있음

 빅데이터는 비즈니스와 전반에 걸쳐 예측·예방에 질적 변화를 가져오고 있으며, 우리나라에서도


기업의 업무 개선이나 신규 서비스 창출을 위해 빅데이터의 활용을 주목

▪ 앞으로 모바일 디바이스의 보급과 IoT의 진전에 따라 GPS 데이터와 RFID 데이터, 센서 데이터
등의 새로운 비정형 데이터가 더욱 급증 할 것으로 예상되며, IoT를 생성하는 다양한 비정형
데이터를 순차 처리 및 실시간 처리가 가능하게 될 전망

▪ 빅데이터는 기존의 정보 시스템과 다른 데이터(모바일 및 IoT 등)와 결합하여 데이터 융합과 고급


분석인 인공 지능 기술 (AI) 발전으로 활용이 가속화

▪ 인공 지능(Artificial Intelligence)는 인간의 지능을 인공적으로 실현하기 위한 연구 분야로


2000년대부터 빅데이터를 이용하여 인공 지능 스스로 지식을 습득하는 기계 학습(Machine
Learning)이 실용화되고 있으며, 최근 인공 지능이 스스로 습득하는 심층 학습(Deep Learning)이
등장하고 연구 개발 및 응용 개발이 활발

117
117
전략품목 현황분석

나. 범위

(1) 제품 분류 관점

 유통에 있어서 빅데이터 활용은 실시간 공급망 관리를 통해 유통 채널, 협력업체와 협업을
통해 전 공급체인의 최적화 및 고객납기 만족을 극대화하기 위함

▪ 민첩하게 적용할 수 있는 이상적인 공급망을 만드는 것으로, 시장수요 변화에 실시간으로 대응하여
팔리는 것만 생산하여 판매하여 비용을 절감하기 위함

▪ 빅데이터 분석은 상품이 어디에 있으며 어디에 있어야 하는지, 그리고 시스템의 저해 요소는
무엇인지에 대한 가시성을 제공하며, 이를 통해 비용을 절감할 수 있음.

▪ 빅데이터를 이용하면 상품이 어디에 있고 어디에 있어야 하는지 정보를 제공하고, 이를 통해 해당


공급망의 계획과 실행 부분에도 도움을 받을 수 있음

▪ 고객 경험을 통해 준거가격은 결정되고, 편익을 증대하기 위해 프리미엄 마케팅을 지원을 포함함

 4차 산업혁명은 유통 물류 산업이 초연결성(Hyper-Connected), 초지능화(Hyper Intelligent)


기반 하에 상호 연결된 지능화 사회로 변화시킬 것으로 주목하고,4가지 융합 기술을 핵심으로
보고 있음
▪ 사물과 ICT의 융합: 사물인터넷 (IoT) ex) 센서기술, 스마트 홈서비스, 공장자동화, 3D 프린팅

▪ 사람과 ICT의 융합: 사람과 장치를 연결하는 인터페이스 ex) 인터넷과 연결된 센서 부착 의류와 안경 등

▪ 운송수단과 ICT의 융합: 자율주행차 ex) 구글 자율주행차 등

▪ AI(인공지능)와 빅데이터의 융합: 딥러닝 ex) IBM “ 왓슨” 등, 빅데이터 정보를 AI가 스스로 분석해
스마트한 의사 결정

 유통 빅데이터는 정형 데이터(Structured Data), 반정형 데이터(Semi-structured Data),


비정형 데이터(Unstructured Data)로 분류 가능
▪ 기존 데이터는 기업의 고객 데이터와 매출 데이터 등의 텍스트나 숫자 중심의 구조화된 정량
데이터였던 것에 반해, 현재는 사진, 영상, 음성, 텍스트를 조합하여 만든 비정형 데이터가 중심이
되고 있음

▪ 정형 데이터는 고정된 필드에 저장된 데이터로 관계형 데이터베이스(RDB, Related DataBase)와


스프레드시트(Spread Sheet) 등을 예로 들 수 있음, 정형 데이터의 경우, Oracle, MySQL,
Microsoft SQL Server, PostgreSQL 등의 관계형 데이터베이스 관리 시스템 (RDBMS)의 활용이
지속되고 있으며, 비정형 데이터의 저장·관리는 MongoDB, Cassandra 등의 NoSQL 데이터베이스
관리 시스템이 활용되고 있음

- 유통업계와 관련된 대표적인 것으로 정형 데이터로는 POS 데이터나 상품 마스터, ID-POS 데이터
및 판촉이나 광고의 실시 상황에 대한 데이터베이스에 정리한 데이터

118
118
유통/물류 빅데이터 구축 및 분석 시스템

▪ 비정형 데이터로서는, Twitter나 블로그, Facebook등의 SNS에 의한 소비자의 발신 데이터나, 점포에


대한 고객의 소리(VoC,Voice of customer), 매장의 감시 카메라 영상, 매장 사진 등 다양화되고 있음

▪ 최근 정형 데이터, 비정형 데이터를 모두 저장하고 관리 할 수 있는 ​


VoltDB, ScaleDB 등의 New
SQL DB 관리 시스템이 새로운 관리 시스템으로써 주목

 이용 측면에서 유통 빅데이터 분류 방법은 데이터베이스로서의 이용, 또 하나는 분석용


데이터로서의 이용 2가지 종류로 분류

▪ 데이터베이스의 이용은 예를 들면, 개개의 데이터 레코드를 추출해 카탈로그, 데이터 레코드별 정보
서비스로써 이용

▪ 분석용 데이터로서의 이용은 데이터 전체 또는 일부의 경향이나 특징에 집중하여, 동향 및 정보


예측 등에 사용

(2) 공급망 관점

 공급망 분석은 회사의 다양한 의사 결정 영역에 적용될 수 있음


▪ 계획 최적화: 제품 카테고리 최적화, 옴니 채널 최적화, 제조 또는 구매 결정

▪ 소싱 의사 결정: 공급 업체 성과 분석, 공급 업체 리스크 프로파일 분석

▪ 제조 최적화: 생산 스케줄링 우선 순위 결정, 용량 관리, 품질 최적화, 생산 원가 분석

▪ 유통 및 주문 이행: 유통 네트워크 최적화, 비용 절감, 고객 세분화

 공급망 관리의 데이터 분석에는 3가지 응용 프로그램 수준이 있음

▪ Description Supply Chain Analytics : 과거 데이터를 기반으로 현재 비즈니스 상황을 분석.


데이터의 기본 쿼리,보고 및 시각화가 포함됨

▪ Predictive Supply Chain Analytics : 미래 상황과 행동 패턴을 나타내기 위한 과거 데이터 마이닝.

▪ Prescriptive Supply Chain Analytics : Predictive Analytics의 결과를 활용하여 예상 시나리오를


최대한 활용하는 작업

119
119
전략품목 현황분석

2. 외부환경 분석

가. 산업환경 분석

(1) 산업의 특징

 공급망의 의사결정자들은 빅데이터 소스를 효과적으로 관리하기 위한 방법을 모색하고


있으며, 빅데이터 솔루션을 적용하는 공급망 운영을 통해 프로세스의 개선을 도모

 공급망 운영에 있어서 빅데이터 분석의 응용

*출처: Supply Chain Big Data Series


[ SCM 단계에서 빅데이터 적용 방식 ]

적용 방식 역할
Schduling 재고 수준, 수요 및 생산능력의 가시성 제고, 따라서 생산 및 유통 일정의 정확성 향상
Warehousing 창고 ERP 시스템 내의 빅데이터 분석 실시간 실시 및 재고 수준, 납품 불일치 및 입고 납품 확인
매출, 시장동향, 경쟁사 데이터, 관련 지역 및 세계 경제요인 등에 대한 접근으로
Demand forecasting
수요의 보다 정확한 추정
배달 경로, 교통 데이터, 실시간 기상의 모니터링 및 용량 및 자산 공유가 필요한 경우
Delivery
재라우팅
SKU 레벨의 완벽한 투명성과 완전히 자동화 된 보충 시스템과 재고 부족 범위를
Inventory Planning
제거하고 재고 범위를 최적화하는 수요 예측 데이터
Distributing 자재 흐름 데이터를 기반으로 유통 허브, 플랜트 및 창고의 복잡한 웹을 실시간 최적화

120
120
유통/물류 빅데이터 구축 및 분석 시스템

 모바일 결제, 오프라인 재화의 디지털화, 앱을 활용한 회원제를 통해 이제 구매 고객의


온·오프라인 데이터 수집 및 고객의 소비 패턴 추적, 분석이 가능해지면서, 이를 근간으로
수집된 빅데이터는 물류, 재고 관리, 상품 구성, 마케팅 등 다방면으로 활용되고 있음

▪ 과거 현금으로 제품을 구매할 때에는 오프라인 고객 데이터 및 구매 패턴을 파악하기 힘들었으나,


모바일 결제 시스템은 오프라인 비즈니스 내에서 판매, 운영, 회원 관리의 디지털 전환을
가속화했고, 모바일 결제 생태계는 판매자와 구매자 사이에 데이터가 오가는 기반이 됨

▪ 이를 통해 기업은 모바일 결제를 통해 소비자들의 디테일한 구매 데이터를 더욱 빠르게 확보하고


분석할 수 있게 되었음

 빅데이터 활용과 매장 시스템 디지털화를 통한 실시간 제품 수요 및 재고 파악이


가능해지면서, 물류 시스템이 최적화되고 있음

▪ 축적된 빅데이터를 기반으로 다양한 알고리즘을 짜서 지역별 인기 있는 상품을 사전에 예측하여


재고 물량을 관리하고, 주문자 집 근처의 물류 창고에서 제품이 발송될 수 있도록 준비할 수 있음

▪ 매장은 계절, 시간, 지역 등을 기반으로 제품이 판매되는 상황을 파악하여 필요한 물량만큼만
발주할 수 있음. 매장은 당일 매출을 예상하고 재고 및 상품 정보를 통합적으로 컨트롤가능

▪ 공급업체는 제공된 정보를 통해 생산 관리를 최적화하여 운영 효율을 향상시킬 수 있음

 통합 비즈니스 플래닝을 지원하는 빅데이터 솔루션은 현재 시장동향과 고객선호를 분석하여


조직이 보다 대응적인 공급망을 운영할 수 있음

▪ 다수의 정적 및 동적 데이터 포인트에서 다양한 시장, 판매, 소셜 미디어, 인구통계학적 및 직접


데이터 입력의 삼각관계는 공급망 활동을 예측하고 능동적으로 계획할 수 있는 인사이트를 제공

 사물인터넷(IoT)과 기계학습은 다운타임을 피하기 위해 예측 자산 정비에 활용되고 있음

▪ IoT는 실시간 원격측정 데이터를 제공하여 생산 공정의 세부사항을 파악

▪ 데이터 분석을 통해 기계학습 알고리즘은 기계 고장 등의 시기를 예측

 빅데이터 솔루션은 전송경로를 동적으로 계획하고 최적화하기 위해 교통 및 기상 데이터 외에


GPS 데이터를 분석함으로써 전송 지연을 사전에 방지

▪ 글로벌 수준의 빅데이터 적용은 공급망 위험(예: 인위적 또는 자연적 재해로 인한 공급 장애, 운용
및 상황적 장애)에 대한 대응보다는 공급망에서 사전 예방적 대응 가능

 중국의 신유통을 대표하는 신선식품 매장 허마셴셩(盒马鲜⽣)은 공급망, 물류, 상품, 회원


시스템을 빅데이터 분석을 통해 판매량을 미리 예측하여 제품을 준비함

▪ 허마셴셩의 데일리프레쉬(르르셴, ⽇⽇鲜) 제품은 다양한 야채, 채소를 당일만 판매하는 것을


원칙으로 사전에 당일 판매량을 조절하고 농장으로부터 직거래하여 매장에 입고

▪ 징동은 상거래 플랫폼 및 자체 물류 센터 운영을 통해 축적된 빅데이터와 빅데이터 처리 기술을 통해,


유통 원가, 제품 및 데이터 관리에 대한 최적화를 실현하여 공급체계의 효율을 높이고 원가를 절감

121
121
전략품목 현황분석

(2) 산업의 구조

 판매 이력 데이터
▪ POS 데이터로 대표되는 판매 이력 데이터의 경우, POS를 통해 정산된 구매일시 구매품목 개수
금액 구매점포 등의 데이터가 기록

 공급망 관리 시스템 (SCM,Supply Chain Management)

▪ SCM은 일반적으로 최종 소비자에게 전달되는 제품과 서비스의 형태로 가치를 창출하는 다양한
프로세스와 활동에서 상류 및 하류 연계를 통해 관여하는 조직의 네트워크로 정의

 유통 시스템은 제품 수명주기 단축, 제품 다양성 확보, 설계에서 효율적 운영, 납기 단축


등의 다양한 시장요구에 맞추어 개발되며, 주요 시스템은 아래와 같음
▪ 자재 수급 계획(MRP, materials requirement planning) : 컴퓨터를 이용하여 최종제품의
생산계획에 따라 그에 필요한 부품 소요량의 흐름을 종합적으로 관리하는 생산관리 시스템임

▪ 제조 자원 계획 (MRP, manufacturing resource planning)

▪ 산업 자원 관리 (MRP, enterprise resource planning),

▪ 전사적 자원 관리(ERP,enterprise resource planning)

▪ 고객 관계 관리(CRM, customer relationship management)

▪ 공급자주도형 재고관리 (VMI,vendor managed inventory)

▪ 창고관리 시스템 (WMS, Warehouse Management System)

▪ 협력적 예측·보충 시스템 (CPFR, collaborative planning, forecasting & replenishment): 협력적
예측·보충 시스템. 판매·재고 데이터를 이용해 제조·유통업체가 상호 협력하여 공동으로 예측하고
계획하며 상품을 보충하는 업무 프로세스로 SCM 공급측면 응용기술

 KMPG의 리테일 테크 4.0에서는 각 분야별로 사용될 수 있는 5가지 분류를 제시


▪ 전략 수립 단계 : AI는 인간을 대신해 데이터를 분석하고 전략을 수립해 경영자의 의사 결정에
도움을 줄 수 있는데, 수요 예측부터 상권 분석, 소비자 분석에 이르기까지 AI가 경영 전략 수립에
기여하는 영역은 다각화

▪ 물류 관리 단계: 재고 및 창고 관리, 재고 실사, 매장 관리 등의 영역에서 자동화가 이루어지고


있음, 특히, IoT 센서의 발달은 재고 관리의 정확성을 높이며, 모든 상품의 이동과 상태 정보를
실시간으로 공유하고 관리하는 ‘Real-Time SCM’화가 나타나고 있는데 이는, 로봇이 사람을
대신하게 해 관리의 효율성을 극대화하려는 목적

▪ 마케팅 단계 : AR과 VR 등 각종 신기술이 고객 경험을 강화하고, 오프라인 매장이 디지털화되면서


‘피지털(phygital)’이라는 패러다임이 나타나고 있으며, AI와 IoT는 빅데이터를 통해 특정 소비자를
주목하는 타깃 마케팅과 실시간(real-time) 마케팅을 구현 중

122
122
유통/물류 빅데이터 구축 및 분석 시스템

▪ 결제 및 배송 단계 : 결제의 간편화, 배송의 효율화를 목적으로, 유통 기업은 VR 페이, 무인 결제


시스템 등으로 소비자가 구매 결정 후 결제하기까지 걸리는 시간을 최소화하는 데 중점을 두고
있음. 드론을 비롯한 각종 로봇 기술을 상품 배송에 활용하면서 기업의 인건비 절감 효과와 더불어
배송 속도를 향상시키고 배송의 정확도를 개선 가능

▪ 고객 관리 단계: 반복 구매 및 재구매를 간편하게 함으로써 자사 플랫폼에서 고객의 지속적인


구매를 유도하고 있으며, IoT 및 블록체인 기반의 제품 이력 추적 시스템을 배송 및 반품 과정에
접목해 소비자의 신뢰도를 높이는 동시에 브랜드 이미지 제고 효과를 통해 고객 로열티 고취 가능

123
123
전략품목 현황분석

나. 시장환경 분석

(1) 세계시장

 다국적 기업의 공급사슬관리 (SCM) 및 e-commerce의 발달이 지속적으로 진행되어, 부가가치를


창출할 수 있는 유통/물류 서비스 관련 수요가 지속적으로 증대되는 양상을 보이는 추세

▪ 지식기반 (Knowledge-based) 사업과 전자상거래의 발달로 세계화 기업의 공급망 효율성 제고를
위한 다양한 물류시스템의 개선이 핵심 요소가 됨. 특히 다국적 기업이 물류 산업의 중심이 된
현재, 해외 배송 등 장거리 배송이 폭발적으로 증가

[ 글로벌 물류 네트워크 현황 ]

▪ 국제 물류가 활발해짐에 따라 빅데이터 기반의 유통 및 물류 배송 추적의 필요성이 증대되고


있으며, 다양한 업체에서 물류 가시성 확보를 위한 서비스를 제공

[ 에어콘테이너 로지스틱스(주)의 물류 가시성 솔루션 예시 ]

124
124
유통/물류 빅데이터 구축 및 분석 시스템

 물류 산업에서의 RFID의 도입은 2000년대 중반 이후 활발해 최신 기술이라고 하기는


어렵지만, 그 응용과 적용범위가 현재도 증가추세에 있어 눈 여겨 보아야 하는 기술

▪ 소매유통, 물류, 우편 등의 분야에서 화물 모니터링과 추적 및 효율적인 재고관리 등 물류 가시성


확보를 위한 시스템의 기반기술로서 RFID 기술이 많이 활용

▪ 최근 들어 RFID 적용분야 전반적 비율을 기준으로 물류 및 유통산업이 약간 감소하는 추세로


예상되지만, 전체 RFID 시장은 꾸준히 증가할 것으로 예상

 빅데이터 기반 트래킹 시스템의 세계 시장 규모는 ‘17년 215억 1,000만 달러에서 연평균


38.4% 성장하여 ’22년에는 1,091억 9,600만 달러 규모에 이를 전망

[ 빅데이터 기반 물류 트래킹 시스템 세계 시장규모 및 전망 ]


(단위 : 백만 달러, %)

구분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 21,510 29,600 41,460 57,260 79,070 109,196 38.4

* 출처 : Technavio Reasearch, 한국전자통신연구원 바탕으로 재구성

 GPS 및 위치정보산업의 시장환경 분석은 스마트 화물추적 서비스의 동향 분석에 매우 중요한데,


이는 유통에 활용되는 스마트 화물 추적을 통한 물류 가시성 확보의 핵심기술이기 때문

▪ 한국전자통신연구원의 위치정보서비스 (LBS) 기술 및 시장동향 분석 연구에 따르면, 2014년 세계


LBS 시장은 83.8억 달러로 평가되며, 연평균 성장률 37.46%로 성장하여 2019년까지 LBS 시장은
414.6억 달러에 이를 것으로 예상됨

▪ 특히, 북미와 유럽이 세계 LBS 시장의 50% 이상을 점유하고 있음

▪ 차량운행관리는 GPS 및 추적기술을 통해 차량의 현재 위치와 운행 정보 등에 관한 실시간 데이터를


제공하는 솔루션임. 특히 Bi Intelligence에 따르면, 2020년에는 북미에서 상업용 차량 1억
8,000만대에 적용을 할 것으로 예견, 이는 전체 시장의 90% 가량을 차지하는 매우 큰 수치

▪ 관련 기업들은 트럭을 통한 물적자산의 운송 모니터링에 GPS 기술을 이용한 솔루션을 매우


효과적으로 사용 중에 있음

125
125
전략품목 현황분석

(2) 국내시장

 국내 유통, 물류시장은 그 규모가 꾸준히 증가하고 있으며, 이에 따라 물류시장에 관여하는


여러 기업들이 물류 시스템의 효율화를 위한 투자가 지속될 것으로 예상
▪ 꾸준히 증가하는 물류시장과, 다양화되는 고객들의 수요, 그리고 기업의 안정적인 물류 시스템
운영을 위해 물류가시화에 대한 투자가 증대될 것으로 예상

 빅데이터 기반 트래킹 시스템의 국내 시장 규모는 ‘17년 161억 4,000만원에서 연평균


30.9% 성장하여 ’22년에는 620억 1,000만원의 규모에 이를 전망

▪ 빅데이터 기반 트래킹 시스템의 세계 시장의 연평균 성장률 38.4%에 못 미치는 수치로, 세계시장과의
격차 심화 우려, 향후 세계 시장에서 경쟁력을 갖추기 위해서는 활발한 지원이 필요할 것으로 분석

[ 빅데이터 기반 트래킹 시스템 국내 시장규모 및 전망 ]


(단위 : 억 원, %)

구분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 161.4 226.2 301.5 381.8 449 620.1 30.9

* 출처 : 한국전자통신연구원, 2015 바탕으로 ‘21년 이후 추정

 한국인터넷진흥원 2016년 국내 LBS 산업 실태조사 결과 보고서에 따르면, 국내 LBS 시장은


대규모 사업자에 의한 독점적 시장지배 구조로 개인 또는 중소기업이 시장에서 성공하기
어려운 상황

 결론적으로 국내 LBS산업은 소규모 LBS사업자의 입지 부족, 원천기술 부족, 여러 정책적


지원 미비 등으로 어려움을 겪고 있어, 물류 화물 모니터링 기술은 위치정보기반 서비스
기술의 제도적 개선과 병행될 필요성 대두

 국내의 위치기반서비스 시장은 꾸준한 성장세를 보여, 연 평균 15.1%의 성장률을 보일


것으로 전망

▪ 특히, 서비스별 매출을 조사해 보면 물류추적·B2B가 두 번째로 큰 매출을 차지할 것으로 예측하는
연구결과도 있음

 국내 시장의 동향은 대기업을 중심으로 자체적 RFID 성공적 사례를 기반으로 RFID에 대한
수요가 꾸준히 증가하고 있음

▪ 특히 국내의 RFID 응용서비스 분야 중 물류 유통분야에서의 적용이 대부분을 차지할 정도로 물류


유통분야에서 널리 쓰이는 기술

▪ 믈류 처리량이 방대한 대기업들을 중심으로 해당 기술에 기반하여 물류 최적화를 위한 물류 가시성


확보에 주력

126
126
유통/물류 빅데이터 구축 및 분석 시스템

3. 기술 분석

가. 기술개발 이슈

 ICBM이라고 일컬어지는 IoT, Cloud computing, Big Data, Mobile 새로운 트렌드에
선제적으로 대응하기 위하여 해외 선진국에서는 정부 차원 및 민간기업 차원에서 축적된
다양한 분야의 데이터를 활용한 새로운 비즈니스 모델에 대한 연구가 활발한 데 비해, 국내의
물류 분야 빅데이터 활용은 아직 미흡한 상황
▪ 정부가 주도하여 공공 분야에서 수집하고 있는 물류분야 데이터는 종류와 범위가 다양하나 그
활용에 있어서 아직 분석 및 활용 모델구축이 부족한 상황

▪ 민간 기업들도 다양한 분야의 데이터를 수집․축적하는 정보 중심 시스템을 구축하고 있으나 수집된


방대한 데이터 처리 방법과 수익 창출 비즈니스 모델에 대한 연구는 아직 초기단계에 머물러 있음

 다양한·대량의 비정형 데이터가 ICT의 진전에 따라 급격히 증가하고 있음

▪ 기존의 축적·활용된 데이터는 기업의 고객 데이터와 매출 데이터 등의 텍스트나 숫자 중심의 정형


데이터였으나, 현재는 사진, 영상, 음성, 텍스트를 조합하여 만든 비정형 데이터가 중심이 되고 있음

▪ 향후, 모바일 디바이스의 보급과 IoT의 진전에 따라 GPS 데이터와 RFID 데이터, 센서 데이터 등의
새로운 비정형 데이터가 더욱 급증할 것으로 예상되며, IoT의 보급에 의해 단시간에 수집된 대량
데이터의 신속한 처리 요구가 나타날 것으로 예상됨

 빅데이터 활용을 위한 데이터 수집에 있어서의 가장 중요한 포인트는 수집한 데이터의 이용을
모두 고려한 후에 데이터의 수집을 실시해야 함

▪ Marchand and Peppard(2013)는 일반적인 IT 도입과 같은 순서로 빅데이터 활용을 진행시키려


하면 실패한다고 지적하면서, 빅데이터 활용의 시스템은 업무시스템과는 달리, 데이터베이스에
정보를 축적하거나 일정한 처리를 연속적으로 반복하는 것이 아니라, 최종적으로 사용자가 사용할
수 있도록 하는 것이 목적이기 때문임

▪ 데이터의 최종 사용자가 얼마나 의사결정이나 부가가치 향상에 활용할 수 있었는가 하는 관점에서


데이터의 가치를 평가해야 하며, 이를 기반으로 데이터를 수집하여, 용량 및 관리 비용 절감 가능

 데이터의 표준화 · 고품질화


§ 수집하는 데이터 이용 목적이 명확하다면 대량의 raw 데이터 품질을 고도화하여 즉시 사용할 수
있는 데이터(딥데이터)를 선별하고, 효율적인 축적·관리를 통한 분석·이용이 필요하며, 이를 위해
수집된 데이터의 선별 및 가공의 타당성에 대한 근거의 필요성 여부 등 검토할 필요가 있음

▪ 데이터 클렌징은 새로운 데이터베이스, 데이터웨어하우스의 무결성 제약조건에 위배되는 데이터들을


클렌징하여 데이터 이전이 될 수 있도록 정리하는 것을 지칭하며, 데이터 클렌징과 데이터
추출·가공·결합 기술은 데이터 분석자·이용자에게 있어서 중요

127
127
전략품목 현황분석

▪ 수집되는 데이터의 종류와 수집 방법에 따라 데이터 중복과 표현의 특징에 따라, 중복 제거 및 표현의
통일 등의 표준화하여 데이터의 품질 향상을 도모할 필요가 있음. 품질이 좋은 데이터라 하더라도
이용·활용에 적합한 형태로 활용하기 위한 데이터 정리·추출이나 데이터 가공·결합 기술 필요

▪ 국제데이터관리협회의 영국 지부 자료를 살펴보면, 데이터의 품질에는 6개의 주요기준이 있음

[ THE SIX PRIMARY DIMENSIONS FOR DATA QUALITY ASSESSMENT ]

기 준 시장규모

Completeness (완전성) 보유한 데이터가 잠재적인 전 데이터에 대해 100%를 포함함

Uniqueness (유일성) 특정 대상이 두 줄 이상에 걸쳐 기록되어 있지 않음

Timeliness (적시성) 요구하는 시점의 현실을 나타내고 있는 정도

Validity (정당성) 정의되어 있는 구문규칙(포맷, 형태, 범위)에 올바르게 준거함

Accuracy (정확성) 기술하고 있는 분야의 대상이나 이벤트를 정확히 나타내고 있는 정도


데이터 세트 내 또는 세트 간에 일관된 정의에 대해, 복수 표현 등의
Consistency (일관성)
상이성이 없는 것

*출처: DAMA UK

 개인 정보를 포함한 데이터 검색

▪ 모바일 장치 및 IoT 디바이스의 보급에 의해 종래에는 어려웠던 다양한 데이터 개인 정보가 포함된
데이터도 수집 가능하며, 개개인에 특화된 빅데이터 응용 서비스가 예상되지만, 개인 정보를 포함한
데이터 취득에는 미리 이용 목적을 확인하고 본인의 동의 또는 이용 목적을 미리 공지하는 등의
개인 정보 보호에 대한 의무 사항을 준수해야 함

 분석 결과의 사용성
▪ 분석에 의해 얻어진 결과를 이용자에게 제공함에 있어 분석가는 결과를 납득할 수 있어야 그러한
결과에 이른 이유와 근거를 확인 가능

▪ 인공 지능·기계 학습·심층 학습에 의한 분석의 경우, 도출된 결과에 대한 근거 확인이 어렵고,


분석가가 산업 전문가가 아닌 상황에서 책임을 져야 한다는 점이 실용화를 방해

▪ 또한, 유통 물류 산업의 경우, IT분야 전문가가 아닌 부분을 감안하여, 인공 지능·기계 학습·심층


학습을 이끌어내는 추론 결과의 이유와 근거를 나타내는 기술의 개발이 필요

 빅데이터 보안
▪ 빅데이터 변조는 무단 액세스, 조작 실수나 시스템 문제, 랜섬웨어(Ransomware)등의 사이버
공격의 피해 등이 예상

▪ 무단 액세스에 의한 파손을 방지하기 위해, 접속자의 엄격한 인증(본인 확인) 및 인증(권한 확인)의
구조와 신속하게 복구할 수 있는 백업 등의 대책이 필요함. 백업 데이터 보호는 일반적으로 암호화
기술 및 비밀 균형 조정 기술이 이용

128
128
유통/물류 빅데이터 구축 및 분석 시스템

▪ 또한, 은닉 검색은 공개키 암호화 또는 대칭키 알고리즘을 이용하여 일치 AND 검색, OR 검색 부분


일치 검색 범위 검색 유사 검색 등을 구현할 수 있는 기술 적용

▪ 은닉 암호화는 암호화 상태 처리에서 얻은 결과를 이용자(분석가)가 소유하는 개인키로만 해독


가능한 암호화 된 결과로 변환하여 이용자(분석가)에 제공함으로써 빅데이터 시스템 운영자에 대한
데이터 유출 방지 가능

 빅데이터 유지 보존 및 폐기
▪ 빅데이터를 구성하는 데이터는 장기간에 걸쳐 가치를 창출하거나, 장기간 유지함으로써 가치가 증가하는
데이터도 있는 반면, 시간이 지남에 따라 가치가 감소하거나 수명이 존재하는 데이터도 있음. 데이터의
효율적인 운영 · 이용에 있어 데이터의 폐기의 필요성 및 폐기 기준 등에 대한 검토가 필요

▪ 특히 개인 정보의 처리의 경우는 복구 불가능한 확실한 폐기 방법 등 미리 검토 할 필요가 있음

◎ 기술 개발 트렌드

 4차 산업혁명이 부상하면서 물류산업에도 시스템과 규모의 경제로 대표되는 ‘리테일 4.0’이 주목

▪ 물류 기기 및 개체 간의 연결에 따른 데이터 활용이 물류산업의 새로운 경쟁력으로 부상하고, 전


세계적으로 거래의 방식과 범위가 다양해지면서 맞춤형 운송서비스에 대한 수요 증가

▪ 온라인을 통한 해외 직구나 개인 간 거래가 확대되면서 소규모의 개인화된 물류서비스 수요의 증가 뿐 아니라


거래 물품도 기존 규격화된 공산품 중심에서 신선식품, 생물 및 음식배달, 각종 심부름 등으로 품목이 다양화

 제조 과정에서 기계 및 설비에 연결된 센서 및 마이크로 칩은 기계의 작동 상태, 사용 중인


재고 및 온도, 습도, 조명 및 동작과 같은 전반적인 생산 조건에 대한 실시간 데이터를
제공하고, 원격 측정이나 상태 데이터로 전송

▪ 경직적인 물류 네트워크에서 벗어나 소비자 수요 대응에 초점을 맞춘 유연한 물류 네트워크 확보가


미래 물류 기업의 성패를 좌우할 핵심경쟁력으로 부상

▪ 물류 전단계의 정보를 실시간으로 다수의 이해관계자에게 제공해야 할 필요성이 증가하고 있으며,


물류 서비스가 전체 상품이나 서비스의 만족도와 직결된다는 점에서 운송 전 단계에 걸쳐 물류를
관리하려는 화주기업이 증가

 수송 규모의 확대와 소량ㆍ다품종 처리 시설 도입 등에 따라 물류 창고의 대형화 및 고도화

▪ 수요 측면에서 온라인 구매의 증가, 산업 측면에서는 M&A를 통한 화주기업의 대형화, 인프라


측면에서 시설 교통 발전에 따른 거점 집중화가 진행되면서, 물류 창고의 대형화가 진행

▪ 온라인 거래 확대와 1인 가구의 증가, 신선 물류에 대한 수요 증대 등으로 물류 창고에서 처리해야 하는


물품의 유형, 크기가 다양화되고 이를 처리하기 위한 창고 시설 기술이 도입되면서 물류 창고가 고도화

129
129
전략품목 현황분석

 물류 창고의 대형화 및 고도화는 물류산업의 노동 주체를 인력에서 로봇ㆍ자동화기술로


이행시키는 현상을 이끌고 있음

▪ 선진국 및 선도 물류기업들은 물류로봇 등 첨단 ICT를 활용해 물류 자동화ㆍ효율화 및 비용절감을 추진

▪ 아마존은 물류창고로봇 ‘키바’를 통해 물류센터 운영비용20% 절감, 재고 보관 공간 50% 증대


등의 성과를 발표

▪ MOL,NYK 등 일본선사는 2025년까지 원격조정(무인)선박 도입을 계획하고 있으며 일본 정부는


2030년까지 정부 주도로 인공지능(AI)을 투입해 물류산업을 ‘완전 무인화’한다는 로드맵을 발표

 물류시스템에 IoT를 결합하려는 기술이 각광


▪ RFID 태그를 이용해 제품을 실시간으로 관리하고, 제품이 이동할 때 어느 도시를 지나 언제쯤
도착하는지 시각화 정보 제공

▪ IoT는 GPS, RFID 및 기타 필수 센서를 통해 운송 차량을 연결하는 공급망에서 연결 교통 수단을


제공하여 차량의 위치, 화물 및 기타 추적 정보를 파악하여 운송 가시성을 제고

▪ GPS와 RFID로부터 수집된 데이터는 또한 분석가들이 화물 도착의 정확한 시간을 결정하고 경로를
동적으로 최적화하고 잠재적인 지연을 방지

▪ 온도, 습도 및 운송 중 제품의 품질에 영향을 미칠 수 있는 기타 변경 파라미터와 같은 중요한 화물


모니터링 세부사항 모니터링 가능

▪ 제조업체가 생산 제품을 전 세계로 배송할 때 배의 속도와 날씨 정보, 태풍 유무 등을 고려해 도착


시간을 미리 계산할 수 있고 도착할 지역 주변의 페이스북과 트위터 등을 분석해 해당 항구에서
국지적 상황이 발생 여부에 대해 미리 판단

 재고관리와 창고보관은 특히 보관된 부품과 제품의 움직임을 감시하고 지속적으로 추적하여


올바른 재고가 올바른 장소로 출하되었는지 확인해야 하는 창고업계에서 IoT를 이용하여
대폭 개선할 수 있음
▪ RFID 태그와 센서를 사용하여 품목의 정확한 위치, 창고 및 그 너머로 이동, 그리고 기타 중요한 정보(예:
재고가 어디에서 왔는지 또는 유통기한이 지났는지, 물리적 조건과 준수 여부)를 입수하여 기록

▪ 창고에 있는 컨베이어 로봇의 동일한 RFID 태그와 센서는 창고 전체에 걸쳐 로봇의 움직임을 동기화하고,
다운타임과 작업 시간 및 그들이 운반하는 재고량을 모니터링하여 유틸리티와 일정을 최적화

 지브라 컨설팅의 연구에 따르면, RFID를 포함한 IoT 기술을 통해 실시간 재고를 자동으로
파악하는 경우, 현재 유통(리테일)업계의 재고 정확도는 약 65% 수준이지만, RFID 플랫폼을
도입하면 재고 정확도를 95% 수준으로 높일 수 있음
▪ 품목 수준의 RFID태그를 부착하면 재고 소진의 경우 60%에서 80%까지 줄일 수 있으며, 재고
관련 인력을 75%이상 감소시키고, 거래 당 판매 품목의 수를 19%까지 늘리고 거래 건수도 6%
증가 가능

130
130
유통/물류 빅데이터 구축 및 분석 시스템

◎ 기술 환경 분석

 집하부터 배송까지 다양한 이해 관계자들이 얽혀 있으며 톱니바퀴처럼 일사 분란하게


움직이는 물류는 다른 산업에 비해 많은 트랜잭션이 발생

▪ 기업들은 경쟁에 앞서기 위해 해외 시장을 개척하고 저렴한 생산지를 찾아 공장을 이전하면서 더욱


복잡해진 공급망의 효율적 관리가 핵심 성공요소로 부각

▪ 물류산업은 역사는 오래되었으나 산업특성상 오프라인 위주의 산업이다 보니 빅데이터와 같은 ICT


융합에 대한 저항이 있음

- 물류에서 빅데이터가 큰 역할을 하기 위해서는 우선 빅데이터를 충분히 생성해야 하며, 물류에서


활용 가능한 다양한 센서들을 개발하고 보급하여 물류 현장에서 더 많은 정보를 축척해 빅데이터를
구성해야 함
- 운송수단의 발달과 컴퓨터와 인터넷이라는 혁명적 기술이 도입되고, 복잡한 공급망과 물류의 관리
방식이 한층 발전됨으로써 이러한 변화에 대응
- 최근 고속통신망과 스마트폰의 보급 확산으로 점화된 이커머스는 쇼핑의 무대를 세계로 확대시키고,
직접 소비자를 대상으로 하는 물류 시장이 재편성

 유통 데이터는 기본적으로 2차 데이터를 필요로 함

▪ 다른 목적을 위해서 구축된 시스템으로부터 자동적으로 수집되어 보존되고 있는 로그 데이터, 혹은


트랜잭션 데이터로 데이터 량에 따라 데이터 가치가 정비례로 증가한다고 볼 수 없음

▪ 빅데이터 활용의 문맥에서 수집, 분석, 이용을 검토하는 데이터의 경우, 다른 목적으로 수집된 2차
데이터를 활용하여야 함. 예를 들면, POS 데이터는 매상관리나 상품발주를 위한 판매시점 관리가
본래의 목적이며, 그 때문에 수집되고 있는 데이터이며, 다른 예로 신상품 개발에 POS 데이터를
이용하는 경우, POS 데이터는 다른 목적 수집된 데이터(=2차 데이터)임

 유통 빅데이터 응용 시스템에서 저장 · 관리하는 데이터 구조에 따라 적절한 데이터베이스


관리 시스템의 선정이 요구됨
▪ 수집하는 데이터 이용 목적을 명확화하고, 레거시 시스템을 통해 즉시 사용할 수 있는 데이터 (딥
데이터)로 변환하고 효율적인 축적·관리 및 분석, 이용 효율화로 이어져야 함

▪ 또한 수집된 데이터의 선별 및 가공의 경우, 그 타당성에 대한 근거의 필요성 여부를 검토해야 함

▪ 수집되는 데이터의 종류와 수집 방법 등에 있어, 중복 제거 및 표현의 통일 등의 표준화를 통해


데이터의 품질을 향상시켜야 함

▪ 데이터 송신자와 전송 장비를 속인 가짜 데이터나 데이터 송신자와 전송 장비가 보낸 데이터가 변조


되는 경우는 빅데이터 분석 활용에 치명적인 영향을 미칠 수 있음. 사이버 공격에 대한 대응은 물론
데이터 송신자 및 장비 확인 및 데이터가 도중에 변경되지 않았는지 확인 등이 요구

131
131
전략품목 현황분석

 유통 빅데이터 분산 처리 시스템 요구 사항

▪ 첫째, IoT 센서를 포함한 빅데이터 분산 처리 시스템이 처리하는 데이터의 양과 서버의 규모는
기존과 비교가 되지 않을 정도로 규모가 큰 점을 고려하여, 비용적인 측면에서의 효율성,
지속적으로 증가하는 데이터들의 수용, 빈번하게 발생하는 장애에 대한 대처와 인프라 관리의
편리성이 요구됨

▪ 둘째, 다양한 사용자들의 요구를 충족시키기 위해 데이터의 입·출력과 높은 처리 성능이 요구됨.


구체적으로 대용량 파일에 대한 신속한 입출력 성능, 네트워크 구조 인식을 통한 저장되는
데이터들의 최적 배치, 보다 빠른 처리를 위한 효과적인 캐시의 사용, 순간적으로 집중되는 부하의
유연한 대처 등이 있음

▪ 셋째, 데이터에 대한 암호화, 데이터 영역에 대한 사용자간 엄격한 접근 제어, 사용자 데이터에 대한
관리자의 접근 제어와 같은 사항들이 요구

 CJ대한통운의 유통 물류 빅데이터 분석환경은 1)데이터 관점에서의 전사 데이터 허브 및


데이터 거버넌스 영역, 2) 분석관점에서의 분석 서비스 모델 개발 영역, 3)인프라 관점에의
데이터 수집, 처리, 저장, 분석 영역으로 구성

*출처: CJ대한통운
[ 빅데이터 분석 환경 ]

132
132
유통/물류 빅데이터 구축 및 분석 시스템

나. 주요기업 동향

(1) 해외업체동향

 아마존 예측물류 (Anticipatory Logistics)


▪ 아마존은 지난 20년간 유통 네트워크와 고객의 행동 및 경험 등에 관련된 수백 억 개의 데이터를 수집하여
빅데이터 시스템을 구축하였으며, 이러한 원 데이터를 자사 기술로 정제하고 표준화하여 스마트데이터를 창출

▪ 12개 이상의 아마존 데이터 센터는 실시간으로 자사 데이터를 받아들이고 반영하여 시스템과 앱을
확장하며, 분권형 유통망 시스템 (Decentralized Distribution System)을 통해 중앙의 물류
시스템이 지역별 물류센터를 빈틈없이 연결하여 자율주행자 동차와 로봇, 드론을 이용해 라스트
마일 시스템을 실제로 적용

▪ 예측물류 기법을 통해 소비자 데이터를 분석해 구입할 가능성이 높은 물품을 예측해 배송을 미리
준비하는 시스템으로, 자사 AI 플랫폼 알렉사를 글로벌 전자 기업들의 주요 스마트 가전에 탑재하여
그 정확도를 한층 높이고 있음. 이는 아마존 물류 시스템 전체와 연결되어 소비자의 구매 예상
물품을 미리 준비할 수 있도록 전달하는 역할

[ 4차산업혁명의 기술과 아마존의 대응 ]

활용 기술 서비스명 내용
▪ 추천, 상품배열 등의 최적화, 배송 예측 등을 통해
빅데이터, 인공지능 아마존 쇼핑(기존 상거래)
소비자 만족 극대화
▪ 인공지능 쇼핑 보조 OS로 최초에는 스피커인
알렉사(Alexa)
에코(Echo)에 탑재
IoT, 인공지능
▪ 결제과정이 없는 쇼핑으로, 등록된 이메일로
아마존 고(Amazon Go)
청구서를 받는 쇼핑 시스템
▪ 클라우드 컴퓨팅 사업을 직접 운영하여 아마존의
클라우드 컴퓨팅 아마존 웹서비스(AWS)
새로운 캐시카우로 성장
▪ 물류 시스템에 도입하여 비용 절감, 배송시간 단축
로봇 키바 로봇(Kiva robot & systems)
등을 꾀함
드론 프라임 에어 ▪ 배송 시스템에 드론을 도입

*출처: KIET 산업경제

 DHL Resilience 360

▪ 데이터 취합과 평가를 통해 공급 사슬망 전반에 산재한 위험 (risk)을 모니터링하고 미리 예측,


대응할 수 있도록 정보를 제공하는 시스템

▪ 공급사슬 가시화, 리스크 평가, 사고 모니터링, 리스크 대응, 포탈시스템 등으로 구성되어 있으며, 리스크
평가는 국가 위험도와 자체 공급사슬 위험 노출도 지표 방법론, 열(온도) 지도 등을 통해 평가·구현

▪ 국가 위험도는 자연재해, 사회·정치, 정치폭력, 운영 지표로 구분하여 도출하고 열 지도는 현재


온도와 예년도 자료 등을 제공하여 온도에 민감한 화물 운송·보관에 대한 계획수립을 지원

▪ 실시간 모니터링 기능은 사고 실시간 추적, 현장 피드백을 통한 경보 등을 수행하고, 리스크 대응


기능을 통해 응급 배송계획 수립 등을 수행

133
133
전략품목 현황분석

 UPS의 ORION

▪ 약 46,000대의 트럭에서 나오는 텔레메틱스 센서들로부터 데이터가 수집되며 차량의 속도, 방향,
제동, 차량의 성능 등의 정보가 포함

▪ 이 데이터는 배송 기사의 평가 지표로도 활용되지만, UPS 중앙 서버로 수집되어 빅데이터를


구성하여 궁극적으로는 UPS 기사들이 이용하게 되는 주요 경로들을 재설정하는데 사용

▪ UPS는 이러한 목적을 위해서 On-Road Integrated Optimization and Navigation(ORION)이라는


시스템을 구축하고 그간 축적된 데이터, 2억 5천만 개의 주소 데이터, 그리고 지도 데이터를
기반으로 배송 기사들의 배달 및 집하 업무를 실시간으로 조절

 히타치제작소

▪ 축적되는 업무데이터를 자동적으로 저장하고 이를 분석하는 인공지능(AI) 창고관리 시스템 개발하여


효율적인 업무를 달성

▪ 인공지능에 과거 작업지시와 관련된 빅데이터와 실시간으로 발생하는 상품 집품작업 실적 데이터를


입력한 후 집품에 걸린 시간과 공간 혼잡도 상관관계를 분석해 집품 작업의 효율을 분석하고, 이
작업효율 모델을 집품 카트를 할당하는 시스템에 반영해 다양한 상품을 카트에 집어넣는 순서를 최적화

▪ 인공지능에 의해 최적화한 작업지시서를 발행하여 직원은 작업지시서에 나온 순서대로 창고를


돌면서 지시된 상품을 꺼내 카트로 선적

▪ 또한, 물류창고에서는 공간이 비좁아 한 선반에 한명씩 밖에 작업할 수 없기 때문에 다음 직원은


대기할 수 밖에 없으며, 이때 인공지능을 통하여 같은 시간에 직원이 겹치지 않도록 순서를
조정하는 빅데이터 활용을 통해 평균 작업시간이 8% 단축

 야마토 예측 시스템
▪ 야마토 예측 시스템은 과거 화물 수취시간의 데이터를 축적, 분석해 고객이 집에 있는 가능성이 높은
시간대를 예측하는 시스템으로, 20%에 달하는 첫 번째 배달 부재율을 낮출 수 있어 배송기사는 남는
시간을 활용해 배달시간을 세분화해 지정하는 등 보다 효율적인 서비스 제공이 가능

 트라센(TRAXENS)

▪ 프랑스 대형 해운회사인 CMA CGM社는 대형 컨터이너 선박에 실시간으로 화물을 모니터링할 수


있는 기술인 트라센 (TRAXENS)을 적용

▪ 트라센 기술은 스마트 컨테이너 에 장착되어 컨테이너 간, 관련 인프라들 간에 커뮤니케이션을


가능하게 해주며, 육상 또는 해상에 있는 컨테이너로부터 실시간으로 데이터를 수집하여
컨테이너선, 고객, 보험회사, 세관 등에 유용한 정보(위치, 온도, 습도, 진동, 침입여부, 통관수속
상태 등)를 제공

 자라(Zara)의 효율적인 물류 배송망

▪ 패스트패션(SPA) 기업의 대표 주자 중 하나인 자라는 빅데이터 분석을 활용해 전세계 매장의 판매


현황을 실시간으로 분석한 뒤 고객 수요가 높은 의류를 실시간으로 공급할 수 있는 물류망을
구축함으로써 재고 부담은 줄이고 매출은 극대화하는 성과를 거두고 있음

134
134
유통/물류 빅데이터 구축 및 분석 시스템

(2) 국내업체동향

 과학기술정보통신부와 한국정보화진흥원에서 발표한 2015년 빅데이터 시장현황 조사


보고서에 의하면 솔루션 및 시스템에 대한 기술 수준이 평균 이상임에 비해 데이터 거래,
분석 서비스, 컨설팅 등 서비스 부분의 기술 수준이 낮게 나타났으며, 관련 이슈는 다음의
3가지로 나타남

▪ 첫째, 사업적 가치가 있는 데이터가 부족함. 데이터 거래 시장(Data Broker)이 전무, 해외의 경우
AggData, Contentfor Sale, Data Market 등 사업적 가치를 지닌 데이터를 판매하는 기업이
다양하게 존재하나, 국내는 개인정보보호법으로 인해 공공데이터 활용이 얕은 수준에 머물러 있으며
데이터를 생산하는 통신, 금융 등 핵심기업 또한 데이터의 개방에 아주 보수적인 태도를 보이고
있어 데이터 거래시장이 제대로 형성되어 있지 않음

▪ 둘째, 데이터 분석 서비스 업체가 부족함. 국내 빅데이터 분석 서비스는 소셜 분석, 지역 분석


제공에 그치고 있음

▪ 셋째, 거래 및 분석 서비스 등 서비스 부문 기술 수준이 낮음. 선진 기술수준과 비교할 때


수집․저장․관리 기술수준은 약 70∼80%로 양호한 반면, 거래 및 분석 서비스 등 서비스 부문에
대한 기술수준은 20∼30% 수준

 유통물류 빅데이터 분석과 관련한 중소기업은 아직 눈에 띄는 곳은 없으나 유통/물류


빅데이터 구축 및 분석 시스템을 개발할 수 있는 역량을 갖춘 기업들이 등장하고 있음

 1990년에 출범한 ㈜위세아이텍은 빅데이터·인공지능 전문기업으로 데이터 관리에서부터


빅데이터 분석과 인공지능을 활용한 예측까지 통합 솔루션 및 서비스를 제공

▪ 2000년 이후 사명을 ‘위세아이텍’으로 변경하고 데이터 품질관리 솔루션인 WiseDQ와 메타데이터


관리 솔루션인 WiseMeta를 다수의 금융기관에 제공하고 공공데이터 관리 솔루션인 WiseOpen을
통하여 다수의 공공기관의 공공데이터 개방을 주도함

▪ 현재는 머신러닝 프로세스 자동화 플랫폼인 WiseProphet을 개발을 통하여 공학화된 데이터
전처리를 제공하고 이를 통해 군 장비 및 각종 설비의 예측 정비, 보험과 금융의 부당청구 탐지,
컨텐츠 개인화 추천 등을 통하여 ‘빅데이터 분석을 넘은 예측 분석’ 서비스를 제공

135
135
전략품목 현황분석

*출처: ㈜위세아이텍

[ 머신러닝 프로세스 자동화 솔루션 WiseProphet ]

 솔트룩스는 지난 20년간 인공지능(AI)과 빅데이터 기술 융합을 통한 혁신 플랫폼과 지능형


서비스를 제공해온 국내 인공지능, 데이터 과학 분야 대표 기업

▪ 2016년 국내 최초로 상용화된 인공지능 플랫폼 아담(ADAM) 출시. 아시아 최대 규모의 지식


베이스를 내장하고 지식, 언어, 시각 인지 등 60여 APIs를 제공. 특히 지식 학습과 복합 추론에
강점이 있으며 생활 질의응답 정답 확률 94% 수준을 제공

▪ 아담을 기반으로 개발한 ‘아담 어시스턴트(Assistant)’를 통해 인간 수준의 고객 대응이 가능한 AI 고객


상담 시스템을 구축. ‘아담 어시스턴트’는 고객지원센터의 반복적 업무 뿐만 아니라 심층질의응답과
대화가 가능한 전문 상담 시스템 구현을 지원, 현재 NH농협은행 상담원 지원 시스템, 우리은행
위비봇, 한국식품안전관리인증원 AI 기반 HACCP 기술 상담 등 다수의 사례를 통해 그 기술력을 입증

136
136
유통/물류 빅데이터 구축 및 분석 시스템

▪ 인공지능과 데이터 과학자을 위한 국내유일의 데이터 사이언스 포털 데이터믹시(DataMixi). 데이터


분석을 위한 통찰과 인공지능이 결합된 인지분석으로 데이터를 융합하여 심층 분석하고 다양한
관점에서 시각화함으로써 데이터 간의 숨겨진 패턴을 발견하고 미래를 예측

▪ 데이터 큐레이션은 데이터 수집과 정제에서 어노테이션과 분류, 학습용 데이터 생성 등 데이터의
활용 가치를 높이기 위한 모든 활동을 포함

[ 데이터 사이언스를 위한 데이터 큐레이션 6단계 ]

데이터 큐레이션
품질 검사 검증 기계학습 품질평가

학습/분석 최적화 학습/분석 알고리즘 선정과 실험, 최적화


학습/분석 준비 데이터 집계.통계 분석, 데이터 어노테이션, 학습준비


데이터 정제, 오류/이상 데이터 식별, 분석, 학습을 위한 데이터 주
정제/변환
변환 기

데이터의 안전한 저장과 이질적 데이터의 통합, 중복제거,
저장관리/통합 리
데이터 셋 버전 관리

이미지, 음성, 텍스트, 센서, 웹, 소셜 데이터 등 원시 데이터
수집/구축
수집/구축 과 기본 메타데이터 생성

*출처: 솔트룩스 데이터믹시(www,datamixi.com)

▪ 데이터 기반의 심층 분석과 기계학습을 위해서는 대규모 데이터의 확보뿐 아니라 기계가
읽고(readable), 학습하고(learnable), 의미 이해 가능한(understandable) 형태로 가공되어
데이터믹시의 데이터 큐레이션 서비스는 솔트룩스 20년의 데이터 품질관리와 기계학습 경험이
축적된 세계 최고 수준의 데이터 서비스를 제공

 ㈜위비즈테크는 빅데이터 전문기업으로 데이터 관리에서부터 데이터의 시각화, 빅데이터 분석과


클라우드 인공지능을 활용한 예측 등 각종 통합 솔루션 및 플랫폼 서비스 제공
▪ Wiver, Smart AEO Platform를 통하여 다수의 물류회사, 공공기관에 빅데이터 관리 솔루션
서비스를 제공하여 시간, 비용 절감에 기여 하였으며, 공공에는 데이터 개방을 주도

▪ 축적된 빅데이터 개발 사업수행을 바탕으로 Google Map 서비스와 빅데이터 등을 가공, 모델링해
시각화하여 전달하는 솔루션 Wiver를 출시

▪ 클라우드 기반의 머신러닝 자동화 플랫폼인 Smart AEO Platform을 개발을 통하여 공인인증
프로세스 자동화, 위험요소 모니터링, 검사일 자동 알람 등의 지원. 빅데이터 로부터 정보를 추출하고
결과를 분석, 예측하는 서비스를 제공

137
137
전략품목 현황분석

*출처: ㈜위비즈테크

[ 클라우드 기반 AEO운영 및 인증 플랫폼 : Smart AEO Platform ]

*출처: ㈜위비즈테크

[ 업무, 관제, 포탈 시각화 솔루션 : Wiver ]

138
138
유통/물류 빅데이터 구축 및 분석 시스템

 이글로벌시스템(대표: 강희창)은 기업용 애플리케이션 공급 전문회사로, 2004년에 설립되어


자사 대용량 DB 전문 컬럼 암호화 솔루션 큐브원(CubeOne)과 미국에 본사를 둔
액티안(Actian)사의 파트너쉽을 통해 빅데이터 분석시장에 빅데이터 분석 DBMS인
벡터(Vector)를 공급

▪ 데이터베이스 및 보안(암호화) 분야에서 오랜 경험과 실력을 겸비하고, 빅데이터 분석 분야에서도


지속적으로 큰 성과를 가시화

▪ 대용량 DB 암호화 사업에서 공공, 금융, 일반기업 등에서 고른 매출기록을 달성하고, 공공분야는
대법원, 국토부 등 굵직한 사업을 완료하였으며, 공공분야 고도화 사업과 비정형암호화 분야의
수요창출, 금융분야의 금결원 사업을 마무리하고 수중은행도 구축 완료

▪ 빅데이터 분석사업에서 글로벌 반도체사의 Machine Learning을 활용한 제조공정 빅데이터 분석시스템
및 MES 시뮬레이션 분석시스템 구축과 함께 의료/진료분야의 빅데이터 분석시스템을 구축,
공공기관에서 업무혁신 및 업무프로세스 개선을 위한 빅데이터 분석 사업에 두드러진 성과를 기록

▪ 빅데이터 분석 사업을 위하여 국내 유명 솔루션 파트너쉽을 통하여 Linux OS, ETL, CDC, BI,
Visualization, Machine Learning 등 고객의 최적의 분석 시스템 서비스를 위한 연결고리 역할을 담당

139
139
전략품목 현황분석

다. 특허 동향

◎ 유통/물류 빅데이터 구축 및 분석 시스템 기술 분야 특허상 주요 기술

 주요 기술
▪ 실시간 데이터 수집 기술, 서비스 시각화 기술, 상품정보 빅데이터 구축 기술, 지능형 삼품 관리
기술, 배송경로 최적화 분석 기술, 스마트 물류 관리 시스템 기술 등이 포함됨

요소기술 코드 설명

▪ 끊임없이 입력되는 스트림 데이터를 적정 구간으로 나누어


저장하며, 스트림 데이터가 들어오는 대로 일련의 처리 업무들을
수행하여 그 결과를 연속적으로 제공하는 기술로 크롤링, 파일
전송을 위한 인터넷 프로토콜 (File Transfer Protocol;FTP),
인터넷 이용자가 일방적으로 웹 검색 결과 및
실시간 데이터 수집 기술 A 사용자인터페이스(UI) 등을 제공받는 데 그치지 않고 직접 응용
프로그램과 서비스를 개발할 수 있도록 공개된 운영체제와
응용프로그램 사이의 통신에 사용되는 언어나 메시지 형식 (Open
API), 업데이트가 빈번한 웹사이트의 정보를 사용자에게 보다
쉽게 제공하기 위하여 만들어진 xml 기반의 콘텐츠 배급 포맷
(RSS), 스트리밍, 관계형 데이터, 로그 등을 포함

▪통계 그래픽, 클라우드(텍스트, 워드, 데이터) 기술을 이용하여


서비스 시각화 기술 B
빅데이터를 이용한 서비스를 시각화

▪대.중소 유통 제조 업체가 공동 활용 가능한 상품정보 표준화 및


상품정보 빅데이터 구축 기술 C
빅데이터 구축 기술

▪빅데이터를 기반으로 상품의 재고 관리 및 반품 관리를 최적화


지능형 상품 관리 기술 D
하는 기술

▪빅데이터를 기반으로 배송순서, 도로정보, 위치 정보를 바탕으로


배송경로 최적화 분석 기술 E
배송경로를 최적화 하는 기술

▪빅데이터를 기반으로 물류센터수, 용량, 수송량 분석을 통해 물류


스마트 물류 관리 시스템 기술 F
거점을 최적화 하는 기술

140
140
유통/물류 빅데이터 구축 및 분석 시스템

◎ 세부 분야별 특허동향

 주요 기술별 출원인 국적별 특허동향

▪ 유통/물류 빅데이터 구축 및 분석 시스템 기술의 요소기술별 주요 출원인 국적별 특허정보 데이터


입수하였으며, 최근 10년간의 특허데이터를 비교 분석

요소기술 한국 미국 일본 유럽 ETC 계

실시간 데이터 수집 기술 23 9 0 0 3 35

서비스 시각화 기술 12 5 1 0 3 21

상품정보 빅데이터 구축 기술 49 26 2 2 18 97

지능형 상품 관리 기술 14 10 0 1 4 29

배송경로 최적화 분석 기술 53 110 8 19 38 228

스마트 물류 관리 시스템 기술 81 129 15 17 51 293

합계 232 289 26 39 117 703

▪ 요소기술별 츨원인 국적별 특허동향에서 미국국적의 출원인이 가장 활발한 연구개발을 하고 있으며,


그 다음으로는 한국, 유럽, 일본 국적 출원인 순으로 나타남

▪ 배송경로 최적화 분석 기술 및 스마트 물류 관리 시스템 기술 분야에서는 미국 국적 출원인이 가장


많은 비중을 차지하고 있으며, 그 다음으로는 한국, 유럽 국적 출원인 순으로 특허를 출원

▪ 스마트 물류 관리 시스템 기술 분야에서는 미국 국적 출원인이 가장 많은 비중을 차지하고 있으며,


그 다음으로는 한국, 유럽 국적 출원인 순으로 특허를 출원

▪ 상품정보 빅데이터 구축 기술 분야에서는 한국 국적 출원인이 가장 많은 비중을 차지하고 있으며,


그 다음으로 미국 국적 출원인이 유럽, 일본 국적 출원인이 상대적으로 출원이 없음

▪ 실시간 데이터 수집 기술 및 서비스 시각화 기술은 한국 국적 출원인이 가장 많은 비중을 차지하고


있으며, 그 다음으로는 미국, 일본 국적 출원인 순으로 특허를 출원

141
141
전략품목 현황분석

▪ 관점을 국내·외 출원인으로 바꾸어 보면 한국국적의 출원인은 외국국적의 출원인에 비해 상품정보


빅데이터 구축 기술(C) 분야의 출원 비중이 상대적으로 높게 나타나고 있음

▪ 반면, 한국국적의 출원인은 외국국적의 출원인에 비해 배송경로 최적화 분석 기술(E)와 스마트 물류


관리 시스템 기술(F) 분야에 상대적으로 특허 출원 비중이 상대적으로 낮은 것으로 나타남

▪ 한국국적의 출원인의 특허 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는
경향을 보이고 있음

* 2017~2018년은 미공개 출원이 존재하여 출원 수가 적게 보이는 구간으로, 시계열 동향을 파악할


때 이 점을 유의해야 함

▪ 외국국적 출원인의 특허 출원량도 한국국적 출원인과 유사하게 2000년 중반 이후 꾸준히 출원량이


높아지는 경향

142
142
유통/물류 빅데이터 구축 및 분석 시스템

 주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도

•Scott W. THOMAS •대기업 중심


실시간 데이터 수집 기술 ◕ •Huawei •한국전자통신연구원,삼성전자,
•한국전자통신연구원 에스케이텔레콤 등

•중소기업 중심
•WORLD AWARD ACADEMY
서비스 시각화 기술 ◓ •HCL Technologies
•(주)가이온, 주식회사 나라시스템

•ZTE Corporation •공공연구기관 중심


상품정보 빅데이터 구축
기술
● •ViXS Systems, Inc. •한국전자통신연구원,
•Savi Technology, Inc. 한글과컴퓨터, 등

•Tata Consultancy Services •대기업 중심


지능형 상품 관리 기술 ◓ •Gewei Ye •삼성전자, 한국전자통신연구원 등

•IBM
•대기업 중심
•FISHER-ROSEMOUNT
배송경로 최적화 분석 기술 ● SYSTEMS, INC.
•삼성전자. LG CNS,
한국전자통신연구원등
•Microsoft

•FISHER-ROSEMOUNT
•공공연구기관 중심
스마트 물류 관리 시스템 SYSTEMS, INC.
기술
● •IBM
•한국전자통신연구원,
국민대학교산학협력단 등
•Huawei Technologies

※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

143
143
전략품목 현황분석

 실시간 데이터 수집 기술 분야 주요 출원인 동향

▪ 실시간 데이터 수집 기술 분야는 Scott W. THOMAS 이 가장 많은 특허를 보유하고 있으며 그


다음으로는 Huawei, 한국전자통신연구원 순으로 일부 특허를 보유

 서비스 시각화 기술 분야 주요 출원인 동향

▪ 서비스 시각화 기술 분야는 출원량이 적으며 WORLD AWARD ACADEMY, HCL Technologies
등이 일부 특허를 보유

 상품정보 빅데이터 구축 기술 분야 주요 출원인 동향

▪ 상품정보 빅데이터 구축 기술 분야는 ZTE Corporation 이 가장 많은 특허를 보유하고 있으며 그


다음으로는 ViXS Systems, Inc., Savi Technology, Inc. 이 일부 특허를 보유

 지능형 상품 관리 기술 분야 주요 출원인 동향

▪ 지능형 상품 관리 기술 분야는 Tata Consultancy Services 와 Gewei Ye 등이 일부 특허를 보유

 배송경로 최적화 분석 기술 분야 주요 출원인 동향

▪ 배송경로 최적화 분석 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며 그 다음으로는


FISHER-ROSEMOUNT SYSTEMS, INC, Microsoft 등이 일부 특허를 보유

 스마트 물류 관리 시스템 기술 분야 주요 출원인 동향

▪ 스마트 물류 관리 시스템 분야는 미국의 FISHER-ROSEMOUNT SYSTEMS, INC.가 가장 많은


특허를 보유하고 있으며 그 다음으로는 IBM, Huawei Technologies 등이 일부 특허를 보유

144
144
유통/물류 빅데이터 구축 및 분석 시스템

◎ 국가별 특허활동지수(AI) 비교

 특허활동지수(Activity Index)는 상대적 집중도를 살펴보기 위한 지표로서, 그 값이 1보다 큰


경우에는 상대적 특허활동이 활발함을 나타냄

 한국은 배송경로 최적화 분석 기술 분야에서는 특허활동이 부진하나, 실시간 데이터 수집


기술 분야의 특허출원은 활발한 것으로 나타남

 미국은 서비스 시각화 기술 분야에 서는 특허활동이 부진하나, 배송경로 최적화 분석 기술


분야의 특허출원은 활발한 것으로 나타남

 일본은 실시간 데이터 수집 기술과 지능형 상품 관리 기술 분야에서는 특허활동이 부진하나,


스마트 물류 관리 시스템 기술 분야의 특허출원은 활발한 것으로 나타남

 유럽은 실시간 데이터 수집 기술과 서비스 시각화 기술 분야에서는 특허활동이 부진하나,


배송경로 최적화 분석 기술 분야의 특허출원은 활발한 것으로 나타남

145
145
전략품목 현황분석

◎ 질적 수준을 고려한 각국의 시장력 분석

 시장력이 전체 평균 1.4를 상회하는 국가로는 미국 외에 중국, 핀란드가 있으며, 질적인


수준이 높은 특허 보유국은 미국과 독일, 이스라엘이 높음

▪ 질적인 측면을 같이 고려한 시장력에 있어서 미국은 질적 수준도 높지만 시장성도 높은 국가 쪽으로 조사됨

▪ 독일은 시장력 면에선 유럽국가와 유사 혹은 다소 뒤지지만 질적 수준은 가장 높은 것으로 나타남

▪ 한국과 일본은 시장력 면에서 미국이나 이스라엘보다 다소 뒤지고 질적 수준도 가장 낮은 것으로 나타남

PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)

ETC 117 1.401709 1.347826

EU 39 1.076923 1.842105

JP 26 1.192308 0

KR 232 1.362069 0

US 289 1.49827 1.555556

전체평균 140.6 1.40 1.42

◎ 유통/물류 빅데이터 구축 및 분석 시스템 기술 분야의 주요 경쟁기술 및 공백기술

 유통/물류 빅데이터 구축 및 분석 시스템 기술 분야의 주요 경쟁기술은 상품정보 빅데이터


구축 기술, 배송경로 최적화 분석 기술, 스마트 물류 관리 시스템 기술이, 공백기술은 서비스
시각화 기술과 지능형 상품 관리 기술로 나타남

▪ 유통/물류 빅데이터 구축 및 분석 시스템 기술 분야에서 스마트 물류 관리 시스템 기술이 가장


경쟁이 치열한 분야이고, 서비스 시각화 기술과 지능형 상품 관리 기술 분야는 아직까지 출원이
활발하지 않은 공백기술 분야로 나타남

요소기술 기술 집중도

실시간 데이터 수집 기술 ◕
서비스 시각화 기술 ◓
상품정보 빅데이터 구축 기술 ●
지능형 상품 관리 기술 ◓
배송경로 최적화 분석 기술 ●
스마트 물류 관리 시스템 기술 ●

※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

146
146
유통/물류 빅데이터 구축 및 분석 시스템

◎ 최신 국내 특허기술 동향

요소기술 최근 핵심기술 동향
•빅데이터를 이용한 전자상거래 구매예측 통합솔루션 시스템 및
실시간 데이터 수집 기술
이를 이용한 응용 서비스 제공 기술

•IoT기반 빅데이터를 이용한 서비스를 시각화 시스템 및 이를


서비스 시각화 기술
이용한 응용 서비스 제공 기술

•빅데이터 및 이벤트를 기반으로 하는 상품 재고 관리 시스템 및


상품정보 빅데이터 구축 기술
이를 이용한 응용 서비스 제공 기술

•상품의 구성품목 선택 구매를 위한 전자상거래 시스템 및 이를


지능형 상품 관리 기술
이용한 응용 서비스 제공 기술

•빅데이터를 이용한 배송관리시스템 및 배송관리 기술 및 이를


배송경로 최적화 분석 기술
이용한 응용 서비스 제공 기술

•사물인터넷 기반 운송 로봇 및 운송 로봇의 동작 방법 기술 및
스마트 물류 관리 시스템 기술
이를 이용한 응용 서비스 제공 기술

 국내 특허동향을 살펴보면 대기업은 실시간 데이터 수집 기술, 배송경로 최적화 분석 기술,


스마트 물류 관리 시스템 기술을, 공공연구기관은 상품정보 빅데이터 구축 기술과 스마트
물류 관리 시스템 기술을 집중적으로 연구개발하고 있는 것으로 나타남

▪ 실시간 데이터 수집 기술 분야는 빅데이터 처리 기술, 데이터 명세서 기반 빅데이터 실시간 가공 및


유통 기술, 빅데이터를 이용한 전자상거래 구매예측 통합솔루션시스템 기술 등이 대기업을 중심으로
집중 연구개발

▪ 서비스 시각화 기술 분야는 인공 지능을 기반으로 한 컴퓨터 보안 기술, 운송 수단의 번호판 인식을
이용한 교통 정보 빅데이터 운용 기술 등이 중소기업을 중심으로 연구개발

▪ 상품정보 빅데이터 구축 기술 분야는 빅 데이터 및 이벤트를 기반으로 하는 상품 재고 관리 시스템


기술, 식별 가능 태그와 인공지능을 이용한 결제수단 시스템 기술 등이 공공연구기관을 중심으로
연구개발

▪ 지능형 상품 관리 기술 분야는 빅 데이터 및 이벤트를 기반으로 하는 상품 재고 관리 시스템 기술,


상품의 구성품목 선택 구매를 위한 전자상거래 시스템 기술 등이 대기업을 중심으로 연구개발

▪ 배송경로 최적화 분석 기술 분야는 빅데이터를 이용한 배송관리시스템 기술, 홈쇼핑 방송의


슈퍼배송 시스템 기술 등이 대기업을 중심으로 연구개발

▪ 스마트 물류 관리 시스템 기술 분야는 사물인터넷 기반 운송 로봇 기술, 3D 카메라와 빅데이터


플랫폼을 이용한 물류 적재 기술 등이 공공연구기관을 중심으로 연구개발

147
147
전략품목 현황분석

◎ 중소기업 특허전략 수립 방향 및 시사점

 유통/물류 빅데이터 구축 및 분석 시스템 기술 분야의 공백기술 분야는 서비스 시각화 기술과


지능형 상품 관리 기술이고 중소기업의 시장진입 상대적으로 수월한 분야는 서비스 시각화
기술로 나타남

▪ 빅데이터 산업은 기존의 데이터베이스 관리도구가 처리할 수 있는 역량을 넘어서는


정형·반정형·비정형 데이터세트(data set)의 집적물, 그리고 이로부터 경제적으로 필요한 가치를
추출 및 분석할 수 있는 기술로 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 폭발적으로
생성되는 웹 문서, 이메일, 소셜 데이터(소셜 네트워크 서비스 텍스트 데이터, 유튜브 비디오
데이터 등) 등을 활용하여 빅데이터 마케팅에 크게 이용할 수 있으므로 고객의 구매 정보를
분석하여 이에 맞는 상품마케팅 및 상품에 대한 물류와 유통 등의 산업에 활용되고 있으며, IoT
시대의 도래에 따라 산업적 활용도는 대폭 증가할 전망

▪ 향후 중소기업은 대기업들의 경쟁이 치열한 실시간 데이터 수집 기술, 배송경로 최적화 분석 기술,
스마트 물류 관리 시스템 기술 보다는 시장진입이 상대적으로 용이한 서비스 시각화 기술 분야에
집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한 상품정보 빅데이터 구축 기술과
스마트 물류 관리 시스템 기술 분야에서는 기술 매입이나 라이센싱 등을 통해 부족한
연구개발능력을 보완하는 것이 바람직할 것으로 사료됨

148
148
유통/물류 빅데이터 구축 및 분석 시스템

4. 연구개발 네트워크

가. 연구개발 기관/자원

(1) 연구개발 기관

 NIA(한국정보화진흥원)의 민·관 빅데이터 전문센터 네트워크

No 참여기관 관련부서(센터) 부문
1 신한은행 빅데이터센터
2 *신한카드 빅데이터 사업본부
3 코리아크레딧뷰로주식회사 빅데이터사업부
4 KB국민은행 데이터분석부
5 KB국민카드 데이터분석부
6 CJ올리브네트웍스 빅데이터센터
7 서울아산병원 헬스이노베이션 빅데이터센터
비즈 혁신(BBC)
8 KT 빅데이터사업지원단
Business Bigdata Center
9 SKT 데이터기술원
(16개)
10 LG유플러스 빅데이터센터
11 LG CNS AI빅데이터센터
12 CJ Hello DataScience팀
13 코스콤 빅데이터AI실
14 비투엔 BigData Excellence 센터
15 삼성SDS 데이터분석사업팀
16 TNMS 빅데이터센터
17 한국에너지공단 에너지데이터분석센터
18 한국교통안전공단 교통빅데이터센터 공공혁신(PBC)
19 국민연금공단 빅데이터부 Public
20 한국수자원공사 물정보종합센터 Bigdata Center
21 국회도서관 데이터융합분석과 (6개)
22 국토연구원 빅데이터본부
23 한국보건사회연구원 빅데이터 정보연구센터
24 전자부품연구원 인공지능 빅데이터센터
25 대구경북연구원 공간빅데이터센터
연구혁신(BSC)
26 한국교통연구원 교통빅데이터사업단
Bigdata
27 강원대학교 데이터분석센터 Science Center
28 세종대학교 인공지능-빅데이터연구센터 (9개)
29 호서대학교 지능형제조빅데이터센터
30 충북대학교 빅데이터연구소
31 안양대학교 공간빅데이터연구단
32 경기도 빅파이센터(경기컨텐츠진흥원)
33 경상북도 경북빅데이터센터(영남대) 지역 혁신(RBC)
34 전라북도 빅데이터활용센터 Regional Bigdata Center
35 제주특별자치도 ICT융합팀 (5개)
36 대구광역시 빅데이터센터(대구디지털산업진흥원)

149
149
전략품목 현황분석

 IoT 기반 물류 트래킹 시스템 분야 주요 연구개발 기관

▪ 서울대학교 기계공학과 Global Navigation Satellite System (GNSS) 연구실

- 위성항법, GPS 등 위성 송수신과 관련된 기술 연구 및 개발을 중심으로 연구를 수행하고 있고,


GPS 송수신과 관련된 기술을 중요 연구로 진행하고 있음

▪ 고려대학교 컴퓨터학과 무선데이터통신 연구실

- 자동차 네트워크와 관련된 연구를 중심으로 수행하는 곳으로 인터넷 기반의 커넥티드 카, 지능형
자동차 등의 연구를 진행하고 있음

▪ 항공우주연구원 SBAS 사업단

- 위성항법팀 등을 중심으로 GPS와 인공위성 등에 대한 연구 및 기술개발을 진행하고 있음


- 항공우주연구원의 설립목적은 정부, 민간, 법인, 단체 등과 연구개발협력 및 기술용역 수탁·위탁,
주요 임무 분야의 전문인력 양성

▪ 한국교통연구원 물류연구본부

- 한국교통연구원은 교통정책 연구, 개발하고 교통 정책 기술에 관련된 국내외 각종 정보를 수집,


조사, 분석하여 이를 널리 보급함으로써 교통분야 발전에 기여하기 위해 설립된 정부출연
연구기관으로 삶의 질 향상과 국가경쟁력 제고를 위하여 효율적이고 지속가능한 교통체계
추진정책을 제시하고, 나아가 교통관련 기초자료 구축 및 핵심기술 개발을 통해 교통산업 발전을
선도하기 위하여 설립

▪ 국토교통과학기술진흥위원회 교통물류실

- 국내 유일의 국토교통 R&D 전문기관으로 국토교통 R&D의 기획, 관리, 평가와 건설·교통신기술
인증업무를 수행하고 있으며, 국민생활과 밀접한 국토교통 R&D를 통해 국민 모두가 행복해지는
기술, 창조적 국토공간을 구현하는 기술을 만들어 나가고자 설립

▪ 한국물류산업정책연구원 ITS첨단교통 연구본부

- 글로벌 물류체계 구축과 물류기업의 경쟁력 제고, 선진물류체계 구축 및 녹색 성장물류 발전을 위한


법률 및 제도 개선과 U-SCM활성화와 글로벌물류시스템 구축 및 글로벌물류기업 육성 등을 위한
혁신을 선도하며, 국제물류 전문인재 양성을 통한 선진물류국가건설을 위하여 설립

▪ LG CNS / 삼성 SDS / 포스코 ICT

- SCM과 관련분야의 기업 컨설팅을 진행하고 있음. 또한 수리적 모델링을 바탕으로 TMS, WMS
등을 고객맞춤형으로 제작하고 공급하고 있음

▪ KT SAT

- 인공위성과 관련된 솔루션 및 플랫폼을 기업에게 공급하고 컨설팅하는 곳으로 해상 위성 통신


서비스를 공급받을 수 있음

150
150
유통/물류 빅데이터 구축 및 분석 시스템

(2) 연구개발 자원

 정부 지원 프로그램
▪ 축산차량 GPS 운영비 지원

- 축산관계 시설에 출입하는 차량에 대하여 GPS 단말기를 장착하여 악성가축전염병 발생 시 질병


확산 조기 진압하기 위해 지원하는 정책

▪ 국토교통부 산업·사회 혁신 프로젝트

- 국토교통부는 2020년까지 GPS 기술의 정확도를 높이기 위한 GPS 보정시스템(SBAS) 기술개발과


관련된 지원 정책을 추진할 예정
- 동시에 초연결 · 지능형 네트워크 조성에 대한 지원을 통해 IoT 기반의 서비스 공급의 증가를
유도할 예정

▪ 국토교통과학기술진흥원

- 정부에서 입찰하는 물류와 관련된 연구 및 기술개발 용역을 관리하는 공공기관. RFID, GPS 기반의
수송관련 연구 또는 시스템 개발과 관련된 공고문을 확인할 수 있음
- 국토교통과학기술 육성법에 근거하여 정부에서 물류 및 교통관련 신기술 개발과 관련된 연구를
공지하고, 연구지원 대상자 선발을 주관하고 있는 기관

▪ 한국교통연구원

- 새로운 수송수단에 대한 연구를 진행하는 곳으로 지능형 컨테이너, 배송시스템에 대한 연구가


중점으로 진행됨.
- 이에 따라 교통연구원에서 외부기관에 의뢰하는 배송정보와 관련된 용역 또는 정부지원 프로그램의
공고문을 확인할 수 있음

151
151
전략품목 현황분석

나. 연구개발 인력

 유통/물류 빅데이터 구축 및 분석 시스템 분야는 서울대학교, 고려대학교, 한국항우주연구원,


한국물류산업정책연구원에서 주로 연구개발을 진행하고 있음
[ 유통/물류 빅데이터 구축 및 분석 시스템 분야 주요 연구인력 현황 ]

기관 부서 대표번호
서울대학교 GNSS 연구실 02-888-2069
고려대학교 무선데이터통신 연구실 02-3290-3253
한국항공우주연구원 SBAS 사업단 042-870-3578
한국물류산업정책연구원 ITS첨단교통 연구본부 02-704-3736

다. 기술이전가능 기술

 유통/물류 빅데이터 구축 및 분석 시스템 분야의 요소기술 이전이 가능한 기관은 한국과학기술원,


한국전자통신연구원, 한국해양과학기술연구원이 있음
[ 유통/물류 빅데이터 구축 및 분석시스템 분야 요소기술 연구기관 및 인원 ]
요소기술 기관
GPS 정확도 개선기술 한국과학기술원

RFID의 수송수단 적용 기술 한국전자통신연구원

무선 인터넷 (WIFI) 기반의 내륙 수송수단과 관제소의 통신기술 한국해양과학기술원

해양과 내륙지역 통신기술 한국해양과학기술원

 유통/물류 관련 빅데이터 SW 관련 요소기술 이전 가능 기관에는 한국데이터진흥원,


한국정호보화진흥원 등이 있음
[ 유통/물류 관련 빅데이터 SW 요소기술 연구기관 ]

분류 요소기술 기관

빅데이터 정보 자율제어 기술 행정안전부


수집
데이터 수집 및 결합 스크립트 언어 및 실행기술 한국데이터진흥원

저장 가상머신 기반 메모리 확장 시스템 SW 한국정보화진흥원

입출력 성능 가속을 지원하는 분산 파일 시스템 SW 한국정보화진흥원

비정형 텍스트 데이터 컨텍스트 추출 및 랭킹 기술 한국정보화진흥원


분석/처리
모바일 사용성 분석 시스템 한국정보화진흥원

빅데이터 공유 활용을 위한 멀티테넌트 분석 프레임워크 기술 한국정보화진흥원

152
152
유통/물류 빅데이터 구축 및 분석 시스템

5. 기술개발로드맵

가. SWOT 분석

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•이미 개발된 기술 활용 시 글로벌 대기업과의 경쟁
•물류 구축 및 분석시스템의 기반이 되는 국내 빅데이터
불가피
기술의 빠른 발전
•개별 기술을 넘어 전체적인 기술의 연계를 통한 빅데이터
•GPS 등의 맵핑 기술에 강점 보유
활용의 어려움
•정부의 빅데이터 지원 정책의 확대
•유통,물류에 최적화된 빅데이터 활용 지원 정책의 부재

기회(Opportunity) 위협(Threat)
•빅데이터의 중요성 부각에 따른 정부차원의 지원 확대 •개인정보보호로 인한 빅데이터 활용 규제
•다양한 산업분야로의 시장 확대 •글로벌 기업의 국내 진출에 따른 국내 시장 잠식
•유통 및 물류량의 증가로 효율적인 프로세스를 찾는 가능성
업체의 증가 •유통, 물류 업체간의 원할한 소통 플랫폼의 부재

중소기업의 시장대응전략
➜ 글로벌 플랫폼에 제공하기 어려운 실시간 데이터 수집 및 연계기술의 개발
➜ 각 산업 분야에 적합한 다양한 데이터 분석 기술의 개발로 중소기업의 경쟁력 강화
➜ 플랫폼이 아닌 빅데이터를 활용한 서비스 개발과 유료 수익 모델 개발을 통한 수익 창출

나. 중소기업핵심요소기술

(1) 핵심요소기술 도출절차

 특허/논문 분석을 통한 요소기술과 기술수요와 각종 문헌을 기반으로 한 요소기술, 전문가


추천 요소기술을 종합하여 품목별 전문가를 통해 분류조정한 후, 전문가 평가과정을 거쳐
핵심요소기술을 선정
- 기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업 적합성(10)을 고려하여 평가

요소기술 요소기술 핵심요소기술 핵심요소기술


Pool 구성 분류 조정 선정평가 선정

- 특허/논문 분석 è - 품목별 전문가 è - 산학연 전문가 검토 è - 평가결과 반영


- 기술수요 및
요소기술 분류 - 평가항목별 요소기술 로드맵 기획 대상
문헌분석
조정·재정의 선정평가 핵심요소기술 도출
- 전문가 추천

153
153
전략품목 현황분석

(2) 요소기술

 산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처로드맵, 중소기업 기술수요를 바탕으로


로드맵 기획을 위하여 요소기술 도출

 요소기술을 대상으로 전문가를 통해 기술의 범위, 요소기술 간 중복성 등을 조정·검토하여


최종 요소기술 확정

[ 유통/물류 빅데이터 구축 및 분석시스템 분야 요소기술 도출 ]

요소기술 출처

실시간 데이터 수집 기술 특허/논문 분석, 전문가추천

대용량 트랜잭션 데이터 저장 기술 특허/논문 분석, 전문가추천

실시간 빅데이터 처리/분석 기술 특허/논문 분석, 전문가추천

네트워크 분석 기술 특허/논문 분석, 전문가추천

서비스 시각화 기술 특허/논문 분석, 전문가추천

상품정보 빅데이터 구축 기술 특허/논문 분석, 전문가추천

구매정보 빅데이터 구축 기술 특허/논문 분석, 전문가추천

배송정보 빅데이터 구축 기술 특허/논문 분석, 전문가추천

물류창고 빅데이터 구축 특허/논문 분석, 전문가추천

지능형 삼품 관리 기술 특허/논문 분석, 전문가추천

맞춤형 상품 추천 기술 특허/논문 분석, 전문가추천

배송경로 최적화 분석 기술 특허/논문 분석, 전문가추천

스마트 물류 관리 시스템 기술 특허/논문 분석, 전문가추천

154
154
유통/물류 빅데이터 구축 및 분석 시스템

(3) 핵심요소기술

 확정된 요소기술을 대상으로 산․학․연 전문가로 구성된 핵심요소기술 선정평가를 통하여


중소기업에 적합한 핵심요소기술 선정

[ 유통/물류 빅데이터 구축 및 분석 시스템 분야 핵심요소기술 ]

분류 핵심요소기술 설명

실시간 데이터 수집 끊임없이 입력되는 스트림 데이터를 적정 구간으로 나누어


저장하며, 스트림 데이터가 들어오는 대로 일련의 처리
기술 업무들을 수행하여 그 결과를 연속적으로 제공하는 기술

데이터 품질
고도화 및 표준화

통계 그래픽, 텍스트, 워드, 데이터 저장 클라우드기술을


서비스 시각화 기술 이용하여 빅데이터 처리 및 분석 결과를 시각화하는 서비스
기술

유통/물류 상품 정보 빅데이터 대.중소 유통 제조 업체가 공동 활용 가능한 상품정보 표준화


빅데이터 구축 구축 기술 및 빅데이터 구축 기술

빅데이터를 기반으로 상품의 재고 관리 및 반품 관리를 최적화


지능형 상품 관리 기술 하는 기술

유통/물류
배송경로 최적화 분석 빅데이터를 기반으로 배송순서, 도로정보, 위치 정보를
빅데이터 예측 바탕으로 배송경로를 최적화 하는 기술
기술
분석

스마트 물류 관리 빅데이터를 기반으로 물류센터수, 용량, 수송량 분석을 통해


시스템 기술 물류 거점을 최적화 하는 기술

155
155
전략품목 현황분석

다. 기술개발전략

(1) 우리의 현황

 국내 유통/물류 빅데이터 구축 및 분석 시스템 분야에서의 시장 규모는 226억 2,000만원


원이며 세계 시장은 296억 달러 규모인 것으로 파악

 국내 시장 성장률은 30.9%로 세계 시장 성장률인 38.4%보다 낮은 수치를 보임

 국내 중소기업의 유통/물류 빅데이터 구축 및 분석 시스템 분야 기술 수준은 세계 최고수준을


보유한 미국(100%)을 기준으로 51.8%, 5.52년의 기술격차를 보이는 것으로 조사됨

 특허 출원량은 232건으로 미국의 289건에 근접

 특허 피인용지수는 유럽이 1.8로 가장 높은 수치이며 국내는 0으로 분석됨

[ 유통/물류 빅데이터 구축 및 분석 시스템 전략 캔버스(Strategy Canvas) ]

* 기술수준은 응답자 평균치

156
156
유통/물류 빅데이터 구축 및 분석 시스템

(2) 기술개발로드맵

 많은 기업들이 투자를 하고 있는 분야로 유통/물류의 시장이 다변화됨에 따라 앞으로의 산업


확대가 기대되는 분야

 중소기업이 유통/물류 빅데이터 구축 및 분석 시스템을 구축하기 위해서는 기존에 공개된


플랫폼을 활용하여 관련 서비스를 개발하는 것이 가장 바람직한 접근방법일 것으로 사료됨

 기술 및 시장에서는 지능형 공급 체인 분석, 공급 예측 체인 분석의 개발이 요구되는 추세

157
157
전략품목 현황분석

※ 참고 : 핵심요소기술 평가결과

지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성

신원 및 접근 관리 기술 7.2 7.0 6.7 7.8 28.7 선정

데이터 손실 방지 기술 7.5 7.3 7.2 7.7 29.7 선정

웹 보안 기술 6.5 6.3 7.3 7.3 27.5

전자 메일 보안 기술 6.3 6.2 7.3 7.3 27.2

보안 평가 기술 6.7 6.2 7.5 6.8 27.2

침입 관리 기술 6.5 6.3 7.5 7.3 27.7

보안 정보 및 이벤트 관리
6.7 6.3 7.5 7.2 27.7
기술

암호화 기술 6.7 6.7 7.0 7.3 27.7

비즈니스 연속성 및 재해
7.0 7.0 7.5 6.8 28.3 선정
복구 기술

네트워크 보안 기술 7.0 6.7 7.0 7.2 27.8

취약점 스캐닝 기술 7.3 7.7 7.7 7.7 30.3 선정

연속적 모니터링 기술 7.3 7.2 7.3 8.0 29.8 선정

응용 프로그램 결합 보안
7.7 7.7 7.2 7.8 30.3 선정
기술
클라우드 서비스 접속 보안
8.2 8.2 7.2 7.5 31.0 선정
브로커 기술

158
158
전략품목 현황분석

빅데이터 분석 및
시각화 플랫폼

159
160
빅데이터 분석 및 시각화 플랫폼
정의 및 범위

▪ 빅데이터 분석 및 시각화 플랫폼은 통상적으로 사용하는 소프트웨어가 수용할 수 없는 크기의 데이터인


빅데이터로부터 가치를 추출하고 결과를 분석하는 기술과 데이터 분석 결과를 유의미한 정보로 표현하는 기술의
총체를 의미

▪ 데이터 시각화는 빅데이터를 분석하여 이용자가 필요로 하는 정보를 도출, 정보를 쉽게 이해할 수 있도록 텍스트
혹은 이미지 등, 내용 전달에 효과적인 시각적 형태를 활용

▪ 빅데이터 분석 및 시각화 플랫폼은 기계학습과 인공지능을 활용한 분석 영역을 확대하고 있으며 분석 결과 정보


전달 측면에서 계속 연구 및 개발되고 있음. 빅데이터 분석 및 시각화는 데이터 수집, 저장, 처리 단계와
직접적인 관련이 있으므로 상호 연관하여 연구 및 개발 필요성 증대

정부지원 정책

▪ 4차 산업 혁명 정책의 중심인 빅데이터 산업 활성화의 체계적 지원을 위해 ‘17년 제3차 ’민간 합동 빅데이터 TF
회의‘를 개최하여 ’21년까지 112개 분야 지능, 융합형 공공데이터 구축 및 개방을 확대하고, 창업 콜라보
프로젝트, 창업 경진대회 등을 통해 공공데이터 활용 기업을 육성하고 창업을 지원할 예정

▪ 범 정부 데이터 관리 체계를 구축하여 데이터 생애주기 전반의 표준화 및 품질관리로 기간 내외 데이터의


불일치 또는 중복 등의 문제를 해소할 전망

▪ 데이터 경제 활성화 목적으로 ‘19년까지 약 1조원을 빅데이터 산업 지원에 투자할 계획, 핵심 기술 및 전략적
투자에 7,300억원, 생태계 조성에 2,400억원을 투자할 것으로 알려짐

- 빅데이터 센터 100개소 구축을 통해 연구 센터와 청년인재 교육을 확대하여 약 5만 명의 빅데이터 전문


인력을 양성하고 데이터 사업 관련 강소기업 100개사 이상 육성 목표

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 세계적 ICT 강국으로 빅데이터 수집 환경 조성
•(환경) 기업들의 빅데이터에 대한 이해도가 상대적 부족
•(기술) 세계적으로 높은 초고속 대규모 복합 미디어 정보
•(기술) 우리나라 기술은 아직 선진국에서 개발한 핵심기술을
처리기술
도입하여 적용하는 수준으로 한계가 뚜렷
•(정책) 정부의 빅데이터 산업에 대한 집중적 지원과 인재
•(정책) 빅데이터를 수집할 수 있는 매체 개발 미비
양성 노력

기회(Opportunity) 위협(Threat)
•(환경) 스마트공장, 스마트시티 등 빅데이터 기반 신사업의
•(환경) 빅데이터 정보 보안에 대한 대책 미흡
등장
•(기술) 글로벌 리더 그룹들의 국내 시장 잠식
•(기술) 빅데이터 기반 기술 개발에 대한 관심 고조
•(정책) 정보 수집을 제한하는 있는 현재 국내 정책
•(정책) 정부의 공공데이터 공개의 활성화

중소기업의 시장대응전략
➜ IoT의 발전화 보편화에 따라 수집되는 비정형 데이터의 양은 폭발적으로 증가하여 비정형 데이터
분석의 중요도는 앞으로도 높아질 전망, 따라서 산업적으로 활용할 수 있도록 비정형 빅데이터를
분석하고 가공하는 기술 개발을 통해 시장 선점
➜ 글로벌 선두 그룹들의 실시간 데이터 처리, 배치 데이터 처리 등의 기술을 도입하여 세계시장에
뒤처지지 않도록 함과 동시에 세부적 시장에 최적화된 기술 개발
전략품목 현황분석

1. 개요

가. 정의 및 필요성

 빅데이터 분석 및 시각화 플랫폼은 통상적으로 사용하는 소프트웨어가 수용할 수 없는 크기의


데이터인 빅데이터로부터 가치를 추출하고 결과를 분석하는 기술과 데이터 분석 결과를
유의미한 정보로 표현하는 기술의 총체를 의미

 데이터 시각화는 빅데이터를 분석하여 이용자가 필요로 하는 정보를 도출, 정보를 쉽게 이해할
수 있도록 텍스트 혹은 이미지 등, 내용 전달에 효과적인 시각적 형태를 활용

 빅데이터 분석 및 시각화 플랫폼은 기계학습과 인공지능을 활용한 분석 영역을 확대하고 있으며


분석 결과 정보 전달 측면에서 계속 연구 및 개발되고 있음. 빅데이터 분석 및 시각화는 데이터
수집, 저장, 처리 단계와 직접적인 관련이 있으므로 상호 연관하여 연구 및 개발 필요성 증대

 지능정보사회는 빅데이터 분석 및 인공지능 기술과 같은 지능정보기술을 이용하여 사회 전반을


혁신적으로 변화시키는 사회

 지능화 관점에서 인공지능 기술을 적용하기 위한 수요는 증가하고 있으며 이의 기반이 되는


빅데이터 분석 기술은 지능정보사회에서 대표적인 기술로 부상

▪ 미국의 정보기술 연구 및 자문회사인 가트너는 지능(Intelligence) 분야, 디지털(Digital) 분야,


매시(Mesh) 분야를 2019년 전략 기술의 3대 핵심 주제로 선정

▪ 지능 분야의 개별적인 기술로 자율 사물(Autonomous Things), 증강 분석(Augmented Analytics),


인공지능 주도 개발(AI-Driven Development)을 선정

- 자율 사물은 로봇, 드론, 자율주행차 등과 같은 사물이며 인간이 수행하던 일을 인공지능을 이용하여


자동화하는 것
- 증강 분석은 특정 영역의 증강 지능에 초점을 맞추어 기계학습을 활용하여 분석 콘텐츠 개발, 소비,
공유의 혁신을 의미
- 인공지능 주도 개발은 전문 데이터 과학자와 앱 개발자가 협력하는 기존 방식이 아닌 전문 개발자들이
단독으로 개발 및 운영할 수 있도록 인공지능을 앱에 내장하기 위한 도구, 기술, 최적화된 프로세스에
관한 연구와 개발과정 자체에서 사용되는 인공지능 기반의 도구 개발 연구를 의미

 전통적인 데이터 분석은 데이터베이스에 질의하여 얻은 결과를 분석하는 비즈니스


인텔리전스(BI, Business Intelligence) 중심이었으나 최근 빅데이터 분석은 기계학습과
인공지능 기술을 이용한 예측 분석 영역으로 확장

 빅데이터 분석 및 시각화 플랫폼은 분석 영역 확대와 분석 결과 표현 측면에서 계속해서 연구


및 개발되어야 하는 분야로, 이전 단계인 데이터 수집, 저장, 처리와 직접적인 관련이 있으므로
상호 연관성을 고려하여 접근

162
162
빅데이터 분석 및 시각화 플랫폼

나. 범위

(1) 제품분류 관점

 빅데이터 솔루션 아키텍처는 데이터를 수집, 저장, 처리, 분석, 시각화와 같은 일련의 단계를
위한 각종 솔루션들의 논리적 구성

▪ 빅데이터 분석은 저장 및 처리된 데이터를 이용해 모델링 및 학습하는 단계이므로 이전 단계 기술인


분산 스토리지 기술, NoSQL 데이터베이스 기술, 배치 데이터 처리 기술, 실시간 데이터 처리
기술에 영향을 받음

* 출처: Microsoft

[ 빅데이터 아키텍처 ]

 분산 스토리지 기술은 대용량 파일을 다양한 형식으로 저장하는 기술로 분산 파일 시스템과


오브젝트 스토리지가 대표적인 솔루션

▪ 분산 파일 시스템은 여러 호스트가 참여하여 마치 단일 파일 시스템인 것처럼 파일 서비스를


제공하는 것으로 HDFS(Hadoop File System), GlusterFS 등의 솔루션이 포함

▪ 오브젝트 스토리지는 블록 스토리지인 파일 시스템과 달리 데이터를 오브젝트로 관리하여 엑사바이트


범위도 손쉽게 확장할 수 있도록 하는 것으로 Ceph, Lustre, AWS S3 등의 솔루션이 포함

 NoSQL 데이터베이스 기술은 관계형 데이터베이스와 달리 비정형, 반정형 데이터를 빠르게


분석하도록 데이터 형태에 따라 Columnar DB, Document DB, Key-Value DB, Graph DB
등으로 나뉘는 저장 기술

▪ 클라우드 환경에서 오픈소스 기반의 NoSQL 데이터베이스인 HBase, MongoDB 등을 대부분


사용했지만 최근 클라우드 솔루션의 확장으로 AWS Dynamo와 같이 클라우드 기업에서 직접
제공하는 솔루션의 사용이 증가

163
163
전략품목 현황분석

 배치 데이터 처리 기술은 대용량 데이터를 MapReduce와 같이 분산병렬 처리하여


상대적으로 장시간에 걸쳐 원하는 데이터를 추출하는 기술

▪ MapReduce는 대용량의 배열 및 행렬로 표현된 데이터를 통계 분석하거나 정형 데이터와 비정형


데이터 간 연계 분석, 기계학습에 활용

 실시간 데이터 처리 기술은 주어진 짧은 시간(보통 0.1초~1분) 내에 데이터 처리를 보장하는 기술

▪ 배치 데이터 처리와 실시간 데이터 처리를 분리하는 람다 아키텍처가 소개된 이후 계층별 적합한
솔루션이 제공

- 예를 들어, 실시간 데이터 처리로 Apache Spark, Apache Storm 등의 솔루션이 활용.

[ 람다 아키텍처 ]

 기계학습 기반 데이터 분석 기술은 기존 통계 기반 데이터 분석 기술과 달리 기계학습과


인공지능 기술을 이용해 예측 분석 등을 하는 기술
▪ 기계학습 기반 분석 알고리즘이 효과적으로 동작하기 위해서는 충분한 학습이 필요한데 학습할
데이터가 많아질 경우 학습 시간이 매우 길어지므로 병렬처리 기법을 이용해 처리 속도를 향상하는
RapidMiner 등과 같은 빅데이터 분석 플랫폼에 대한 개발이 활발

 데이터 시각화 기술은 유용한 데이터 분석 결과를 시각적으로 표현하는 기술로 기업용 보고
도구부터 시작해 최근 오픈 소스 이용 확대로 R, Python을 이용한 다양한 시각화 도구로 확장

164
164
빅데이터 분석 및 시각화 플랫폼

(2) 공급망 관점

 빅데이터 분석 및 시각화 서비스는 데이터 분석 플랫폼, 데이터과학 플랫폼, BI 플랫폼,


시각화, 기계학습, 컴퓨터비전 등 다양한 관점에서 공급

* (출처: https://learnbigdatatools.com

[ 빅데이터 분석 서비스 분야별 제공업체 ]

165
165
전략품목 현황분석

2. 외부환경 분석

가. 산업환경 분석

(1) 산업의 특징

 웹/모바일의 대중화/일상화로 기하급수적인 비정형데이터가 생성

▪ 주요 통신사는 CDR 분석, 네트워크 및 시스템 관리 등에 빅데이터 기술을 적용해 서비스 품질


강화에 활용하고 있으며 내부 빅데이터 적용 성과를 사업모델화해 클라우드 기반 빅데이터 분석
플랫폼을 제공하고 있으며, 공공 분야에 적용해 공익사업에 참여하는 추세

▪ 앞으로 몇 년간 3세대 플랫폼에 기반한 혁신과 가치 창조가 크게 증가할 것으로 전망되며 새로운
핵심 기술이 혁신 가속기로 작용하면서 이 단계를 견인할 것이고 그러면 전 산업에 걸쳐 3세대
플랫폼의 힘과 애플리케이션이 확대될 전망

 빅데이터/DB 시스템의 보급과 언어처리 기술의 발달로 다양한 기업에서 다양한 형태의
비정형데이터들이 정형화되어 기록

▪ 제조 분야에서 머신 데이터 분석을 통한 품질 관리에 투자를 확대하고 있으며, IoT와 연계한 센서


데이터의 활용 방안을 모색하는 등 아직 전사적이진 않지만 부분적으로 빅데이터 분석 기술을
활용하는 사례들이 꾸준히 증가하는 추세

▪ 대형 제조사를 중심으로 소셜 분석이나 텍스트 마이닝과 같은 빅데이터 분석 기술을 적용해


제품개발 및 고객 관계 강화에 활용하고 있으며, 제조 공정의 기계 설비, 장비들에서 나오는 머신
데이터 분석을 통해 제품 공급 관리나 품질 관리의 효율성을 제고

▪ 유통 분야는 오프라인, 온라인, 모바일, 콜센터 등 폭넓은 옴니 채널의 활용과 온오프라인을 넘나드는
고객과 소통 강화를 위해 빅데이터 분석에 투자를 확대하고 있는 추세

▪ 가트너는 불과 몇 년 전만 하더라도 분석을 위해 고객이나 직원의 데이터를 가능한 많이 수집하는


기업들이 많았으나, 앞으로는 기업이 추구하는 비즈니스 성과와 관련이 있는 부분에 초점이 맞춰질
것이며, 과거에는 확보하지 못했던 통찰력을 주는 데이터를 더욱 추구하게 될 것이라 예측

 많은 머신 데이터를 입수하고, 교통망, 분산형 발전 및 공급, 의료, 비재생 자원의 재사용,


산업자동화, 농업 등에 있어 복잡한 최적화 문제를 해결할 때 빅데이터의 잠재력이 실현될
것이며, 빅데이터는 머신 생성 데이터에 기반을 두고 있는 모든 경제 부문의 새로운 자동화,
파괴적인 혁신의 형태로 가시화 된 혜택을 가져올 전망

166
166
빅데이터 분석 및 시각화 플랫폼

(2) 산업의 구조

 빅데이터 관련 국내 산업의 구조는 데이터 솔루션, 데이터 구축 및 컨설팅, 데이터 서비스로 분류

[ 데이터산업 범위 ]

구분 범위

▪ DBMS, DBMS 관리, 데이터 모델링, 분석·시각화, 검색엔진, 품질 등 관련 솔루션


데이터 솔루션 제품으로 비즈니스를 영위하는 기업
▪ 라이선스, 유지보수, 커스터마이징(개발)에서 매출 발생

▪ 데이터를 활용해 정보제공, 데이터 거래, 분석 결과 정보 등을 온·오프라인(모바일, 앱


등 포함)으로 제공하면서 데이터 이용료/수수료 또는 광고료 등으로 비즈니스를
데이터 서비스
영위하거나, 마케팅을 목적으로 데이터를 수집 및 가공하여 판매하는 기업 (데이터
브로커)

▪ DB 설계, 데이터 이행 등을 포함한 DB 시스템 구축, 문서·음성·영상 등의 데이터를 DB로


데이터 구축 변환·정비하는 데이터 처리, 데이터 외부 제공을 위한 API, LOD 구축, DW Data Lake 등
데이터 구축 관련 비즈니스를 영하는 기업(데이터/DB 관련 SI·IT 아웃소싱 포함)

▪ 데이터 거버넌스, 품질, 데이터 설계 및 데이터 활용 등 데이터 관련 기획 및 컨설팅


데이터 컨설팅
비즈니스를 영위하는 기업

* 출처: 데이터 산업 현황 조사 보고서, 한국데이터진흥원, ‘17. 3월

 데이터 솔루션에는 데이터 수집, 데이터 설계, DBMS, 데이터 관리, 데이터 품질, 데이터
분석, 데이터 플랫폼이 포함됨. 이 중 데이터 분석 관련한 시장 규모는 전체 빅데이터
시장에서 약 8%를 차지
[ 2017년 데이터솔루션 시장 규모 비중 ]

* 출처: 데이터 산업 현황 조사 보고서, 한국데이터진흥원, 2017. 3월

167
167
전략품목 현황분석

 데이터 분석에는 정형 데이터 분석, 비정형 데이터 분석, 실시간 데이터 분석, 데이터 시각화 분석이 포함

[ 데이터 솔루션 정의 ]

분류 정의 관련 예시

▪ DBMS의 데이터를 사용자의 이용목적에 맞도록 간편하게 보고서를 생성


및 활용할 수 있도록 지원하는 솔루션 (데이터 리포팅)
Reporting 솔루션,
정형
▪ 미리 정의된 관점에 따라 사용자가 기준을 유연하게 변경하면서 데이터를 OLAP(Online Analytical
데이터
분석할 수 있도록 지원하는 솔루션 (OLAP) Processing),
분석
통계분석패키지
▪ 데이터 집합을 통계적으로 분석하여 의미 있는 인사이트를 찾아내는
과정을 지원하는 솔루션 등 (데이터마이닝)

▪ 웹사이트 데이터를 추출 및 분석하여 기술트렌드 및 기업 평판 등을


분석하기 위해 적용하는 솔루션 (웹크롤링)
▪ 주로 문서 및 웹사이트의 데이터에서 키워드를 찾아내고 빈도 및 웹크롤링(Web Crawling),
연관관계 등을 분석하는 솔루션 등 (텍스트마이닝) 텍스트 마이닝,
비정형 비디오데이터 가공 솔루션,
▪ 신문기사, 논문, 특허 등의 동향정보로부터 주요 개체 및 개체와 관련된
데이터 음성 데이터 가공 솔루션,
사실정보를 정형화된 형태로 추출하여 분석에 활용하는 솔루션 (정보추출)
분석 트위터, 페이스북 등의 API
▪ 음성 및 영상 등의 데이터로부터 의미 있는 데이터를 추출하여 분석하는 연계 솔루션(Social
솔루션 Analytics 솔루션)

▪ 소셜미디어 내의 인맥정보를 이용하여 사회관계망을 분석하고, 포스팅되는


내용을 통해 최신 이슈와 트렌드를 분석하는 솔루션

CEP(Complex Event
실시간
▪ 데이터 분석을 통해 위험 신호 또는 징후를 감지하여 위기나 재난에 Processing),
데이터
대처할 수 있도록 예측하는 솔루션 BAM(Business Activity
분석
Monitoring)

데이터 시각화 및 비주얼 분석


▪ 데이터 세트의 의미를 시각적으로 표현하거나 탐색하는 과정을 지원하는
시각화 솔루션(Visual Analytics
솔루션
분석 솔루션)

* 출처: 데이터 산업 현황 조사 보고서, 한국데이터진흥원, 2017. 3월

168
168
빅데이터 분석 및 시각화 플랫폼

나. 시장환경 분석

(1) 세계시장

 빅데이터 시장 내에서 비정형 데이터가 전체의 90% 이상을 차지, 사물인터넷, 웨어러블
디바이스의 이용 증가와 미디어 매체의 증가에 따라 하루 수집되는 빅데이터의 양은 약
1,000만건을 상회할 것으로 예측 (1년이면 약 40억 건 이상의 데이터 수집)

 빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 ’22년 900억
달러로 성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 53,400 59,040 65,450 72,890 81,380 90,006 10.6

*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 세계 시장은 2023년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)

▪ 빅데이터 선진개발국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,


민간 데이터 시장에서는 중개업이 활성화되어 있음

▪ 미국의 경우 2016년 기준 데이터 브로커 기업은 약 650억개로 150억불 규모의 시장을 형성

 IoT(사물인터넷)의 상용화로, 대용량 실시간 데이터를 빠르게 처리·분석할 수 있는 빅데이터


기술개발이 활발하게 이뤄지고 있음
▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 2020년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정

 빅데이터 세계 시장은 빅데이터, 인프라, 빅데이터 소프트웨어, 빅데이터 서비스 시장으로


세분화 할 수 있으며, 빅데이터 소프트웨어 및 서비스에 대한 전 세계 빅데이터 매출액은
2018년 420억 달러에서 2027년 1,030억 달러로 증가
▪ 시장 변화는 연간 약 10.48%의 성장률을 보일 것으로 예측되며, Wikibon은 전세계 빅데이터
시장이 2017년과 2027년에 각각 350억 달러에서, 1,030억 달러를 달성하여 연평균 11.4%의
성장률을 보일 것으로 추정

▪ 빅데이터 시장 중 인프라 시장의 점유율이 가장 높으며, 또한, 가장 높은 성장세를 보일 전망

▪ 빅데이터 분석 및 시각 플랫폼에 활용될 수 있는 인프라 시장의 경우, ’16년 136억 달러 규모에서


연평균 19.6% 성장하여 ’22년 439억 달러 시장 형성을 예측

169
169
전략품목 현황분석

[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ’16 ’17 ’18 ’19 ’20 ’21 ’22 CAGR(%)

인프라 13,600 17,700 21,700 26,000 30,700 36,200 43,900 19.60

소프트웨어 6,000 7,400 9,000 10,600 12,300 14,300 16,200 16.61

서비스 7,100 8,800 10,800 12,600 14,700 17,700 20,500 17.05

합계 26,700 33,900 41,500 49,200 57,700 68,200 80,600 18.26

*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용

 세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)

▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순

▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)

 Hadoop 및 빅데이터 시장, ‘22년 993억 달러로 성장하여 연평균 28.5% 성장

▪ ‘17년에는 171억 달러 수준에 그쳤으나, ’18년에는 243억 달러, ’19년에는 346억 달러로 크게
성장할 것으로 전망되며, 성장추세는 매년 지속적이거나 더 큰 성장세를 보일 것으로 예측

▪ ‘21년에서 ’22년, 1년 간 300억 달러로 가장 급격하게 성장 예측

[ Hadoop 및 빅데이터 시장 성장 추이 2017-2022 ]

120
99.3
100

백 80 69.8
만 60 49.1

달 34.6
40
24.3
러 17.1
20

0
2017 2018 2019 2020 2021 2022

*출처: Strategy MRC and reported by Statista, NIA 2018.6 재인용

170
170
빅데이터 분석 및 시각화 플랫폼

(2) 국내시장

 빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 ’20년
4,468억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망

[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 244.2 298.7 358.3 446.8 557.2 694.8 24.7%

*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 시장은 빅데이터 인프라(서버, 스토리지), 빅데이터 소프트웨어, 빅데이터 서비스로


나누어 집계
▪ 빅데이터 시장은 빅데이터 분석 및 시각화 플랫폼을 포함하는 인프라 시장이 55.9%로 가장 큰
부분을 차지하고 있으나, 소프트웨어(23.2%), 서비스(20.9%) 시장은 활성화되고 있지 못한
것으로 나타남

[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0

*출처: 2017년 빅데이터 시장현황 조사, 인사이트플러스

 국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억원로 연평균 7.6% 성장 예상 (데이터 산업 활성화 전략, 2018.6)

▪ ’17년 부문별 시장 규모 : 데이터구축/컨설팅(2조 9,291억원), 데이터 서비스(1조 7,146억원),


데이터솔루션(1조 6,536억원) 순

171
171
전략품목 현황분석

 기업의 빅데이터 대한 인식 호전과 중견·대기업의 투자 증가, 정부의 강력한 빅데이터 산업 육성의지에


따라 성장세를 보이고 있으며, 결과적으로 시장이 확대 (한국데이터진흥원, 데이터산업백서 2017)

▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출

▪ 국내 일반기업의 빅데이터 시스템 도입률은 ‘16년 기준 5.8%이나, 중견·대기업은 12.3%의


도입률을 보여 기업 규모별 편차가 존재하는 것으로 나타남

▪ 산업별로는 금융(14%), 공공(6.9%), 통신미디어(6.5%), 의료(6.3%), 유통·서비스(5.5%), 제조(4.2%)


순으로 나타나 데이터 활용의 중요성이 높은 산업에서의 빅데이터 도입이 상대적으로 적극적인 것으로 분석

 국내 빅데이터 시장은 포털사, 통신사, IT 업체 등이 자사 보유 데이터를 바탕으로 빅데이터


서비스 제공을 시작하는 단계

▪ 국내 ICT 산업은 경쟁력이 높고 데이터 생산량이 많아 빅데이터 산업의 성장 잠재력이 크지만


도입의 필요성 인지 부족 및 개인정보법 등 법적 리스크로 그동안 활용은 상대적으로 저조한 상황

 업계별 빅데이터 시스템 도입률 증가 추이


▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름

▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고, 분석할만한
데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차 기반 마련 예상

▪ 업종별로 보면 제조업, 물류, 유통, 금융, 의료 분야에서 특히 높은 성장 예상

172
172
빅데이터 분석 및 시각화 플랫폼

3. 기술 분석

가. 기술개발 이슈

 IoT 데이터 처리 및 분석 이슈

▪ 오늘날 IoT 환경에서 엄청난 양의 데이터가 생성되고 있으며 이를 분석하는 방법은 다양

- 첫 번째로 IoT 사이트에 독립형 클러스터를 배포하여 분석하는 것이나 이 방법은 자동차와 같이
공간 제약적인 환경에 적용할 수 없고 여러 자동차의 데이터를 함께 분석하는 데에는 한계
- 두 번째는 클라우드와 같은 중앙 클러스터에 데이터를 보내어 분석하는 것이나 이 방법은 네트워크
연결과 대역폭이 제약적인 환경에 적용할 수 없고 실시간 분석하는 데에는 한계

▪ 이를 해결하고자 데이터 소스와 가까운 곳에서 1차적으로 데이터를 처리 및 분석하고 부분


데이터만 중앙 클러스터로 보내어 2차적으로 데이터를 처리 및 분석하는 엣지 컴퓨팅 환경이 고려

▪ 엣지 컴퓨팅은 기존 클라우드 컴퓨팅과 달리 사물과 중앙 클라우드 사이에 에지 노드를 추가하여


IoT 데이터를 처리하는 구조

[ 클라우드 컴퓨팅과 엣지 컴퓨팅 비교 ]

▪ MapR Technologies社는 MapR Converged Data Platform을 경량화한 MapR Edge 제품을 출시

- MapR 제품의 큰 특징은 분산 스토리지와 NoSQL 데이터베이스를 자체 개발한 분산 파일


시스템(MapRFS) 상에서 구현하여 오픈 소스 기반의 하둡 제품보다 성능이 우수하고 여러
클러스터 간 데이터 통합이 용이
- 공간 제약성과 네트워크 제약성을 극복하기 위해 분산 스토리지 기술과 NoSQL 데이터베이스 기술
측면에서는 에지 클러스터와 클라우드 클러스터 간 데이터를 통합하여 관리하는 기술이 요구
▪ 엣지 컴퓨팅 환경에서 기계학습을 활용한 배치 처리 및 분석뿐만 아니라 스트림 데이터를 실시간
처리 및 분석하는 기술 개발과 응용이 요구됨. 그리고 분석 결과를 시각화하는 일련의 과정의
기술 개발이 요구

173
173
전략품목 현황분석

 플랫폼 기술 관련 산업의 주요 이슈는 SQL의 재등장, 데이터 가상화

▪ 최근 SQL 데이터베이스 기술인 구글(Google)의 스패터(Spanner) 클라우드 버전, 아마존(Amazon)의


아테나(Athena) 등이 출시

▪ 구글의 빅쿼리(BigQuery), 스파크(Spark) SQL 및 프레스토(Presto) 활용이 가장 활발

▪ 데이터 가상화의 급속한 발전으로 차세대 분석 업체들은 이에 맞추어 데이터 가상화 및 처리


서비스를 제공하고 있으며, 인포매티카(Informatica), 콜리브라(Collibra), 에이레이션(Alation)
등에서 안전하고 쉬운 데이터 접근 솔루션 제공

 데이터 분석 기술 관련 산업 내 자동화된 분석 도구의 이슈화

▪ 아마존(Amazon), 구글(Google), 마이크로소프트(Microsoft) 는 데이터 센터를 건립 등 데이터


수집 관련 분야에 ‘17년 약 315억 달러를 투자하여 빅데이터 저장 능력 고도화

▪ 빅데이터 기술 전문가 수요 공급 부족으로 기업에서 관련 인재를 영입하기 어려운 실정, 최근


자동화된 분석도구의 등장으로 인재 부족에 대처하여 빅데이터 분석 가능

◎ 기술개발트렌드

 Dataversity에 따르면 새로운 빅데이터 개념과 기술이 시장에 끊임없이 나타나면서 구형


기술은 사라지거나 새로운 방식으로 대체될 것이라고 하며 다음과 같은 2019년 빅데이터
트렌드를 발표
▪ 기계학습을 위한 IoT 스트리밍: 기계학습은 일반적으로 통제된 학습 환경에서 저장된 데이터를
사용하였으나 덜 통제된 학습 환경인 IoT 스트리밍 데이터를 실시간으로 학습하는 새로운 모델이 요구
▪ 사물은 인간과의 의사소통에 중점을 두면서 다양한 상황에서 유연하고 적절하게 대응함에 따라
스트리밍 데이터를 적용한 복잡하고 정교한 기계학습 알고리즘이 필요
▪ 스트리밍 분석은 데이터와 가까운 엣지에서 1차적으로 분석되고 2차적으로 클라우드 서버에
보내어 분석되는 엣지 컴퓨팅 환경에서 이루어질 것으로 예상

* 출처: https://becominghuman.ai

[ 예측 분석을 활용한 IoT 아키텍처 예제 ]

174
174
빅데이터 분석 및 시각화 플랫폼

 빅데이터를 처리하는 인공지능 플랫폼은 향후 비즈니스 인텔리전스에 많은 영향


▪ 인공지능 플랫폼은 기본 작업을 자동화하여 단순하지만, 시간 소모적인 활동을 줄이는 등 여러
가지 방법으로 비용을 절감
▪ 인공지능은 신뢰할 수 있는 조언자가 되어 작업이 더욱더 빨리 완료될 수 있도록 지원

* 출처: Microsoft Research

[ 프로그램 작성을 위한 기계학습 ]

 데이터 큐레이터는 데이터 보호, 데이터 거버넌스 및 데이터 품질, 메타데이터를 관리하며
해당 데이터로 작업하기 위한 모범 사례를 결정하고 대시보드, 도표 또는 슬라이드 쇼
형식의 시각적으로 표시되는 프레젠테이션을 담당

* 출처: Freitas A., Curry E. (2016) Big Data Curation. In: Cavanillas J., Curry
E., Wahlster W. (eds) New Horizons for a Data-Driven Economy.
Springer, Cham

[ 데이터 큐레이션 효과 ]

175
175
전략품목 현황분석

 하이브리드 클라우드는 프라이빗 클라우드와 퍼블릭 클라우드를 결합한 것으로 민감 데이터를


내부에 안전하게 유지하고 다른 데이터를 외부에 유지하는 방법을 제공하는 것으로
응용분야가 늘어날 것으로 예상

* 출처: https://www.wowrack.com

[ 하이브리드 클라우드 이용률 ]

 위의 트렌드에 따라 IoT, 기계학습, 인공지능, 데이터 큐레이터, 하이브리드 클라우드가 차기


빅데이터 분석 및 시각화 플랫폼에서 중요한 키워드가 될 것으로 예상

 분산 스토리지 기술, NoSQL 데이터베이스 기술, 배치 데이터 처리 기술은 하이브리드


클라우드 환경에서 IoT 데이터의 저장과 처리 관점에서 기술 보강 가능

 실시간 데이터 처리 기술과 기계학습 기반 데이터 분석 기술은 스트리밍 데이터를 복잡한


인공지능 알고리즘을 이용한 처리 및 분석 관점에서 기술이 보강될 것으로 보임

 데이터 시각화 기술은 데이터 큐레이터의 요구에 따라 프레젠테이션 기술이 보강될 전망

176
176
빅데이터 분석 및 시각화 플랫폼

나. 주요기업 동향

(1) 해외기업 동향

 구글(Google)은 빅데이터 처리 관련 주요 기술을 보유하고 있고, 클라우드 기반의 빅데이터


분석 서비스와 딥러닝 플랫폼 제공

▪ 빅데이터의 저장을 위한 분산 파일 시스템 GFS(Google File System), 빅데이터의 분산 처리를


위한 분산 프로그래밍 기술인 Map Reduce, 관계형 DB의 테이블 형태로 빅데이터를 저장하기
위한 BigTable 기술을 원천적으로 보유

▪ 구글은 그래프 알고리즘의 처리를 지원하기 위한 기술인 Pregel, 대용량 데이터를 분산 처리로
빠르게 분석할 수 있는 기술인 Dremel, 검색 인덱스를 작성하기 위한 기술인 Percolator 등의
빅데이터 관련 기술 및 도구들을 직접 개발하여 사용하고 있으며, 대용량 데이터의 실시간 처리
기술인 Dremel을 BigQuery로 상용화하여 서비스 제공

▪ 구글은 플랫폼 업체로서 오래 전부터 온라인, 오프라인 할 것 없이 수많은 데이터를 모으고 있는


중이며 인터넷 상의 웹 페이지 수집뿐만 아니라, 지메일, 캘린더 등의 무료 서비스를 통한 사용자
데이터와 스트리트뷰, 북스 라이브러리 프로젝트 등을 통해 오프라인 데이터, 구글 플러스 등을
통한 SNS의 데이터, 안드로이드 기기를 통한 디바이스의 데이터까지 모으고 있음. 즉, 사용자가
구글이 제공하는 서비스를 이용하기만 하면 구글의 클라우드에 데이터가 자동으로 쌓이는 구조이며
구글은 이렇게 모은 데이터를 각종 광고 사업에 활용해 수익 창출

▪ 구글이 공개 소스로 제공하는 딥러닝 플랫폼 TensorFlow도 딥러닝 관련 제반 도메인의 추론을


위한 기반 데이터를 구글의 클라우드로 수집하는 역할 수행

 클라우데라(Cloudera)는 Hadoop 플랫폼을 기반으로 머신 러닝 및 빅데이터 분석 기능을


클라우드 서비스로 제공

▪ CDH는 클라우데라가 제공하는 Hadoop의 오픈 소스 배포판이고, Cloudera Essentials는 Apache


Hadoop의 상용 지원 제품으로 구조화 데이터, 비구조 데이터를 모두 통합하여 처리하는 기능 제공

▪ Cloudera Data Science Workbench는 Apache Spark와 Apache Impala에 대한 안전한 온디맨드
원격 액세스를 통해 웹 브라우저에서 Python, R, Scala를 직접 사용할 수 있도록 하는 셀프 서비스

 스팟파이어(TIBCO Spotfire)는 시각화 도구 Spotfire, 자연어 검색 및 AI 기반 인사이트를


제공하는 Spotfire X, 다양한 데이터 소스에 대한 스트리밍 분석을 제공하는 Spotfire Data
Streams 등의 다양한 솔루션 제공

 TIBCO Spotfire는 다중 소스의 데이터에 대한 통합 분석과 시각화 지원

▪ 데이터 시각화를 위한 사용자 친화적인 인터페이스와 대화형 대시 보드 및 포인트-앤드-클릭 방식의


데이터 탐색 지원

▪ 스마트한 데이터 발견, 데이터 랭글링, 지리 공간 분석, 원 클릭 예측 분석을 통해 의사결정을


개선할 수 있도록 지원

177
177
전략품목 현황분석

 타블로 소프트웨어(Tableau Software)는 BI에 초점을 둔 대화식 시각화 도구 타블로(Tableau) 제공

 데이터 플래닛

▪ 개인 및 기업, 정부가 보유한 공공데이터를 라이브 에디터(Live Editor)를 활용해서 인터랙티브


시각화 라이브러리 서비스. 무료 차트 및 3D 입체 지도 제작의 데이터 시각화 서비스 제공

- 소셜이나 블로그, 웹사이트 등에 반영 가능

178
178
빅데이터 분석 및 시각화 플랫폼

(2) 국내업체동향

 KT 넥스알(KT NexR)은 하둡 기반의 빅데이터 분석 플랫폼인 NDAP을 주력 솔루션으로 제공


▪ NDAP(NexR Data Analytic Platform)은 글로벌 빅데이터 표준기술로 부상한 Hadoop의 주요 핵심
기능들을 표준화하여 엔터프라이즈 환경에 최적화된 성능, 신뢰성, 사용편의성을 제공

▪ 빅데이터 배치 처리 및 근-실시간 검색 플랫폼으로 빅데이터 분석을 위한 모든 작업 (수집/저정/분석/검색/관리


등) 및 실시간 데이터 질의를 처리 가능

▪ 실시간으로 발생하는 다양한 형태의 머신/휴먼데이터를 수집하여 데이터에 기반한 신속한 비즈니스
의사 결정을 지원하는 Lean Stream 솔루션을 제공

[NDAP 중심의 빅데이터 플랫폼 개념도]


 솔트룩스는 비정형 빅데이터 분석 및 시맨틱 기술 전문기업으로, 비정형 빅데이터 분석
플랫폼(truestory), 클라우드 기반 시맨틱 검색 플랫폼(IN2), 시맨틱 기반 빅데이터 추론
플랫폼(STORM), 빅데이터 분석 서비스 플랫폼(O2)을 서비스 중
▪ 비정형 빅데이터 분석 플랫폼인 트루스토리(truestory)는 클라우드 컴퓨팅과 인공지능 기술이 결합된
정형/비정형의 빅데이터 분석을 수행하며 솔트룩스 고유의 시맨틱 기술이 적용된 워크플로우 기반의
심층 분석 가능

▪ 소셜 빅데이터 분석뿐 아니라 기업 빅데이터 분석, 통신 및 금융 빅데이터 분석 등 다양한 도메인에 활용 가능

 엑셈은 머신러닝 자동화(AutoML) 솔루션 기업이 데이터로봇(DataRobot), 빅데이터 분석


솔루션 기업인 나임(KNIME)과 파트너 계약을 체결하여, 데이터에서 최적의 알고리즘 조합을
찾아내 결과를 예측함과 동시에, 분석된 데이터 시각화까지 제공하는 서비스인
‘아울아이(Owleye)’ 사이트를 오픈할 예정 (‘19)

▪ 다양한 고객사들을 대상으로 데이터 분석에 대한 전문적 지식을 공유할 예정

▪ 경쟁력있는 글로벌 솔루션 기업인 나임과 데이터로봇과 파트너십을 맺음으로써, 고객사에 더욱


차별화되고 발전된 데이터 분석 서비스 제공 목적

179
179
전략품목 현황분석

 효성인포메이션시스템은 100%GUI 기반의 간편한 환경의 데이터 수집 및 통합부터 머신러닝


모델 구축, 모델기반 고급분석, 모델 업그레이드, 시각화 및 리포팅을 모두 제공하는 히타치
밴타라의 원스톱 빅데이터 플랫폼인 ‘펜타호’을 개발

▪ ‘19년 네이버 비즈니스 플랫폼(NBP)의 네이버 클라우드 플랫폼 마켓플레이스에 등록되어 더 많은


기업들이 기업 내 산재되어 있는 데이터 소스로부터 데이터를 추출하고 빅데이터 기반 분석 수행에
도움이 될 전망

 기타 국내 중소기업 사례
▪ ㈜빅오이는 빅데이터, IoT, 제조, 빅데이터 컨설팅 및 서비스를 주된 사업에 주력하는 업체로 다양한
IoT 솔루션과 토털 RFID 시스템 제공. 스포츠 빅데이터 의사결정시스템 'Big SASS' 개발하여
세계적인 기업으로 성장. 산업 전 분야에 빅데이터 부문의 사업확장. 항만터미널 내 차량을
제어하는 차량 제어 서버, 시스템 및 방법 특허 출원

▪ (주)에스씨플랫폼은 빅데이터 솔루션업체 에스씨플랫폼은 과학기술정보통신부 정보통신연구기반


구축사업 지원을 받아 중소기업 경영정보 빅데이터 시스템을 개발, 에스씨플랫폼은 현재 데이터
분석이 필요한 업체에 선행적 서비스를 제공, 기업과 공공기관을 위한 신규 분석 서비스를 출시,
사업 영역을 확장할 계획

▪ 투그램시스템즈는 검색엔진, 워크플로우, 대용량 데이터 분석 및 처리, 최적화, 통계 등에 대한


기술적 노하우를 보유한 업체로 빅데이터 기반의 선박엔진고장예측시스템 개발하여 현재, 대기업
H사 선박 2대에 시범 적용하고 있으며 내년에는 적용 선박을 확대해 나갈 예정

▪ (주)그루터는 오픈소스 빅데이터 분석엔진 개발업체로 '아파치 타조'에 관한 한 국제적인 명성을


얻을 정도로 중요한 공헌자로 평가받고 있으며, AWS의 빅데이터 분석 플랫폼 서비스인 EMR에서
동작하는 타조와, 자체 클라우드 분석 플랫폼 서비스인 TaaS(Tajo as a Service)를 선보임

▪ (주)사이람은 네트워크와 관련된 최첨단 지식과 기술을 체화하고 있느 기업으로서 네트워크 모델링,
분석, 시각화와 관련된 전문지식과 솔루션을 개발 및 보유한 업체. 최근. 조직 분석, 인터넷
커뮤니티 분석, 전염병 확산경로 분석, 게놈 연구, 범죄 수사 등의 분야에 활발하게 응용되면서 최근
전 세계적인 주목

▪ (주)다음소프트는 자연어 처리와 인공지능, 지식기술 및 최첨단 IT기술을 활용하여 CRM및 기타


솔루션 분야에서 최고의 성능과 이식성을 갖춘 제품 개발. Aritificial Virtual REPRESENTATIVE
Solution, Web Integratin Solution, Dynamic Homepage, Data Mining Tool 등 계속해서
새로운 제품을 출시할 예정

180
180
빅데이터 분석 및 시각화 플랫폼

다. 특허동향

◎ 빅데이터 분석 및 시각화 플랫폼 기술 분야 특허상 주요 기술

 주요 기술
▪ 분산 스토리지 기술, NoSQL 데이터베이스 기술, 배치 데이터 처리 기술, 실시간 데이터 처리 기술,
머신 러닝 기반 데이터 분석 기술, 데이터 시각화 기술 등이 포함

요소기술 코드 설명

분산 스토리지 기술 A 대용량 파일을 저장하기 위한 분산 파일 시스템 기술

문서, 그래프, 키 값, 인 메모리, 검색 등과 같은 데이터


NoSQL 데이터베이스 기술 B 모델을 지원하는 빅 데이터 처리를 위한 비관계형
데이터베이스 관리 시스템(NoSQL) 기술

배치 데이터 처리 기술 C 대용량 비정형 데이터를 정형화하기 위한 배치 처리 기술

실시간 데이터 처리 기술 D 고성능인 메모리를 이용한 실시간 데이터 처리 기술

머신 러닝 기반 데이터 분석 기술 E 추천, 분류, 군집 등과 같은 머신러닝 기반 분석 기술

데이터 분석 결과를 시각화하여 유의미한 정보를


데이터 시각화 기술 F
표현하는 기술

181
181
전략품목 현황분석

◎ 세부 분야별 특허동향

 주요 기술별 출원인 국가별 특허동향

▪ 빅데이터 분석 및 시각화 플랫폼 기술의 요소기술별 주요 출원인 국적별 특허정보 데이터


입수하였으며, 최근 10년간의 특허데이터를 비교 분석

요소기술 한국 미국 일본 유럽 ETC 계

분산 스토리지 기술 45 6 1 2 2 54

NoSQL 데이터베이스 기술 16 3 0 0 5 19

배치 데이터 처리 기술 31 14 0 3 11 48

실시간 데이터 처리 기술 45 18 0 4 15 67

머신 러닝 기반 데이터 분석 기술 96 83 9 15 46 203

데이터 시각화 기술 76 15 3 0 10 94

합계 309 139 13 24 89 485

▪ 요소기술별 출원인 국적별 특허동향에서 한국국적의 출원인이 가장 활발한 연구개발을 하고 있으며,


그 다음으로는 미국, 유럽, 일본국적의 출원인 순으로 나타남

▪ 분산 스토리지 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고 있으며, 그 다음으로는


미국, 유럽, 일본국적의 출원인 순으로 특허 많이 출원

▪ NoSQL 데이터베이스 기술 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고 있으며,


유럽 및 일본국적의 출원인이 상대적으로 적은 출원량을 보유

▪ 배치 데이터 처리 기술 및 실시간 데이터 처리 기술 분야에서는 한국국적의 출원인이 가장 많은


비중을 차지하고 있으며, 일본국적의 출원인이 상대적으로 적은 출원량을 보유

▪ 머신 러닝 기반 데이터 분석 기술 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고


있으며, 그 다음으로는 미국, 유럽, 일본국적의 출원인 순으로 특허 많이 출원

▪ 데이터 시각화 기술 분야에서는 한국국적의 출원인이 가장 많은 비중을 차지하고 있으며,


유럽국적의 출원인이 상대적으로 적은 출원량 보유

182
182
빅데이터 분석 및 시각화 플랫폼

▪ 관점을 국내·외 출원인으로 바꾸어 보면 한국국적의 출원인은 외국국적의 출원인에 비해 분산


스토리지 기술(A)과 실시간 데이터 처리 기술(D), 데이터 시각화 기술(F) 분야의 출원 비중이
상대적으로 높게 나타남

▪ 반면, 한국국적의 출원인은 외국국적의 출원인에 비해 배치 데이터 처리 기술(C)와 머신 러닝 기반


데이터 분석 기술(E) 분야에 상대적으로 특허 출원 비중이 상대적으로 낮은 것으로 나타남

▪ 한국국적 출원인의 특허 출원량은 2010년 초반부터 급격히 출원량이 높아지는 경향을 보이고
있으며 머신 러닝 기반 데이터 분석 기술 분야는 2014년부터 출원량이 급격히 증가

* 2017~2018년은 미공개 출원이 존재하여 출원 수가 적게 보이는 구간으로, 시계열 동향을 파악할


때 이 점을 유의해야 함

▪ 외국국적 출원인의 특허 출원량은 비교적 조금씩 증가하는 것으로 보여지며, 머신 러닝 기반 데이터


분석 기술 분야는 한국국적 출원인과 유사하게 2000년 중반 이후 급격히 출원량이 높아지는
경향을 나타냄

183
183
전략품목 현황분석

 주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도

•HCL Technologies •공공연구기관 중심


Limited •한국전자통신연구원,
분산 스토리지 기술 ● •FISHER ROSEMOUNT 가톨릭관동대학교산학협력단,
SYST INC 등

•공공연구기관 중심
•Oracle
NoSQL 데이터베이스 기술 ◓ •ZTE Corporation
•한국과학기술정보연구원,
성균관대학교산학협력단 등

•Qualcomm •공공연구기관 중심
배치 데이터 처리 기술 ● •FISHER ROSEMOUNT •한국전자통신연구원,
SYST INC 전자부품연구원, 케이티 등

•WORLD AWARD •공공연구기관 중심


실시간 데이터 처리 기술 ● ACADEMY •성균관대학교산학협력단,
•Alert Enterprise, Inc. ㈜가이온 등

•IBM •공공연구기관 중심
머신 러닝 기반 데이터 분석
기술
● •Intel •한국전자통신연구원,한국과학
•Aerion Corporation 기술원 등

•WORLD AWARD
ACADEMY •공공연구기관 중심
데이터 시각화 기술 ◕ •FISHER ROSEMOUNT •가톨릭관동대학교산학협력단,
SYST INC 국민대학교산학협력단 등
•AT&T

※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

184
184
빅데이터 분석 및 시각화 플랫폼

 분산 스토리지 기술 분야 주요 출원인 동향

▪ 분산 스토리지 기술 분야는 HCL Technologies Limited 이 가장 많은 특허를 보유하고 있으며, 그


다음으로는 FISHER ROSEMOUNT SYST INC 등이 일부 특허 보유

 NoSQL 데이터베이스 기술 분야 주요 출원인 동향

▪ NoSQL 데이터베이스 기술 분야는 Oracle과 ZTE Corporation 등이 일부 특허 출원

 배치 데이터 처리 기술 분야 주요 출원인 동향

▪ 배치 데이터 처리 기술 분야는 Qualcomm , FISHER ROSEMOUNT SYST INC 등이 일부 특허 보유

 실시간 데이터 처리 기술 분야 주요 출원인 동향

▪ 실시간 데이터 처리 기술 분야는 WORLD AWARD ACADEMY, Alert Enterprise, Inc. 등이


동일하게 특허 보유

 머신 러닝 기반 데이터 분석 기술 분야 주요 출원인 동향

▪ 머신 러닝 기반 데이터 분석 기술 분야는 IBM 이 가장 많은 특허를 보유하고 있으며, 그


다음으로는 Intel, Aerion Corporation 등이 일부 특허 출원

 데이터 시각화 기술 분야 주요 출원인 동향

▪ 데이터 시각화 기술 분야는 WORLD AWARD ACADEM 이 가장 많은 특허를 보유하고 있으며, 그


다음으로는 FISHER ROSEMOUNT SYST INC, AT&T 등이 일부 특허 출원

185
185
전략품목 현황분석

◎ 국가별 특허활동지수(AI) 비교

 특허활동지수(Activity Index)는 상대적 집중도를 살펴보기 위한 지표로서, 그 값이 1보다 큰


경우에는 상대적 특허활동이 활발함을 나타냄

 한국은 머신 러닝 기반 데이터 분석 기술 분야에서 특허활동이 부진하나, 분산 스토리지


기술과 데이터 시각화 기술 분야의 특허출원은 활발한 것으로 나타남

 미국은 분산 스토리지 기술과 NoSQL 데이터베이스 기술 분야에서는 특허활동이 부진하나,


머신 러닝 기반 데이터 분석 기술 분야의 특허출원은 활발한 것으로 나타남

 일본은 NoSQL 데이터베이스 기술과 배치 데이터 처리 기술, 실시간 데이터 처리 기술


분야에서는 특허활동이 부진하나, 머신 러닝 기반 데이터 분석 기술 분야의 특허출원은
활발한 것으로 나타남

 유럽은 NoSQL 데이터베이스 기술와 데이터 시각화 기술 분야에서는 특허활동이 부진하나,


머신 러닝 기반 데이터 분석 기술 분야의 특허출원은 활발한 것으로 나타남

186
186
빅데이터 분석 및 시각화 플랫폼

◎ 질적 수준을 고려한 각국의 시장력 분석

 시장력이 전체 평균 1.29를 상회하는 국가로는 미국 외에 중국, 독일이 있으며, 질적인


수준이 높은 특허 보유국은 미국

▪ 질적인 측면을 같이 고려한 시장력에 있어서 유럽(독일, 프랑스)은 질적 수준은 높지만 시장성은
낮은 국가 쪽으로 조사

▪ 한국과 일본은 시장력 면에선 유럽국가와 유사 혹은 다소 뒤지며 질적 수준도 가장 낮은 것으로


나타남

▪ 미국은 시장력도 다른 국가에 비해 높으며 질적 수준도 큰 국가에 속하는 것으로 조사됨

▪ 기타 국가 중 중국과 이스라엘은 시장력은 높게 나타나나 질적 수준도는 가장 낮은 것으로 나타남

PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)

ETC 89 1.58427 0.894737

EU 24 1.833333 0.571429

JP 13 1.307692 0

KR 309 1.190939 0

US 139 1.964029 1.711111

전체평균 114.8 1.29 1.47

◎ 빅데이터 분석 및 시각화 플랫폼 기술분야의 주요 경쟁기술 및 공백기술

 빅데이터 분석 및 시각화 플랫폼 기술 분야의 주요 경쟁기술은 분산 스토리지 기술, 배치


데이터 처리 기술, 실시간 데이터 처리 기술, 머신 러닝 기반 데이터 분석 기술 분야이며,
공백기술은 NoSQL 데이터베이스 기술로 나타남

▪ 빅데이터 분석 및 시각화 플랫폼 기술 분야에서 머신 러닝 기반 데이터 분석 기술이 가장 경쟁이 치열한


분야이고, NoSQL 데이터베이스 기술 분야는 아직까지 출원이 활발하지 않은 공백기술 분야로 분석

요소기술 기술 집중도
분산 스토리지 기술 ●
NoSQL 데이터베이스 기술 ◓
배치 데이터 처리 기술 ●
실시간 데이터 처리 기술 ●
머신 러닝 기반 데이터 분석 기술 ●
데이터 시각화 기술 ◕
※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만

187
187
전략품목 현황분석

◎ 최신 국내 특허기술 동향

요소기술 최근 핵심기술 동향

•빅데이터의 저장 기술과 실시간 분석을 위한 스마트 스토리지


분산 스토리지 기술
플랫폼 기술 및 이를 이용한 응용 서비스 제공 기술

•비관계형 다종 빅데이터 수집 장치 및 이를 이용한 응용 서비스


NoSQL 데이터베이스 기술
제공 기술

•비정형 데이터의 빅데이터 처리 분산 시스템 및 이를 이용한


배치 데이터 처리 기술
응용 서비스 제공 기술

•대용량 빅데이터의 실시간 분석을 위한 스마트 스토리지 플랫폼


실시간 데이터 처리 기술
기술 및 이를 이용한 응용 서비스 제공 기술

•빅데이터 및 인공지능 학습 기반의 스크린도어 관리시스템과


머신 러닝 기반 데이터 분석 기술 이미지 캡처를 이용한 통합 모니터링 시스템 및 이를 이용한
응용 서비스 제공 기술

•빅데이터 스트림 모델링 시스템 기술과 빅데이터 시각화 시스템


데이터 시각화 기술
및 이를 이용한 응용 서비스 제공 기술

 국내 특허동향을 살펴보면 대기업은 데이터 시각화 기술을, 공공연구기관은 배치 데이터 처리


기술과 실시간 데이터 처리 기술을 집중적으로 연구개발하고 있는 것으로 나타남

▪ 분산 스토리지 기술 분야는 빅데이터의 저장기술, 실시간 분석을 위한 스마트 스토리지 플랫폼 기술,
빅데이터 처리 장치 및 이를 저장하는 기록매체 기술 등이 공공연구기관을 중심으로 집중 연구개발

▪ NoSQL 데이터베이스 기술 분야는 비관계형 다종 빅데이터 수집 장치 및 방법 기술, 사용자 중심의


헬스케어 빅데이터 서비스 방법을 수행하는 컴퓨터프로그램 및 시스템 기술 등이 공공연구기관을
중심으로 집중 연구개발

▪ 배치 데이터 처리 기술 분야는 빅데이터 처리 시스템 및 처리 방법 기술, 효율적인 저장 및 실시간


분석형 스마트 스토리지 플랫폼 기술, 시각화 방법 및 프로그램을 저장한 저장매체 기술, 빅데이터
기반 컴퓨터로 읽을 수 있는 기록 매체 기술 등이 공공연구기관을 중심으로 연구개발

▪ 실시간 데이터 처리 기술 분야는 통신거래정보 기반의 실시간 신용평가정보 제공 서비스 시스템


기술, 대용량 데이터 분석을 위한 R의 연계방법, 빅데이터의 실시간 분석을 위한 스마트 스토리지
플랫폼기술, 컴포넌트 기반 모바일 헬스 애플리케이션 제공 시스템 기술 등이 공공연구기관을
중심으로 연구개발

▪ 머신 러닝 기반 데이터 분석 기술 분야는 빅데이터 및 인공지능 학습 기반의 스크린도어 관리시스템


기술, 지능형 보안로그 분석 기술, 이미지 캡처를 이용한 통합 모니터링 시스템 기술 등이
공공연구기관을 중심으로 연구개발

▪ 데이터 시각화 기술 분야 빅데이터 스트림 모델링 시스템 기술, 스마트 빅데이터 기반 조기보안
관제 시스템 기술, 빅데이터 시각화 시스템 및 방법 기술 등이 공공연구기관을 중심으로 연구개발

188
188
빅데이터 분석 및 시각화 플랫폼

◎ 중소기업 특허전략 수립 방향 및 시사점

 빅데이터 분석 및 시각화 플랫폼 기술 분야의 공백기술 분야는 NoSQL 데이터베이스


기술이고 중소기업의 시장진입 상대적으로 수월한 분야는 NoSQL 데이터베이스 기술로 분석

▪ 빅데이터 분석 및 시각화 산업은 단순히 데이터베이스에 잘 정리된 정형 데이터뿐 아니라 인터넷,


소셜 네트워크 서비스, 모바일 환경에서 폭발적으로 생성되는 웹 문서, 이메일, 소셜 데이터(소셜
네트워크 서비스 텍스트 데이터, 유튜브 비디오 데이터 등) 등 비정형 빅데이터를 효과적으로
분석하는 것이 무엇보다 중요해지고 이러한 빅데이터 분석이 대부분 산업에 활용되고 있으며, IoT
시대의 도래에 따라 산업적 활용도는 대폭 증가할 전망

▪ 향후 중소기업은 대기업들의 경쟁이 없으며 공공연구기관에서 아직 활발히 연구되지 않는 기술


분야를 중심으로 출원량이 적어 시장진입이 상대적으로 용이한 NoSQL 데이터베이스 기술 분야에
집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한 배치 데이터 처리 기술과 실시간
데이터 처리 기술 분야에서는 기술 매입이나 라이센싱 등을 통해 부족한 연구개발능력을 보완하는
것이 바람직할 것으로 사료됨

189
189
전략품목 현황분석

4. 연구개발 네트워크

가. 연구개발 기관/자원

(1) 연구개발 기관

 빅데이터 분석 및 시각화 플랫폼 관련 분야 주요 연구개발 기관

▪ 행정안전부 공공데이터 포털

- 공공기관이 생성 또는 취득하여 관리하고 있는 공공데이터를 한 곳에서 제공하는 통합 창구


- 국민이 쉽고 편리하게 공공데이터를 이용할 수 있도록 파일데이터, 오픈API, 시각화 등 다양한
방식으로 제공하고 있으며, 누구라도 쉽고 편리한 검색을 통해 원하는 공공데이터를 빠르고
정확하게 검색 가능

▪ 한국빅데이터학회

- 빅데이터 네트워크 구축, 빅데이터 분석을 위한 기술 및 정보 교류, 빅데이터 분석 서비스 및 인증,


빅데이터 분석가 양성 교육, 학회지/논문지 발간, 학술행사 및 전시회 개최, 국제적 학술 교류 및
기술협력 등을 위해 설립된 사단법인 학회

▪ K-ICT 빅데이터센터

- 벤처·스타트업의 빅데이터 솔루션 및 응용서비스 개발 등 창업·사업화 지원


- 데이터소재 정보 확인, 사용가능 여부, 저작권 범위 및 권리관계, 데이터 융합에 따른 권리 귀속,
저작권 부당활용 및 손해배상 문제 등 중소기업 활용 확산
- 실무중심의 빅데이터 전문인력 양성을 위한 빅데이터 교육 콘텐츠 개발, 교육실습 플랫폼 및 강사 지원
- 데이터 허브 구축·운영 강화 및 빅데이터 유통 활성화, 시장창출 선도사업 추진 등 활성화 여건 조성

▪ 서울대학교 빅데이터 연구원

- 고성능 빅데이터 처리기술 개발 및 응용과 융합적 빅데이터 전문인력 양성을 위해 서울대학교에


설립된 연구소
- LG전자, 신한카드, KCB, BC카드, SK텔레콤 등 여러 기업 교육부, 과학기술정보통신부, 행정자치부
등 정부 및 공공기관과 협력을 맺고 교류

▪ 다음소프트

- 인공지능 대화기술과 자연어 처리 기술을 보유하고 있으며, 이를 기반으로 데이터 수집, 정보검색,
텍스트 마이닝, e-비즈니스, 소셜분석 등의 솔루션과 서비스를 제공하고 있음
- KB국민카드의 소셜미디어 수집/분석, SBS 통합리스닝 플랫폼, 국민건강보험공단 국민건강알람서비스,
KT 고객 니즈 관리 시스템 등을 개발하여 서비스 중

190
190
빅데이터 분석 및 시각화 플랫폼

(2) 연구개발 자원

 빅데이터 분석 및 시각화 플랫폼 관련 분야 지원 프로그램


▪ 민관 합동 빅데이터 TF

- 빅데이터 업무 추진현황을 종합적으로 파악하고, 공공과 민간 빅데이터 활성화를 지원하기 위해


2016년 12월 8일 출범
- 빅데이터 TF는 중앙·지자체 공공기관과 민간기업 및 학계전문가 40명이 참여
- 창업콜라보 프로젝트, 창업 경진대회 등을 통해 공공데이터 활용기업을 육성하고 창업을 지원
- 공공데이터 활용 민간 주도 협의체인 ‘오픈데이터포럼’을 운영하여 사회현안에 관한 유의미한
데이터를 상시 발굴하고, 사회문제 해결을 지원할 예정
- 고품질의 데이터 개방과 과학적인 정책결정 지원을 위해 데이터 관리체계 및 빅데이터 분석지원
등을 중점적으로 추진할 계획 발표
- 범정부 데이터 관리 체계 구축을 위해 데이터 수집·관리, 융합·분석, 의사결정 지원 등 ‘정부 통합
데이터 플랫폼’ 구축을 위한 업무재설계/정보화전략계획(BPR/ISP) 진행 중(2017년 12월)
- ‘17~‘18년 공공 빅데이터 센터 설립에 대한 구체적인 방안을 마련하고 늦어도 ‘19년까지 설치할 예정
- ‘21년까지 112개 분야 지능·융합형 공공데이터 구축·개방을 확대하고 인공지능 의료영상 등 15개
분야 국가데이터 개방을 추진하는 등 민간이 필요로 하는 새로운 공공데이터의 부문별 개방 추진
- 데이터 기반 행정 활성화에 관한 법률안에 대한 부처 협의

▪ 한국정보화진흥원 K-ICT 빅데이터 센터의 빅데이터 스타트업 지원사업

- 빅데이터 기반 예비창업자 및 신규 비즈니스를 개발하는 스타트업을 위해 K-ICT 빅데이터 센터의


대용량 분석 인프라와 기술 노하우를 바탕으로 빅데이터 창업 및 사업화 지원
- 기술 교육: 스타트업의 빅데이터 스킬업을 위한 실무중심 교육(분석, 인프라 구축·운영 기술 등) 제공
- 인프라 지원: 대용량 데이터 분석 및 서비스 제공을 위한 API, APP, WEB 등 개발을 지원하기
위한 인프라 제공
- 작업 공간: K-ICT 빅데이터 센터 오픈랩을 활용하여 스타트업이 일정기간 활용할 수 있는 작업 공간 지원
- 기술 멘토링: 빅데이터 사업화 애로사항에 대한 전문가 기술자문 제공
※주요 분야 서비스 기획, 빅데이터 분석, 빅데이터 인프라 및 분석 솔루션 구축 등
- 운영서버 지원: 개발 결과를 일정기간 서비스 할 수 있는 상용 클라우드 기반 서버(웹서버, DB,
WAS 서버 등)를 제공

▪ 삼성 SDS의 산학협력 프로그램인 ‘브라이틱스 아카데미(Brightics Academy)’

- 성균관대, 한양대, 서울대, 카이스트, 연세대, 이화여대에 이어 ‘19년 울산과학기술원(UNIST)와


빅데이터 분석 기술 교육 활성화 및 공동연구 진행
- 브라이틱스 AI 오픈소스 버전인 ‘브라이틱스 스튜디오’를 공개, 이 플랫폼을 활용해 AI 분석 관련
커뮤니티를 형성하고 브라이틱스 아카데미 활동에 박차를 가할 전망

191
191
전략품목 현황분석

나. 연구개발 인력

[ 빅데이터 분석 및 시각 플랫폼 분야 주요 연구인력 현황 ]

기관 부서 대표 전화번호

통계청 통계데이터기획과 042-481-3616

과학기술정보통신부 융합신산업과 02-2110-2844

과학기술정보통신부 과학기술정보통신부 02-2110-2849

과학기술정보통신부 지능정보사회추진단 02-2110-2152

한국정보화진흥원 K-ICT융합본부 053-230-1419

정보통신기술진흥센터 기반 SW·컴퓨팅 CP -

한국전자통신연구원 (ETRI) 지능정보연구본부 시각지능연구그룹 042-860-6340

한국전자통신연구원 (ETRI) 스마트데이터 연구그룹 042-860-6340

다. 기술이전가능 기술

(1) 기술이전가능 기관

[빅데이터 분석 및 시각 플랫폼 분야 연구기관 ]

분류 요소기술 기관

빅데이터 정보 자율제어 기술 행정안전부


수집
데이터 수집 및 결합 스크립트 언어 및 실행기술 한국데이터진흥원

저장 가상머신 기반 메모리 확장 시스템 SW 한국정보화진흥원

입출력 성능 가속을 지원하는 분산 파일 시스템 SW 한국정보화진흥원

분석/처리 비정형 텍스트 데이터 컨텍스트 추출 및 랭킹 기술 한국정보화진흥원

빅데이터 공유 활용을 위한 멀티테넌트 분석 프레임워크 기술 한국정보화진흥원

192
192
빅데이터 분석 및 시각화 플랫폼

(2) 이전 기술에 대한 세부 내용

[ 가상머신 기반 메모리 확장 시스템 SW ]

분류 세부내용

기술명 •가상머신 기반 메모리 확장 시스템 SW

• 인 메모리 컴퓨팅(In memory computing) 의 출현 : 빅데이터에서 요구되는


실시간 분석처리와 같은 요구가 증가함에 따라서 데이터를 기존의 디스크
대신에 메인메모리에 저장하고 처리하는 컴퓨팅 기술로, CPU, 메모리나
네트웍의 속도에 비해서 디스크의 입출력 속도가 상대적으로 느리게
발전함으로써 병목이 되는 것을 해결하고자 함
• 빅데이터 애플리케이션이나 바이오 분석 응용과 같이 대규모의 데이터를
기술개요
처리하는 응용들은 점점 더 많은 물리 메모리를 필요로 하지만 단일 노드에서
수용 가능한 메모리의 물리적 크기는 제한되어 있으며, 더 많은 물리적
메모리를 장착하기 위해서 상당한 비용이 발생
• 메모리 확장 기술은 이처럼 대규모의 메모리를 필요로 하는 애플리케이션을
위한 기반 기술로 일반적으로 판매하는 다수의 서버를 고속 네트워크로
연결하여 대규모의 메모리를 가진 가상 시스템처럼 보이도록 하는 기술임

• 본 기술은 “유전체 분석용 슈퍼컴퓨팅 시스템 개발 사업”의 실행과제인


“성능가속시스템SW 서브시스템” 과제의 결과물로서 개발되었으며, 이를
산업계에 전수하여 국내 소프트웨어 산업 발전에 이바지하고자 함
• 최근 빅데이터의 출현과 더불어 인 메모리 컴퓨팅 기술이 대두되고 있고, 또한
유전체 분석 등과 같이 많은 용량의 메모리를 필요로 하는 과학 응용이
기술이전 목적 및 필요성
증가함에 따라 큰 비용을 들이지 않고 유휴 서버의 메모리를 이용하는 방법을
제공하고자 함
• 국내 기업들이 글로벌 기업들과 경쟁력을 갖출 수 있도록 저비용으로 다수의
노드로부터 메모리를 제공받아 사용할 수 있는 기술을 제공하여 글로벌
기업과의 기술 격차를 극복하는 기회로 활용

• 물리적 메모리보다 크게 보이도록 하는 가상 주소 공간 관리 기능


• 메모리 페이지 부족시 페이지 Victim 선택 및 교체
• Infiniband RDMA 기반 고속 데이터 통신 제공
기술의 특징 및 장점
• 응용 특성에 따라 기본 페이지 크기 설정 (4K ~ 2Mbyte )
• 1-N ( 클라이언트-서버 ) 지원 및 데이터 placement 정책 제공
• 원격 메모리를 블록디바이스로 접근 가능

기술성숙도(TRL) •단계: 6

• 인 메모리 멀티 노드 데이터베이스의 기본 아키텍처 인프라로 적용 가능


•클라우드 환경에서 동적으로 메모리를 사용가능하도록 하는 메모리 클라우드의
활용방안 및 기대성과 기반 기술로 사용
•새로운 하드웨어의 추가 없이 기존 다른 서버로부터 메모리를 제공받아
대규모의 메모리를 필요로 하는 응용을 수행시킬 수 있는 환경을 제공

193
193
전략품목 현황분석

분류 세부내용

가. 기술이전의 내용
A. 가상머신 기반 메모리 확장 시스템 SW

- 다수의 노드의 메모리를 단일 메모리를 가진 시스템으로 보여주는 가상머신


기반 메모리 확장 시스템 SW V1.0
A-1. 메모리 확장 모듈 기술
o 원격메모리 가상주소 매핑 기술
o Infiniband RDMA 기반 고속 데이터 통신 기술
o 응용특성을 고려한 페이지 크기 조절
o 페이지 교체를 위한 Victim 선택
o 다수의 메모리 제공자 지원
A-2. 고속 통신 기반 원격 메모리 블록 디바이스 기술
o 원격 메모리 블록 디바이스 접근 기술
o Infiniband RDMA 기반 고속 데이터 통신 기술
기술이전 내용 및 범위 o 다수의 메모리 제공자 지원

나. 기술이전의 범위
A. 가상머신 기반 메모리 확장 시스템 SW
A-1. 메모리 확장 모듈 기술
o 하이퍼바이저 패치 모듈
o 메모리 확장 리눅스 모듈
o RDMA 기반 노드간 통신 모듈
o 소스코드, 상세설계서, 시험계획서, 시험 절차서, 기타 기술문서
A-2. 고속 통신 기반 원격 메모리 블록 디바이스 기술
o 메모리 제공자 서버 모듈
o RDMA 기반 노드간 통신 모듈
o 원격 메모리 블록 디바이스 모듈
o 소스코드, 상세설계서, 시험계획서, 시험 절차서, 기타 기술문서

•특허 2건
1) 클라우드 컴퓨팅 시스템의 메모리 관리 장치 및 방법
(출원번호 : 10-2014-0069643)
2) 대용량 메모리 기반 데이터 처리를 위한 원격 메모리 데이터 관리 방법 및
관련지적재산권
장치
(출원번호 : 2014-0002836)
성능가속 시스템 SW 서브시스템 메모리 확장 기술 상세 설계서 등 기술문서
20건

194
194
빅데이터 분석 및 시각화 플랫폼

분류 세부내용

실시권 허용범위 •비독점적 통상실시권

계약기간 •계약체결일로부터 5 년간

※경상기술료

구분 중소기업 중견기업 대기업


기술료조건 착수기본료
기술 32,000 65,000 65,000
(부가세별도) (천원)
이전
매출정률
조건 1.25 3.75 5
사용료(%)

기술전수교육 •1개월 / 1,000 천 원정(부가세별도)

•세부기술별 착수기본료
기타특기사항 - 메모리 확장 모듈 기술: 20백만 원(중소기업기준)
- 고속 통신 기반 원격 메모리 블록 디바이스 기술: 12백만 원(중소기업기준)

•고성능컴퓨팅SW연구실 김원영
•기술개발 발표당시
042-860-6847
기술관련
•고성능컴퓨팅연구그룹 김원영
•현재
042-860-6847
세부
문의
•기술이전팀 김영규
•기술개발 발표당시
042-860-4960
계약련
•기술이전팀 김영규
•현재
042-860-4960

195
195
전략품목 현황분석

5. 기술개발로드맵

가. SWOT 분석

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 세계적 ICT 강국으로 빅데이터 수집 환경 조성
•(환경) 기업들의 빅데이터에 대한 이해도가 상대적 부족
•(기술) 세계적으로 높은 초고속 대규모 복합 미디어 정보
•(기술) 우리나라 기술은 아직 선진국에서 개발한 핵심기술을
처리기술
도입하여 적용하는 수준으로 한계가 뚜렷
•(정책) 정부의 빅데이터 산업에 대한 집중적 지원과 인재
•(정책) 빅데이터를 수집할 수 있는 매체 개발 미비
양성 노력

기회(Opportunity) 위협(Threat)
•(환경) 스마트공장, 스마트시티 등 빅데이터 기반 신사업의
•(환경) 빅데이터 정보 보안에 대한 대책 미흡
등장
•(기술) 글로벌 리더 그룹들의 국내 시장 잠식
•(기술) 빅데이터 기반 기술 개발에 대한 관심 고조
•(정책) 정보 수집을 제한하는 있는 현재 국내 정책
•(정책) 정부의 공공데이터 공개의 활성화

중소기업의 시장대응전략
➜ IoT의 발전화 보편화에 따라 수집되는 비정형 데이터의 양은 폭발적으로 증가하여 비정형 데이터
분석의 중요도는 앞으로도 높아질 전망, 따라서 산업적으로 활용할 수 있도록 비정형 빅데이터를
분석하고 가공하는 기술 개발을 통해 시장 선점
➜ 글로벌 선두 그룹들의 실시간 데이터 처리, 배치 데이터 처리 등의 기술을 도입하여 세계시장에
뒤처지지 않도록 함과 동시에 세부적 시장에 최적화된 기술 개발

나. 중소기업 핵심요소기술

(1) 핵심요소기술 도출절차

 특허/논문 분석을 통한 요소기술과 기술수요와 각종 문헌을 기반으로 한 요소기술, 전문가


추천 요소기술을 종합하여 품목별 전문가를 통해 분류조정한 후, 전문가 평가과정을 거쳐
핵심요소기술을 선정
- 기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업 적합성(10)을 고려하여 평가

요소기술 요소기술 핵심요소기술 핵심요소기술


Pool 구성 분류 조정 선정평가 선정

- 특허/논문 분석 è - 품목별 전문가 è - 산학연 전문가 검토 è - 평가결과 반영


- 기술수요 및
요소기술 분류 - 평가항목별 요소기술 로드맵 기획 대상
문헌분석
조정·재정의 선정평가 핵심요소기술 도출
- 전문가 추천

196
196
빅데이터 분석 및 시각화 플랫폼

(2) 요소기술

 산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처로드맵, 중소기업 기술수요를 바탕으로


로드맵 기획을 위하여 요소기술 도출

 요소기술을 대상으로 전문가를 통해 기술의 범위, 요소기술 간 중복성 등을 조정·검토하여


최종 요소기술 확정

[ 빅데이터 분석 및 시각화 플랫폼 분야 요소기술 ]

요소기술 출처

내외부 데이터 연동 기술 특허/논문 분석, 전문가추천

실시간 데이터 저장 기술 특허/논문 분석, 전문가추천

분산 스토리지 기술 특허/논문 분석, 전문가추천

NoSQL 데이터베이스 기술 특허/논문 분석, 전문가추천

배치 데이터 처리 기술 특허/논문 분석, 전문가추천

실시간 데이터 처리 기술 특허/논문 분석, 전문가추천

대용량 및 실시간 데이터 분석 플랫폼 기술 특허/논문 분석, 전문가추천

통계 기반 데이터 분석 기술 특허/논문 분석, 전문가추천

머신 러닝 기반 데이터 분석 기술 특허/논문 분석, 전문가추천

데이터 시각화 기술 특허/논문 분석, 전문가추천

서비스 시각화 기술 특허/논문 분석, 전문가추천

197
197
전략품목 현황분석

(3) 핵심요소기술 도출

 확정된 요소기술을 대상으로 산․학․연 전문가로 구성된 핵심요소기술 선정평가를 통하여


중소기업에 적합한 핵심요소기술 선정

[ 빅데이터 분석 및 시각화 플랫폼 분야 핵심요소기술 ]

분류 핵심요소기술 개요

분산 스토리지 기술 대용량 파일을 저장하기 위한 분산 파일 시스템 기술

빅데이터 저장

문서, 그래프, 키 값, 인 메모리, 검색 등과 같은 데이터


NoSQL 데이터베이스 기술 모델을 지원하는 빅 데이터 처리를 위한 비관계형
데이터베이스 관리 시스템(NoSQL) 기술

배치 데이터 처리 기술 대용량 비정형 데이터를 정형화하기 위한 배치 데이터 처리 기술

빅데이터 처리

실시간 데이터 처리 기술 고성능 인메모리를 이용한 실시간 데이터 처리 기술

머신 러닝 기반 데이터 분석
빅데이터 분석 추천, 분류, 군집 등과 같은 머신러닝 기반 빅데이터 분석 기술
기술

분석데이터 데이터 분석 결과를 시각화하여 인간이 이해할 수 있도록


데이터 시각화 기술
시각화 유의미한 정보를 표현하는 기술

198
198
빅데이터 분석 및 시각화 플랫폼

다. 기술개발전략

(1) 우리의 현황

 국내 빅데이터 분석 및 시각화 플랫폼 분야 관련 시장 규모는 2,987억 원이며 세계 시장은


590억 4,000만 달러 규모인 것으로 파악

 국내 시장 성장률은 24.7%로 세계 시장 성장률인 10.6%보다 높은 수치를 보임

 국내 중소기업의 빅데이터 분석 및 시각화 플랫폼 분야 기술 수준은 세계 최고수준을 보유한


미국(100%) 기준으로 58.8%인 것으로 나타나며, 4.11년의 기술격차를 보이는 것으로
조사됨

 특허 출원량은 309건으로 미국의 139건에 비해 높은 수치

 특허 피인용지수는 미국이 1.7로 가장 높은 수치이며 국내는 0으로 분석됨

[ 빅데이터 분석 및 시각화 플랫폼 전략 캔버스(Strategy Canvas) ]

* 기술수준은 응답자 평균치

199
199
전략품목 현황분석

(2) 기술개발로드맵

 빅데이터의 활용 분야 확대와 더불어 분석된 빅데이터를 가시성 있도록 시각화 하는 기술


또한 수요가 증가하는 추세

 기술/시장에서는 빅데이터 처리를 위한 대용량 스트리밍 데이터 처리 및 분석 기술, 기계학습


기반의 데이터 분석 플랫폼, 데이터 시각화를 위한 기반에 대한 니즈가 증가

200
200
빅데이터 분석 및 시각화 플랫폼

※ 참고 : 핵심요소기술 평가결과

지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성

내외부 데이터 연동 기술 6.3 5.8 5.8 6.8 24.8

실시간 데이터 저장 기술 6.3 5.8 6.7 6.5 25.3

분산 스토리지 기술 7.2 6.5 6.8 7.0 27.5 선정

NoSQL 데이터베이스 기술 7.0 6.8 6.3 7.0 27.2 선정

배치 데이터 처리 기술 6.3 6.5 6.8 6.3 26.0 선정

실시간 데이터 처리 기술 7.2 6.5 6.7 6.3 26.7 선정

대용량 및 실시간 데이터


7.2 7.2 5.5 6.0 25.8
분석 플랫폼 기술

통계 기반 데이터
6.7 6.2 6.2 6.8 25.8
분석 기술

머신 러닝 기반 데이터 분
7.0 6.7 6.2 6.7 26.5 선정
석 기술

데이터 시각화 기술 6.7 6.3 6.2 7.2 26.3 선정

서비스 시각화 기술 6.2 6.3 6.2 7.2 25.8

201
201
202
전략품목 현황분석

데이터 3D 변환
시각화 도구

203
204
데이터 3D 변환 시각화 도구

정의 및 범위

▪ 데이터 3D 변환 시각화란 데이터 분석 결과를 쉽게 이해할 수 있도록 AR/VR를 활용하여 3D 형태로


정보를 시각적으로 표현하고 전달하는 과정을 의미하며, 최근 빅데이터의 적용 산업이 확대되어 산업
내 수요가 증가할 것으로 기대

▪ 데이터 3D 변환 시각화 도구란 데이터의 분석 결과를 사용자가 쉽게 3D 데이터로 변환 시켜 주는


소프트웨어를 의미, 특히 BIM (3D설계 도구)등에서 도출된 데이터를 3D로 변환 후 각각의 요소들을
대상화하여 시각화된 데이터를 이용자에게 제공하는 도구

정부지원 정책

▪ 과학기술정보통신부는 2020년까지 400억원을 투자하여 VR․AR 산업 클러스터 구축을 위한 상암


누리꿈스퀘어에 코리아 VR․AR콤플렉스 개소하여 인재양성, 창업, 기술 및 인프라, 상용화등에 종합
지원할 예정

▪ 산업통상자원부는 2018년부터 5년간 유통산업 분야 연구개발(R&D)에 약 170억 원을 투자할 예정

▪ 고용노동부와 안전보건공단은 2017년 시뮬레이터를 활용한 건설현장 가상체험 콘텐츠 1종과 증강현실을
활용한 콘텐츠 2종을 추가 개발할 계획

▪ 2017년 문화체육관광부는 가상현실(VR)과 증강현실(AR), 혼합현실(MR) 등 첨단 융·복합 게임은 물론


기능성 게임과 체험형 아케이드 게임에 총 96억 원을 지원

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 거대자본의 대기업 중심의 산업 생태계 조성으로
•(환경) 빅데이터 관련 우수한 전방, 후방 인프라 구축
인한 산업 내 약한 중소기업의 입지
•(기술) 데이터 3D 변환에 활용 가능한 글로벌 수준의
•(기술) 세계 선두 기업에 비하여 핵심 원천기술 미흡
ICT 및 IoT 경쟁력
•(정책) 산업계 연계성이 낮은 법과 세계 트렌드에 뒤쳐진
•(정책) 중앙정부의 해당 산업 지원 정책 수립
제도적 지원

기회(Opportunity) 위협(Threat)
•(환경) 시각 데이터 활용 기반의 교육 및 의료 시장의
확대에 따라 기대되는 수요 증가 •(기술) 글로벌 업체와의 기술격차 심화
•(기술) 기반기술 연구·개발로 누적된 기술 데이터 활용 가능 •(정책) 빅데이터 활용에 따른 보안 문제 대두
•(정책) 정부와 업계의 높은 니즈에 따라 높은 발전가능성

중소기업의 시장대응전략

➜ AR/VR 기술을 기반으로 건축, 의료, 교육, 제조, 조선 등에 적용한 제품 개발로 시장대응

➜ 적은 비용으로 상용화된 3D 변환 도구 등을 활용하여 데이터 시각화를 통한 중소기업의 이윤


추구와 선두 그룹들을 벤치마킹함과 동시에 아이디어 중심의 새로운 시장 발굴
전략품목 현황분석

1. 개요

가. 정의 및 필요성

▢ 데이터 3D 변환 시각화란 2D-3D BIM매핑, 가상현실(VR : Virtual Reality), 증강현실 (AR :


Augmented Reality), 빅데이터 수집/처리/분석/시각화/저장하는 기술을 이용하여 수많은
데이터들을 인간이 쉽게 알아볼 수 있도록 표현해주는 기술을 의미함
▪ 글로벌 시장조사업체 IDC에 따르면 오는 2022년까지 전 세계 데이터 시장은 2,600억 달러로 성장할
것으로 전망. 각 산업분야에서 쏟아지는 방대하고 전문적인 정보들을 기존의 단순한 구조방식으로는
효율적인 정보 분석이 불가능하며, 이를 해결하기 위한 방법으로 데이터 시각화가 필요

▪ 데이터를 얼마나 보유하고 있는가가 중요하지 않고 어떻게 분석해서 활용하는 것이 중요하며 방대한
양의 데이터를 쉽게 파악할 수 있는 시각화 기술이 중요해짐

▪ 데이터 시각화 기술은 AR/VR 기술과 접목하여 3D 형태로 처리되고 있음

▢ 데이터 시각화란 인지를 증폭시키기 위해 인간의 시지각 능력을 이용하는 데이터의 표현과
설명방식으로 정의하며, 데이터의 표현, 데이터의 설명방식, 시지각 능력의 이용, 인지 증폭의
속성을 포함1)

▪ 데이터 시각화: 수많은 데이터를 도표와 그래프등을 이용하여 시각적으로 표현하는 방식으로
접근하기 어렵고 이해하기 힘든 정보들을 알아보기 쉽도록 도와주는 역할을 함. 정보 시각화,
과학적 시각화, 인포그래픽으로 분류

1) Andy Kirk, 2012, Data Visualization : A Successful Design Process, Packt Publishign, pp. 16-17

206
206
데이터 3D 변환 시각화 도구

▢ AR(Augmented Reality, 증강현실)은 현실에 가상의 영상정보를 합성해 제공하는 기술이며,


VR(Virtual Reality, 가상현실)은 현실공간을 완전히 대체한 가상공간을 구현하여 사용자와의
상호작용을 가능하게 하는 기술

▪ AR(증강현실) 기술은 현실 공간과 사물에 증강된 디지털 콘텐츠를 내재시킴으로써 사용자에게 보다


많은 체험 서비스를 제공하는 기술

▪ 증강현실은 스마트폰이 제공하는 기능을 통해 좌표상 위치와 움직임을 용이하게 측정할 수 있게


됨에 따라 다양한 용도로 응용되어 확산

▪ 실제 영상에 사용자에게 도움이 되는 가상 객체와 정보를 증강시킬 수 있어, 교육·원격의료진단·방송·건축·설계·제


조·공정관리 등 다양한 산업 분야에 응용이 가능

▢ VR(가상현실) 기술은 컴퓨터로 만든 가상공간 내에서 사용자의 시각·청각·촉각 등 감각정보를


확장·공유함으로써 공간적, 물리적 제약에 의해 현실세계에서 실질적으로 경험하지 못하는
상황을 실감적으로 체험할 수 있게 하는 총체적 기술

▪ 가상현실은 사용자가 가상으로 생성된 객체만을 경험하도록 기본적인 감각인 시각에 대해 실세계가
차단되도록 시야 전체를 가상 영상으로 채우는 착용형 디스플레이를 이용

▪ 가상현실은 실세계 영상이 차단되므로 고정된 자세에서 영상 시청에는 무리가 없으나, 사용자의
이동이나 가상 객체와의 상호작용을 위해서는 부수적인 요소기술 활용이 필요

▢ 혼합현실(MR : Mixed Reality)

▪ 실제 세상과 가상 세계를 통합, 물체와 디지털 개체가 공존하고 실시간으로 상호작용을 하는 새로운
시각화 환경

▪ 가상현실의 몰입도와 증강현실의 실제 세상에 데이터를 구현하는 기능을 결합

▪ 증강현실과 달리 HMD(Head Mounted Display)를 필요

▢ 빅데이터 시각화 서버 기술
▪ GPU 데이터베이스는 GPU의 병렬 처리를 이용해 데이터의 처리 속도를 향상. GPU는 SQL의
데이터세트의 모든 행에 대해 동일한 작업을­대개 검색­ 수행하기 때문

▪ QL 조인(JOIN) 연산부터 시작해, 병렬 프로세싱을 수행하도록 처음부터 새롭게 설계되고 코딩

▪ 하둡(Hadoop), 카프카(Kafka), H베이스(HBase), 스파크(Spark), 스톰(Storm) 등 유명 오픈 소스


프레임워크로의 커넥터 지원

▪ 태블로(Tableau), 파워 BI(Power BI), 스팟파이어(Spotfire) 등 시각화 및 BI 툴과의 통합을 위한


ODBC 및 JDBC 드라이버 지원

▪ C++, SQL, 자바, 노드제이에스(Node.js), 파이썬 등 유명 프로그래밍 언어와의 결합을 위한 API 지원

207
207
전략품목 현황분석

나. 범위

[ 제품분류 관점 기술범위 ]

전략품목 제품분류 관점 세부기술

2D-3D BIM • 2D 시각 데이터를 BIM(Building Image Modelling)을 이용하여


맵핑 3D로 변환하는 작업

• 현실 공간과 사물에 증강된 디지털 콘텐츠를 내재시킴으로써


가상현실(VR)
사용자에게 보다 많은 체험 서비스를 제공하는 기술

• 컴퓨터로 만든 가상공간 내에서 사용자의 시각청각촉가 등


감각정보를 확장 공유함으로써 공간적, 물리적ㅈ 제약에 의해
증강현실(AR)
현실세계에서 실질적으로 경험하지 못하는 상황을 실감적으로 체험할
수 있게 하는 총체적 기술
데이터
3D 변환 • 외부 데이터 저장소 종류, 데이터 형식, 데이터 타입, 해당 스키마,
빅데이터 수집
시각화 도구 해당 테이블, 해당 컬럼, 데이터 크기 등의 정보를 기반으로 데이터를
기술
수집하는 빅데이터 수집 기술

빅데이터 시각화 • 적어도 하나의 3D 템플릿 레이아웃과 분석된 유효 데이터들을


처리 기술 매칭시켜 3D 인포그래픽 데이터 파일을 생성하는 시각화 처리 기술

• 복수의 3D 템플릿 레이아웃 모델들을 생성하거나 네트워크를 통해


빅데이터 시각화
외부로부터 불러들여 복수의 3D 템플릿 레이아웃 모델을 형성하고
서버 기술
각각의 3D 텟플릿 레이아웃 모델들을 저장하는 서버 기술

▢ 데이터 시각화의 장점

▪ 많은 양의 데이터를 한눈에 파악 가능

▪ 데이터 분석 전문가가 아니어도 데이터에서 쉽게 인사이트(insight) 도출 가능

▪ 요약 통계보다 정확한 데이터 분석 결과를 도출 가능

▪ 효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정 가능

▪ 데이터 시각화를 활용할 수 있는 분야와 방법이 다양

208
208
데이터 3D 변환 시각화 도구

2. 외부환경 분석

가. 산업환경 분석

▢ 엔지니어링 및 제조, 미디어 및 엔터테인먼트, 석유, 가스, 의료, 금융 등 다양한 산업군에


걸쳐 데이터 3D 시각화 기술이 활용

▪ 모든 각도에서 실시간으로 제품을 검사하거나 위치나 환경을 조사할 수 있으며, 실제로 눈앞에서
펼쳐지는 것처럼 다양한 시뮬레이션을 오버레이할 수 있음. VR을 통해 설계, 엔지니어링, 기술
전문가들은 물리적 모델과 관련된 비용을 절약 가능

▪ Autodesk의 VRED, 3ds max 및 Maya, Luxion의 KeyShot, Chaos Group의 VRAY, Dassault
Systems 3DExcite 및 CATIA Live Render 같은 시스템은 현대 시각화 기술 산업 부문에서 적극 활용

▢ 디자이너는 3D 시각화 기술을 활용하여 자신의 아이디어를 구현

▪ Autodesk, Luxion 및 Dassault Systems 같은 솔루션 업체가 제공하는 CPU 기반의 시스템을 통해
점점 더 많은 디자이너가 실제와 같은 조건 하에 제품의 성능을 시뮬레이션해 보고, 최종 제품이
어떤 모습일지 자세한 시각화를 통해 확인

▢ PGO Automobiles사는 사용자 맞춤 복고풍 자동차를 제작시 PGO 의 디자이너들은 Dell


Precision Rack 7000 시리즈를 사용하여 현실을 반영한 실사 이미지를 제작하여 각 고객이
가상의 자동차를 구현

209
209
전략품목 현황분석

▢ AR과 VR은 게임, 교육, 의료, 영상, 방송·광고, 제조·산업 등 다양한 분야에서 활용

▪ AR, VR 모두 입력/출력 인터페이스, 저작도구, 콘텐츠 서비스로 구분

산업 활용 예시

· 게임: PC/콘솔 게임, 모바일 게임 등


게임
· 테마파크: 롤러코스터, 4D 시뮬레이터 등

· 이러닝: 팝업북 등 교육 콘텐츠


교육
· 훈련: 군사작전 훈련, 직업 훈련 트레이닝

· 외과학분야: 수술 교육용, 고난이도 수술 훈련용 등


· 정신신경과학분야: 가상 시뮬레이션 정신행동치료
· 영상진단학분야: 3D 가상 대장내시경 등 CG 활용
의료
· 재활의학분야: 재활치료용 시뮬레이션 훈련
· 헬스케어분야: 원격 의료, 원격 피트니스 등
· 기타분야: MRI, CT 등 센서를 통한 환자 정보 3D 구현

· 영화: 기술영화(Tech-Film)
· 내비게이션: 3차원 가상경로, 실사영상기반 실감 내비게이션
영상
· 드론: 1인칭시점(FPV) 영상, e-스포츠 등
· 부동산: 가상 모델하우스, 부동산 영상 등

· 방송: 가상 스튜디오, 드라마 등 VR콘텐츠 제작, 스포츠 중계, 콘서트 실황 공연 등


방송 · 광고
· 광고: 가상 광고 시스템, 전시관 가상 체험 등

· 자동차: 가상 테스트, 디자인 및 설계, 자율주행체험 등


제조 · 산업 · 항공: 배선조립 및 도색공정 가상훈련, 기내서비스 제공 등
· 기타: 복잡한 기계조립, 유지보수(A/S) 정도 획득

▢ 혼합현실 활용
▪ 포드 : 디자이너들이 진흙으로 프로토타입을 만들지 않고 가상으로 프로토타입을 만들어 각종
실험과 테스트

▪ 티센크루프(Thyssenkrupp) : 세일즈에 혼합현실을 활용. 집 계단에 고령자나 장애자용 리프트를


설치했을 대 모습을 가상으로 구현해 보여줌.

▪ 인터랙티브 건축 모델

▪ 의료용 스캔 데이터

▪ 3D 데이터 시각화

210
210
데이터 3D 변환 시각화 도구

나. 시장환경 분석

 빅데이터 기반 데이터 3D 변환 시각화 도구 시장의 규모는 정확히 알기 어려우나, 빅데이터


시장의 따라 데이터 분석 결과를 이해하기 위해 시각화의 중요성이 높아지고 있으며, 특히
널리 활용 할 수 있는 3D 시각화에 대한 산업 내 관심이 높아지고 있는 점을 고려하여,
데이터 3D 변환 시각화 도구의 기반이 되는 빅데이터 시장 규모와 3D 시각화를 활용한
VR/AR 관련 시장 규모 분석을 통하여 간접적으로 예측

(1) 세계시장

 빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 ’21년 814억
달러로 성장할 전망(’17, IDC)

[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

세계시장 53,400 65,450 65,450 72,890 81,380 90,006 10.6

*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 세계 시장은 2023년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)

▪ 빅데이터 선진개발국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,


민간 데이터 시장에서는 중개업이 활성화

▪ 미국의 경우 2016년 기준 데이터 브로커 기업은 약 650억개로 150억불 규모의 시장을 형성

 빅데이터 세계 시장은 빅데이터, 인프라, 빅데이터 소프트웨어, 빅데이터 서비스 시장으로


세분화 할 수 있으며, 빅데이터 소프트웨어 및 서비스에 대한 전 세계 빅데이터 매출액은
2018년 420억 달러에서 2027년 1,030억 달러로 증가

▪ 시장 변화는 연간 약 10.48%의 성장률을 보일 것으로 예측되며, Wikibon은 전세계 빅데이터


시장이 2017년과 2027년에 각각 350억 달러에서, 1,030억 달러를 달성하여 연평균 11.4%의
성장률을 보일 것으로 추정

▪ 2016년 기준, 빅데이터 인프라, 소프트웨어, 서비스 부문은 각각 51.4%, 22.4%, 26.2%의
비중으로 시장 형성

▪ 빅데이터 시장 중 인프라 시장의 점유율이 가장 높으며, 또한, 가장 높은 성장세를 보일 전망

- 인프라 시장의 경우, ’16년 136억 달러 규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장
형성을 예측

211
211
전략품목 현황분석

[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)

구 분 ’16 ’17 ’18 ’19 ’20 ’21 ’22 CAGR(%)

인프라 13,600 17,700 21,700 26,000 30,700 36,200 43,900 19.60

소프트웨어 6,000 7,400 9,000 10,600 12,300 14,300 16,200 16.61

서비스 7,100 8,800 10,800 12,600 14,700 17,700 20,500 17.05

합계 26,700 33,900 41,500 49,200 57,700 68,200 80,600 18.26

*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용

 세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)

▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순

▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)

 빅데이터 애플리케이션 및 분석 시장은 2026년 194억 달러로 증가 예상

▪ 빅데이터 애플리케이션 및 분석 시장은 2018년 50억 달러에서 2026년 194억 달러로 크게 증가하여
연평균 15.49%의 성장률을 달성할 전망

▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, 2018년 165억 달러에서


2026년 213억 달러로 성장

[ 빅데이터 품목별 세계 시장 규모 및 전망]

*출처: Wikibon and reported by Statista, NIA 2018.6 재인용

212
212
데이터 3D 변환 시각화 도구

 세계 시장에서 AR/VR 기반 융복합 신시장/신산업 창출이 기대되며, 이를 통해 수출시장


중심으로 막대한 경제적 파급효과 발생 전망

▪ ‘14년 기준 실감콘텐츠 관련 종사자(22만 3천여명) 중 20%(4만 5천여명)가 ’20년까지 실감콘텐츠


종사자로 전환 시, 연 7,400여명의 전문인력 필요

▪ 콘텐츠 및 스마트미디어 생태계 조성에 기여함으로써, 관련 산업 육성과 글로벌 역량강화 및 신규


일자리 창출 기여

[ 2025년 AR/VR 소프트웨어 시장예측 ]


(단위 : 십억 달러, 백만 명)
2020년 시장예측 2025년 시장 예측
산업 혁신 시장
시장규모 사용자 수 시장규모 사용자 수
PC, 콘솔,
게임 6.9 70 11.6 216
아케이드 게임

공연 및 이벤트 0.8 28 4.1 95 티켓 판매

영상 0.8 24 3.2 79 온라인 스트리밍

유통 0.5 9.5 1.6 31.5 전자상거래

부동산 0.8 0.2 2.6 0.3 중개시장

교육 소프트웨어
교육 0.3 7 0.7 15
및 서비스

등록된 등록된 훈련 및
국방 0.5 1.4
HMD수로 추정 HMD수로 추정 시뮬레이션

헬스케어 1.2 0.8 5.1 3.4 환자 모니터링

엔지니어링 1.5 1.0 4.7 3.2 CAD/CAM

* 출처 : AR/VR report, Goldmam sachs, 2016

 Digi-Capital에 의하면 AR/VR의 세계 시장규모는 2016년 39억 달러에서 연평균 145.6%씩


급증해 2021년에는 3,735억 4,900만 달러에 이를 것으로 전망

▪ 특히 증강현실 산업은 2016년부터 2019년까지 최소 100% 이상의 연평균 성장률을 보이며


가파른 성장세를 나타낼 것으로 예상

213
213
전략품목 현황분석

(2) 국내시장

 빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 2022년
6,948억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)

구 분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 244.2 298.7 358.3 446.8 557.2 694.8 24.7%

*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용

 빅데이터 시장은 빅데이터 인프라(서버, 스토리지), 빅데이터 소프트웨어, 빅데이터 서비스로


나누어 집계
▪ 빅데이터 시장은 인프라 시장이 55.9%로 가장 큰 부분을 차지하고 있으나, 데이터 3D 변환
시각화 도구를 포함하는 소프트웨어(23.2%), 서비스(20.9%) 시장은 활성화되고 있지 못한 것으로
나타남

[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0

*출처: 2017년 빅데이터 시장현황 조사, 인사이트플러스

 국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억원로 연평균 7.6% 성장 예상 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 부문별 시장 규모 : 데이터구축/컨설팅(2조 9,291억원), 데이터 서비스(1조 7,146억원),
데이터 솔루션(1조 6,536억원) 순

 기업의 빅데이터 대한 인식 호전과 중견·대기업의 투자 증가, 정부의 강력한 빅데이터 산업 육성의지에


따라 성장세를 보이고 있으며, 결과적으로 시장이 확대 (한국데이터진흥원, 데이터산업백서 2017)

▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출

214
214
데이터 3D 변환 시각화 도구

▪ 국내 일반기업의 빅데이터 시스템 도입률은 2016년 기준 5.8%이나, 중견·대기업은 12.3%의


도입률을 보여 기업 규모별 편차가 존재하는 것으로 나타남

▪ 산업별로는 금융(14%), 공공(6.9%), 통신미디어(6.5%), 의료(6.3%), 유통·서비스(5.5%), 제조(4.2%)


순으로 나타나 데이터 활용의 중요성이 높은 산업에서의 빅데이터 도입이 상대적으로 적극적인 것으로 분석

 국내 빅데이터 시장은 포털사, 통신사, IT 업체 등이 자사 보유 데이터를 바탕으로 빅데이터


서비스 제공을 시작하는 단계

▪ 국내 ICT 산업은 경쟁력이 높고 데이터 생산량이 많아 빅데이터 산업의 성장 잠재력이 크지만


도입의 필요성 인지 부족 및 개인정보법 등 법적 리스크로 그동안 활용은 상대적으로 저조한 상황

 업계별 빅데이터 시스템 도입률 증가 추이

▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름

▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고,


분석할만한 데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차
기반 마련 예상

▪ 업종별로 보면 제조업, 물류, 유통, 금융, 의료 분야에서 특히 높은 성장 예상

 정보통신정책연구원에 따르면, VR 분야의 국내 시장규모는 2016년 1조 3,735억 원에서


연평균 42.9%씩 증가해 2021년에는 8조 1,839억 원 규모로 성장할 것으로 예측

[ VR 분야의 국내 시장규모 및 전망 ]
(단위 : 억 원, %)

구분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

국내시장 19,601 27,999 40,028 57,271 81,839 116,947 42.9

* 출처 : 가상현실(VR) 생태계 현황 및 시사점. 정보통신정책연구원, 2016, ‘22년은 ’17~‘21년 CAGR로 추정

 국내 시장 매출의 대부분이 디스플레이에 편중되어 있어 타 분야의 성장에 있어서는 특히


국내 중소기업의 매출 비중이 매우 낮음

▪ 디스플레이 분야를 제외한 다른 C-P-N-D 분야 중 무선 시뮬레이터가 속한 디바이스 분야의 경우,


삼성의 매출액이 절대다수를 차지하고 있으며, 국내 시장뿐만 아니라 해외 시장을 통해 매출 성장을
기대할 수 있는 글로벌 경쟁력 있는 신규 사업모델의 발굴 및 산업 활성화 반드시 필요

215
215
전략품목 현황분석

[ AR/VR 세부 분야별 매출 구성 현황 ]

(단위 : 백만 원, %)

구분 ‘15 ‘16 증감

전체 2,416,177 2,659,236 10.1

콘텐츠(C) 279,499 289,426 3.6

플랫폼(P) 199,277 244,778 22.8

분야별 네트워크(N) 38,465 40,131 4.3

디바이스(D) 208,936 254,901 22.0

HW Display 1,690,000 1,830,000 8.3

* 출처 : 2016년 스마트미디어산업 실태조사, 과학기술정보통신부, 2016

3. 기술 분석

가. 기술개발 이슈

◎ AR 및 VR을 통한 3D데이터 시각화 유용

 KPMG는 홀로렌즈를 사용하여 인사이트 센터(Insight Center)를 방문하는 임원 그룹들이


프레젠테이션의 데이터를 쉽게 볼 수 있도록 함

▪ 회의실에서 파워 BI 모바일 앱을 통해 홀로렌즈와 파워 BI를 사용하거나 GWA(Great Wave


Analytics) VR을 통해 오큘러스 리프트(Rift)와 립 모션(Leap Motion) 컨트롤러를 사용하여
세일즈포스 데이터에 대한 3D시각화를 구현

 미국의 3D 지리 데이터와 3D 가상화 솔루션을 공급하는 미국의 전문가용 지형공간 솔루션


기업인 브리콘(Vricon)은 공공안전응답센터(PASP)에 긴급 구조 요청 전화가 접수되면 Vricon
3D 데이터가 911 상담요원들이 보다 정확하게 발신자 위치를 추적, 특히 다층구조나 여러
건물 밀집지역에서도 위치 파악이 가능하도록 지원

 산업 전반에서 활용
▪ 홀로렌즈 도구를 활용하여 건축가, 소매 디자이너, 공장 레이아웃 디자이너들이 물리적인 현장에서
계획서와 프로젝트를 확인하기 위해 AR를 활용

▪ 스트라이커(Stryker)는 병원 및 외과의사들과 협력하여 수술실을 설계

216
216
데이터 3D 변환 시각화 도구

 AR/VR 시장은 2021년 5,920만대 규모로 증가할 예정

▪ IDC(2018년)에 따르면 AR 및 VR에 지출되는 약 180억 달러 중 60% 이상이 비즈니스용


프로젝트에 지출될 것으로 분석, 2021년이면 그 비율이 85%까지 증가할 것으로 전망

▪ 캡제미니(Capgemini)는 AR 또는 VR프로젝트를 이행하는 기업 중 82%가 만족하고 있으며, AR


또는 VR을 아직 시작하지 않은 기업 중 절반이 향후 3-5년 이내에 계획 중이라고 발표

▪ IDC(2017)에 따르면, 증강현실과 가상현실을 포함한 헤드셋의 세계 출하대수가 2017년


960만대였으며, 2021년에는 5,920만대까지 늘어날 것이라고 전망

▪ 2017년 100만대였던 산업용 VR 헤드셋의 출하대수는 2021년 말 1,260만대가 되고, AR/VR


헤드셋 출하대수 전체의 21%를 차지할 것으로 예측

▪ 증강현실 헤드셋은 2021년 말 가상현실 헤드셋을 웃도는 1,560만대가 출하되어, 전체의 26%를
차지할 것으로 예상

◎ 국내 AR/VR산업 이슈

 은행연합회와 한국은행은 IT기반 체험형 교육 ‘금융빅게임-더 로스트 시티’를 공동으로 개최

▪ 은행연합회가 2016년부터 실시해온 ‘금융빅게임-더 로스트 시티’는 참가자가 가상현실의 주인공이


되어 주어진 미션을 수행함으로써 자금이체, 대출, 원리금 상환, 금융사기 대처 등 금융을 쉽고
재밌게 배울 수 있는 오프라인 교육용 게임임

▪ 2017년 한국은행과 은행연합회가 함께 개최한 ‘금융빅게임-더 로스트 시티’는 진위폐 감별미션을


증강현실(AR) 콘텐츠로 추가

 삼성, LG는 가상현실(VR) 제품 개발 중이며 SK텔레콤, KT은 통신망 연계 서비스를 개발


중이나 최고 기술보유국 대비 기술격차가 2.5년 수준(2015년 ICT기술수준조사 IITP)
▪ 세계적인 디스플레이 및 네트워크 기술을 보유하고 있지만 콘텐츠 및 플랫폼 관련 핵심기술 확보가 필요

 과학기술정보통신부는 평창 올림픽프라자에 2017년 11월 738㎡ 규모의 ‘평창 ICT 체험관’을 개관

▪ 평창 ICT 체험관을 공식 후원하는 KT는 평창 인근에 기존 LTE보다 20배 빠른 5G망을 구축하고,


5G 환경에서 구축된 인공지능과 가상현실 서비스를 제공

▪ 가상현실 스노보드, 봅슬레이 기기와 가상현실 롤러코스터가 설치되어 실감나는 체험이 가능

 스노보드 기기는 다리에 힘을 줘 좌우로 움직이면 실제로 미끄러져 나가는 느낌을 체험할 수 있으며,
봅슬레이 기기에서는 시속 135km로 달리는 체험을, 롤러코스터에서는 HMD(Head Mounted
Display)를 쓴 채 360도 회전하는 기구를 타고 실제 롤러코스터를 타는 것 같은 체험이 가능

217
217
전략품목 현황분석

 KT는 대관령 의야지마을에 ‘평창 5G 빌리지’를 조성해, 세계 최초로 5G 네트워크를 적용하고


증강현실(AR), 혼합현실(MR), 홀로그램 등 첨단 ICT를 결합시켜 방문객들에게 관광 안내,
특산품 판매, 드론 체험 등을 제공

▪ ‘평창 5G 빌리지’ 중심에 ‘꽃밭양지카페’를 조성해 1층에는 네트워크 기반의 AR 기술을 활용한
터치게임을 제공하고, 2층에는 AR 쇼핑 플랫폼인 5G AR 마켓을 제공

◎ 기술 동향

 데이터의 시각화
시각화 기술 예
도표와 통계 분석 도구 마이크로 소프트 엑셀이나 태블로

javascript의 D3.js, chart.js, googlechart.jsp5.js


프로그래밍 환경 R의 ggplot2, ggmap, shiny
python의 matplotlib, seaborn, Altair, bokeh

Adobe사의 일러스트레이트
Adobe사의 이펙트
전문가 도구 SAP
마이크로소프트의 PowerBi
구글의 구들트렌드, Visualizing Google Data

ElasticSearch는 Kibana(https://www.elastic.co/kibana)
자연어 처리
HTC는 Vive Tracker(https://www.vive.com/eu/vive-tracker)

출처 : 데이터 산업백서 2017.


[ 프로그래밍 환경에서의 데이터 시각화 ]

218
218
데이터 3D 변환 시각화 도구

▪ VR환경에서의 데이터 시각화

업체 개 요

Virtualitics Virtualitics(https://www.virtualitics.com

구글 틸트 브러시(Google Tilt Brush, https://www.tiltbrush.com)

Disney Research
iKinema(https://ikinema.com/Orion)
LA

 과학 시각화

▪ 시뮬레이션 데이터 등 복잡한 데이터를 쉽게 탐색할 수 있도록 그래픽 기술을 활용해 시각화하는
분야로서 의학이나 공학, 분야에서 활용, 특히 건축분야는 AR기반의 BIM(Building Information
Modeling)모델링 기술을 적극 활용

분야 개 요

의학 Insight Heart(http://www.insight-heart.com)

SmartReality(http://smartreality.co)
건축
DottyAR

 MR(Mixed Reality : 혼합현실)의 데이터 시각화

주도업체 기술 개요

Micorsoft Microsoft HoloLens

Fove O
기타
Razer OSVR

 다양한 HMD, AR 글래스를 활용한 빅데이터와 지능처리 기반의 혼합현실(MR) 기술의 도입


및 패러다임 전환이 가속화되고, 증강현실(AR)용 모바일 환경에서도 스마트폰 카메라를
이용하여 가상 캐릭터를 현실 환경에 있는 것처럼 보여주는 혼합현실(MR) 서비스 기술
개발에 초점

▪ AR/VR 서비스 생태계 구축의 필요성이 커짐에 따라 글로벌 기업들은 PC와 모바일을 대체할 컴퓨팅
플랫폼으로 관련 플랫폼 개발에 몰두

▪ 이 중 기술 플랫폼은 전체 플랫폼 생태계의 근간이 되는 영역으로 각 생태계의 영향력 확대를


목적으로 삼고 있음. 기술 플랫폼은 크게 수직통합, 오픈소스와 게임 엔진으로 구분. 개인 AR/VR
디스플레이 도구는 국내외 대기업들의 적극적인 투자로 인해 빠른 기술 개발이 이루어지고 있음

▪ 레노버가 CES 2018에서 세계 최초의 독립형 가상현실 헤드셋인 미라지 솔로(Mirage Solo)를 공개

▪ 미라지 솔로는 HMD에 적용된 센서와 카메라, 배터리 덕분에 PC나 스마트폰이 필요하지 않음

219
219
전략품목 현황분석

 해외 대기업과 스타트업은 우수한 기술력을 기반으로 다양한 제품을 선보이고 있는 반면,


우리나라의 기술수준은 선진기업과 큰 차이를 보이며, 대부분 저가의 장치위주의 생산 활동을
펼치고 있는 것으로 판단

 의료 분야에서 AR/VR은 모의 수술을 통한 의학 교육, 가상 재활 치료 등 다양한 분야에


걸쳐 적용 중이며, 특히 정신건강의학 분야에서는 각종 공포증이나 중독을 치료하는
노출치료법이 임상 활용 단계에 올라선 상황
▪ 노출치료는 특정 상황에서 나타나는 심리적인 고통을 겪고 있는 환자에게 계획적으로 고통스러운
상황에 놓이게 만들어 감정적 내성을 길러주는 행동 치료법

▪ 가상현실(VR)은 노출하고자 하는 상황에 대한 정밀한 조절이 가능하기 때문에, 전쟁이나 교통사고


등의 외상적 상황에 대한 회피, 불안, 재경험 등의 외상후스트레스장애(PTSD)를 겪는 환자를
치료하는 목적으로 적극적으로 활용

▪ 가천대학교 길병원은 2018년 1월 '가상현실 치료센터'를 설립해 PTSD와 공황장애를 본격적으로


치료할 계획이며, 추후 경도인지장애나 주의력결핍 과잉행동장애(ADHD)로 치료 분야를 확대할 예정

▪ 삼성서울병원은 암병원 내 주요시설을 둘러볼 수 있는 '암병원 VR' 앱을 출시해 환자들에게 미리


치료를 받을 장소와 과정을 안내해줘 환자들의 불안감이나 스트레스를 줄여주고 있으며, 가상현실
클리닉을 운영해 온 강남세브란스 병원은 삼성전자와 손잡고 VR로 정신건강을 관리하는 기술을 개발

220
220
데이터 3D 변환 시각화 도구

나. 주요기업 동향

(1) 해외업체 동향

 데이터 플래닛

▪ 개인 및 기업, 정부가 보유한 공공데이터를 라이브 에디터(Live Editor)를 활용해서 인터랙티브


시각화 라이브러리 서비스. 무료 차트 및 3D 입체 지도 제작의 데이터 시각화 서비스 제공

- 소셜이나 블로그, 웹사이트 등에 반영 가능

 마이크로소프트는 가상현실(VR)과 증강현실(AR)의 장점을 융합해 새로운 경험을 제공하는


혼합현실 (MR) 플랫폼을 구축하고 서비스 시작

▪ MR은 물리적인 현실과 가상 세계를 혼합한 광범위한 개념으로 기존의 VR과 AR을 모두 포함

▪ 윈도 MR 디바이스는 헤드셋에 카메라가 장착되어 있어, 시야 범위를 감지하고 외부 센서 없이


사용자의 위치를 정확하게 인식 가능하며, 삼성을 비롯해 레노버, HP 등 6개 사에서 판매

▪ ‘마인크래프트’ 같은 글로벌 게임은 물론 마이크로소프트 오피스와 업무 및 교육 콘텐츠 등 다양한


앱을 사용할 수 있음

 레노버(Renovo)는 VR 콘텐츠 제작 도구인 ‘미라지 카메라(Mirage Camera with


Daydream)’를 CES 2018에서 공개

▪ 유튜브의 새로운 3D VR180 포맷에서 실시간 스트리밍, 사진 및 비디오 촬영이 가능

▪ 180도 어안 카메라 2개를 탑재해 간편하게 180도 가상현실 동영상을 촬영할 수 있음

▪ 고가의 전문적 시스템이 필요하지 않고, 누구나 쉽게 가상현실 콘텐츠 제작이 가능

▪ 퀄컴 스냅드래곤835 칩을 사용했으며 2GB의 메모리, 16G의 내장 저장공간을 갖췄고 마이크로 SD


카드를 사용하면 최대 128GB까지 추가 가능 2018년 2분기, 229달러에 판매예정

221
221
전략품목 현황분석

 광학 기기 제조사 인스타360은 CES 2018에서 스마트폰 장착형 VR 카메라 ‘나노S’를 발표

▪ ‘나노S’는 애플 아이폰의 라이트닝 단자에 장착해 4K 해상도의 VR 영상 혹은 2,000만 화소의 VR


사진을 촬영할 수 있음

▪ 2016년부터 판매해온 ‘나노’에 비해 해상도가 높아지고 편의 기능이 추가

▪ 2~3개 카메라 앵글을 나눠 영상을 동시에 담는 멀티뷰 슈팅 기능, 전자식 흔들림 보정 기능 등


촬영과 관련된 소프트웨어가 강화됐고, 실시간 VR 채팅과 라이브 스트리밍, SNS 원터치 공유 지원
가격은 240 달러로 예상됨

 uDCV, uinnova
▪ 3D 시각화 플랫폼

- 시각화 기능, 대화형 드론 방식 전시 비행, 자산 관리, 용량/공간, 물리적 접근 보안, 환경, 케이블

▪ 3D 데이터 센터를 위한 데이터 통합 및 관리 플랫폼

▪ 업무 처리, 응용 프로그램, 가상 머신, 시스템, 네트워크, 스토리지 등 IT 아키텍처와 구성 요소를


실시간으로 시각화 가능

▪ Logical View

- 비즈니스, 응용프로그램, DB, 소프트웨어, 시스템, 호스트, 보안, 인터넷 등 종합적인 논리 아키텍처 시각화

▪ Holistic View

- 장애 영향 및 원인에 대한 진단과 분석

▪ Alarm Alerting

- 논리적 뷰에서 물리적 뷰까지의 전반적인 관계

222
222
데이터 3D 변환 시각화 도구

 구글은 AR플랫폼인 ARCore(2017년 8월), 데이드림(2016년 5월)을 공개하고 AR을


스마트폰으로 제공 중이며, 애플은 AR플랫폼인 ARKit을 출시(2017년 8월)한데 이어 애플용
웨어러블 AR 디바이스를 2020년에 출시할 예정

 마케팅, 관광, 건축, 자동차 등 이미 VR을 사용해 성과를 올리고 있는 산업 분야들이 존재


▪ 갭(Gap)은 고객들이 옷을 가상으로 입어볼 수 있도록 일련의 신체 사이즈와 키로 준비된 3D
마네킹을 제공하는 드레싱룸(DressingRoom) 앱을 보유

▪ 이베이(eBay) : 판매자가 적절한 크기의 USPS 포장을 찾고 운송 비용을 미리 확인할 수 있는


안드로이드AR앱 보유

▪ 이케아(Ikea) : iOS 플레이스(Place) 앱을 통해 쇼핑자는 자신의 집에 가구를 배치해 볼 수 있음

▪ 로우스(Lowe's)와 볼보(Volvo)는 고객들이 주방을 설계하고 신차의 내부를 가상으로 살펴볼 수


있도록 홀로렌즈를 사용

▪ 킴벌리 클락(Kimberly-Clark) : 소매점에서 아이들을 즐겁게 하기 위해 할로윈(Halloween) 게임을


개발, 유로스타(Eurostar) 열차에 탑승한 여행객들은 채널 터널(Channel Tunnel)을 통과해 창밖에
깜깜할 때 스마트폰을 사용해 숨겨진 물고기와 인어의 세계를 볼 수 있음

▪ 오토데스크(Autodesk), 솔리드웍스(SolidWorks), 트림블 커넥트(Trimble Connect), 스케치업(SketchUp)


등의 CAD 도구는 현재 AR과 VR을 지원

▪ VR 산업화 적용도구

- 뷰포리아 스튜디오(Vuforia Studio),


- VR에서 3D로 스케치하기 위한 그래비티 스케치(Gravity Sketch),
- 회의 도구가 내장된 월드비즈(Worldviz)의 비저블(Vizible) 같은 VR전용 디자인 도구

223
223
전략품목 현황분석

(2) 국내업체 동향

 사이람의 넷마이너는 다양한 데이터 형식의 지원, 데이터의 변환 및 순환적 프로세스,


융복합적 분석방법 등과 같은 독창적인 기능을 제공
▪ 소셜 네트워크 분석 응용솔루션 및 컨설팅을 제공하며 대규모 소셜 네트워크 및 데이터 간의 관계를
계량적으로 분석해 패턴을 파악하고 시각화하는 기능 제공

▪ 넷마이너는 숙달되지 않은 사용자들을 위한 자동스크립트 생성기를 갖춘 파이썬 기반의 내부 스트립트 엔진을 탑재

▪ 소셜네트워크분석 소프트웨어 최초로 Actual 3D맵 지원

[ 넷마이너 3D 네트워크 맵 ]
 가상현실 솔루션 제공 업체 넥스트이온은 한국전자통신연구원(ETRI)과 협력해 모바일
기기에서 전용 하드웨어 없이 360도 VR 콘텐츠를 제작할 수 있는 유브이알(YouVR) 기술을
개발·상용화
▪ 360도 VR 콘텐츠를 제작하려면 멀티카메라 리그와 같은 전용 하드웨어와 여러 개 카메라로 동시에
사진을 찍고 이 사진을 연결하는 스티칭(stitching) 소프트웨어가 필요

▪ ETRI가 개발한 유브이알은 무선으로 연결된 로테이터(rotator)를 이용해 360도 VR 사진을 촬영하면
자체 개발된 스티칭 알고리즘이 사진을 생성해 360도 VR 콘텐츠를 제작 가능

▪ 또한 사용자가 스마트폰을 들고 원하는 장소에서 360도 회전하면서 촬영하면 VR 콘텐츠가 생성됨

 KT는 IPTV 서비스 ‘올레 tv’에서 업계 최초로 ‘실시간 모션인식 증강현실(AR)’ 기술을 적용,
양방향 놀이학습 서비스가 가능한 ‘TV쏙 2.0’을 시범 출시
▪ ‘TV쏙 2.0’은 KT가 출시한 IPTV ‘하이퍼 VR’ 서비스 ‘TV쏙’에 ‘실시간 모션인식 AR’ 기술을 적용해
양방향 놀이학습 기능을 강화한 서비스

▪ 2018년 1월 초부터는 기가지니 이용 고객, ‘올레 tv UHD’ 상품 중 ‘올레 tv 라이브’ 수신방식을


이용하는 고객 대상으로 상용화할 계획

▪ KT는 AR 교육 콘텐츠를 다양한 영역으로 확대하고 모션인식 체험이 가능하도록 제공할 예정

224
224
데이터 3D 변환 시각화 도구

 팝스라인은 중국 최대 O2O 플랫폼 메이퇀·디엔핑과 파트너십을 맺고 유저가 360VR


동영상을 활용해 쇼핑을 즐길 수 있는 마케팅·쇼핑 플랫폼 제공

▪ 유저는 영상 속에서 '마커'를 클릭해 물건 상세 정보를 볼 수 있으며, 연계된 쇼핑몰로 넘어가거나


물건을 계산하는 것도 가능

 해든브릿지는 VR을 활용한 영상회의 솔루션을 개발해 중국과 인도로 수출


▪ 영상회의 참석자가 VR 콘텐츠 속에 나타나는 방식으로, 공간 전체를 조망하면서 회의에 참여할 수
있어 몰입감이 높음

 티라움랩(T.Raum Lab) : VR, VR360, Real Time 3D 시뮬레이션 솔루션을 통해 건축,


인테리어 관련 산업에 디지털 시각화 솔루션을 제공

 애슬릿미디어 : 야구 경기의 투구·타구 추적데이터를 분석·가공해 3D 시각화 솔루션

 데이터킹

▪ 파노라마 사진을 360˚VR 콘텐츠로 만들 수 있는 저작 도구 프로그램 ‘360헥사곤(360Hexagon)’을


출시, 웹 브라우저상에서 프로그램 설치 없이 로그인만으로 파노라마 사진에 3D오브젝트를 편집할
수 있는 저작 도구

225
225
전략품목 현황분석

다. 특허 동향

◎ 데이터 3D 변환 시각화 도구 기술 분야 특허상 주요 기술

 주요 기술
▪ 데이터 3D 변환 시각화 도구 기술 분야는 데이터의 이미지 변환 및 정보 추출, 2D-3D BIM 맵핑,
가상현실(VR), 증강현실(AR), 빅데이터 수집기술, 빅데이터 시각화 처리기술, 빅데이터 시각화 서버
기술 등을 포함함

요소기술 코드 설명
데이터의 이미지 변환 및 정보 수집된 데이터를 이미지로 시각화하여 필요한 정보를
A
추출 추출하는 기술
2D 시각 데이터를 BIM (Building Image Modelling)을
2D-3D BIM 맵핑 B
이용하여 3D로 변환하는 기술

현실 공간과 사물에 증강된 디지털 콘텐츠를


가상현실(VR) C 내재시킴으로써 사용자에게 보다 많은 체험 서비스를
제공하는 기술

기술은 컴퓨터로 만든 가상공간 내에서 사용자의


시각·청각·촉각 등 감각정보를 확장·공유함으로써 공간적,
증강현실(AR) D 물리적 제약에 의해 현실세계에서 실질적으로 경험하지
못하는 상황을 실감적으로 체험할 수 있게 하는 총체적
기술

외부 데이터 저장소 종류, 데이터 형식, 데이터 타입,


빅데이터 수집기술 E 해당 스키마, 해당 테이블, 해당 컬럼, 데이터 크기 등의
정보를 기반으로 데이터를 수집하는 빅데이터 수집 기술

적어도 하나의 3D 템플릿 레이아웃과 분석된 유효


빅데이터 시각화 처리기술 F 데이터들을 매칭시켜 3D 인포그래픽 데이터 파일을
생성하는 시각화 처리 기술

복수의 3D 템플릿 레이아웃 모델들을 생성하거나


네트워크를 통해 외부로부터 불러들여 복수의 3D
빅데이터 시각화 서버 기술 G
템플릿 레이아웃 모델을 형성하고 각각의 3D 템플릿
레이아웃 모델들을 저장하는 서버 기술

226
226
데이터 3D 변환 시각화 도구

◎ 세부 분야별 특허동향

 주요 기술별 출원인 국적별 특허동향

▪ 데이터 3D 변환 시각화 도구 기술의 요소기술별 주요 출원인 국적별특허정보 데이터 입수하였으며,


최근 10년간의 특허데이터를 비교 분석함

요소기술 한국 미국 일본 유럽 기타 계
데이터의 이미지 변환 및 정보 추출 117 47 98 20 34 316

2D-3D BIM 맵핑 19 12 6 2 12 51

가상현실(VR) 21 22 18 10 9 80

증강현실(AR) 19 15 0 7 8 49

빅데이터 수집기술 123 174 54 21 87 459

빅데이터 시각화 처리기술 129 276 264 130 114 913

빅데이터 시각화 서버 기술 101 102 108 43 42 396

합계 529 648 548 233 306 1,958

▪ 국가별 요소기술별 출원인 국적별 특허동향에서 미국 국적의 출원인이 가장 활발한 연구개발을 하고


있으며, 그 다음으로는 일본, 한국 ,유럽 국적 출원인 순으로 나타남

▪ 데이터의 이미지 변환 및 정보 추출 기술 분야에서는 한국 국적의 출원인이 가장 많은 비중을


차지하고 있으며, 유럽 국적의 출원인이 상대적으로 적은 출원량을 보유

▪ 2D-3D BIM 맵핑 기술, 증강현실(AR) 기술, 가상현실(VR) 기술은 전체적으로 관련 특허 출원


실적이 미미

▪ 빅데이터 수집기술 기술 분야에서는 미국 국적의 출원인이 가장 많은 출원을 하고 있으며, 유럽


국적의 출원인이 상대적으로 적은 출원량을 보이고 있음

▪ 빅데이터 시각화 처리 기술 분야에서는 미국 국적의 출원인이 가장 많은 출원을 하고 있으며, 한국


국적의 출원인이 상대적으로 적은 출원량을 보이고 있음

▪ 빅데이터 시각화 서버 기술 분야는 일본 국적의 출원인이 가장 많은 출원을 하고 있으며, 유럽


국적의 출원인이 상대적으로 적은 출원량을 보이고 있음

227
227
전략품목 현황분석

▪ 관점을 국내·외 출원인으로 바꾸어 보면 한국 국적의 출원인은 빅데이터 시각화 처리기술과


빅데이터 시각화 서버 기술에 집중하고 있으며 외국 국적의 출원인은 빅데이터 시각화 처리기술에
집중하고 있는 것으로 나타남

▪ 한국 국적의 출원인의 특허 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는
경향을 보이고 있음

▪ 외국 국적의 출원인의 특허 출원량은 최근 다소 감소하는 경향을 보이고 있으며 특히 빅데이터


시각화 처리기술은 2015년을 기점으로 다소 감소 추세

228
228
데이터 3D 변환 시각화 도구

 주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•Toshiba •대기업 중심
데이터의 이미지 변환 및
정보 추출
◓ •SAMSUNG MEDISON •SAMSUNG MEDISON,
•Toshiba Medical Systems 연세대학교, 홍익대학교 등

•HITACHI MEDICAL
•한국건설기술연구원 •공공연구기관 중심
2D-3D BIM 맵핑 ◯ •SHENZHEN MINDRAY •한국건설기술연구원,
BIO-MEDICAL 서울시립대학교, 차후 등
ELECTRONICS
•Toshiba Medical Systems
•중소기업 중심
가상현실(VR) ◯ •Sirona Dental Systems
•(주)뮤테이션, (주)부품디비,
•Verizon Patent and
(주)휴톰 등
Licensing
•Siemens Healthcare
•대기업 중심
증강현실(AR) ◯ •WORLD AWARD
ACADEMY
•LG Electronics,, SAMSUNG
MEDISON 등
•Lytro
•대기업 중심
•Hitachi
빅데이터 수집기술 ◕ •IBM
•포스코아이씨티,
한국전자통신연구원,
•포스코아이씨티
에스케이텔레콤 등
•Toshiba Medical Systems •대기업 중심
빅데이터 시각화 처리기술 ● •Toshiba •Samsung Medison, Samsung
•Samsung Medison Electronics등

•Toshiba Medical Systems •대기업 중심


빅데이터 시각화 서버 기술 ◓ •Toshiba •Samsung Medison, 건국대학교,
•Samsung Medison 한국건설기술연구원 등

※ ●:추출건수의 30%이상, ◕: 30~20%, ◓: 20~10%, ◔: 10~5%, ◯: 5% 미만

229
229
전략품목 현황분석

 데이터의 이미지 변환 및 정보 추출 분야 주요 출원인 동향

▪ 데이터의 이미지 변환 및 정보 추출 분야는 Toshiba가 가장 많은 특허를 보유하고 있으며 그


다음으로는 SAMSUNG MEDISON과 Toshiba Medical Systems 순으로 다수의 특허를 보유

 2D-3D BIM 맵핑 기술 분야 주요 출원인 동향

▪ 2D-3D BIM 맵핑 기술 분야는 Toshiba Medical Systems가 가장 많은 특허를 보유하고 있으며 그


다음으로는 한국건설기술연구원, SHENZHEN MINDRAY BIO-MEDICAL ELECTRONICS 등이 많은
특허를 출원

 가상현실(VR) 기술 분야 주요 출원인 동향
▪ 가상현실(VR) 기술 분야는 Toshiba Medical Systems가 가장 많은 특허를 보유하고 있으며, 그
다음으로는 Sirona Dental Systems, Verizon Patent and Licensing 등이 많은 특허를 보유

 증강현실(AR) 기술 분야 주요 출원인 동향

▪ 증강현실(AR) 기술 분야는 Siemens Healthcare가 가장 많은 특허를 보유하고 있으며. 그


다음으로는 WORLD AWARD ACADEMY가 다수의 특허를 보유

 빅데이터 수집기술 분야 주요 출원인 동향

▪ 빅데이터 수집기술 분야는 Hitachi가 가장 많은 특허를 보유하고 있으며 그 다음으로는 IBM,


포스코아이씨티 등이 많은 출원

 빅데이터 시각화 처리기술 분야 주요 출원인 동향

▪ 빅데이터 시각화 처리기술 분야는 Toshiba Medical Systems가 가장 많은 특허를 보유하고 있으며
그 다음으로는 Toshiba, Samsung Medison 등이 많은 특허를 출원

 빅데이터 시각화 서버 기술 분야 주요 출원인 동향


▪ 빅데이터 시각화 서버 기술 분야는 Toshiba Medical Systems가 가장 많은 특허를 보유하고
있으며 그 다음으로는 Toshiba, Samsung Medison 등이 많은 특허를 출원하고 있음 특허를 출원

230
230
데이터 3D 변환 시각화 도구

◎ 국가별 특허활동지수(AI) 비교

 특허활동지수(Activity Index)는 상대적 집중도를 살펴보기 위한 지표로서, 그 값이 1보다 큰


경우에는 상대적 특허활동이 활발함을 나타냄

 한국은 빅데이터 시각화 처리기술 기술분야에 서는 특허활동이 부진하나, 증강현실(AR)


기술분야의 특허출원은 활발한 것으로 나타남

 미국은 데이터의 이미지 변환 및 정보 추출 기술분야에 서는 특허활동이 부진하나, 빅데이터


수집기술 분야의 특허출원은 활발한 것으로 나타남

 일본은 증강현실(AR) 기술분야에서는 특허활동이 부진하나, 데이터의 이미지 변환 및 정보


추출 기술분야의 특허출원은 활발한 것으로 나타남

 유럽은 2D-3D BIM 맵핑 기술분야에서는 특허활동이 부진하나, 증강현실(AR) 기술분야의


특허출원은 활발한 것으로 나타남

231
231
전략품목 현황분석

◎ 질적 수준을 고려한 각국의 시장력 분석

 시장력이 전체 평균 1.22를 상회하는 국가로는 미국, 이스라엘이며, 질적인 수준이 높은 특허


보유국도 미국, 이스라엘로 조사됨

▪ 한국은 시장력 면에선 전체 평균보다 낮으며 질적 수준도 낮은 것으로 나타남

▪ 이스라엘은 시장성과 질적인 수준에서 평균 이상인 것으로 나타났으나 출원량은 높지 않은 것으로 나타남

▪ 독일은 질적 수준은 다소 낮지만 시장성은 평균 정도에 속하는 것으로 조사됨

PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
JP 548 1.096715 0.532258

KR 529 1.10397 0.473684

US 648 1.371914 2.283465

DE 144 1.215278 0.933333

IL 11 1.545455 2.75

전체평균 2264 1.219081 1.286638

◎ 데이터 3D 변환 시각화 도구 기술 분야의 주요 경쟁기술 및 공백기술

 데이터 3D 변환 시각화 도구 기술 분야의 주요 경쟁기술은 빅데이터 시각화 처리기술,


빅데이터 수집기술, 데이터의 이미지 변환 및 정보 추출 기술이, 공백기술은 2D-3D BIM
맵핑, 가상현실(VR), 증강현실(AR) 기술로 나타남

▪ 데이터 3D 변환 시각화 도구 기술 분야에서 빅데이터 시각화 처리기술이 가장 경쟁이 치열한


분야이고, 증강현실(AR) 기술 분야는 아직까지 출원이 활발하지 않은 공백기술 분야로 나타남

요소기술 기술 집중도
데이터의 이미지 변환 및 정보 추출 ◓
2D-3D BIM 맵핑 ◯
가상현실(VR) ◯
증강현실(AR) ◯
빅데이터 수집기술 ◕
빅데이터 시각화 처리기술 ●
빅데이터 시각화 서버 기술 ◓
※ ●:추출건수의 30%이상, ◕: 30~20%, ◓: 20~10%, ◔: 10~5%, ◯: 5% 미만

232
232
데이터 3D 변환 시각화 도구

◎ 최신 국내 특허기술 동향

요소기술 최근 핵심기술 동향

데이터의 이미지 변환 및 정보 추출 •정보 디스플레이 방법, 디바이스, 및 시스템

•3차원 BIM 객체 모델을 이용한 3차원 모니터링 서버


2D-3D BIM 맵핑
및 이를 포함하는 3차원 모니터링 시스템

가상현실(VR) •가상 현실 기반 사용자 맞춤형 훈련 시스템

증강현실(AR) •증강현실 애플리케이션을 접목한 제품현시시스템

빅데이터 수집기술 •빅데이터 기반의 에너지 소모량 시뮬레이션 방법

•3차원 공간 정보 구축을 위한 빅데이터 시스템의 연계


빅데이터 시각화 처리기술
장치 및 방법

•영상분석을 활용한 가상 실제(CPS) 물류 통합관제


빅데이터 시각화 서버 기술
시스템

 국내 특허동향을 살펴보면 대기업은 데이터의 이미지 변환 및 정보 추출, 증강현실(AR),


빅데이터 시각화 처리기술, 빅데이터 시각화 서버 기술을, 공공연구기관은 2D-3D BIM 맵핑
기술을 집중적으로 연구개발하고 있는 것으로 나타남

▪ 데이터의 이미지 변환 및 정보 추출 기술에서는 정보 디스플레이 방법, 디바이스, 및 시스템 기술


등이 연구 개발 진행 중

▪ 2D-3D BIM 맵핑 기술 분야는 3차원 BIM 객체 모델을 이용한 3차원 모니터링 서버 및 이를


포함하는 3차원 모니터링 시스템 기술 등이 연구 개발 진행 중

▪ 가상현실(VR) 기술에서는 가상 현실 기반 사용자 맞춤형 훈련 시스템 기술 등이 연구 개발 진행 중

▪ 증강현실(AR) 기술 분야는 전체적으로 관련 특허가 거의 없는 분야로서 증강현실 애플리케이션을


접목한 제품현시시스템 등이 연구 개발 진행 중

▪ 빅데이터 수집기술에서 빅 데이터 기반의 에너지 소모량 시뮬레이션 방법 등이 연구개발 되고 있음

▪ 빅데이터 시각화 처리기술에서 3차원 공간 정보 구축을 위한 빅데이터 시스템의 연계 장치 및 방법


등이 연구개발 되고 있음

▪ 빅데이터 시각화 서버 기술에서 영상분석을 활용한 가상 실제(CPS) 물류 통합관제 시스템 등이


연구개발 되고 있음

233
233
전략품목 현황분석

◎ 중소기업 특허전략 수립 방향 및 시사점

 데이터 3D 변환 시각화 도구 기술 분야의 공백기술 분야는 증강현실(AR) 기술이고


중소기업의 시장진입 상대적으로 수월한 분야는 가상현실(VR) 기술로 나타남

▪ 데이터 3D 변환 시각화 도구 기술 분야는 정보의 고도화가 가속화됨에 따라 컴퓨터 공간상에서


다루어지는 공간 정보데이터가 2차원데이터에서 3차원 데이터로 확장되고 있으며 한국 국적의
출원인의 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는 추세를 보이고 있음

▪ 향후 중소기업은 대기업들의 경쟁이 치열한 빅데이터 시각화 처리기술 보다는 시장진입이 상대적으로
용이한 증강현실(AR) 기술과 중소기업을 중심으로 연구개발되고 있는 가상현실(VR) 기술 분야에
집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한 2D-3D BIM 맵핑 기술 분야에서 기술
매입이나 라이센싱 등을 통해 부족한 연구개발능력을 보완하는 것이 바람직할 것으로 사료됨

234
234
데이터 3D 변환 시각화 도구

4. 연구개발 네트워크

가. 연구개발 기관/자원

◎ 연구개발 기관

▪ 한국전자통신연구원

- 차세대콘텐츠연구본부 CG/Vision기술연구그룹 : 세대 컴퓨터그래픽스/비전기술, 영상 특수효과


기술(모델링/렌더링/시뮬레이션), 3D/4D프린팅 콘텐츠기술, 헤리티지 콘텐츠기술, 합성전장 생성
및 가시화기술 개발
- 차세대콘텐츠연구본부 VR/AR기술연구그룹 : 디지털테마파크기술, 콘텐츠 연동 실감 감상음향기술,
VR/AR/MR 융‧복합 콘텐츠기술, 가상현실/증강현실 게임콘텐츠기술, 체험형/스포츠 게임콘텐츠기술,
융복합 엔터테인먼트콘텐츠기술, VR콘텐츠 서비스 플랫폼 기술, 영상기반 인체 모션/형상
획득/분석/피팅기술, 플렌옵틱 영상콘텐츠 생성/편집/제작기술 개발
- 미디어연구본부 테라미디어연구그룹
- 미디어연구본부 실감AV연구그룹
- 미디어연구본부 미디어전송연구그룹
- 네트워크연구본부 광네트워크연구그룹
- 미래이동통신연구본부 기가통신미래기술연구그룹
- 전파위성연구본부 전파자원연구그룹
- SW기반기술연구본부
- 지능정보연구본부

▪ 전자부품연구원

- 정보통신미디어연구본부 VR/AR 연구센터 : 인지감성컴퓨팅, 실감UI/UX 서비스, 실감미디어


저작도구 SW, 가상훈련SW시스템, 현실-가상세계 융합기술, 실감 응용 시스템 기술 등 연구개발
- 정보통신미디어연구본부 지능형영상처리연구센터 : 영상기반인식기술(객체,제스처,보행자,장면등),
다중객체추적기술, 깊이정보처리기술, 3D 프린팅 그래픽기술, 3D 모델 슬라이싱기술, 영상/3D
그래픽 Segmentation 기술, UHD/3D 영상코덱, 영상전처리기술, 미디어 신호처리기술, 영상처리
IP 및 칩설계 기술 등 연구개발

▪ 한국과학기술연구원

- 로봇미디어연구소 영상미디어연구단

▪ 동신대학교

- 실감미디어기반조성사업단

▪국민대학교

- 데이터 분석 및 설계 연구실

▪ 미래기술교육연구원

- AR/VR을 위한 주요 핵심 요소기술 개발과 적용방안 전문가 과정

235
235
전략품목 현황분석

◎ 연구개발 자원

과제명 기간, 예산 수행기관 주요내용


▪ 병렬형 과제의 총괄과제로서, 증강현실을 위한 핵심
알고리즘들*의 개발, 고도화, 모바일 환경에
(병렬-총괄과제, SW원천)
한국전자통신연구원(주관), 최적화하고, 오픈소스로 공개할 예정
실내외 임의공간 실시간 4년,
한양대학교, ㈜맥스트, * 실내외 임의공간에서 착용형/모바일 카메라를
영상 합성을 위한 핵심 94억 원
㈜코스코이 이용한 위치추출, 배경 3D 구조의 실시간 복원 및
원천기술 및 개발툴킷 개발
배경과 객체의 분리, 실시간 영상 증강 합성 및
가변연체정합 가시화 등

서울대학교(주관),
(병렬-1세부과제, 인하대학교, 숭실대학교, ▪ 2세부과제에서 개발되는 AR 스마트글래스와
AR수술) AR기반 4년, 분당서울대학교병원, 총괄과제에서 개발되는 핵심알고리즘을 기반으로,
수술용 개발툴킷 37.5억 원 연세대학교, 증강현실기반 수술응용시스템을 위한 개발툴킷 및
및 응용개발 ㈜에스디옵틱스, 응용시스템을 개발
㈜다울이엔에스

(병렬-2세부과제,
AR디바이스)
가상·증강현실 4년, ㈜엘비전테크(주관), ▪ 디바이스 원천과제의 연구결과를 활용하여 환자의
핵심 부품/모듈을 적용한 AR 20억 원 ㈜세솔, 한국광기술원 처치(수술, 진단 등)를 위한 스마트글래스를 개발
수술지원
스마트글래스 개발

전자부품연구원(주관), ▪ 가상증강현실 디바이스에 필요한 광학계 등 핵심


(디바이스 원천)
4년, 한국광기술원, 디스플레이 부품 및 전용 프로세싱 모듈과
가상·증강현실 디바이스용
56억 원 한국과학기술원, 산업응용 확산을 위한 기능 확장 모듈에 필요한
핵심 부품 원천기술 개발
한국전자정보통신산업진흥회 원천기술과 핵심 부품 및 모듈을 개발

(AR스포츠) 스마트글래스 알바이오텍(주)(주관), ▪ 본 과제는 실내외 스마트글래스 기반으로 고속


4년,
기반 AR 구기스포츠 훈련 ㈜리얼야구존, 서울대학교, 동작분석 및 사용자의 시선방향을 고려한 실시간
42.75억 원
플랫폼 기술 한양대학교) 증강합성을 통한 AR 스포츠 훈련 플랫폼 기술 개발

나. 연구개발 인력

▪ 전자부품연구원

▪ 한국정보통신연구원

▪ 동신대학교

▪ 국민대학교

▪ 한국과학기술연구원

236
236
데이터 3D 변환 시각화 도구

5. 기술개발로드맵

가. SWOT 분석

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•(환경) 거대자본의 대기업 중심의 산업 생태계 조성으로
•(환경) 빅데이터 관련 우수한 전방, 후방 인프라 구축
인한 산업 내 약한 중소기업의 입지
•(기술) 데이터 3D 변환에 활용 가능한 글로벌 수준의
•(기술) 세계 선두 기업에 비하여 핵심 원천기술 미흡
ICT 및 IoT 경쟁력
•(정책) 산업계 연계성이 낮은 법과 세계 트렌드에 뒤쳐진
•(정책) 중앙정부의 해당 산업 지원 정책 수립
제도적 지원

기회(Opportunity) 위협(Threat)
•(환경) 시각 데이터 활용 기반의 교육 및 의료 시장의
확대에 따라 기대되는 수요 증가 •(기술) 글로벌 업체와의 기술격차 심화
•(기술) 기반기술 연구·개발로 누적된 기술 데이터 활용 가능 •(정책) 빅데이터 활용에 따른 보안 문제 대두
•(정책) 정부와 업계의 높은 니즈에 따라 높은 발전가능성

중소기업의 시장대응전략
➜ 빅데이터와 AR/VR 기술을 기반으로 건축, 의료, 교육, 제조, 조선 등에 적용한 제품 개발로
시장대응

➜ 적은 비용으로 상용화된 3D 변환 도구 등을 활용하여 데이터 시각화를 통한 중소기업의 이윤


추구와 선두 그룹들을 벤치마킹함과 동시에 아이디어 중심의 새로운 시장 발굴

나. 중소기업 핵심요소기술

(1) 핵심요소기술 도출절차

 특허/논문 분석을 통한 요소기술과 기술수요와 각종 문헌을 기반으로 한 요소기술, 전문가


추천 요소기술을 종합하여 품목별 전문가를 통해 분류조정한 후, 전문가 평가과정을 거쳐
핵심요소기술을 선정
- 기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업 적합성(10)을 고려하여 평가

요소기술 요소기술 핵심요소기술 핵심요소기술


Pool 구성 분류 조정 선정평가 선정

- 특허/논문 분석 è - 품목별 전문가 è - 산학연 전문가 검토 è - 평가결과 반영


- 기술수요 및
요소기술 분류 - 평가항목별 요소기술 로드맵 기획 대상
문헌분석
조정·재정의 선정평가 핵심요소기술 도출
- 전문가 추천

237
237
전략품목 현황분석

(2) 요소기술

 산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처 로드맵, 중소기업 기술수요를 바탕으로
로드맵 기획을 위하여 요소기술 도출

 요소기술을 대상으로 전문가를 통해 기술의 범위, 요소기술 간 중복성 등을 조정·검토하여


최종 요소기술 확정

[ 데이터 3D 변환 시각화 도구 분야 요소기술 ]

요소기술 출처

데이터의 이미지 변환 및 정보 추출 특허/논문 분석, 전문가추천

2D-3D BIM 맵핑 특허/논문 분석, 전문가추천

가상현실(VR) 특허/논문 분석, 전문가추천

증강현실(AR) 특허/논문 분석, 전문가추천

빅데이터 수집기술 특허/논문 분석, 전문가추천

대용량 텍스트 분석 기술 특허/논문 분석, 전문가추천

다차원 통계 분석 기술 특허/논문 분석, 전문가추천

빅데이터 시각화 처리기술 특허/논문 분석, 전문가추천

빅데이터 시각화 서버 기술 특허/논문 분석, 전문가추천

238
238
데이터 3D 변환 시각화 도구

(3) 핵심요소기술 도출

 확정된 요소기술을 대상으로 산․학․연 전문가로 구성된 핵심요소기술 선정평가를 통하여


중소기업에 적합한 핵심요소기술 선정

[ 데이터 3D 변환 시각화 도구 분야 핵심요소기술 ]

분류 핵심요소기술 설명

데이터의 이미지 변환 및 수집된 데이터를 이미지로 시각화 후 추출된 자료 중 필요한


정보 추출 정보를 획득하는 기술
데이터 처리
및 시각화
빅데이터 분석을 통해 도출된 2D데이터를 BIM (Building
2D-3D BIM 맵핑
Image Modelling)을 이용하여 3D로 변환하는 기술

현실 공간과 사물에 증강된 디지털 콘텐츠를 내재시킴으로써


가상현실(VR)
사용자에게 보다 많은 체험 서비스를 제공하는 기술

AR/VR 기술
컴퓨터로 만든 가상공간 내에서 사용자의 시각·청각·촉각 등
감각정보를 확장·공유함으로써 공간적, 물리적 제약에 의해
증강현실(AR)
현실세계에서 실질적으로 경험하지 못하는 상황을 실감적으로
체험할 수 있게 하는 총체적 기술

외부 데이터 저장소 종류, 데이터 형식, 데이터 타입, 해당


빅데이터 수집기술 스키마, 해당 테이블, 해당 컬럼, 데이터 크기 등의 정보를
기반으로 데이터를 수집하는 빅데이터의 대표적 기술

빅데이터 적어도 하나의 3D 템플릿 레이아웃과 분석된 유효 데이터들을


빅데이터 시각화 처리기술
기반 기술 매칭시켜 3D 인포그래픽 데이터 파일을 생성하는 시각화 처리 기술

복수의 3D 템플릿 레이아웃 모델들을 생성하거나 네트워크를 통해


빅데이터 시각화 서버 기술 외부로부터 불러들여 복수의 3D 템플릿 레이아웃 모델을 형성하고
각각의 3D 템플릿 레이아웃 모델들을 저장하는 서버 기술

239
239
전략품목 현황분석

다. 기술개발전략

(1) 우리의 현황

 국내 데이터 3D 변환 시각화 도구 분야에서의 관련 시장 규모는 2,987억 원이며 세계


시장은 654억 5,000만 달러 규모인 것으로 파악

 국내 시장 성장률은 24.7%로 세계 시장 성장률인 10.6%보다 높은 수치를 보임

 국내 중소기업의 데이터 3D 변환 시각화 도구 분야 기술 수준은 세계 최고수준을 보유한


미국(100%)를 기준으로 58.8%, 4.96년의 기술격차를 보이는 것으로 조사됨

 특허 출원량은 529건으로 미국의 648건에 비해 다소 낮은 수치

 특허 피인용지수는 이스라엘이 2.8로 가장 높은 수치이며 국내는 0.5로 분석됨

[ 데이터 3D 변환 시각화 도구 전략 캔버스(Strategy Canvas) ]

* 기술수준은 응답자 평균치

240
240
데이터 3D 변환 시각화 도구

(2) 기술개발로드맵

 정보의 고도화가 가속화 됨에 따라 공간 데이터가 2차원에서 3차원으로 확장되고 있음

 중소기업들은 빅데이터 시각화 처리 기술 보다는 데이터 3D 변환과 관련 있는 증강현실(AR)


과 가상현실(VR) 분야에 집중하여 연구를 하는 것이 시장력을 향상 시키는데 도움이 될
것으로 분석

 특히 가상현실(VR)은 현재 중소기업들이 많이 연구를 하고 있는 상대적으로 수월한


분야이므로 기술 매입이나 선진 기업들과의 라이센스 체결을 통해 부족한 연구 개발 능력을
보완하는 방안을 고려

241
241
※ 참고 : 핵심요소기술 평가결과

지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성

데이터의 이미지 변환 및
정보 추출 8.4 7.6 7.8 8.6 32.4 선정

2D-3D BIM 맵핑 6.4 7.6 7.6 6.8 28.4 선정

가상현실(VR) 7.8 8 7.4 8.2 31.4 선정

증강현실(AR) 7.8 7.8 7.2 8.6 31.4 선정

빅데이터 수집기술 7.6 8.4 7.4 8.2 31.6 선정

대용량 텍스트 분석 기술 7.6 8.2 7.4 8.2 31.4

다차원 통계 분석 기술 7.6 7.6 7 8.6 30.8

빅데이터 시각화 처리기술 8.2 7.2 7.4 8.2 31 선정

빅데이터 시각화 서버기술 8.2 7.8 7 8 31 선정

242
전략품목 현황분석

감성정보 분석 서비스

243
244
감성정보 분석 서비스

정의 및 범위

▪ 감성정보 분석 서비스란 인간의 감정 관련 빅데이터를 바탕으로 이용자의 감성 패턴을 분석하여, 이용자의


감성에 맞는 음악, 서비스, 또는 현재 상태에서 필요한 정보를 추천, 제공하는 서비스

▪ 감성 분석(Sentiment Analysis)은 ‘오피니언 마이닝(Opinion Mining)’으로도 불리는데, 이는 텍스트에 나타난


사람들의 태도, 의견, 성향과 같은 주관적인 데이터를 분석하는 자연어 처리 기술을 포함

정부지원 정책

▪ 5대 기술분야 영역 설정 및 투자 전략 마련(기초, 핵심, 기반, 융합, 제도 개선)

▪ R&D 투자 프로세스 혁신(R&D PIE), 기술 분류체계 정비 등을 추진하여 4차 산업혁명에 선제적 대응

▪ 국가 빅데이터 지원체계 확립(공공·민간 빅데이터 전문센터 구축 등), 핵심 네트워크 인프라 구축(5G 세계최초
상용화), 핵심인력 양성(~‘22, 4.6만명)

▪ 핵심 선도사업 등에 대하여 ‘규제 샌드박스’본격 추진(기존 규제 적용을 탄력적으로 유예·면제해주는 제도)

▪ AI, 빅데이터 등 4차 산업혁명의 핵심동인이 되는 요소기술 투자확대를 통해 글로벌 수준의 기술역량 확보

▪ AI 학습용 데이터(지식베이스) 구축(AI 허브 사업 ­ NIA/NIPA 사업)


- 산업적으로 활용가치가 높은 인공지능 학습용 데이터셋(지식베이스) 구축 및 개방
- 복합 인지 AI개발을 위한 멀티모달 영상 데이터 구축(상황·감정인식 학습지원 정보 부착)

▪ 인공지능 전문기업 육성(중소·중견기업 대상 ‘19년 총 26.25억 원, 총 7개 과제 내외 지원)

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•세계수준의 ICT 인프라, 역량, 제조 경쟁력 보유 •대기업 중심의 기업 생태계로 중소·벤처 활성화를 통한
산업의 다양성과 기술력·성장역량 확보 부진
•정부의 혁신형 중소기업 육성, 신기술·신산업 창출 지원
- 간접지원(세액공제 등)을 확대하고 바우처 등 중소기업의 •우수 기술인력의 중소기업 기피로 산업 활력 저하 우려
시장경쟁력을 높여주는 R&D지원 확대 •기술수준·교육시스템 등 4차 산업혁명 적응도 평가, 세계
- ‘22년까지 중소기업 전용 R&D ’17년 대비 2배 확대 추진 25위에 불과(UBS, ‘16)

기회(Opportunity) 위협(Threat)
•핵심 선도사업 등에 대하여 ‘규제 샌드박스’ 본격 추진 •사업관리 중심의 연구제도, 창의·도전적 연구를 가로막는
•정부 중소·중견기업 대상 인공지능 전문기업 육성 연구관리 행정부담 개선 필요
(‘19년 총 26.25억 원, 총 7개 과제 내외)•시장의 급성장에 따라 정부의 주도권이 상실되었음에도
•혁신성장 옴부즈만을 본격 운영하여 현장의 애로사항을 불구하고 여전히 정부 주도의 추격형 전략을 지속하여
해소하고 기업의 혁신 지원을 위한 규제개선 추진 민간과 중복 문제 발생

중소기업의 시장대응전략
➜ 규제 샌드박스 제도를 활용하여 중소기업의 장점인 속도와 유연성으로 대기업보다 빠르게 시장 선점
➜ 산학연 및 대-중견-중소기업 협력에 기반해 자체적으로 진행하기 어려웠던 R&D 진행
➜ 정부 R&D사업과 현장실습 프로그램 연계로 부족한 인력 확충하여 경쟁력 제고
전략품목 현황 분석

1. 개요

가. 정의 및 필요성

 감성정보 분석 서비스란 인간의 감정 관련 빅데이터를 바탕으로 이용자의 감성 패턴을


분석하여, 이용자의 감성에 맞는 음악, 서비스, 또는 현재 상태에서 필요한 정보를 추천,
제공하는 서비스

 감성 분석(Sentiment Analysis)은 ‘오피니언 마이닝(Opinion Mining)’으로도 불리는데, 이는


텍스트에 나타난 사람들의 태도, 의견, 성향과 같은 주관적인 데이터를 분석하는 자연어 처리 기술

 감성 분석은 통상 3단계로 구성
▪ 첫 번째는 각종 소셜 미디어 매체에서 정보를 수집하는 ‘데이터 수집(data collection)’ 단계

▪ 두 번째는 이렇게 총체적으로 수집된 정보에서 사용자의 주관이 드러난 부분만을 걸러 내는 ‘주관성
탐지(subjectivity detection)’ 과정

▪ 마지막 세 번째 단계에서 ‘극성 탐지(polarity detection)’ 작업이 이뤄지는데, 이는 추출된 감성


데이터를 ‘좋음’과 ‘싫음’의 양 극단으로 분류하는 과정

 개개인의 감성이나 의견은 연령이나 성별, 나이 등의 데이터와는 달리 숫자로는 쉽게 표현될


수 없고 기업의 규모와 시장 규모가 커질수록 소비자의 의견을 추적하는 것이 어려워지고
있는데, 이러한 작업을 처리하기 위해 많은 기업에서 소셜 데이터를 자동으로 처리하는
감성분석 기술에 주목하며 효과적인 분석 솔루션을 제시

▪ 과거 마케터들은 소비자의 감성이나 의견을 모으기 위해 오직 직관에만 의존했기 때문에 소셜 채널에


출판하는 각종 뉴스나 마케팅 자료가 사용자들에게 얼마나 호응을 이끌어내는지, 사용자의 참여가
저조했던 이유가 무엇이었는지에 대해 수치화된 이유를 제시할 수 없음. 따라서 소셜 마케팅에 대한
제대로 된 피드백을 받을 수 없기 때문에 빅데이터 기반의 감성정보 분석 서비스가 필요

 감성 분석 서비스나 툴을 이용하면 다음과 같은 마케팅 리서치를 효율적으로 실행 가능

▪ 제품 및 서비스에 대한 사용자의 의견이나 평가, 별점 조사

▪ 업체에 대한 부정적인 의견이나 이슈의 실시간 모니터링

▪ 시장 현황이나 경쟁 업체의 활동, 소비자 트랜드 추적

▪ 업체의 활동이나 관련 이슈에 대한 대중의 반응 측정

246
246
감성정보 분석 서비스

나. 범위

(1) 제품 분류 관점

 감성정보 분석 서비스는 입력 신호에 따라 다르게 분류되며, 사용하고자 하는 대상과 목적,


제공하고자 하는 서비스에 따라 각각 단일로 사용되기도 하고 융합적으로 사용

▪ 기술의 발전에 따라 점차 단일보다 융합적으로 시너지 효과를 내며 활용되고 있는 추세

 감성정보 분석 서비스에서 사용되는 주요 핵심기술은 텍스트, 이미지, 동작, 음성, 생체신호,


멀티모달 감성 분석 등으로 구성

[ 감성분석 종류별 기술 ]

감성분석 분류 세부기술

텍스트인식 자연어처리(언어분석, 대화처리, 자동번역 기술), 감정, 성향, 언어스타일 분석

이미지인식 얼굴인식, 표정인식

동작인식 거리센서, 전신동작 인식, 손동작 인식

음성인식 음성인식 기술(음성전처리, 음성분석, 대화체 음성인식 등), 화자 인식 기술

생체신호 전기적 생체 신호(심전도, 뇌전도, 근전도), 기계·물리적 생체 신호, 광학·화학적 생체 신호

멀티모달 딥러닝 알고리즘, 텍스트인식, 이미지인식, 동작인식, 음성인식, 생체신호 인식

247
247
전략품목 현황 분석

(2) 공급망 관점

 감성정보 분석 서비스는 교육, 의료, 자동차, 안전, 게임, 건강, 면접 등과 인간과 밀접한
분야의 대부분에 적용되어 사용 가능

 최근 인공지능과 빅데이터의 급성장으로 인해 다양한 분야로 공급망이 넓어지고 있고 앞으로


활용될 분야가 무궁무진한 것으로 분석

공급망 관점 세부기술
▪ 얼굴 감정, 표정, 긍정·부정 표정, 졸음 분석 등과 음성을 통한 자극적인 표현을 종합하여
운전자의 감정 상태와 졸음상태를 파악하여 안전한 주행을 도와줌.
자동차
▪ 한층 더 나아가 운전자의 감정상태와 졸음상태를 위험수준에서 안전수준으로 만들기 위해
자체적으로 음향, 조명, 온도 등을 설정

▪ 의료 진단용 소프트웨어를 사용하여 환자의 목소리를 음성 분석하여 우울증 및 치매와


의료
같은 질병을 진단하여 의사에게 도움이 됨

▪ 응급 처치 요원과 같이 매우 까다로운 직무를 수행하는 직원의 스트레스 및 불안 수준을


안전 분석하는데 도움이 되기도 하며, 콜센터 등 흥분한 고객의 목소리를 분석하여 감정조절을
위한 준비된 안내멘트 등을 통하여 직원 스트레스를 미리 조절

▪ 컴퓨터 비전을 사용하여 게이머의 얼굴 표정과 마이크를 통한 음성 인식을 통해 감성을


게임 분석하여 게임에 반영하여 게임에 더 몰입하고 재미를 느낄 수 있게 실시간 개인 맞춤형
게임을 개발

▪ 사이버 교육 시 수강자의 얼굴표정과 생체 신호를 감지하여 감성을 분석하여 수업이 너무


교육
어렵거나 지루해 보일 때 프로그램이 과제의 난이도를 조절하여 개인 맞춤형 교육을 개발

248
248
감성정보 분석 서비스

2. 외부환경 분석

가. 산업환경 분석

(1) 산업의 특징

 감정 감지 및 인식 시장의 규모는 2016년 6.72억 달러에서 2021년 36.9억 달러로 연평균


성장률 39.9%로 성장할 것으로 예상
* 출처: The report "Emotion Detection and Recognition Market by Technology (Bio-Sensor, NLP, Machine
Learning), Software Tool (Facial Expression, Voice Recognition), Service, Application Area, End User, And
Region. Global Forecast to 2021

▪ 경쟁 인텔리전스에 대한 관심 증가, 인지 서비스의 증가, 확대되는 감시 시장, 정부 서비스 증가.


그리고 수많은 산업 분야에서 증가하는 어플리케이션들은 감정을 감지하고 인지하는 시장 견인

[ 감성정보 분석 서비스 예상 시장 규모 ]

* 출처: Market and Markets

 바이오 센서 기술은 예측 기간 동안 감정 탐지 및 인식 시장에서 가장 높은 연평균 성장률로


성장할 것으로 예상
▪ 바이오 센서 기술은 ECG, EEG, EMG, fMRI, GSR, 안구 추적 및 웨어러블 기술을 포함한 여러
기술을 통합

▪ 최종 사용자들 사이에서 전례없는 관심을 빠르게 얻고 있으며, 특히 웨어러블 기술의 형태로 개발

▪ 착용 가능한 바이오 센서는 특히 스포츠, 군대 및 의료 관련 응용 분야에서 널리 보급

 감성 분석 기술을 사용하여 마케팅 및 광고 분야에서 급진적인 변화를 최적화하고 이끌어


내려는 요구가 커짐에 따라 북미 지역에서 주목할 만한 잠재력을 창출
▪ 북미 지역는 감성 분석에 대한 인프라가 잘 갖춰져 있어 큰 수요를 얻고 있음. 감성 분석 시장은
보안 및 감시 인프라에 대한 막대한 정부 투자, 대중 인식 제고 및 향상된 분석기술의 출현으로
인해 시장이 크게 성장할 것으로 예상

249
249
전략품목 현황 분석

 감성 분석 시장의 주요 벤더는 Affectiva(미국), Emotient, an Apple Company(미국),


Eyeris(미국), Kairos Ar. Inc.(미국), Noldus(네덜란드), nViso(스위스), Realeyes(영국) 등

 Gatner는 2018년 1% 미만에서 2022년까지 감성 AI 기능을 개인용 장치의 10% 장치


또는 클라우드 서비스를 가질 것으로 예측

 소규모 창업자뿐만 아니라 대기업도 10년 이상 감성 AI에 투자해 왔으며 컴퓨터 비전이나
음성 분석을 통해 인간의 감정을 인식
▪ 글로벌 리더 그룹들은 시장 조사, 제품 또는 TV 광고에 대한 응답으로 인간의 감정을 분석하고
캡쳐하는 데 초점을 두기 시작. 상업용 배포는 개인 보조 장치(VPA), 자동차, 콜센터, 로봇 및
스마트 장치에서 서서히 출현 중

250
250
감성정보 분석 서비스

(2) 산업의 구조

전방산업 감성 정보 분석 서비스 후방산업

이미지(얼굴 및 표정) 감성 분석,


음성 기반 감성 분석,
의료, 교육, 헬스케어, 자동차,
동작(제스처)인식을 통한 감성 분석, 텍스트 분석, 음성 인식, 영상 인식,
콜센터, 시장조사, 마케팅, 게임,
감성 분석용 언어처리, 소셜미디어 이미지 인식, 생체신호 인식
신뢰도 등
언어분석 기술, 생체신호 감성 분석,
개인 성향 분석 기술

 전방산업은 의료, 교육, 헬스케어, 자동차, 콜센터, 마케팅, 게임, 신뢰도 등의 분야에서
소프트웨어 및 서비스 부문으로 성장
▪ 의료 부문은 음성분석을 통한 조울증 치료, 자폐증과 같이 표정으로 감정이 드러나지 않는 질환에서
음성정보를 통하여 환자 내면상태 파악

▪ 자동차 부문은 자동차 안전과 밀접한 관련. 운전석 카메라와 마이크를 사용하여 얼굴과 음성을
분석하여 졸음운전 방지 및 운전자의 감정을 완화시켜주는 조명, 음향, 온도를 조절

▪ 시장조사 부문은 기존 방식보다 시간, 비용적인 측면들이 매우 효율적으로 변함. 대규모, 실시간
텍스트로부터 감성 분석이 가능하기 때문에 기업 정책에 대한 대중들의 불만과 인식을 이해하고
선제적으로 대응이 가능

▪ 신뢰도 부문은 기업 면접이나, 사건에 대한 진술이 필요한 상황에서 표정, 음성, 생체신호의 변화를
측정하여 발화자의 내용에 대한 신뢰도를 더 자세하게 평가 가능

 기존에 기술들은 텍스트, 음성, 영상, 생체신호 등 단일 분야만으로 감성을 분석했다면


향후에는 복합적인 기술의 융합, 즉 멀티모달 기술 기반의 감성 분석 서비스가 시장을
이끌어 갈 것으로 예상

▪ 영상정보를 이용한 감정 인식에서 영상 내부의 표정으로 드러나지 않는 감정 정보를 인물의 대화


톤이나 의성어 같은 음성 신호나 EEG와 맥박 같은 생체 신호를 분석하여 보완해 정확도를 높임

▪ 멀티모달 딥러닝 과정에서는 서로 다른 모달리티의 정보를 융합하는 과정이 핵심인데 크게 조기


융합과 늦은 융합으로 나누어짐

 전방산업과 후방산업의 상호관계가 기술개발의 매우 직접적인 영향을 미치기 때문에


후방산업의 기술발전이 곧 전방산업의 발전 속도를 좌우함

▪ 각각 후방산업의 개별적인 분야의 기술 즉, 텍스트, 음성, 이미지, 생체신호 분석기술이 더 발전되고 정교한
분석이 가능해지고 상호 간의 보완이 더 잘됨의 따라 전방산업의 발전이 비약적으로 될 것이라 예상

▪ 전방산업의 기술과 하드웨어의 결합이 또 다른 후방산업들의 발전을 야기. 제스처, 신체 자세,


목소리 톤, 표정과 같은 인간의 감정을 포착하기 위한 마이크 및 카메라와 같은 기타 구성 요소와
함께 심장박동 및 온도를 모니터링 하는 생물학적 센서가 장착된 하드웨어가 늘어나면서 향후 감성
분석 시장의 성장을 이끌 것으로 예상

251
251
전략품목 현황 분석

나. 시장환경 분석

(1) 세계시장

 ICT 기술의 개발과 사물인터넷의 발전으로 이용자 정보 수집이 용이해져, 감성인식 기술


개발이 다양한 기술 분야에서 빠르게 확산

 기존의 ICT 산업에 감성 기술이 적용되어 새로이 발생하는 산업인 감성 ICT 산업의 세계
시장 규모는 ‘17년 1조 2,078억 달러 규모에서 연평균 9.9% 성장하여 ’22년에는 1조
9,324억 달러 규모로 확장될 것으로 예측

 기존에 ICT 산업에 포함되지 않았던 분야에 감성 기술이 융합되어 새로이 탄생하는 산업으로
정의되는 감성 ICT 융합 산업 세계 시장은 ‘17년 1조 732억 달러 규모에서 연평균 9.2%
성장하여 ’22년에는 1조 6,695억 달러 규모에 이를 전망

 감성 ICT 산업과 감성 ICT 융합 산업의 총합으로 예측한 감성 ICT 종합 세계 시장의 규모는


‘17년 2조 2,810억 달러에서 ’22년 3조 6,019억 달러로 연평균 9.6% 성장할 것으로 예상

[ 세계 감성 ICT 시장 ]
(단위: 억 달러, %)

구분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

감성 ICT 산업 12,078 13,274 14,588 16,000 17,584 19,325 9.9

감성 ICT 융합 산업 10,732 11,720 12,798 14,000 15,288 16,694 9.2

합계 22,810 24,994 27,386 30,000 32,872 36,019 9.6

*출처: 감성ICT 산업협회(‘16.03) 재구성

252
252
감성정보 분석 서비스

(2) 국내시장

 기존의 ICT 산업에 감성 기술이 적용되어 새로이 발생하는 산업인 감성 ICT 산업의 국내
시장 규모는 ‘17년 29 조 원 규모에서 연평균 10.0% 성장하여 ’22년에는 46.8 조 원
규모로 확장될 것으로 예측

 기존에 ICT 산업에 포함되지 않았던 분야에 감성 기술이 융합되어 새로이 탄생하는 산업으로
정의되는 감성 ICT 융합 국내 산업은 ‘17년 29.5조 원 규모에서 연평균 8.8% 성장하여
’22년에는 44.9 조 원에 이를 전망

 감성 ICT 산업과 감성 ICT 융합 산업의 총합으로 예측한 감성 ICT 종합 국내 시장의 규모는


‘17년 58.5조 원에서 ’22년 91.7조 원으로 연평균 9.4% 성장할 것으로 예상

[ 국내 감성 ICT 시장 ]
(단위: 조 원, %)

구분 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 CAGR

감성 ICT 산업 29.0 31.9 35.1 38.7 42.5 46.8 10.0

감성 ICT 융합 산업 29.5 32.1 34.9 38.0 41.3 44.9 8.8

합계 58.5 64 70 76.7 83.8 91.7 9.4

*출처: 감성ICT 산업협회(‘16.03) 재구성

253
253
전략품목 현황 분석

3. 기술 분석

가. 기술개발 이슈

(1) 기술개발 트렌드

 현재까지 감성 분석의 기술 개발 트렌드는 단위 기술에 대한 개별적인 기술 발달이 대부분


주를 이루었으나 점차 단위 기술에 대한 기술력이 감성 분석을 실시할 수 있는 수준으로
올라오면서 각 분야에서 점차 연구가 활발하게 진행되었고, 각 단위기술로는 정확도를 어느
수준 이상으로 높이기가 어려운 한계점에 도달, 각 분야의 미흡한 부분을 서로 보완해주어
정확도를 높이기 위해 멀티모달 딥러닝 기반의 감정인식 기법이 등장

▪ 한 서비스의 한 가지 단위 기술이 아닌 이미지, 영상, 음성, 생체신호 등 단위기술들을 복수 채택


및 융합하여 서비스의 고정확도와 다기능을 갖추는 것이 현재 감성정보 분석 서비스의 추세

▪ 단위기술 융합과정에는 Early Fusion과 Late Fusion으로 나뉨

- 전자의 경우 전처리의 복잡도가 있을 수 있고 각 모달리티 고유의 특징을 추출하는 데 한계가


존재하지만, 하나의 딥 네트워크로 처리하기 때문에 상대적으로 연산량이 적은 장점
- 후자는 각 모달리티 고유의 특징을 추출하는 데 효과적이나 연산량 측면에서는 부담이 될 수 있음

[ 멀티모달 딥러닝 융합 방식 예시 ]

 최근 불고 있는 감성 인공지능 시스템 열풍은 가상 개인 비서(VPA)와 대화형 인공지능 기술


보급에 따라 발생. 인공지능 기술은 교육용 소프트웨어, 비디오 게임, 진단용 소프트웨어,
운동·건강 기능, 자율주행차 및 자동차 안전 등을 포함한 더욱 풍부한 고객 경험을 제공

▪ 교육용 소프트웨어 프로토 타입은 아이들의 감정에 적응하도록 개발. 예를 들면 어린이가 과제가
너무 어렵거나 너무 간단해서 좌절을 보일 때, 프로그램이 과제의 난이도를 조절하는 형식

▪ 비디오 게임은 컴퓨터 비전을 사용하여 게임 콘솔/비디오 게임은 얼굴 표정을 통해 감정을 감지하고 적응

▪ 의료 진단용 소프트웨어는 음성 분석을 사용하여 우울증 및 치매와 같은 질병을 진단하여 의사를 도움

254
254
감성정보 분석 서비스

▪ 자동차 안전은 컴퓨터 비전 기술을 사용하여 운전자의 감정 상태를 모니터링. 극도의 정서적 불안정
상태 또는 졸음 상태를 파악하여 운전자에게 경고할 수 있음

▪ 직원안전은 응급 처치 요원과 같이 매우 까다로운 직무를 수행하는 직원의 스트레스 및 불안 수준을


분석하는 데 도움을 줄 수 있음

▪ 사기 탐지는 보험 회사 등에서 음성 분석을 사용하여 고객이 보험금 청구서를 제출할 때 진실을


말하고 있는지에 대한 여부를 감지

▪ 선거, 면접 등에서 후보자의 신뢰도를 이해하기 위해 취업 면접에서 소프트웨어가 사용

▪ 콜센터 지능형 라우팅은 분노한 고객을 처음부터 감지할 수 있으며, 대화가 어떻게 진행되고
조정되는지 실시간으로 모니터링이 가능하여 이에 대한 내용들을 상담원에게 전달할 수 있음

[ 기아자동차 R.E.A.D. System 감정인식 사진 ]

 기존의 감성 정보를 분석하기 위해서는 단답형 QA 기반의 문법분석이었다면 점차 서술형


QA 기반의 의미분석으로 발전해 나가고 있음

▪ 현재의 정보추출 기술은 의미손실이 크며, 구문분석 수준의 문법으로는 의미처리에 한계가 명확하기
때문에 의미분석 기술이 필요

▪ 의미분석 기술은 단답형, 서술형 지식을 추출/저장하여 질의응답에 활용할 수 있음

- 문장에서 인간이 인지하는 정보의 단위로 구분하여, 단위 지식을 추출하고, 단위 지식 간의


의미역을 부착, 그래프로 상호 연결시켜야 함
- 또한 어휘와 어순이 상이하나 의미가 동일한 문장 간의 유사도 분석도 필요한데 이를 위해서는
패러프레이즈 사전과 학습데이터 구축, NLP 기반 문장 유사도 분석 기술 개발, 딥러닝 기반 문장
유사도 분석 기술 개발이 필요

255
255
전략품목 현황 분석

* 출처: 2018 by ETRI

[ 엑소브레인 2단계 연구목표 ]

(2) 기술환경 분석

 AI 학습용 데이터(지식베이스) 구축(AI 허브 사업 ­ NIA/NIPA 사업)


▪ 산업적으로 활용가치가 높은 인공지능 학습용 데이터셋(지식베이스) 구축 및 개방

▪ 복합 인지 AI개발을 위한 멀티모달 영상 데이터 구축(상황·감정인식 학습지원 정보 부착)

▪ 드라마나 예능 등 다양한 상황을 나타내는 약 3000분의 영상을 토대로 7가지 감정, 상황 외


성별이나 연령대등 인물 분류와 10종 이상의 객체 및 장소 정보, 발화 내용 데이터를 수집

 과학기술 지식 인프라 통합서비스 출범 Science ON(scienceon.kisti.re.kr)


▪ 한국과학기술정보연구원은 그동안 다양한 과학기술 지식인프라 (과학기술정보, 연구데이터,
R&D정보서비스, 분석서비스, HPC 기반 서비스, 시스템 인프라 등)를 한곳에서 활용할 수 있는
지식 인프라 통합서비스를 출범하여 필요한 기술에 대한 접근성이 향상

 인공지능 전문기업 육성
▪ 국내 기업들의 인공지능 활용 제품·서비스 연구개발 과제 자원을 통해 다양한 분야 인공지능
전문기업 육성

▪ 국내 역량 있는 인공지능기업을 대상으로 금융, 의료 등 산업 응용분야의 AI제품·개발을 지원하여


초기시장 창출 지원

▪ 중소·중견기업 대상 ‘19년 총 26.25억 원, 총 7개 과제 내외 지원

 인공지능 정책 동향
▪ 주요국 인공 지능 정책 내용을 AI 기술기반 확보, AI 인력양성, AI 인프라 조성, AI 시장 확대
등으로 분류 가능

256
256
감성정보 분석 서비스

▪ 과학기술정보통신부는 AI 기술기반 확보, 인력 양성, 인프라 조성 측면에 집중안 AI R&D 전략을


발표(‘18.5)하였으며 향후 AI 시장 확대 관련 정책은 ICT 산업 및 국가정보화 사업 등을 동원하여
총체적으로 추진할 계획

[ 주요국 인공지능 정책 내용(정책분석 프레임워크) ]

* 출처: 과학기술정보통신부, 주요국 인공지능 정책 동향 분석

 중앙 정부는 빅데이터 센터 통해 유통 확대.. ‘글로벌 AI 100’ 프로젝트 추진하여 ‘23년까지


국내 데이터 시장을 30조 원 규모로 확대하여 빅데이터 분야 유니콘 그룹 100개 발굴을
목표로 수립

▪ 현재 국내 데이터 시장은 수요·공급 모두 부족하고 거래량은 미국에 비해 1/40수준(약 5000억


원)에 불과하며 선진국과의 인공지능 기술 격차도 큰 것으로 평가

▪ 빅데이터센터(100개), 플랫폼(10개) 대거 구축 계획

 바이오-인공지능(AI)_로봇 융합 등 선도적 융합기술 개발에 올해 375억 원 투자

▪ ‘휴먼플러스 융합연구개발 챌린지사업’은 인간의 삶의 질 향상 및 4차 산업혁명시대 선도를 위해


인간증강 융합플랫폼 원천기술을 개발하는 상버으로 올해 새롭게 시행(‘19년, 19억 원 투자)

▪ ‘휴먼플러스(Human+)’란 4차 산업혁명의 기반이 되는 바이오, 인공지능, 로봇 등 첨단기술을


융·복합하여 궁극적으로 인간의 인지적(지능+), 육체적(신체+), 사회적(오감+) 능력을 강화하는
것으로, 고효율 오감센서 기반 융합 인터페이스 기술 개발 등 초연결·초지능의 혁신 원천기술을
확보하고, 제품 및 서비스로도 연계할 계획

257
257
전략품목 현황 분석

(3) 기술개발 이슈

 현재까지 개발된 생체인식정보(지문,홍채,지정맥,얼굴,음성,목소리,서명 등)를 기반으로 한


감성인지 기술은 기계학습법을 이용한 연구와 경험적이고 통계적인 Rule_based 기법으로
구분하여 연구

▪ Rule-based 기법에 의한 기술들은 수많은 생체신호를 분석하고 감성을 표현하는 감성특성을 추출한
후, 감성별로 Rule에 해당하는 조건을 설정하고 이를 통해 감성을 분류

[ 기계학습에 의한 감성인지 알고리즘의 기반이 되는 기법 ]

1) 신경망(NN: Neural Network)


2) 서포트벡터 머신(SVM: Support Vector Machine)
3) kNN(k-Nearest Neighbor)
4) 다계층 퍼셉트론(MLP: Multi Layer Perceptron)
5) 가우시안 혼합모델(GMM: Gausian Mixture Model)
6) 의사결정트리(DT: Decision Tree)
7) 베이지안 네트워크(BN: Baysian Network)

 감성정보 분석 서비스의 최전방 기술인 멀티모달 딥러닝의 활용 현황은 영상·음성 감성


분석정보를 동시에 활용하거나 여러 종류의 생체 신호를 융합하여 사용하는 사례가 대부분

▪ 아직 기술 간 동기화 문제와 데이터 부족으로 감성정보 분석 서비스가 많이 등장하고 못하고 있는 실정

▪ 향후 텍스트, 음성, 이미지, 생체신호 간 기술 동기화가 원활해지고 데이터가 많이 쌓이게 된다면


현재 예상한 것보다 더욱 다양한 분야와 큰 시장규모를 형성할 것으로 예상

258
258
감성정보 분석 서비스

나. 주요기업 동향

◎ 해외 업체 동향

 IBM社 ‘Watson’과 같은 차세대 분석 플랫폼을 연구·개발하기 위해 인공지능에 대해


집중적으로 투자
▪ Tone Analyzer는 텍스트 기반, 인지적 언어 분석을 활용하여 문장 레벨과 문서 레벨에서 다양한
어조를 식별하고 텍스트에서 감정(분노, 혐오, 두려움, 기쁨, 슬픔), 사회적 성향(개방성, 성실성,
외향성, 친화성, 감정 범위), 언어 스타일(분석적, 자신감, 망설임)과 같은 세 가지 유형의 어조 발견

- 소셜 미디어 청취 및 대중 모니터링, 이메일 전송 전 색조 확인 등 활용

▪ Personality Insights는 텍스트기반, 구입의사결정, 의도 및 행동 특성을 판별하는 심리적인 특성을


식별하도록 트랜잭션 및 소셜 미디어 데이터에서 통찰을 유도, 개인의 세세한 특성까지 파악, 소비
취향 이해, 맞춤형 고객 경험 제공

 Affectiva社는 Affectiva Automotive AI, Affdex for Market Research, Emotion SDK
등의 서비스를 제공 중

▪ Automotive AI는 차량 탑승자의 복잡하고 미묘한 감정 및 인지상태를 얼굴과 목소리로 실시간으로


식별하는 최초의 운전실 감지 AI

▪ 모든 탑승객을 추적 가능하며, 3가지 얼굴 감정, 긍정·부정 표정 판단, 졸음 판단을 위한 4개의


안면 마커(눈 닫기, 하품, 눈 깜빡임 등), 머리 위치 추정, 8가지 얼굴 표정(미소, 입 벌리기, 눈썹
늘리기 등), 두 가지 음성감정(분노, 웃음), 자극적인 음성 표현(경계, 흥분 등)으로 운전자의 감정
상태와 졸음 상태를 판단하여 안전한 주행을 지원

▪ Affdex는 특허받은 감정 인식 소프트웨어를 사용하는 클라우드 기반 솔루션

- Mars, Kellogg’s and CBS와 같은 1,400 개의 브랜드를 포함하여 Millward Brown, LRW,
Added Value and Unruly와 같은 주요 시장 조사 회사와 Fortune Global 100의 1/3은 시장
조사를 위해 Affdex를 사용하여 콘텐츠 및 미디어 지출을 최적화 중
- 75개국에서 분석된 2만4천 개의 광고와 5백만 개 이상의 얼굴을 가진 세계 최대 감정
데이터베이스를 사용하여 제작

259
259
전략품목 현황 분석

[ AFFDEX FOR MARKET RESEARCH ­ NORMS ]

 Microsoft社 Azure Face API는 이미지에서 사람 얼굴을 감지, 인식 및 분석하기 위한


알고리즘을 제공하는 인지 서비스

▪ 얼굴 정보를 처리하는 기능은 보안, 자연스러운 사용자 인터페이스, 이미지 콘텐츠 분석 및 관리,
모바일 앱, 로봇과 같은 다양한 소프트웨어 시나리오에서 중요하게 활용

▪ Face API는 이미지에서 사람 얼굴을 감지하고 해당 위치의 사각형 좌표 반환 가능

▪ 필요에 따라 얼굴 감지는 포즈, 성별, 연령, 머리 포즈, 수염 및 안경과 같은 일련의 얼굴 관련


속성을 추출 가능.

 Softkinetic社는 벨기에 스타트업 회사로 3차원 카메라를 이용해 사람의 몸짓을 분석한 후
감정을 파악하는 기술을 개발

▪ Softkinetic은 이미지 센서를 이용한 측정에 효과적인 Time of Flight(ToF) 방식 거리 이미지 센서 기술 보유

- ToF 방식은 광원으로부터 나온 빛이 물체에 반사되어 센서에 닿을 때까지 빛의 비행시간을


감지하여 물체까지의 거리를 얻을 수 있는 거리 측정 방식 가운데 하나

 구글은 현재 가장 많은 데이터를 수집하고 있을 뿐만 아니라 가장 다양한 형태의 데이터를


수집하고 있으며, 그래프 알고리즘의 처리를 지원하기 위한 Pregel, 대용량 데이터를 분산
처리로 빠르게 분석할 수 있는 기술인 Dremel, 검색 인덱스를 작성하기 위한 기술인
Percolator 등의 빅데이터 관련 기술 및 도구들을 직접 개발하여 사용하고 있음

260
260
감성정보 분석 서비스

◎ 해외 업체

 북미 지역 Affectiva (U.S.), Cross Match Technologies, Inc. (U.S.), Emotient, Inc, an


Apple company.(U.S.), EmoSpeech(U.S.), GestureTek(U.S.), GestSure(U.S.), Intel
(U.S.), Kairos AR, Inc.(U.S.), Microchip Technology, Inc.(U.S.), Microsoft(U.S.),
Nuance (U.S.), Orbeus Inc./Rekognition(U.S.), Qualcomm Inc.(U.S.), Sensum(U.S.),
ThalmicLabs(Canada), and CogniVue (Canada)

 유럽: Cognitec Systems (Germany), Sentiance (Belgium), SoftKinetic (Belgium),


IrisGuard Technology (U.K), CrowdEmotion (U.K), Realeyes (U.K.), Visual
Recognition (Universiteit van Amsterdam), SightCorp (Amsterdam), nViso SA
(Switzerland), Good Vibrations Company B.V. (the Netherlands), Sky Biometry
(Lithuania), and Tobii AB (Sweden)

 아시아/태평양 지역: Fujitsu (Japan), NEC (Japan), and Megvii/Face++ (China)

 중동: Beyond Verbal (Israel), eyeSight (Israel), and PointGrab (Israel)

261
261
전략품목 현황 분석

◎ 국내 업체 동향

 와이즈넛社는 WISE BIC Analyzer이 감성분석용 대표 솔루션으로 비정형 빅데이터를 의미


분석함으로써 필요 정보를 획득, 시간 및 비용을 절감, 빠른 의사결정 수립 가능

▪ 온라인 문서와 SNS, 일반 문서 등 다양한 비정형 빅데이터를 분석 대상으로 하며, 긍/부정 분석에도 탁월한 성능

▪ 감성분석용 언어처리(형태소 분석, 자연어처리, 적합문서 필터링, 개체명 인식, 표현어 추출)

▪ 감성분석 기능(집단지성분석 통계, 감성분석 지수화 등)

 아크릴社 Jonathan Brain은 텍스트, 이미지, 음성을 통해 사람의 감성을 이해하고 공감하는
딥러닝 기술을 제공하는 지능형 프레임워크로 자연어처리 기술을 기반으로 텍스트가 내포한 단어,
감성, 주제, 사람, TPO 등 다양한 의미를 추출하고 고도화된 딥러닝 알고리즘 서비스j 제공

▪ 독자적인 딥러닝 알고리즘을 통해 텍스트, 음성, 이미지를 통합 분석하여 7종의 감성을 인식

▪ 텍스트의 단어 분석 정보 및 음정 분석 정보, 음성의 특징 정보, 이미지의 얼굴 속성 데이터를


독립적으로 분석한 후 융합하여 감성을 추론하는 독자적인 알고리즘을 구현

▪ 로봇에 멀티모달 감성 인식 기술 적용

[ 조나단 멀티모달 작동방식 ]

 기아자동차는 R.E.A.D.시스템(Real-time Emotion Adaptive Driving), 실시간 감정반응 차량 제어


시스템을 선보임. 이 시스템은 차량이 탑승자의 심리상태와 감정을 멀티모달 시스템을 통해 읽어내어
인공지능을 통해서 실내온도, 향기, 조명, 음악 등을 컨트롤하여 탑승객에게 최적의 공간 제공

▪ V-touch라고 불리는 제스처 인식 기술은 버튼이나 터치 조작 없이 허공에서 손을 이용해 다양한


시스템을 제어하는 기술로 사용자의 눈까지 추적하여 더욱 정밀한 컨트롤을 가능하게 하는 기술.

 데이터솔루션은 예측분석 소프트웨어 및 솔루션, 예측분석 컨설팅 등 데이터의 컨설팅, 분석,


구축 및 운영에 이르는 데이터 솔루션 사업을 진행

 다음 소프트는 SNS 정보 기반 여론 진단 서비스, 소셜 미디어 트위터, 블로그 트렌드 분석


등을 서비스하며, 소셜미디어 상의 데이터들에서 의미 있는 정보를 찾고, 조직화함으로써
정보간의 관계나 패턴, 트렌드 등을 분석하는 서비스를 제공
 사이람의 넷마이너는 다양한 데이터 형식의 지원, 데이터의 변환 및 순환적 프로세스,

262
262
감성정보 분석 서비스

융복합적 분석방법 등과 같은 독창적인 기능을 제공

▪ 소셜 네트워크 분석 응용솔루션 및 컨설팅을 제공하며 대규모 소셜 네트워크 및 데이터 간의 관계를


계량적으로 분석해 패턴을 파악하고 시각화하는 기능 제공

▪ 넷마이너는 숙달되지 않은 사용자들을 위한 자동스크립트 생성기를 갖춘 파이썬 기반의 내부 스트립트 엔진을 탑재

▪ 소셜네트워크분석 소프트웨어 최초로 Actual 3D맵 지원

[ 넷마이너 3D 네트워크 맵 ]

 솔트룩스의 ADAMs는 국내 최초로 상용화된 인공지능 플랫폼으로, 아시아 최대 규모의


지식베이스를 내장하고 지식, 언어, 시각 인지 등 50여 API를 제공. 아담은 지식 학습과
복합 추론에 강점이 있으며 생활 질의응답 정답 확률 94% 수준에 도달

[ 솔트룩스 인공지능 플랫폼 ADAMs ]

 마인즈랩은 음성, 텍스트 센서 데이터 등 비정형 고객의 소리를 State-of-the-art 수준의


음성인식, 자연어처리, 텍스트마이닝, 데이터마이닝 기술을 통해 처리하고 이를 소셜 빅데이터
분석정보 및 기업 내부의 정형 데이터와 교차 분석하여 비즈니스 활동에 필요한 정보 제공

 스타트업 ‘네우로데이터 랩(Neurodata Lab)’은 로봇 제조회사 ‘프로모 봇(Promobot)’과


제휴해 사람 기분을 파악하는 로봇을 시연, 해당 로봇은 음성 언어, 행동, 표정, 눈 움직임,
심장박동, 호흡 등을 분석해 사람 기분을 파악 가능

263
263
전략품목 현황 분석

다. 특허 동향

◎ 감성정보 분석 서비스 기술 분야 특허상 주요 기술

 주요 기술
▪ 감성정보 분석 서비스 기술 분야는 축적된 인간의 감정 관련 빅데이터를 바탕으로 이용자의 감성
패턴을 분석, 이용자의 감성에 맞는 음악, 서비스 또는 현재 상태에서 필요한 정보를 추천·제공하는
서비스 등이 포함

요소기술 코드 설명

이미지(얼굴 및 표정)에서의 얼굴 및 표정으로부터 특징과 변화를 인식하고 내적


A
분석 기술 감성상태를 추정하는 기술

컴퓨터 비전 기술을 이용하여 사용자 식별과 인간


동작(제스처)인식을 통한 분석
B 감정 및 행동 인식과 분류에 대한 기술로 인간의
기술
내면을 인식 기술

감정변화에 따라 음성의 질, 높이, 강도, 속도, 템포,


음성에서의 감성 인식 기술 C 억양, 악센트, 어휘 사용 등이 변화하여, 이를
분석함으로써 감성을 인식하는 기술

감성이나 감성의 지속적 상태인 기분을 측정하기


감성신호 측정을 통한 분석
D 위해 호르몬의 레벨, 신경 전달 속도 및 신경 시스템
기술
활동 상태 등을 측정하고 이를 계량화하는 기술

언어분석 기반의 소셜미디어 소셜 빅데이터로부터 이슈를 탐지, 모니터링 하여


E
분석 기술 이슈의 향후 전개 과정에 대한 예측

언어분석 기반의 개인성향 분석 개인이 쓴 텍스트(소개서, 일기, 블로그, 소셜


F
기술 데이터)를 분석하여 개인의 성향과 감성등을 분석함

이용자의 감성 패턴을 분석, 이용자의 감성에 맞는


감성응용서비스기술 G
음악, 서비스를 제공하는 기술

264
264
감성정보 분석 서비스

◎ 세부 분야별 특허동향

 주요 기술별 출원인 국적별 특허동향

▪ 감성정보 분석 서비스 기술 분야의 요소기술별 주요 출원인 국적별 특허정보 데이터 입수하였으며,


최근 10년간의 특허데이터를 비교 분석

요소기술 한국 미국 일본 유럽 기타 계

이미지(얼굴 및 표정)에서의 분석 기술 129 52 32 32 16 261

동작(제스처)인식을 통한 분석 기술 89 51 16 18 19 193

음성에서의 감성 인식 기술 48 31 10 7 9 105

감성신호 측정을 통한 분석 기술 94 29 15 23 22 183

언어분석 기반의 소셜미디어 분석 기술 189 80 38 9 31 347

언어분석 기반의 개인성향 분석 기술 59 51 10 4 13 137

감성응용서비스기술 123 64 12 9 22 230

합계 731 358 133 102 132 1,324

▪ 국가별 요소기술별 출원인 국적별 특허동향에서 한국 국적의 출원인이 가장 활발한 연구개발을 하고


있으며, 그 다음으로는 미국, 일본, 유럽 국적 출원인 순으로 나타남

▪ 이미지(얼굴 및 표정)에서의 분석 기술 분야에서는 한국 국적의 출원인이 가장 많은 비중을


차지하고 있으며, 유럽, 일본 국적의 출원인이 상대적으로 적은 출원량을 보유

▪ 동작(제스처)인식을 통한 분석 기술은 한국 국적의 출원인이 가장 많은 비중을 차지하고 있으며, 그


다음으로는 미국, 유럽, 일본 국적 출원인 순으로 특허를 많이 출원

▪ 음성에서의 감성 인식 기술 분야에서는 한국 국적의 출원인이 가장 많은 출원을 하고 있으며, 유럽


국적의 출원인이 상대적으로 적은 출원량을 보이고 있음

▪ 감성신호 측정을 통한 분석 기술은 한국 국적의 출원인이 가장 많은 출원을 하고 있으며, 일본


국적의 출원인이 상대적으로 적은 출원량을 보이고 있음

▪ 언어분석 기반의 소셜미디어 분석 기술, 언어분석 기반의 개인성향 분석 기술 분야,


감성응용서비스기술 분야 에서는 한국 국적의 출원인이 가장 많은 출원을 하고 있으며, 유럽 국적의
출원인이 상대적으로 적은 출원량을 보이고 있음

265
265
전략품목 현황 분석

▪ 한국 국적의 출원인은 언어분석 기반의 소셜미디어 분석 기술과 이미지(얼굴 및 표정)에서의 분석


기술에 집중하고 있으며 외국 국적의 출원인도 언어분석 기반의 소셜미디어 분석 기술과
이미지(얼굴 및 표정)에서의 분석 기술에 집중하고 있는 것으로 나타남

▪ 한국 국적의 출원인의 특허 출원량은 비교적 꾸준히 출원량이 높아지며 2016년도에 많은 출원을


보이고 있음

▪ 외국 국적의 출원인의 특허 출원량은 꾸준한 출원량을 보이며 감성응용서비스기술과 언어분석


기반의 소셜미디어 분석 기술은 2015년에 가장 많은 출원량을 보이고 있음

266
266
감성정보 분석 서비스

 주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도

•PHILIPS •공공연구기관 중심
이미지(얼굴 및 표정)에서의
◓ •한국전자통신연구원 •한국전자통신연구원, 건국대학교,
분석 기술
•ZAdvanced Computing 스마트올웨이즈온 등

•한국전자통신연구원 •공공연구기관 중심
동작(제스처)인식을 통한
◓ •ZAdvanced Computing •한국전자통신연구원, (주)다울,
분석 기술
•PHILIPS 건국대학교 등
•ZAdvanced Computing •중소기업 중심
음성에서의 감성 인식 기술 ◔ •Kawasaki Jukogy •스마트올웨이즈온, 한양대학교,
•스마트올웨이즈온 중앙환경기업 등

•PHILIPS •중소기업 중심
감성신호 측정을 통한 분석
◓ •(주)바인테크 •(주)바인테크, 한국전자통신연구원,
기술
•한국전자통신연구원 (주)다울 등

•한국전자통신연구원 •공공연구기관 중심
언어분석 기반의
◕ •IBM •한국전자통신연구원, (주)바인테크,
소셜미디어 분석 기술
•Tata Consultancy (주)다울 등

•ZAdvanced Computing
언어분석 기반의 개인성향 •중소기업 중심
◔ •Hartford Fire
분석 기술 •(유)중앙환경기업, (주)모노시스 등
•IBM

•한국전자통신연구원 •공공연구기관 중심
감성응용서비스기술 ◓ •Hartford Fire •한국전자통신연구원,
•Tata Consultancy (주)시엠아이코리아, 건국대학교 등

※ ●:추출건수의 30%이상, ◕: 30~20%, ◓: 20~10%, ◔: 10~5%, ◯: 5% 미만

267
267
전략품목 현황 분석

 이미지(얼굴 및 표정)에서의 분석 기술 분야 주요 출원인 동향

▪ 이미지(얼굴 및 표정)에서의 분석 기술 분야는 PHILIPS가 가장 많은 특허를 보유하고 있으며 그


다음으로는 한국전자통신연구원과 ZAdvanced Computing 순으로 다수의 특허를 보유함

 동작(제스처)인식을 통한 분석 기술 분야 주요 출원인 동향

▪ 동작(제스처)인식을 통한 분석 기술 분야는 한국전자통신연구원이 가장 많은 특허를 보유하고


있으며 그 다음으로는 ZAdvanced Computing, PHILIPS 등이 많은 특허를 출원하고 있음

 음성에서의 감성 인식 기술 분야 주요 출원인 동향

▪ 음성에서의 감성 인식 기술 분야는 ZAdvanced Computing이 가장 많은 특허를 보유하고 있으며,


그 다음으로는 Kawasaki Jukogy, 스마트올웨이즈온 등이 많은 특허를 보유하고 있음

 감성신호 측정을 통한 분석 기술 분야 주요 출원인 동향

▪ 감성신호 측정을 통한 분석 기술 분야는 PHILIPS가 가장 많은 특허를 보유하고 있으며. 그


다음으로는 (주)바인테크가 다수의 특허를 보유함

 언어분석 기반의 소셜미디어 분석 기술 분야 주요 출원인 동향

▪ 언어분석 기반의 소셜미디어 분석 기술 분야는 한국전자통신연구원이 가장 많은 특허를 보유하고


있으며. 그 다음으로는 IBM이 다수의 특허를 보유함

 언어분석 기반의 개인성향 분석 기술 분야 주요 출원인 동향


▪ 언어분석 기반의 개인성향 분석 기술 분야는 ZAdvanced Computing이 가장 많은 특허를 보유하고
있으며. 그 다음으로는 Hartford Fire가 다수의 특허를 보유함

 감성응용서비스 기술 분야 주요 출원인 동향

▪ 감성응용서비스기술 분야는 한국전자통신연구원이 가장 많은 특허를 보유하고 있으며. 그


다음으로는 Hartford Fire가 다수의 특허를 보유함

268
268
감성정보 분석 서비스

◎ 국가별 특허활동지수(AI) 비교

 특허활동지수(Activity Index)는 상대적 집중도를 살펴보기 위한 지표로서, 그 값이 1보다 큰


경우에는 상대적 특허활동이 활발함을 나타냄

 한국은 언어분석 기반의 개인성향 분석 기술분야에서는 특허활동이 부진하나, 언어분석


기반의 소셜미디어 분석 기술분야의 특허출원은 활발한 것으로 나타남

 미국은 감성신호 측정을 통한 분석 기술분야에서는 특허활동이 부진하나, 언어분석 기반의


개인성향 분석 기술분야의 특허출원은 활발한 것으로 나타남

 일본은 언어분석 기반의 개인성향 분석 기술분야에서는 특허활동이 부진하나, 이미지(얼굴 및


표정)에서의 분석 기술분야의 특허출원은 활발한 것으로 나타남

 유럽은 언어분석 기반의 개인성향 분석 기술분야에서는 특허활동이 부진하나, 감성신호


측정을 통한 분석 기술분야의 특허출원은 활발한 것으로 나타남

269
269
전략품목 현황 분석

◎ 질적 수준을 고려한 각국의 시장력 분석

 시장력이 전체 평균 1.36을 상회하는 국가로는 미국 외에 중국이 있으며, 질적인 수준이


높은 특허 보유국도 미국과 중국으로 나타남

▪ 미국은 시장력과 질적 수준에서 전체 평균을 상회하며 출원건수도 높은 것으로 나타남

▪ 한국은 출원량은 많지만 시장력 면에선 미국에 뒤지며 질적 수준도 낮은 것으로 나타남

▪ 중국은 시장력과 질적 수준에서 전체 평균을 상회하지만 출원건수는 높지 않은 것으로 나타남

PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)

JP 133 1.195489 0

KR 731 1.165527 0.466667

US 358 1.586592 3.086957

DE 53 1.283019 0.384615

CN 37 2.621622 7.5

전체평균 1456 1.360577 2.397213

◎ 감성정보 분석 서비스 기술 분야의 주요 경쟁기술 및 공백기술

 감성정보 분석 서비스 기술 분야의 주요 경쟁기술은 언어분석 기반의 소셜미디어 분석 기술,


이미지(얼굴 및 표정)에서의 분석 기술, 감성응용서비스 기술이, 공백기술은 음성에서의 감성
인식 기술, 언어분석 기반의 개인성향 분석 기술로 나타남

▪ 감성정보 분석 서비스 기술 분야에서 언어분석 기반의 소셜미디어 분석 기술이 가장 경쟁이 치열한


분야이고, 음성에서의 감성 인식 기술 분야는 아직까지 출원이 활발하지 않은 공백기술 분야로
나타남

요소기술 기술 집중도
이미지(얼굴 및 표정)에서의 분석 기술 ◓

동작(제스처)인식을 통한 분석 기술 ◓

음성에서의 감성 인식 기술 ◔

감성신호 측정을 통한 분석 기술 ◓

언어분석 기반의 소셜미디어 분석 기술 ◕

언어분석 기반의 개인성향 분석 기술 ◔

감성응용서비스기술 ◓

※ ●:추출건수의 30%이상, ◕: 30~20%, ◓: 20~10%, ◔: 10~5%, ◯: 5% 미만

270
270
감성정보 분석 서비스

◎ 최신 국내 특허기술 동향

요소기술 최근 핵심기술 동향

•3차원 공간 정보 구축을 위한 빅데이터 시스템의 연계


이미지(얼굴 및 표정)에서의 분석 기술
장치 및 방법

동작(제스처)인식을 통한 분석 기술 •댄스 게임 장치 및 이를 이용한 댄스 게임 방법

음성에서의 감성 인식 기술 •대화용 이모티콘 서비스 제공 방법

감성신호 측정을 통한 분석 기술 •단말기를 이용한 맞춤형 테라피 시스템

•빅데이터 감성 분석을 통한 온라인 이슈 대응 시스템


언어분석 기반의 소셜미디어 분석 기술
및 방법

언어분석 기반의 개인성향 분석 기술 •목표 지향적 빅데이터 비즈니스 분석 프레임워크

•복지서비스 발굴을 위한 빅데이터 사례 기반 감성


감성응용서비스기술
오피니언 추출 및 평가 시스템 및 그 방법

 국내 특허동향을 살펴보면, 공공연구기관은 이미지(얼굴 및 표정)에서의 분석 기술과


동작(제스처)인식을 통한 분석 기술, 감성응용서비스기술을 집중적으로 연구개발하고 있는
것으로 나타남

▪ 이미지(얼굴 및 표정)에서의 분석 기술에서는 3차원 공간 정보 구축을 위한 빅데이터 시스템의 연계


장치 및 방법, 이종동물 양방향 커뮤니케이션 서비스 제공 방법, 딥 러닝 기반 CCTV용 영상 인식
방법 등이 공공연구기관을 중심으로 집중 연구개발 되고 있음

▪ 동작(제스처)인식을 통한 분석 기술 분야는 복댄스 게임 장치 및 이를 이용한 댄스 게임 방법,


반려동물 케어를 위한 멀티모달 시스템 기술 등이 공공연구기관을 중심으로 집중 연구개발 되고
있음

▪ 음성에서의 감성 인식 기술에서는 대화용 이모티콘 서비스 제공 방법, 영상 데이터 처리 방법,


컨시어지 로봇 시스템, 컨시어지 서비스 방법 및 컨시어지 로봇 등이 연구개발되고 있음

▪ 감성신호 측정을 통한 분석 기술 분야는 단말기를 이용한 맞춤형 테라피 시스템, 이어폰을 이용한
필터링된 외부 소리 전달 서비스 제공 방법 등이 연구개발되고 있음

▪ 언어분석 기반의 소셜미디어 분석 기술에서 빅데이터 감성 분석을 통한 온라인 이슈 대응 시스템 및


방법 등이 연구개발되고 있음

▪ 언어분석 기반의 개인성향 분석 기술 분야는 목표 지향적 빅데이터 비즈니스 분석 프레임워크, 어휘


분석을 이용한 트렌드정보 추출 및 예측 방법 등이 연구개발되고 있음

▪ 감성응용서비스기술에서 복지서비스 발굴을 위한 빅데이터 사례 기반 감성 오피니언 추출 및 평가


시스템 및 그 방법 등이 연구개발되고 있음

271
271
전략품목 현황 분석

◎ 중소기업 특허전략 수립 방향 및 시사점

 감성정보 분석 서비스 기술 분야의 공백기술 분야는 음성에서의 감성 인식 기술이고


중소기업의 시장진입 상대적으로 수월한 분야는 감성신호 측정을 통한 분석 기술과 언어분석
기반의 개인성향 분석 기술로 나타남

▪ 감성정보 분석 서비스 기술은 과학기술정보통신부 정보 서비스로 보고 듣는 것에서 만지고, 느끼고,


기기와 소통하게 함으로써 제품과 서비스의 가치가 결정되는 감성 기반의 서비스가 될 것으로 전망

▪ 향후 중소기업은 중소기업을 중심으로 연구 개발이 활발한 음성에서의 감성 인식 기술, 감성신호


측정을 통한 분석 기술 분야에 집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한
언어분석 기반의 소셜미디어 분석 기술 분야에서는 기술 매입이나 라이센싱 등을 통해 부족한
연구개발능력을 보완하는 것이 바람직할 것으로 사료됨

272
272
감성정보 분석 서비스

4. 연구개발 네트워크

가. 연구개발 기관/자원

◎ 연구개발 기관/자원

 다음소프트
▪ 키워드 감성 조회 할 수 있는 Contextual Finder 서비스

 솔트룩스

▪ 국내 최초로 상용화된 인공지능 플랫폼 ADAMs 보유

▪ 개인 맞춤형 AI ‘에바(EVA)’ 7월 출시 예정

 아크릴

▪ 옴니씨앤에스와 감성 분석 인공지능 기반의 심리상담 플랫폼 개발을 위한 MOU 체결(‘18)

▪ 높은 수준의 감성 인식 기술과 딥러닝 기반 고성능 자연어 이해 기술을 갖춘 통합 AI 플랫폼


‘조나단’ 출시

 현대기아자동차

▪ 실시간 감정반응 차량 제어 시스템 R.E.A.D.시스템 출시(‘19)

 네우로데이터 랩

▪ ‘프로모 봇’과 제휴해 사람 기분 파악하는 로봇 시연, 해당 로봇은 음성언어, 행동, 표정, 눈 움직임,
심장박동, 호흡 등을 분석해 사람 기분을 파악

 쿨디

▪ 딥러닝 기술을 이욯해 이미지로부터 관련 정보를 인식하는 기술을 개발하는 스타트업

 마인즈랩

▪ ETRI의 음성인식 기술이전 및 자체 개발, 최고 95%의 음성인식률로 원천기술력의 수준이 높음

 인하대의 송병철 교수팀


▪ 18년 ‘감정 인식 기술 동향’ 연구 발표

273
273
전략품목 현황 분석

나. 연구개발 인력

기관 부서 대표전화번호

한국전자통신연구원 지능정보연구본부 042-860-6340

한국전자통신연구원 지능로보틱스연구본부 042-860-1629

한국전자통신연구원 바이오의료IT연구본부 042-860-5465

한국전자통신연구원 중소기업협력부 042-860-1263

한국정보화진흥원 ICT융합본부 053-230-1418

한국정보화진흥원 지능데이터사업팀 053-230-1278

다. 기술이전가능 기술

 감성 정보 분석 서비스의 요소기술은 이미지에서의 분석 기술, 동작(제스처)인식을 통한 분석


기술, 음성에서의 감성 인식 기술, 감성신호 측정을 통한 인식 기술 등이 있음

 기술이전이 가능한 기관은 한국전자통신연구원이 대표적

요소기술 기관

3차원 휴먼 동작 인식 및 행동인식 기술 한국전자통신연구원

생체신호 수집 및 분석 기술 한국전자통신연구원

손목밴드형 생체신호 센싱 디바이스 기술 한국전자통신연구원

얼굴 정보 인식 기술 한국전자통신연구원

얼굴영상기반 심박신호 측정 기술 한국전자통신연구원

엑소브레인 한국어 언어 분석 툴킷 한국전자통신연구원

주행상황 및 운전자 상태 판단 기술 한국전자통신연구원

한영중일 순환신경망 기반 단말탑재형 음성인식기술 한국전자통신연구원

274
274
감성정보 분석 서비스

5. 기술개발로드맵

가. SWOT 분석

중소기업 시장대응전략

강점(Strength) 약점(Weakness)
•세계수준의 ICT 인프라, 역량, 제조 경쟁력 보유 •대기업 중심의 기업 생태계로 중소·벤처 활성화를 통한
•정부의 혁신형 중소기업 육성, 신기술·신산업 창출 지원 산업의 다양성과 기술력·성장역량 확보 부진
- (간접지원(세액공제 등)을 확대하고 바우처 등 중소기업의 •우수 기술인력의 중소기업 기피로 산업 활력 저하 우려
시장경쟁력을 높여주는 R&D지원 확대 •기술수준·교육시스템 등 4차 산업혁명 적응도 평가, 세계
- ‘22년까지 중소기업 전용 R&D ’17년 대비 2배 확대 추진 25위에 불과(UBS, ‘16)

기회(Opportunity) 위협(Threat)
•핵심 선도사업 등에 대하여 ‘규제 샌드박스’ 본격 추진 •사업관리 중심의 연구제도, 창의·도전적 연구를 가로막는
•정부 중소·중견기업 대상 인공지능 전문기업 육성 연구관리 행정부담 개선 필요
(‘19년 총 26.25억 원, 총 7개 과제 내외) •시장의 급성장에 따라 정부의 주도권이 상실되었음에도
•혁신성장 옴부즈만을 본격 운영하여 현장의 애로사항을 불구하고 여전히 정부 주도의 추격형 전략을 지속하여
해소하고 기업의 혁신 지원을 위한 규제개선 추진 민간과 중복 문제 발생

중소기업의 시장대응전략
➜ 규제 샌드박스 제도를 활용하여 중소기업의 장점인 속도와 유연성으로 대기업보다 빠르게 시장 선점
➜ 산학연 및 대-중견-중소기업 협력에 기반해 자체적으로 진행하기 어려웠던 R&D 진행
➜ 정부 R&D사업과 현장실습 프로그램 연계로 부족한 인력 확충하여 경쟁력 제고

나. 중소기업 핵심요소기술

(1) 핵심요소기술 도출절차

 특허/논문 분석을 통한 요소기술과 기술수요와 각종 문헌을 기반으로 한 요소기술, 전문가


추천 요소기술을 종합하여 품목별 전문가를 통해 분류조정한 후, 전문가 평가과정을 거쳐
핵심요소기술을 선정
- 기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업 적합성(10)을 고려하여 평가

요소기술 요소기술 핵심요소기술 핵심요소기술


Pool 구성 분류 조정 선정평가 선정

- 특허/논문 분석 è - 품목별 전문가 è - 산학연 전문가 검토 è - 평가결과 반영


- 기술수요 및
요소기술 분류 - 평가항목별 요소기술 로드맵 기획 대상
문헌분석
조정·재정의 선정평가 핵심요소기술 도출
- 전문가 추천

275
275
전략품목 현황 분석

2) 요소기술

 산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처 로드맵, 중소기업 기술수요를 바탕으로
로드맵 기획을 위하여 요소기술 도출

 요소기술을 대상으로 전문가를 통해 기술의 범위, 요소기술 간 중복성 등을 조정·검토하여


최종 요소기술 확정
[ 감성정보 분석 서비스 분야 요소기술 ]

요소기술 출처

이미지(얼굴 및 표정)에서의 분석 기술 특허/논문 분석, 전문가추천

동작(제스처)인식을 통한 분석 기술 특허/논문 분석, 전문가추천

음성에서의 감성 인식 기술 특허/논문 분석, 전문가추천

감성신호 측정을 통한 분석 기술 특허/논문 분석, 전문가추천

언어분석 기반의 소셜미디어 분석 기술 특허/논문 분석, 전문가추천

언어분석 기반의 개인성향 분석 기술 특허/논문 분석, 전문가추천

감성응용서비스기술 특허/논문 분석, 전문가추천

실시간감성인지서비스기술 특허/논문 분석, 전문가추천

감성응용의료서비스기술 특허/논문 분석, 전문가추천

276
276
감성정보 분석 서비스

(3) 핵심요소기술 도출

 확정된 요소기술을 대상으로 산․학․연 전문가로 구성된 핵심요소기술 선정평가를 통하여


중소기업에 적합한 핵심요소기술 선정

[ 감성정보 분석 서비스 분야 핵심요소기술 ]

분류 핵심요소기술 설명

이미지(얼굴 및 표정)에서의 얼굴 및 표정으로부터 특징과 변화를 인식하고 저장된 정보와의


분석 기술 대조를 통해 내적 감성상태를 추정하는 기술

컴퓨터 비전 기술을 이용하여 사용자 식별과 인간 감정 및 행동


동작(제스처)인식을 통한 분석
인식과 분류에 대한 기술로 인간의 내면을 인식하는 데이터 분석
기술
기술

감성분석
감정변화에 따라 변화하는 음성의 질, 높이, 강도, 속도, 템포,
음성에서의 감성 인식 기술 억양, 악센트, 어휘 사용 등의 빅데이터를 분석함으로써 감성을
인식하는 데 활용하는 기술

감성이나 감성의 지속적 상태인 기분을 측정하기 위해 호르몬의


감성신호 측정을 통한 분석
레벨, 신경 전달 속도 및 신경 시스템 활동 상태 등을 측정하고
기술
이 데이터를 계량화하는 기술

언어분석 기반의 소셜미디어 소셜 빅데이터로부터 이슈를 탐지, 모니터링 하여 이슈의 향후


분석 기술 전개 과정에 대한 예측 기술
언어분석
기반 기술
언어분석 기반의 개인성향 개인이 쓴 텍스트(소개서, 일기, 블로그, 소셜 데이터)관련
분석 기술 빅데이터를 분석하여 개인의 성향과 감성 등을 분석하는 기술

이용자의 감성 패턴을 분석, 이용자의 감성에 맞는 음악,


응용서비스 감성응용서비스기술
서비스를 제공하는 기술

277
277
전략품목 현황 분석

다. 기술개발전략

(1) 우리의 현황

 국내 감성정보 분석 서비스 분야에서의 시장 규모는 64조 원이며 세계 시장은 2억 4,994억


달러 규모인 것으로 파악

 국내 시장 성장률은 9.4%로 세계 시장 성장률인 9.6%보다 낮음 수치를 보임

 국내 중소기업의 감성정보 분석 서비스 분야 기술 수준은 세계 최고 수준을 보유한


미국(100%)를 기분으로 50.4%, 5.66년의 기술격차를 보이는 것으로 조사됨

 특허 출원량은 731건으로 미국의 358건에 비해 높은 수치

 특허 피인용지수는 미국이 3.1로 가장 높은 수치이며 국내는 0.5로 조사됨

[ 감성정보 분석 서비스 전략 캔버스(Strategy Canvas) ]

* 기술수준은 응답자 평균치

278
278
감성정보 분석 서비스

(2) 기술개발로드맵

 감성신호 측정을 통한 분석 기술과 언어분석 기반의 개인성향 분석 기술은 중소기업이


상대적으로 접근하기 용이한 요소기술로 분석

 국내 감성정보 분석 서비스의 시장 규모는 세계 시장 대비 작은 편이지만, 세계 시장


성장률에 근접한 성장률과 세계 최다 특허 출원량은 해당 분야 품목 개발에 고무적임을 시사

 향후 중소기업은 중소기업을 중심으로 연구 개발이 활발한 음성에서의 감성 인식 기술,


감성신호 측정을 통한 분석 기술 분야에 집중하여 연구 개발하는 것이 바람직할 것으로 분석

279
279
전략품목 현황 분석

※ 참고 : 핵심요소기술 평가결과

지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
이미지
(얼굴 및 표정)에서의 8.7 8.2 8.0 8.0 32.8 선정
분석 기술

동작(제스처)인식을 통한
8.7 8.8 7.5 8.2 33.2 선정
분석 기술

음성에서의 감성 인식
8.5 8.7 6.7 7.8 31.7 선정
기술

감성신호 측정을 통한
8.0 8.3 7.0 8.2 31.5 선정
분석 기술

언어분석 기반의
7.7 8.3 7.5 8.0 31.5 선정
소셜미디어 분석 기술

언어분석 기반의 개인성향


8.2 8.0 7.5 8.0 31.7 선정
분석 기술

감성응용서비스기술 7.8 7.8 7.8 8.3 31.8 선정

실시간감성인지서비스기술 7.8 8.0 7.8 7.7 31.3

감성응용의료서비스기술 7.8 8.2 7.3 8.0 31.3

280
280
감성정보 분석 서비스

※ 붙임

1. 참여위원 명단

소속 직위 성명

단국대학교 교수 나연묵

전자부품연구원 책임연구원 신사임

전북대학교 교수 이말례

애드잇 대표 배지은

대구가톨릭대학교 교수 이종혁

가천대학교 교수 이강윤

시엠아이코리아 대표 이상훈

위세아이텍 부장 박병훈

T3Q 대표 박병훈

281
281
2. 전략품목 선정평가 결과
전략품목 후보 지표별 평가결과
4차
중소 일자리 비고
산업
No 명칭 기술성 시장성 기업 창출 합계
혁명
적합성 효과성
대응성

빅데이터를 활용한 개인화


1 6.4 6.8 6.6 8 6.8 34.6
맞춤 서비스

빅데이터 내 데이터 품질
2 7.8 7.4 8.4 8.2 7 38.8 선정
검사 자동화 시스템

자연어 처리기반 텍스트


3 8.2 8.2 7 8 7.2 38.6 선정
마이닝

유통/물류 빅데이터 구축 및
4 7.8 8.8 8.2 8 8.2 41 선정
분석 시스템

데이터 보안(Data Security)


5 7 7.4 6.2 6.4 6 33
플랫폼

다종/이중의 복합 Interface
6 Data 빅데이터 통합 처리 6.6 5.6 4.8 5.6 6.2 28.8
시스템

실시간 빅데이터 분석을


7 지원하는 일체형 빅데이터 6.8 7.4 7 6.8 6.8 34.8
플랫폼

빅데이터 분석 및 시각화
8 6.6 7 7.6 8 8.2 37.4 선정
플랫폼

감성정보 분석
감성정보 수집 및 분석
9 8 7.4 6.2 7.8 6.8 36.2 서비스
플랫폼
품목명 변경

빅데이터 수집·저장·처리·관리
10 5.8 6 6 6 5.2 29
시스템

11 머신러닝 자동화 도구 7 6 4.6 6.6 5.4 29.6

지능형 빅데이터 분석·예측


12 7.8 7 6.2 6.4 6.2 33.6
시스템

282
282
전략품목 후보 지표별 평가결과
4차
중소 일자리 비고
산업
No 명칭 기술성 시장성 기업 창출 합계
혁명
적합성 효과성
대응성

GPU를 활용한 3차원


13 6 6 6 6 6 31.4
고속병렬처리 시스템

데이터 3D 변환
14 3D 시각화 도구 9 8.75 9.25 7.75 8.5 42.6 시각화 도구
품목명 변경

스마트 제조 빅데이터 분석 스마트 공장


15 8.6 9 8.8 8.8 8.4 43.6
시스템 분야로 이전

GPU에서 동작하는 암호화


16 6.8 6 5.8 6.4 5.4 30.4
플랫폼

17 빅데이터 기반 지식 서비스 6.8 7 7.4 7.4 7 35.6

283
283

You might also like