2018년 중소기업 기술로드맵 - 02 빅데이터 PDF
2018년 중소기업 기술로드맵 - 02 빅데이터 PDF
전략 분야
빅데이터
1. 개요 ········································································································································· 1
2. 정책 분석 ······························································································································· 4
3. 생태계 분석 ···························································································································· 9
4. 기술 분석 ····························································································································· 20
5. 중소기업 시장대응전략 도출 ····························································································· 31
6. 전략품목 ······························································································································· 32
전략 품목
빅데이터 내 데이터 품질 검사 자동화 시스템
1. 개요 ······································································································································ 38
2. 외부환경 분석 ····················································································································· 42
3. 기술 분석 ····························································································································· 51
4. 연구개발 네트워크 ·············································································································· 68
5. 기술개발로드맵 ···················································································································· 71
1. 개요 ······································································································································ 80
2. 외부환경 분석 ····················································································································· 85
3. 기술 분석 ····························································································································· 92
4. 연구개발 네트워크 ············································································································ 104
5. 기술개발로드맵 ················································································································· 107
유통/물류 빅데이터 구축 및 분석 시스템
1. 개요 ···································································································································· 116
2. 외부환경 분석 ··················································································································· 120
3. 기술 분석 ··························································································································· 127
4. 연구개발 네트워크 ············································································································ 149
5. 기술개발로드맵 ················································································································· 153
1. 개요 ···································································································································· 162
2. 외부환경 분석 ··················································································································· 166
3. 기술 분석 ··························································································································· 173
4. 연구개발 네트워크 ············································································································ 190
5. 기술개발로드맵 ················································································································· 196
데이터 3D 변환 시각화 도구
1. 개요 ···································································································································· 206
2. 외부환경 분석 ··················································································································· 209
3. 기술 분석 ··························································································································· 216
4. 연구개발 네트워크 ············································································································ 235
5. 기술개발로드맵 ················································································································· 237
감성정보 분석 서비스
1. 개요 ···································································································································· 245
2. 외부환경 분석 ··················································································································· 248
3. 기술 분석 ··························································································································· 254
4. 연구개발 네트워크 ············································································································ 273
5. 기술개발로드맵 ················································································································· 275
전략분야 현황분석
빅데이터
빅데이터
빅데이터
1. 개요
가. 정의
나. 범위 및 분류
(1) 범위
데이터와 빅데이터
▪ 사람이 가지고 있는 일반적 지식을 노드와 링크 구조의 시맨틱 네트워크(semantic network)로 표현한
것도 지식(knowledge)이라고 하며, 최근에는 온톨로지(ontology) 형태로 표현
1
1
전략분야 현황분석
2
2
빅데이터
(2) 분류
[ 빅데이터 분류 ]
기술 내용
•빅데이터 수집/정제/융합/가공
•실시간 ETL/ELT
•데이터 생성/증강
•민간정보 은닉, 비식별화 및 필터링
빅데이터 수집/유통
•센서/머신 데이터 수집 및 정제
•웹/소셜 데이터 수집 및 정제
•데이터 품질 및 생명주기 관리
•데이터 유통 및 공유
•대규모 데이터 분산 저장
•대규모 데이터 분산 처리
•복합 스트림/이벤트 데이터 실시간 처리
빅데이터 저장/처리/관리 •인메모리 기반 실시간 데이터 관리
•운영/분석 통합형 데이터 관리
•데이터 큐레이션 자동화
•가상 데이터맵 관리
3
3
전략분야 현황분석
2. 정책 분석
가. 해외 정책동향
◎ 미국
▪ 빅데이터 개술 개발, 의사결정 도구 R&D 지원, 빅데이터 인프라 강화, 개인정보 보호와 윤리적
접근 추구, 빅데이터 인력 확충과 협력 생태계 구축이 주요 내용
4
4
빅데이터
◎ 유럽
데이터 경제 육성 전략 [’17]
◎ 중국
5
5
전략분야 현황분석
빅데이터의 응용 기술 표준 및 통계 표준 제정
◎ 일본
▪ G20 정상회의에서 데이터베이스 구축에 미국과 유럽의 참가를 요청해 10억 명 이상의 정보가
집적된 초국가적인 데이터베이스 Pool 구축을 최종 목표로 함
6
6
빅데이터
나. 국내 정책 동향
데이터 산업 활성화 전략: I-Korea 4.0 데이터 분야 계획 I-Data [관계부처 합동, ‘18.6]
- 빅데이터 전문기업 성장 지원으로 데이터 강소기업 100개社를 육성하고 빅데이터 개발에 필수적인
컴퓨팅 자원, 데이터셋 등이 집적된 판교 글로벌 ICT 혁신 클러스터 지속 고도화 및 활용 지원
- K-ICT빅데이터센터, K-ICT클라우드혁신센터, 글로벌 IoT시험인증센터, 정보보호클러스터,
HPC이노베이션허브 등, 세계 최고수준의 성능을 갖춘 초고성능컴퓨터 5호기와도 연계
▪ 제조업, 에너지, 농수산업, 스마트시티 등의 분야에 빅데이터 기술을 활용하거나, 빅데이터를 구축하여 지능화 혁신 추진
7
7
전략분야 현황분석
▪ 고품질의 데이터 개방과 과학적인 정책결정 지원을 위하여, 데이터 관리체계 및 빅데이터 분석지원
등을 중점적으로 추진할 계획 발표
▪ 정보주체를 알아볼 수 없도록 비식별 조치를 적정하게 한 비식별 정보는 개인정보가 아닌 것으로
추정하여 빅데이터 분석에 폭 넓게 활용 가능하도록 허용
8
8
빅데이터
3. 생태계 분석
가. 시장 동향 및 전망
(1) 세계시장
빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 2022년
900억 달러로 성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용
빅데이터 세계 시장은 ‘23년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)
9
9
전략분야 현황분석
▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 2020년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정
▪ ‘16년 기준, 빅데이터 인프라, 소프트웨어, 서비스 부문은 각각 51.4%, 22.4%, 26.2%의
비중으로 시장 형성
▪ 인프라 시장의 경우, ’17년 177억 달러 규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장
형성 예측
[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순
▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)
▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, ‘18년 165억 달러에서 ‘26년
213억 달러로 성장
10
10
빅데이터
▪ ‘17년에는 171억 달러 수준에 그쳤으나, ’18년에는 243억 달러, ‘19년에는 346억 달러로 크게
성장할 것으로 전망되며, 성장추세는 매년 지속적이거나 더 큰 성장세를 보일 것으로 예측
120
99.3
100
80 69.8
백
만
60 49.1
달 34.6
40
러
24.3
17.1
20
0
2017 2018 2019 2020 2021 2022
11
11
전략분야 현황분석
비관계형 분석 데이터 저장소 분야는 ‘15년과 ’20년 사이에 연평균 38.6%의 성장률로
빅데이터 분야에서 가장 빠르게 성장
50
38.6
연 40
평
30 23.3
균
17.3 16.6
20 14.6
성 9.3
장 10
률
0
비관계형 인지적 콘텐츠 분석 탐색 시스템 IT 서비스 기타
% 분석 소프트웨어
데이터 플랫폼
저장소
▪ 문서 DB인 Mongo DB가 231억 달러, Hadoop 플랫폼을 제공하는 Cloudera가 141억 달러의
투자를 유치하는 등 신생 빅데이터 업체 중 상위 4개의 확보투자액이 ’14년 말 기준 약 700억
달러 기록
12
12
빅데이터
(2) 국내시장
빅데이터 국내 시장은 연평균 24.7% 성장하고 있어, ‘17년 2,442억 원에서 ’20년 4,468억
규모에 이를 것으로 기대. (’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)
*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용
[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0
13
13
전략분야 현황분석
국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억 원로 연평균 7.6% 성장 예상 [출처: 데이터 산업 활성화 전략, 2018.6]
▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요 도출
▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름
14
14
빅데이터
나. 가치사슬 분석
[ 빅데이터 분야 생태계 현황 ]
(단위: 개, 명, 억 원)
빅데이터
중소기업 84 (82.4) 2,301 35 2,453.7 48.1 9.8 4.9
분야 전체
15
15
전략분야 현황분석
다. 주요 이슈
16
16
빅데이터
데이터 기반 기업 경쟁력 강화
기업 비용 절감 사례
- 매출액의 75%가 자사 제품에 부착한 센서데이터를 통한 유지보수에서 발생
GE - 자사가 취급하는 선박‧항공기엔진‧발전소터빈‧의료기기 등에서 수집한 데이터 분석 결과를
고객에게 제공, 연간 200억 달러의 이익 창출을 예상
국내 데이터 산업 준비 부족
▪ 데이터가 산업·사회 혁신의 촉매제로 역할이 기대되나 산업적 활용은 아직 초기단계로서 산업 전반의
경쟁력 제고에 한계에 봉착하고 있고, 국내 전체 사업체 빅데이터 이용률은 7.5%로 매우 낮음
17
17
전략분야 현황분석
분야 빅데이터 구축 방향
의료 의료 인공지능(AI) 개발을 위한 학습용 의료데이터셋 및 의료정보시스템 구축(’18)
◎ 기술 인프라 현황
기반 기술 개발 추이
▪ 빅데이터의 신속한 처리를 위해 Hadoop에서 Spark와 같은 인메모리 활용을 통해 처리 속도를
높이는 기술, 클라우드 상에서의 빅데이터 처리를 위해 VM 대신 컨테이너를 활용하는 기술,
NoSQL에서 ACID를 보장하는 NewSQL 기술로의 리턴, 빅데이터 기술과 AI 기술의 밀접한 결합,
빅데이터 처리를 위한 HPC 고성능 컴퓨팅과 고밀도 고집적 데이터센터 출현 등이 이슈화
▪ 관계형 모델, 키-밸류 모델, 문서 모델, 그래프 모델 등 이질적인 다양한 데이터 소스의 차이로 인한
데이터 활용 복잡성을 해소하여 손쉽게 융합 분석 결과를 얻는 크로스 모델 데이터 통합 처리
플랫폼 연구 개발 추진 예정
18
18
빅데이터
▪ 글로벌 수준의 데이터 강소기업 육성을 위해 컴퓨팅 자원, 데이터 셋 등이 집적된 판교 글로벌 ICT
혁신 클러스터 고도화 및 맞춤형 성장 지원 강화
19
19
전략분야 현황분석
4. 기술 분석
가. 해외기술 동향
(IoT 시스템) 급격하게 증가하고 있는 IoT 시스템들은 향후 빅데이터 소스로서 주요한 역할을
할 것으로 보임
20
20
빅데이터
주요 기술별 연구개발 현황
▪ 공간분석: 미국을 중심으로 한 세계 각국의 공공 데이터 개방이 있고, 구글, 야후, 트위터 등
기업들과 연구기관 및 정부기관에서 다양한 플랫폼과 시스템을 구축 서비스 중
▪ 고급분석: 해외업체들이 예측분석 솔루션 분야에서 강세를 보이고 있으며, 특히 IBM, SAS는
포레스터가 선정한 가장 경쟁력 있는 솔루션 업체
◎ 핵심플레이어 동향
▪ 구글은 그래프 알고리즘의 처리를 지원하기 위한 기술인 Pregel, 대용량 데이터를 분산 처리로
빠르게 분석할 수 있는 기술인 Dremel, 검색 인덱스를 작성하기 위한 기술인 Percolator 등의
빅데이터 관련 기술 및 도구들을 직접 개발하여 사용하고 있으며, 대용량 데이터의 실시간 처리
기술인 Dremel을 BigQuery로 상용화하여 서비스를 제공 중
▪ 구글은 플랫폼 업체로서 오래 전부터 온라인, 오프라인에서 수많은 데이터를 모으고 있는 중이며
인터넷 상의 웹 페이지 수집뿐만 아니라, Gmail, 캘린더 등의 무료 서비스를 통해 사용자 데이터와
스트리트뷰, 북스 라이브러리 프로젝트 등을 통해 오프라인 데이터, 구글 플러스 등을 통한 SNS의
데이터, 안드로이드 기기를 통한 디바이스의 데이터까지 모으고 있음. 즉, 사용자가 구글이 제공하는
서비스를 이용하기만 하면 구글의 클라우드에 데이터가 자동으로 쌓이는 구조이며 구글은 이렇게
모은 데이터를 각종 광고 사업에 활용해 수익을 창출
21
21
전략분야 현황분석
▪ 고객이 구매 패턴 예측을 통해 고객이 구매할 것으로 예상되는 물품을 미리 포장해서 고객과 가까운
물류창고에 옮겨 놓음으로써 배달 시간과 물류비용을 절감
▪ 실시간 데이터를 수집, 색인, 상관지어 검색 가능한 저장소에 저장하고, 그래프, 리포트, 경고,
대시보드, 시각화 등을 생성
22
22
빅데이터
[ Splunk 개념도 ]
SAP는 기존의 ERP 엔진에 인메모리 데이터베이스와 데이터 분석 기능을 통합한 SAP
HANA를 중심으로 시장 점유율을 확대
23
23
전략분야 현황분석
나. 국내기술 동향
주요 기술별 연구개발 현황
▪ 빅데이터 서비스 기술(BDaaS): 클라우드 환경에서 여러 사용자간의 데이터 공유와 분석을 지원하기
위해 업체 중심으로 멀티테넌트 Hadoop 개발이 진행중이나, 컴퓨팅 자원관리, 데이터보안 등의
국외 기술에 비해 성숙도가 낮은 모델
◎ 핵심플레이어 동향
▪ 실시간으로 발생하는 다양한 형태의 머신/휴먼데이터를 수집하여 데이터에 기반한 신속한 비즈니스
의사 결정을 지원하는 Lean Stream 솔루션을 제공
24
24
빅데이터
▪ TeraONE은 Hadoop, HDFS, HBase, Hive 등을 기반으로 정형 데이터, 비정형 데이터, 빅데이터의
통합과 데이터 거버넌스를 종합적으로 구성한 One-Stop 데이터 처리 플랫폼 제공
25
25
전략분야 현황분석
[ Goldilocks 아키텍처 ]
▪ 빅데이터 플랫폼 BAAS(Bigdata Analysis & Application System)는 다양한 오픈소스와 그루터
자체 기술로 구성된 소프트웨어 스택 솔루션 제공
▪ 데이터 부문은 예측분석 소프트웨어 및 솔루션, 예측분석 컨설팅, 빅데이터 솔루션 사업, 교육 및
출판사업 등 데이터의 컨설팅, 분석, 구축 및 운영에 이르는 데이터 솔루션 사업을 진행하고 있고,
인프라 부문은 데이터의 수집 및 저장에 필요한 스토리지, 서버 및 네트워크, 가상화 플랫폼,
클라우드 포털 솔루션을 제공하고 있으며, 서비스 부문은 SI 서비스, SM, ICT 컨설팅과 IoT 솔루션
기반의 여러 서비스 사업을 수행
26
26
빅데이터
[ NetMiner의 분석 결과 리포트의 예 ]
27
27
전략분야 현황분석
▪ 텍스트 마이닝: 고품질 개체명 인식, 내용기반 자동분류, 이슈 군집분석 등 고난이도 고품질의
결과를 제공하는 텍스트 마이닝 서비스를 제공함
▪ 산업 IoT, 클라우드, 빅데이터 기술을 기반으로 제조 환경의 실시간 데이터를 검출, 분석, 예측하여
고장 탐지, 데이터 분석, AI 기반의 운영 등을 실현하기 위한 솔루션 제공
(빅데이터 분석) 네이버, 카카오 등 국내를 대표하는 포털, SNS 업체들도 자사에 누적된
빅데이터를 기반으로 다양한 빅데이터 분석을 수행하고 API 공개를 통해 빅데이터 활용
서비스 제공
28
28
빅데이터
중소기업
참여정도
◔ ◔
중소기업
시장점유정도
◔ ◔
* 중소기업 참여정도와 점유율은 주요제품 시장에 참여하는 중소기업의 참여규모와 정도(업체수, 비율 등)를 고려하여 5단계로 구분
(낮은 단계: ○ ,중간 단계(◔, ◑, ◕) 높은 단계: ●)
29
29
전략분야 현황분석
다. 기술개발 시나리오
30
30
빅데이터
5. 중소기업 시장대응전략 도출
•데이터/데이터셋 부족 및 데이터 품질 저조
•4차 산업에서 빅데이터 기반 및 실제 데이터 축적
•전문 인력 부족 및 개발 비용 부담으로 중소기업의 기술
필요성 증가
개발에 한계 발생
기술 •AI에서 데이터 및 지식 축적의 중요도 증가
•원천기술 분야에서 선도국가와의 기술격차
•스마트기기 및 IoT 센서 확산에 따른 비정형
•빅데이터 전문가 및 우수 인력 부족
데이터 폭증
•취약한 빅데이터 분석 기술(SW)
중소기업의 시장대응전략
31
31
전략분야 현황분석
6. 전략품목
가. 전략품목 도출절차
분야 설정
메가트렌드 분석, 핵심투자주제 발굴, 타부처 정책 분석, R&D 신청·지원과제 분석 등을 통해
중소기업 기술개발 전략분야 설정
전문가위원회 구성
현장밀착형 기술로드맵 수립 및 전략 강화를 위해 30개 분야별 산・학・연 전문가 풀을 구성하여
분야별 전략품목 추천 및 검토 진행
전략품목 Pool 구성
주요 제품·상품의 키워드 검색과 특허정보의 기술분류 매핑, R&D과제 지원기업 매핑을 통해
분야별 분석대상 기업 Pool을 구성하여 기술수요조사 및 품목이슈 발굴
전략품목 후보리스트 구성
전략품목 후보 발굴 체크리스트를 통해 후보 적합성 평가를 실시해 상대적으로 적합성이 부족한
품목을 1차 제외하고, 분야별 전략품목 검토위원회의 검토 기초자료로 활용
전략품목 선정
분석대상 기업 Pool을 활용한 생태계 분석과 1차 분야별 전략품목 검토위원회, 2차 전문가 워크샵을
통해 산・학・연 전문가 반복 검토로 전략품목 선정
32
32
빅데이터
나. 전략품목 도출결과
전략품목 개요 및 선정사유
33
33
34
전략품목 현황분석
빅데이터 내
데이터 품질 검사
자동화 시스템
35
36
빅데이터 내 데이터 품질 검사 자동화 시스템
정의 및 범위
▪ 데이터와 관련된 품질진단의 종류는 크게 데이터 값 진단, 데이터 구조 진단, 데이터 관리 프로세스
진단 등으로 구분
정부지원 정책
강점(Strength) 약점(Weakness)
•(환경) 4차산업혁명에 따른 빅데이터 시대 강조 •(환경) 빅데이터에 대한 낮은 신뢰성
•(기술) IoT, 클라우드, 빅데이터의 연계구조 확산 •(기술) 핵심 원천기술 미흡
•(정책) 인공지능 산업 활성화에 따른 관련 투자 증가 •(정책) 단기간 성과 도출 중심 투자
기회(Opportunity) 위협(Threat)
•(환경) 대기업의 빅데이터 도입 확산 •(환경) 빅데이터 분석 전문인력 부족
•(기술) 실시간 데이터 분석 기술의 발전 •(기술) 원천기술에 대한 기업경쟁력 미흡
•(정책) 빅데이터 활성화 정책 확대 •(정책) 개인정보유출 및 침해로 인한 정책마련 부족
중소기업의 시장대응전략
➜ 현재 기초적인 품질검사 솔루션들을 이용해 인공지능 엔진을 접목하여 자동화 시스템을 구축하고,
현재 품질검사 인력을 대체할 수 있도록 하여 데이터 품질을 향상
1. 개요
가. 정의 및 필요성
38
38
빅데이터 내 데이터 품질검사 자동화 시스템
▪ 데이터 품질 검사가 필수적인 비정형 데이터가 전체 정보량의 92%를 차지하고 있고, 정형 텍스트
데이터는 8%에 불과하여 비정형 데이터가 디지털정보에서 압도적인 비중을 차지하고 있음
▪ 산업별 가이드에 대한 부재로 현장에서 지표의 적용이 어렵고, 범용적 지표만 가이드
▪ 데이터 품질 측정을 위한 사전분석 작업을 인적 자원에 의존하기 때문에 진단에 시간과 인적 자원이
과다 소요
▪ 현재는 금융이나 공공분야 대규모 사이트 위주로 품질관리시스템이 도입되고 있으며, SQL기반의
측정방식으로 비정형 데이터에 대한 측정이 어려움
39
39
전략품목 현황 분석
나. 범위
(1) 제품분류 관점
[ 제품분류 관점 기술범위 ]
데이터품질 이상값 탐지, 텍스트 매칭, 텍스트 클러스터링, 명칭오류 탐지, 품질오류
진단 및 평가 패턴 분류, 데이터품질 Scoring 등
40
40
빅데이터 내 데이터 품질검사 자동화 시스템
(2) 공급망 관점
[ 공급망 관점 기술범위 ]
빅데이터 내
데이터 품질 •농·축·수산물품목,가격, 생산액, 시설제원, 수출입통계, 귀농,귀촌인
농·축·수산업
검사 자동화 현황, 수산통계연보, 농업관측정보 등
시스템
41
41
전략품목 현황 분석
2. 외부환경 분석
가. 산업환경 분석
(1) 산업의 특징
▪ 데이터가 자본이나 노동을 능가할 경쟁의 원천으로 부상하였고, 대규모 데이터를 보유하고 이를 잘
활용하는 기업이 시장을 주도하는 추세
- 시민단체에서는 법적 근거가 없고, 재식별 가능성이 있다는 이유로 가이드라인 활용 기관을 고발한
사례도 있음
42
42
빅데이터 내 데이터 품질검사 자동화 시스템
▪ 개별기업 중심의 제한적 데이터 유통이 이뤄지고 있으며, 거래제도가 확립되어있지 않는 등으로
인해 질 좋은 데이터의 유통을 제한
(2) 산업의 구조
세계 데이터 시장 규모는 ‘17년 1,508억 달러에서 ’20년 2,100억 달러까지 성장할 것으로
전망되며, 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문 서비스 분야 순으로 데이터 시장의
영역을 차지
43
43
전략품목 현황 분석
▪ IDC는 빅데이터 시장 내 소프트웨어가 ‘19년 550억 달러의 시장을 형성할 것으로 전망하며, 특히
최종 사용자 쿼리, 보고, 분석 도구 및 데이터 웨어하우스 관리 툴이 이 중절반 이상을 점유할
것으로 예상
▪ 빅데이터 하드웨어 시장은 2019년 280억 달러 규모를 형성할 것이라 예측, 산업별로는 다음 3가지
업종이 두드러짐
[ 산업별 예상 시장 규모 ]
산 업 시장규모
*출처: ciokorea
44
44
빅데이터 내 데이터 품질검사 자동화 시스템
빅데이터 산업은 데이터의 생성과 분석, 재가공의 과정에서 데이터를 둘러싼 많은 개체가
활동을 하고, 빅데이터 서비스 제공을 위하여 여러 산업과 기업이 상호작용하는 복잡한
구조이며 빅데이터 산업의 구성은 빅데이터 자체와 행위자, 가치 생산자, 외부 환경으로 볼
수 있음
▪ 생산자의 범위와 역할로 개인의 경우 일상생활 활동, 기업은 단순 비즈니스 활동, 정부의 경우에는
공공 빅데이터 생산
▪ 외부 환경으로는 빅데이터 산업을 둘러싼 다양한 산업, 문화, 기술적 환경을 말하며 외부 환경의
예로는 클라우드, 사물인터넷(IoT), 스마트 공장(Smart Factory) 등이 있음
45
45
전략품목 현황 분석
나. 시장환경 분석
(1) 세계시장
빅데이터 세계 시장은 연평균 10.6% 성장하여, ‘17년 534억 달러에서 ’22년 900억 달러로
성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용
빅데이터 세계 시장은 ‘23년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점할
것으로 전망 (‘16, 지식산업정보원)
▪ 빅데이터 개발 선진국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,
민간 데이터 시장에서는 중개업이 활성화되어 있음
46
46
빅데이터 내 데이터 품질검사 자동화 시스템
▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 2020년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정
▪ 인프라 시장의 경우, ’16년 136억 달러 규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장
형성을 예측
[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용
세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 지역별 시장 규모 : 미국(788억 달러), 서유럽(341억 달러), 아시아태평양(일본제외)(136억 달러) 지역 순
▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)
▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, ‘18년 165억 달러에서 ’26년 213억
달러로 성장
47
47
전략품목 현황 분석
[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
48
48
빅데이터 내 데이터 품질검사 자동화 시스템
(2) 국내시장
빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 ’20년
4,468억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)
*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용
[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0
49
49
전략품목 현황 분석
국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억원로 연평균 7.6% 성장 예상 [출처: 데이터 산업 활성화 전략, 2018.6]
▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출
▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름
50
50
빅데이터 내 데이터 품질검사 자동화 시스템
3. 기술 분석
가. 기술개발 이슈
공공 데이터 측면
민간 데이터 측면
▪ 기업의 특성상 데이터 품질관리를 위한 지속적인 투자와 리소스 투입이 어려운 것이 사실이지만,
ICT 비즈니스 추진에 따라 데이터품질 관리 활동은 기업 경쟁력 강화를 위해 반드시 필요한 업무
영역이라는 인식이 점차 확산 중
51
51
전략품목 현황 분석
◎ 연구 개발 동향
빅데이터 내 품질검사 자동화 시스템은 데이터품질 진단과 평가기술, 패턴분석 기술, 데이터
전처리 기술, 데이터 이상값 탐지 기술, 명칭 오류 탐지 기술, 데이터 품질 개선 기술 등의
복합적인 기술 요구
데이터 품질 진단 및 평가 기술
▪ 데이터 품질 진단 및 평가 기술에는 이상값 탐지, 텍스트 매칭, 텍스트 클러스터링, 명칭오류 탐지,
품질오류 패턴 분류, 데이터품질 Scoring 방법이 사용
패턴분석 기술
▪ 대용량의 데이터베이스에 저장된 데이터에 숨겨진 중요한 정보와 지식을 추출하는 데이터 마이닝
기술과 예측정보를 제공할 수 있는 예측 분석 등이 빅데이터 분석에 사용되고, NoSQL, 하둡과
맵리듀스 등의 기술을 사용하여 분석
▪ 현재의 현상과 결과적인 관점을 제시하는데 초점을 둔 비즈니스 분석과 대용량의 데이터로부터
숨겨진 패턴을 발견하고 상황을 예측하며, 구조화 및 비구조화된 복잡한 형태의 데이터 요인들 간의
상관관계를 확인하는 고급 분석이 있으며 이는 의미 있는 데이터의 패턴을 식별하고 예측하기 위한
모든 기법과 기술들을 포괄
데이터 전처리기술
▪ 데이터 셋 확인은 변수확인 및 RAW 데이터를 확인 하는 단계로, 독립/종속 변수의 정의, 변수의
유형, 변수의 데이터 타입을 확인하여 잘못 설정된 변수를 변경해주고, 단변수, 이변수, 다변수에
대한 기술 통계를 확인하고, 변수간의 관계를 시각화를 통해 확인
52
52
빅데이터 내 데이터 품질검사 자동화 시스템
- 다른 값으로 대체는 결측값이 발생한 경우 다른 관측지의 평균, 최빈값, 중간값 등으로 대체할 수
있으며, 결측값 발생이 다른 변수와 관계가 있는 경우 대체 방법이 유용한 측면은 있지만, 모델이
왜곡될 가능성이 존재
- 예측값 삽입은 결측값이 없는 관측치를 트레이닝 데이터로 사용해서 결측값을 예측하는 모델을
만들고, 이 모델을 통해 결측값이 있는 관측 데이터의 결측값을 예측하는 방법으로,
Regression이나 Logistic Regression을 주로 사용
- 이상값을 찾아내기 위해서는 변수의 분포를 시각화하고, 이상값이 Human Error에 의해 발생한
경우 관측치를 삭제하면 됨
- 절대적인 관측치의 숫자가 작은 경우, 삭제의 방법으로 이상치를 제거하면 관측치의 절대량이
작아지는 문제가 발생하기 때문에 이를 다른 값으로 대체하거나 예측모델을 만들어 대체하는
방법도 사용 가능
- 이 밖에 이상값을 처리하기 위해 변수화, 리샘플링, 케이스 분리 분석 등이 있음
▪ Feature Engineering은 기존의 변수를 사용해서 데이터에 정보를 추가하는 일련의 과정으로, 새로
관측치나 변수를 추가하지 않고도 기존의 데이터를 보다 유용하게 만드는 방법론
▪ 변수의 단위를 변경하거나 변환하는 Scaling과 연속형 변수를 범주형 변수로 만드는 Binning,
변수의 성질을 이용해 다른 변수를 만드는 Transform, 범주형 변수를 연속형 변수로 변환하는
Dummy 등의 방법이 있음
데이터 이상값 탐지 기술
▪ 이상탐지(Anomaly Detection)는 데이터마이닝의 일부로, 분석 목적으로 분류한 것 중 하나이며,
시계열 데이터에서 과거 또는 비슷한 시점의 보편적인 패턴에서 벗어나거나 벗어나려는 징후가
있는 패턴이나 사실, 대상개체를 찾아내는 데이터 분석의 한 분야
명칭 오류 탐지기술
53
53
전략품목 현황 분석
데이터 품질 개선 기술
◎ 기술환경분석
국내 빅데이터 관련 통계제도의 동향
54
54
빅데이터 내 데이터 품질검사 자동화 시스템
[ 품질관리 수준평가 추진 방향 ]
55
55
전략품목 현황 분석
나. 주요기업 동향
(1) 해외기업 동향
▪ 10년 연속 가트너 데이터 품질 관리 툴 부문의 리더로 선정된 솔루션으로 현업부서 사용자가 IT에
의존하지 않고 비즈니스 규칙을 신속하게 개발할 수 있도록 지원
▪ IoT, 대용량 데이터 분석, 데이터 거버넌스 및 콘텐츠 중심의 데이터 분석과 같은 새로운
시나리오를 해결하기 위해 머신러닝(Machine Learning)과 예측 분석 알고리즘을 사용
▪ 데이터를 이해, 정리, 모니터링, 변환 및 제공할 수 있도록 지원하는 IBM의 정보통합 플랫폼으로
빅데이터, 충돌점 분석, 비즈니스 인텔리전스, 데이터 웨어하우징, 마스터데이터 관리, 애플리케이션
통합 및 마이그레이션 등 신뢰할 수 있는 정보를 생성 후 유지 관리해 전략적 비즈니스
이니셔티브를 지원
▪ 데이터 품질을 클라우드 환경으로 확장하고, 단순한 데이터 구조에서 복잡한 데이터 구조에
이르기까지 대용량 데이터 정제를 지원하며, 제품 전반에 머신러닝 알고리즘을 적용하고, IoT
데이터를 지원
▪ 다양한 소스의 ETL(Extract, transform and load) 및 ELT(Extract, load and transform) 활동에
데이터 품질을 추가할 수 있고, 기본적인 마스터데이터 관리 뷰를 지원
NineHertz
▪ 2008년 설립된 기업으로 세계 여러 곳에 지점을 두고 있으며, 모바일앱 및 웹 개발, CMS, 디지털
마케팅, 빅데이터, IoT 등 다양한 부분의 제품 및 솔루션을 개발하는 기업
▪ 빅데이터 생산에 들어가기 전 데이터 모델을 작성하고 다양한 검증 방법을 적용하여 모델을
확인하고, 시간 경과에 따라 모델을 다시 검증하는 맞춤형 분석 솔루션 제공
56
56
빅데이터 내 데이터 품질검사 자동화 시스템
IIH 노르딕
Hitachi
▪ 품질 관리 솔루션(HCI, Hitachi Content Intelligence)은 100% 완전성과 정확성을 보장하는
데이터 확보가 어렵기 때문에 둘 중 하나를 선택하는 것이 아닌 적절한 균형을 확보하고자 개발된
품질관리 솔루션
57
57
전략품목 현황 분석
(2) 국내업체 동향
58
58
빅데이터 내 데이터 품질검사 자동화 시스템
[ 국내외 중요 기업 동향 ]
회사명 국가 제품명 특징
59
59
전략품목 현황 분석
다. 특허동향
주요 기술
▪ 데이터품질 진단 및 평가, 패턴 분석, 데이터 전처리 기술, 데이터 이상값 탐지 가술, 명칭 오류
탐지 기술, 데이터 품질 개선 기술 등이 포함됨
요소기술 코드 설명
60
60
빅데이터 내 데이터 품질검사 자동화 시스템
◎ 세부 분야별 특허동향
▪ 빅데이터 내 데이터 품질검사 자동화시스템 기술의 요소기술별 주요출원인 국적별 특허정보 데이터
입수하였으며, 최근 10년간의 특허 데이터를 비교 분석
요소기술 한국 미국 일본 유럽 ETC 계
데이터품질 진단 및 평가 0 1 0 0 0 1
패턴 분석 288 58 11 15 34 406
데이터 전처리 기술 15 1 1 0 0 17
명칭 오류 탐지 기술 8 16 9 0 1 34
61
61
전략품목 현황 분석
▪ 외국국적 출원인의 특허 출원량도 한국국적 출원인과 유사하게 출원량이 미미하게 출원되고 있으며,
데이터 이상값 탐지 가술 분야에서 급격히 출원량이 높아지는 경향
62
62
빅데이터 내 데이터 품질검사 자동화 시스템
주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•IBM • 공공연구기관 중심
패턴 분석 ● •삼성전자 •한국전자통신연구원,
•ABB Technology 에스케이텔레콤 등
•공공연구기관 중심
•IBM
데이터 전처리 기술 ◔ •Apple
•아주대학교산학협력단,
한국전자통신연구원 등
•IBM
•The Boeing Company •대기업 중심
데이터 이상값 탐지 기술 ● •GE Company •삼성전자, 현대자동차, LG전자 등
•Ford
•IBM
•대기업 중심
명칭 오류 탐지 기술 ◯ •Google
•삼성전자, 전자부품연구원 등
•Intel
•IBM •대기업 중심
데이터 품질 개선 기술 ● •GE Company •삼성전자, 현대자동차,
•The Boeing Company 동국대학교 산학협력단 등
63
63
전략품목 현황 분석
데이터품질 진단 및 평가 기술 분야 주요 출원인 동향
패턴 분석 기술 분야 주요 출원인 동향
명칭 오류 탐지 기술 분야 주요 출원인 동향
데이터 품질 개선 기술 분야 주요 출원인 동향
64
64
빅데이터 내 데이터 품질검사 자동화 시스템
◎ 국가별 특허활동지수(AI) 비교
65
65
전략품목 현황 분석
▪ 질적인 측면을 같이 고려한 시장력에 있어서 오스트리아, 스위스, 아일랜드, 이스라엘, 노르웨이는
질적 수준은 높지만 시장성은 낮은 국가 쪽으로 조사
PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
요소기술 기술 집중도
데이터품질 진단 및 평가 ◯
패턴 분석 ●
데이터 전처리 기술 ◔
데이터 이상값 탐지 기술 ●
명칭 오류 탐지 기술 ◯
데이터 품질 개선 기술 ●
※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만
66
66
빅데이터 내 데이터 품질검사 자동화 시스템
◎ 최신 국내 특허기술 동향
요소기술 최근 핵심기술 동향
•네트워크의 데이터 관리 기술 및 이를 이용한 응용
데이터품질 진단 및 평가
서비스 제공 기술
67
67
전략품목 현황 분석
4. 연구개발 네트워크
가. 연구개발 기관/자원
◎ 연구개발 기관
▪ 한국데이터산업진흥원 KDATA
- 각종 데이터 산업 지원 및 인력양성 지원
- 공공/민간 데이터의 품질,관리, 보안에 관한 인증을 진행
68
68
빅데이터 내 데이터 품질검사 자동화 시스템
◎ 연구개발 자원
국가 연구개발 지원사업
▪ 공공 데이터 포털
- 공공데이터 품질관리 표준 및 수준 평가
▪ 농촌진흥청
- 공공데이터 품질관리 개선 사업
▪ 한국 데이터 진흥원
나. 연구개발 인력
기관 소속 연구분야
•공공데이터 개방 추진 및 제공
•공공데이터품질관리 수준평가
행정안전부 공공데이터정책과
•개방표준 고시 제정 및 확대
•기업지원정책
69
69
전략품목 현황 분석
다. 기술이전가능 기술
◎ 기술이전가능 기관 및 세부내용
기관 이전 기술 내용
70
70
빅데이터 내 데이터 품질검사 자동화 시스템
5. 기술개발로드맵
가. SWOT 분석
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
기회(Opportunity) 위협(Threat)
중소기업의 시장대응전략
➜ 현재 기초적인 품질검사 솔루션들을 이용해 인공지능 엔진을 접목하여 자동화 시스템을 구축하고,
현재 품질검사 인력을 대체할 수 있도록 하여 데이터 품질을 향상
➜ 자동화 시스템 구축을 위한 적절한 인공지능 엔진 및 자동화 시스템 플랫폼 개발
나. 중소기업 핵심요소기술
71
71
전략품목 현황 분석
(2) 요소기술
산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처 로드맵, 중소기업 기술수요를 바탕으로
로드맵 기획을 위하여 요소기술 도출
요소기술 출처
72
72
빅데이터 내 데이터 품질검사 자동화 시스템
(3) 핵심요소기술 도출
분류 핵심요소기술 설명
빅데이터
오류 및 개선 결과에 대한 기계학습을 통하여 데이터 품질을
품질 검사 데이터 품질 개선 기술
개선하는 기술
후처리 기술
73
73
전략품목 현황 분석
다. 기술개발전략
(1) 우리의 현황
74
74
빅데이터 내 데이터 품질검사 자동화 시스템
(2) 기술개발로드맵
75
75
※ 참고 : 핵심요소기술 평가결과
지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
품질 수준 평가 기술 8.2 7.8 7 8 31
76
전략품목 현황분석
자연어 처리기반
텍스트 마이닝
77
78
자연어 처리기반 텍스트 마이닝
정의 및 범위
▪ 자연어 처리기반 텍스트 마이닝은 사람들이 말하는 언어를 이해할 수 있는 자연어처리(Natural Language
Processing) 시스템을 기반으로 자연어로 구성된 비정형 텍스트 데이터에서 패턴 또는 관계를 추출하여 정보를
찾아내는 마이닝 기법
▪ 텍스트 마이닝 (Text mining)은 데이터 마이닝의 일부로, 데이터 마이닝이 수치 데이터를 다루는 것과는 달리
자연어처리 도구 활용을 통하여 비정형 데이터의 수치데이터화 과정까지를 포함하는 개념
▪ 비정형 텍스트의 다양한 의미 분석 기술을 활용하여 유의미한 정보들을 추출하고 패턴을 도출하여 다양한 서비스에
활용하거나 다양한 서비스를 위한 핵심 정보들을 추출하는 응용 기술
정부지원 정책
▪ ‘I-Korea 4.0 실현을 위한 인공지능 R&D 전략’을 수립(’18. 5)하여 세계적 수준의 인공지능 기술력 및 R&D 생태계
확보를 목표로 2018년부터 5년간 2.2조원 투자 추진
- 2022년까지 6개의 대학원을 설립하여 5,000명의 인공지능 전문가를 육성하고, 단기적 인공지능 인력의
필요에 대비하여 600명의 예비 인력 훈련 추진
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•(환경) 세계시장 대비 한글 음성인식 수요 미미
•(환경) 응용서비스 기술 및 산업 환경 등 잘 구축된 인프라
•(기술) 다국어 음성데이터 확보 및 원천기술력 부족에 따른
•(기술) 다양한 영역의 우수한 IT 인프라
기술 장벽 극복
•(정책) 언어 및 음성인식 SW분야의 기업차원 대규모 투자
•(정책) 산ㆍ학ㆍ연ㆍ정부 연계 미흡
기회(Opportunity) 위협(Threat)
•(환경) 클라우드 컴퓨팅 및 스마트 모바일 기기 확산에 따른 •(환경) 원천기술 보유 외국 기업이 국내 기업과 기술제휴를
정보통신 패러다임의 변화 통한 국내 시장 잠식
•(기술) 복잡한 기능의 디지털화된 기기의 제어를 위한 자연어 •(기술) 글로벌 선두 업체 국내진출과 기술격차
인식 기술개발 초기단계 •(정책) 자체적인 기술 개발력을 가진 대기업의 첨단투자 집중
•(정책) 정부와 업계의 높은 니즈 및 시장 지배력 증가
중소기업의 시장대응전략
➜ 자연어 처리 텍스트 마이닝 주변 기술에 대한 인프라 구축 등 비용절감 전략 수립
➜ 기관에서 무료나 유료로 제공되는 대규모 데이터와 오픈 API를 적극적으로 활용한 기술개발
➜ 자연어 처리기반 텍스트 마이닝 응용환경을 고려한 독자적인 핵심 기술과 고급 개발 인력 확보
전략품목 현황분석
1. 개요
가. 정의 및 필요성
텍스트 마이닝 (Text mining)은 데이터 마이닝의 일부로, 데이터 마이닝이 수치 데이터를
다루는 것과는 달리 자연어처리 도구 활용을 통하여 비정형 데이터의 수치데이터화
과정까지를 포함하는 개념
80
80
자연어 처리기반 텍스트 마이닝
*출처: Annu297
[ 인간 수준에 도달한 컴퓨터의 인공지능 ]
- 비즈니스 변화에 대한 명확한 연결고리가 없다면 기업들은 자금에 대한 비용을 지불할 수밖에 없을
것이며 살아남기 어려운 상황에 직면할 것으로 예측
- ‘18년에 기업의 50%는 빅데이터 분석을 위해 클라우드 우선 전략을 채택할 것으로 예측되며, 그
중 클라우드 우선 정책을 채택할 것으로 예상
- 고객의 목소리를 통일된 방식으로 분석하고 있거나 빅데이터 기반의 비즈니스 의사결정에 반영한
기업의 56%는 이미 이를 달성하기 위해 분산된 모델보다는 중앙 집중식 또는 통합 Insight
center를 구축하겠다는 의사를 표시
81
81
전략품목 현황분석
▪ 여덟째, 세계 주요 기업의 20%는 실시간 지침을 내려주는 인공지능 시스템을 구축할 것으로 예측
- 기업의 20%는 빅데이터 기반의 인공지능(AI)시스템이 의사 결정을 내리고 실시간 지침을 제공하게
될 것이며 빅데이터 분석을 통해 AI는 고객에게 무엇을 제공할지, 공급 업체에게는 어떤 조건을
제안할지, 직원들에게는 무엇을 말하고 행동할지를 실시간으로 알려주게 될 것으로 예측
▪ 아홉째, 빅데이터 기술과 AI는 비정형 데이터와 정형데이터의 경계를 지워줄 것으로 예측
- 학계뿐만 아니라 비영리 단체인 Open AI와 같은 조직에서는 기업이 가지는 어려운 분석 문제나 AI
관련 문제를 해결할 가장 우선적으로 고려해볼 만한 파트너가 될 것으로 예측
82
82
자연어 처리기반 텍스트 마이닝
나. 범위 및 분류
(1) 제품 분류 관점
▪ 자동 분석 빅데이터 자동 시각화 기술
(2) 공급망 관점
구분 도구
Excel, CVS/JSON, Gooogle, Chart API, Flot, Raphael, D3(Data-Driven
Basic Tools
Documents), Visually, infogram
83
83
전략품목 현황분석
대용량 데이터의 실시간 처리를 위해 클라우드 컴퓨팅 기술은 기본이며, 자연어처리, 텍스트
마이닝, 기계학습, 시맨틱 기술과 같은 인공지능 기술이 폭넓게 활용되어야 함
▪ 데이터 마이닝(Data Mining)은 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적
규칙이나 패턴을 찾아내는 기법을 의미하며 다른 말로는 KDD(데이터베이스 속의 지식 발견,
knowledge-discovery in databases)라고도 함
▪ 웹 마이닝(web mining)은 인터넷을 이용하는 과정에서 생성되는 웹 로그(web log) 정보나 검색어로부터
유용한 정보를 추출하는 웹 대상의 데이터 마이닝기법으로 웹 마이닝에선 웹 데이터의 속성이 반정형 혹은
비정형이고, 링크 구조를 형성하고 있기 때문에 별도의 분석기법이 필요. 웹마이닝은 분석 대상에 따라 웹
구조 마이닝(web structure mining)과 웹 유시지 마이닝(webusage mining), 그리고 웹 콘텐츠
마이닝(web contents mining)으로 구분하며 이 중 웹 콘텐츠 마이닝은 웹 페이지에 저장된
콘텐츠로부터 웹 사용자가 원하는 정보를 빠르게 찾는 기법으로 검색엔진에 많이 사용
84
84
자연어 처리기반 텍스트 마이닝
2. 외부환경 분석
가. 산업환경 분석
(1) 산업의 특징
▪ 앞으로 몇 년간 3세대 플랫폼에 기반한 혁신과 가치 창조가 크게 증가할 것으로 전망되며 새로운
핵심 기술이 혁신 가속기로 작용하면서 이 단계를 견인할 것이고 그러면 전 산업에 걸쳐 3세대
플랫폼의 힘과 애플리케이션이 확대될 전망
빅데이터/DB 시스템의 보급과 언어처리 기술의 발달로 다양한 기업에서 다양한 형태의
비정형데이터들이 정형화되어 기록
▪ 유통 분야는 오프라인, 온라인, 모바일, 콜센터 등 폭넓은 옴니 채널의 활용과 온오프라인을 넘나드는
고객과 소통 강화를 위해 빅데이터 분석에 투자를 확대하고 있는 추세
85
85
전략품목 현황분석
(2) 산업의 구조
[ 산업별 예상 시장 규모 ]
산 업 시장규모
*출처: ciokorea
86
86
자연어 처리기반 텍스트 마이닝
나. 시장환경 분석
(1) 세계 시장
[ 자연어 처리 소프트웨어 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
[ 분야별 자연어 처리 시장 규모 ]
87
87
전략품목 현황분석
[ 분야별 자연어 처리 시장 규모 ]
(단위: 백만 달러, %)
구 분 ‘16 ‘17 ‘18 ‘19 ‘20 ‘21 ‘22 ‘23 ‘24 ‘25 CAGR
하드
100 500 650 1,050 1,550 2,200 3,000 3,900 4,950 6,250 37.1%
웨어
소프트
150 250 450 650 1,000 1,550 2,300 3,200 4,300 5,250 46.3%
웨어
서비스 250 450 800 1,350 2,300 3,400 4,900 6,750 8,600 10,750 48.7%
합 계 500 1,200 1,900 3,050 4,850 7,150 10,200 13,850 17,850 22,250 44.1%
* 출처: Revenues from the natural language processing (NLP) market worldwide from 2016 to 2025, by segment (in
million U.S. dollars), Statista, ‘19
빅데이터 시장 내에서 자연어를 포함한 비정형 데이터가 전체의 90% 이상을 차지, 사물인터넷,
웨어러블 디바이스의 이용 증가와 미디어 매체의 증가에 따라 하루 수집되는 빅데이터의 양은 약
1,000만건을 상회할 것으로 예측 (1년이면 약 40억 건 이상의 데이터 수집)
빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 ’21년 814억
달러로 성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용
빅데이터 세계 시장은 ‘23년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)
▪ 빅데이터 선진개발국들은 오픈 플랫폼을 활용하여 공공데이터의 산업적 활용을 촉진하고 있으며,
민간 데이터 시장에서는 중개업이 활성화되어 있음
88
88
자연어 처리기반 텍스트 마이닝
▪ 현재 IoT 기반 기술은 미국이 주도하고 있고, 일본은 ‘Society 5.0’ 실현을 위해 로봇, 기계 등의
강점을 기반을 ‘20년까지 세계 최초의 ‘IoT 빅데이터’ 유통시장을 개설할 예정
[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용
89
89
전략품목 현황분석
세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)
▪ 자연어 처리기반 텍스트 마이닝을 포함한 빅데이터 애플리케이션 및 분석 시장은 ‘18년 50억 달러에서
‘26년 194억 달러로 크게 증가하여 연평균 15.49%의 성장률을 달성할 전망
▪ 전 세계 빅데이터 시장에는 프로페셔녈 분석 서비스가 포함되어 있으며, ‘18년 165억 달러에서 ‘26년
213억 달러로 성장
(2) 국내시장
빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 ’20년
4,468억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)
*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용
90
90
자연어 처리기반 텍스트 마이닝
[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0
국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억 원에서 ’20년
7조 8,450억 원로 연평균 7.6% 성장 예상 (데이터 산업 활성화 전략, 2018.6)
▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출
▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고, 분석할만한
데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차 기반 마련 예상
91
91
전략품목 현황분석
3. 기술 분석
가. 기술개발 이슈
▪ 한국어 형태소 분석
▪ 한국어 개체명 인식
▪ 한국어 구문 분석
▪ 대화 의도 분석
▪ 대화 주제 분석
▪ 대화 처리
- 끊기지 않는 일상 대화
- 대화 기반 업무 지원
▪ 다중 업무 지원
▪ 업무 처리를 위한 slot 정보 추출 기술
▪ 전문 저작도구
▪ 구축 현황/결과 시각화
워드임베딩 구축/최적화
▪ 도메인 데이터 수집 기술
▪ 임베딩 시각화 기술
기계학습 알고리즘 활용 기술
92
92
자연어 처리기반 텍스트 마이닝
▪ 웹 기반 동적 시각화 기반 서비스
◎ 기술개발트렌드
공개되는 기술들을 빠르게 융합하고 새로운 형태의 데이터 서비스를 고안하여 모바일/웹
환경에서 특화된 서비스를 빠르게 제안하는 융합형 서비스 기술이 필요
◎ 기술환경 분석
93
93
전략품목 현황분석
나. 주요기업 동향
▪ 텍스트 마이닝: 고품질 개체명 인식, 내용기반 자동분류, 이슈 군집분석 등 고난이도 고품질의
결과를 제공하는 텍스트 마이닝 서비스를 제공
94
94
자연어 처리기반 텍스트 마이닝
다. 특허 동향
주요 기술
▪ 분석 정보 시각화, 빅데이터 지원 고속 키워드 추출 기술, 시맨틱 검색 지원을 위한 한국어
워드임베딩, 문서 분류, 문서/데이터 이해 기반 요약, 빅데이터 고속 분석을 통한 사전/브로셔/검색
시스템 구축, 담화 분석 데이터 구축 기술 등이 포함
요소기술 코드 설명
텍스트 마이닝을 통해 획득한 빅데이터 분석 결과를 쉽게
분석 정보 시각화 A
이해할 수 있도록 시각적으로 표현하여 전달하는 기술
95
95
전략품목 현황분석
◎ 세부 분야별 특허동향
▪ 자연어 처리기반 텍스트 마이닝 기술의 요소기술별 주요 출원인 국적별 특허정보 데이터를
입수하였으며, 최근 10년간의 특허데이터를 비교 분석함
요소기술 한국 미국 일본 유럽 ETC 계
분석 정보 시각화 10 4 0 0 0 14
빅데이터 지원 고속키워드
10 2 0 0 3 15
추출 기술
시맨틱 검색 지원을 위한
17 506 3 63 106 695
한국어 워드임베딩
문서 분류 21 495 9 47 81 653
문서/데이터 이해 기반
18 71 1 2 4 96
요약
빅데이터 고속 분석을 통한
25 14 0 0 4 43
사전/브로셔/검색 시스템 구축
96
96
자연어 처리기반 텍스트 마이닝
▪ 한국국적의 출원인의 특허 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는
경향을 보이고 있음
97
97
전략품목 현황분석
주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•WORLD AWARD
•중소기업 중심
분석 정보 시각화 ◔ ACADEMY
•강원오픈마켓, 주식회사 로보러스 등
•GM GLOBAL
•IBM
•공공연구기관 중심
시맨틱 검색 지원을 위한 •Microsoft
한국어 워드임베딩
● •FREE STREAM MEDIA
•포항공과대학교 산학협력단,
한국전자통신연구원 등
CORP.
•IBM •공공연구기관 중심
문서 분류 ● •Microsoft •한국전자통신연구원,
•Google 강원대학교산학협력단 등
•IBM •공공연구기관 중심
문서/데이터 이해 기반
요약
● •Microsoft •고려대학교산학협력단,한국과학기
•Amazon 술정보연구원 등
•IBM •대기업 중심
담화 분석 데이터 구축 ● •Microsoft •삼성전자, ㈜머니브레인,
•Apple Inc. 포항공과대학교산학협력단 등
98
98
자연어 처리기반 텍스트 마이닝
문서 분류 기술 분야 주요 출원인 동향
문서/데이터 이해 기반 요약 기술 분야 주요 출원인 동향
담화 분석 데이터 구축 기술 분야 주요 출원인 동향
99
99
전략품목 현황분석
◎ 국가별 특허활동지수(AI) 비교
100
100
자연어 처리기반 텍스트 마이닝
▪ 질적인 측면을 같이 고려한 시장력에 있어서 독일과 이스라엘, 스페인, 러시아는 시장력은 높으나
질적 수준은 낮은 국가 쪽으로 조사됨
PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
KR 175 1.154286 0
US 1362 1.389868 3.532836
JP 20 1.4 0
EU 140 1.664286 2.843137
ETC 240 1.5375 4.26087
전체평균 49.6 1.41 3.51
요소기술 기술 집중도
분석 정보 시각화 ◔
빅데이터 지원 고속키워드 추출 기술 ◔
시맨틱 검색 지원을 위한 한국어 워드임베딩 ●
문서 분류 ●
문서/데이터 이해 기반 요약 ●
빅데이터 고속 분석을 통한 사전/브로셔/검색 시스템 구축 ◕
담화 분석 데이터 구축 ●
※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만
101
101
전략품목 현황분석
◎ 최신 국내 특허기술 동향
요소기술 최근 핵심기술 동향
102
102
자연어 처리기반 텍스트 마이닝
▪ 자연어 처리기반 텍스트 마이닝 산업은 인간의 언어 현상을 컴퓨터와 같은 기계를 이용해서 모사
할수 있도록 이를 구현하는 인공지능의 주요 분야 중 하나로 반정형/비정형 텍스트 데이터를
정형화하고, 특징을 추출하기 위한 기술과 추출된 특징으로부터 의미 있는 정보를 발견할 수 있도록
하는 텍스트 마이닝 기술이며 이러한 텍스트 마이닝 기술은 데이터를 다루는 산업 전반에 활용되고
있으며, IoT 시대의 도래에 따라 산업적 활용도는 대폭 증가할 전망
103
103
전략품목 현황분석
4. 연구개발 네트워크
가. 연구개발 기관/자원
(1) 연구개발 기관
대학 연구소
- 언어 처리 기반 기술 보유
- 대화처리 관련 요소 기술 보유
▪ KAIST 자연어처리 연구실
- 최기선 교수: 지식베이스 관련 기술 보유 (자동 구축, 활용 언어처리 서비스 기술)
- 맹성현 교수: 정보 검색 (Information Retrieval) 관련 기술 보유
- 박종철 교수: Grammar 기반 언어 분석/표현 기술 보유
- 언어 처리 기반 기술 보유 (구문 분석)
- 딥러닝 기반 언어처리 기술
연구소
▪ KETI 인공지능연구센터
- 한국어 처리 기반 기술 보유
- 대화 기반 서비스 기술 보유
- 멀티모달 데이터 통합 분석 기술
- 멀티모달 대화 서비스 기술
104
104
자연어 처리기반 텍스트 마이닝
▪ ETRI
- 한국어 처리 기반 기술 보유
- 전문지식 QA 기술
기업
▪ 다음카카오
- 인공지능 대화기술과 자연어 처리 기술을 보유하고 있으며, 이를 기반으로 데이터 수집, 정보검색,
텍스트 마이닝, e-비즈니스, 소셜분석 등의 솔루션과 서비스 제공
- KB국민카드의 소셜미디어 수집/분석, SBS 통합리스닝 플랫폼, 국민건강보험공단 국민건강알람서비스,
KT 고객 니즈 관리 시스템 등을 개발하여 서비스 중
- 인공지능 스피커 서비스 운영으로 대화 기반 서비스 처리 기술 보유
▪ NHN
- 정보검색 및 한국어 처리 관련 기술
- 인공지능 스피커 서비스 운영으로 대화 기반 서비스 처리 기술 보유
▪ SKT
(2) 연구개발 자원
AI 오픈 이노베이션 허브 (http://www.aihub.or.kr/)
105
105
전략품목 현황분석
나. 연구개발 인력
기관 부서 대표 전화번호
서강대학교 자연어처리 연구실 02-706-8954
다. 기술이전가능 기술
(1) 기술이전가능 기관
분류 요소기술 기관
106
106
자연어 처리기반 텍스트 마이닝
5. 기술개발로드맵
가. SWOT 분석
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•(환경) 세계시장 대비 한글 음성인식 수요 미미
•(환경) 응용서비스 기술 및 산업 환경 등 잘 구축된 인프라
•(기술) 다국어 음성데이터 확보 및 원천기술력 부족에 따른
•(기술) 다양한 영역의 우수한 IT 인프라
기술 장벽 극복
•(정책) 언어 및 음성인식 SW분야의 기업차원 대규모 투자
•(정책) 산ㆍ학ㆍ연ㆍ정부 연계 미흡
기회(Opportunity) 위협(Threat)
•(환경) 클라우드 컴퓨팅 및 스마트 모바일 기기 확산에 따른 •(환경) 원천기술 보유 외국 기업이 국내 기업과 기술제휴를
정보통신 패러다임의 변화 통한 국내 시장 잠식
•(기술) 복잡한 기능의 디지털화된 기기의 제어를 위한 자연어 •(기술) 글로벌 선두 업체 국내진출과 기술격차
인식 기술개발 초기단계 •(정책) 자체적인 기술 개발력을 가진 대기업의 첨단투자 집중
•(정책) 정부와 업계의 높은 니즈 및 시장 지배력 증가
중소기업의 시장대응전략
나. 중소기업 핵심요소기술
107
107
전략품목 현황분석
(2) 요소기술
요소기술 출처
108
108
자연어 처리기반 텍스트 마이닝
(3) 핵심요소기술 도출
분류 핵심요소기술 개요
109
109
전략품목 현황분석
다. 기술개발전략
(1)우리의 현황
110
110
자연어 처리기반 텍스트 마이닝
(2) 기술개발로드맵
111
111
* 참고 : 핵심요소기술 평가결과
지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
문서/데이터 이해 기반
요약 8.2 7.4 7 8.2 30.8 선정
빅데이터 고속 분석을
통한 사전/브로셔/검색 8.4 8 7 8.8 32.2 선정
시스템 구축
112
전략품목 현황분석
유통/물류 빅데이터
구축 및 분석 시스템
113
114
유통/물류 빅데이터 구축 및 분석 시스템
정의 및 범위
정부지원 정책
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•이미 개발된 기술 활용 시 글로벌 대기업과의 경쟁
•물류 구축 및 분석시스템의 기반이 되는 국내 빅데이터
불가피
기술의 빠른 발전
•개별 기술을 넘어 전체적인 기술의 연계를 통한 빅데이터
•GPS 등의 맵핑 기술에 강점 보유
활용의 어려움
•정부의 빅데이터 지원 정책의 확대
•유통,물류에 최적화된 빅데이터 활용 지원 정책의 부재
기회(Opportunity) 위협(Threat)
•빅데이터의 중요성 부각에 따른 정부차원의 지원 확대 •개인정보보호로 인한 빅데이터 활용 규제
•다양한 산업분야로의 시장 확대 •글로벌 기업의 국내 진출에 따른 국내 시장 잠식
•유통 및 물류량의 증가로 효율적인 프로세스를 찾는 가능성
업체의 증가 •유통, 물류 업체간의 원할한 소통 플랫폼의 부재
중소기업의 시장대응전략
➜ 글로벌 플랫폼에 제공하기 어려운 실시간 데이터 수집 및 연계기술의 개발
➜ 각 산업 분야에 적합한 다양한 데이터 분석 기술의 개발로 중소기업의 경쟁력 강화
➜ 플랫폼이 아닌 빅데이터를 활용한 서비스 개발과 유료 수익 모델 개발을 통한 수익 창출
전략품목 현황분석
1. 개요
가. 정의 및 필요성
빅데이터는 기술의 발달로 유통/물류 분야를 포함한 다양한 산업에 영향력이 높아지고 있는
추세
*출처: DHL
[ 물류 동향 레이더 ]
인공지능(AI), 사물인터넷(IoT), 빅데이터 등 4차 산업혁명의 기반 기술을 백화점, 대형 마트,
편의점, 홈쇼핑, 소셜 커머스 등 다양한 리테일 산업에 활용해 초지능, 초실감, 초연결화를
구현하는 현상을 지칭하는 ‘리테일 4.0’ 개념이 등장
▪ 오프라인/온라인 유통 채널과 점포가 4차 산업혁명 신기술과 만나 진화함에 따라 유통(Retail)과
기술(Technology)이 융합된 ‘리테일 테크’ 개념 등장
116
116
유통/물류 빅데이터 구축 및 분석 시스템
3) 기업이 사회적 책임을 완수하는데 있어서, 공공적 문제를 해결하기 위한 효율적인 경영 전략의
도입을 목표로 활용함
▪ 다만 물류와 유통은 전통적인 분야인 만큼 데이터의 공유와 거래에도 보수적인 입장을 취하는 민간
기업이 많아 빅데이터 적용 성공사례가 선행되어야 민간 기업을 빅데이터 시장으로 끌어들이는
유인책이 될 수 있음
▪ 앞으로 모바일 디바이스의 보급과 IoT의 진전에 따라 GPS 데이터와 RFID 데이터, 센서 데이터
등의 새로운 비정형 데이터가 더욱 급증 할 것으로 예상되며, IoT를 생성하는 다양한 비정형
데이터를 순차 처리 및 실시간 처리가 가능하게 될 전망
117
117
전략품목 현황분석
나. 범위
(1) 제품 분류 관점
유통에 있어서 빅데이터 활용은 실시간 공급망 관리를 통해 유통 채널, 협력업체와 협업을
통해 전 공급체인의 최적화 및 고객납기 만족을 극대화하기 위함
▪ 민첩하게 적용할 수 있는 이상적인 공급망을 만드는 것으로, 시장수요 변화에 실시간으로 대응하여
팔리는 것만 생산하여 판매하여 비용을 절감하기 위함
▪ 빅데이터 분석은 상품이 어디에 있으며 어디에 있어야 하는지, 그리고 시스템의 저해 요소는
무엇인지에 대한 가시성을 제공하며, 이를 통해 비용을 절감할 수 있음.
▪ 사람과 ICT의 융합: 사람과 장치를 연결하는 인터페이스 ex) 인터넷과 연결된 센서 부착 의류와 안경 등
▪ AI(인공지능)와 빅데이터의 융합: 딥러닝 ex) IBM “ 왓슨” 등, 빅데이터 정보를 AI가 스스로 분석해
스마트한 의사 결정
- 유통업계와 관련된 대표적인 것으로 정형 데이터로는 POS 데이터나 상품 마스터, ID-POS 데이터
및 판촉이나 광고의 실시 상황에 대한 데이터베이스에 정리한 데이터
118
118
유통/물류 빅데이터 구축 및 분석 시스템
▪ 데이터베이스의 이용은 예를 들면, 개개의 데이터 레코드를 추출해 카탈로그, 데이터 레코드별 정보
서비스로써 이용
(2) 공급망 관점
119
119
전략품목 현황분석
2. 외부환경 분석
가. 산업환경 분석
(1) 산업의 특징
적용 방식 역할
Schduling 재고 수준, 수요 및 생산능력의 가시성 제고, 따라서 생산 및 유통 일정의 정확성 향상
Warehousing 창고 ERP 시스템 내의 빅데이터 분석 실시간 실시 및 재고 수준, 납품 불일치 및 입고 납품 확인
매출, 시장동향, 경쟁사 데이터, 관련 지역 및 세계 경제요인 등에 대한 접근으로
Demand forecasting
수요의 보다 정확한 추정
배달 경로, 교통 데이터, 실시간 기상의 모니터링 및 용량 및 자산 공유가 필요한 경우
Delivery
재라우팅
SKU 레벨의 완벽한 투명성과 완전히 자동화 된 보충 시스템과 재고 부족 범위를
Inventory Planning
제거하고 재고 범위를 최적화하는 수요 예측 데이터
Distributing 자재 흐름 데이터를 기반으로 유통 허브, 플랜트 및 창고의 복잡한 웹을 실시간 최적화
120
120
유통/물류 빅데이터 구축 및 분석 시스템
▪ 매장은 계절, 시간, 지역 등을 기반으로 제품이 판매되는 상황을 파악하여 필요한 물량만큼만
발주할 수 있음. 매장은 당일 매출을 예상하고 재고 및 상품 정보를 통합적으로 컨트롤가능
▪ 글로벌 수준의 빅데이터 적용은 공급망 위험(예: 인위적 또는 자연적 재해로 인한 공급 장애, 운용
및 상황적 장애)에 대한 대응보다는 공급망에서 사전 예방적 대응 가능
121
121
전략품목 현황분석
(2) 산업의 구조
판매 이력 데이터
▪ POS 데이터로 대표되는 판매 이력 데이터의 경우, POS를 통해 정산된 구매일시 구매품목 개수
금액 구매점포 등의 데이터가 기록
▪ SCM은 일반적으로 최종 소비자에게 전달되는 제품과 서비스의 형태로 가치를 창출하는 다양한
프로세스와 활동에서 상류 및 하류 연계를 통해 관여하는 조직의 네트워크로 정의
▪ 협력적 예측·보충 시스템 (CPFR, collaborative planning, forecasting & replenishment): 협력적
예측·보충 시스템. 판매·재고 데이터를 이용해 제조·유통업체가 상호 협력하여 공동으로 예측하고
계획하며 상품을 보충하는 업무 프로세스로 SCM 공급측면 응용기술
122
122
유통/물류 빅데이터 구축 및 분석 시스템
123
123
전략품목 현황분석
나. 시장환경 분석
(1) 세계시장
▪ 지식기반 (Knowledge-based) 사업과 전자상거래의 발달로 세계화 기업의 공급망 효율성 제고를
위한 다양한 물류시스템의 개선이 핵심 요소가 됨. 특히 다국적 기업이 물류 산업의 중심이 된
현재, 해외 배송 등 장거리 배송이 폭발적으로 증가
[ 글로벌 물류 네트워크 현황 ]
124
124
유통/물류 빅데이터 구축 및 분석 시스템
125
125
전략품목 현황분석
(2) 국내시장
▪ 빅데이터 기반 트래킹 시스템의 세계 시장의 연평균 성장률 38.4%에 못 미치는 수치로, 세계시장과의
격차 심화 우려, 향후 세계 시장에서 경쟁력을 갖추기 위해서는 활발한 지원이 필요할 것으로 분석
▪ 특히, 서비스별 매출을 조사해 보면 물류추적·B2B가 두 번째로 큰 매출을 차지할 것으로 예측하는
연구결과도 있음
국내 시장의 동향은 대기업을 중심으로 자체적 RFID 성공적 사례를 기반으로 RFID에 대한
수요가 꾸준히 증가하고 있음
126
126
유통/물류 빅데이터 구축 및 분석 시스템
3. 기술 분석
가. 기술개발 이슈
ICBM이라고 일컬어지는 IoT, Cloud computing, Big Data, Mobile 새로운 트렌드에
선제적으로 대응하기 위하여 해외 선진국에서는 정부 차원 및 민간기업 차원에서 축적된
다양한 분야의 데이터를 활용한 새로운 비즈니스 모델에 대한 연구가 활발한 데 비해, 국내의
물류 분야 빅데이터 활용은 아직 미흡한 상황
▪ 정부가 주도하여 공공 분야에서 수집하고 있는 물류분야 데이터는 종류와 범위가 다양하나 그
활용에 있어서 아직 분석 및 활용 모델구축이 부족한 상황
▪ 향후, 모바일 디바이스의 보급과 IoT의 진전에 따라 GPS 데이터와 RFID 데이터, 센서 데이터 등의
새로운 비정형 데이터가 더욱 급증할 것으로 예상되며, IoT의 보급에 의해 단시간에 수집된 대량
데이터의 신속한 처리 요구가 나타날 것으로 예상됨
빅데이터 활용을 위한 데이터 수집에 있어서의 가장 중요한 포인트는 수집한 데이터의 이용을
모두 고려한 후에 데이터의 수집을 실시해야 함
127
127
전략품목 현황분석
▪ 수집되는 데이터의 종류와 수집 방법에 따라 데이터 중복과 표현의 특징에 따라, 중복 제거 및 표현의
통일 등의 표준화하여 데이터의 품질 향상을 도모할 필요가 있음. 품질이 좋은 데이터라 하더라도
이용·활용에 적합한 형태로 활용하기 위한 데이터 정리·추출이나 데이터 가공·결합 기술 필요
기 준 시장규모
*출처: DAMA UK
▪ 모바일 장치 및 IoT 디바이스의 보급에 의해 종래에는 어려웠던 다양한 데이터 개인 정보가 포함된
데이터도 수집 가능하며, 개개인에 특화된 빅데이터 응용 서비스가 예상되지만, 개인 정보를 포함한
데이터 취득에는 미리 이용 목적을 확인하고 본인의 동의 또는 이용 목적을 미리 공지하는 등의
개인 정보 보호에 대한 의무 사항을 준수해야 함
분석 결과의 사용성
▪ 분석에 의해 얻어진 결과를 이용자에게 제공함에 있어 분석가는 결과를 납득할 수 있어야 그러한
결과에 이른 이유와 근거를 확인 가능
빅데이터 보안
▪ 빅데이터 변조는 무단 액세스, 조작 실수나 시스템 문제, 랜섬웨어(Ransomware)등의 사이버
공격의 피해 등이 예상
▪ 무단 액세스에 의한 파손을 방지하기 위해, 접속자의 엄격한 인증(본인 확인) 및 인증(권한 확인)의
구조와 신속하게 복구할 수 있는 백업 등의 대책이 필요함. 백업 데이터 보호는 일반적으로 암호화
기술 및 비밀 균형 조정 기술이 이용
128
128
유통/물류 빅데이터 구축 및 분석 시스템
빅데이터 유지 보존 및 폐기
▪ 빅데이터를 구성하는 데이터는 장기간에 걸쳐 가치를 창출하거나, 장기간 유지함으로써 가치가 증가하는
데이터도 있는 반면, 시간이 지남에 따라 가치가 감소하거나 수명이 존재하는 데이터도 있음. 데이터의
효율적인 운영 · 이용에 있어 데이터의 폐기의 필요성 및 폐기 기준 등에 대한 검토가 필요
◎ 기술 개발 트렌드
129
129
전략품목 현황분석
▪ GPS와 RFID로부터 수집된 데이터는 또한 분석가들이 화물 도착의 정확한 시간을 결정하고 경로를
동적으로 최적화하고 잠재적인 지연을 방지
▪ 창고에 있는 컨베이어 로봇의 동일한 RFID 태그와 센서는 창고 전체에 걸쳐 로봇의 움직임을 동기화하고,
다운타임과 작업 시간 및 그들이 운반하는 재고량을 모니터링하여 유틸리티와 일정을 최적화
지브라 컨설팅의 연구에 따르면, RFID를 포함한 IoT 기술을 통해 실시간 재고를 자동으로
파악하는 경우, 현재 유통(리테일)업계의 재고 정확도는 약 65% 수준이지만, RFID 플랫폼을
도입하면 재고 정확도를 95% 수준으로 높일 수 있음
▪ 품목 수준의 RFID태그를 부착하면 재고 소진의 경우 60%에서 80%까지 줄일 수 있으며, 재고
관련 인력을 75%이상 감소시키고, 거래 당 판매 품목의 수를 19%까지 늘리고 거래 건수도 6%
증가 가능
130
130
유통/물류 빅데이터 구축 및 분석 시스템
◎ 기술 환경 분석
▪ 빅데이터 활용의 문맥에서 수집, 분석, 이용을 검토하는 데이터의 경우, 다른 목적으로 수집된 2차
데이터를 활용하여야 함. 예를 들면, POS 데이터는 매상관리나 상품발주를 위한 판매시점 관리가
본래의 목적이며, 그 때문에 수집되고 있는 데이터이며, 다른 예로 신상품 개발에 POS 데이터를
이용하는 경우, POS 데이터는 다른 목적 수집된 데이터(=2차 데이터)임
131
131
전략품목 현황분석
유통 빅데이터 분산 처리 시스템 요구 사항
▪ 첫째, IoT 센서를 포함한 빅데이터 분산 처리 시스템이 처리하는 데이터의 양과 서버의 규모는
기존과 비교가 되지 않을 정도로 규모가 큰 점을 고려하여, 비용적인 측면에서의 효율성,
지속적으로 증가하는 데이터들의 수용, 빈번하게 발생하는 장애에 대한 대처와 인프라 관리의
편리성이 요구됨
▪ 셋째, 데이터에 대한 암호화, 데이터 영역에 대한 사용자간 엄격한 접근 제어, 사용자 데이터에 대한
관리자의 접근 제어와 같은 사항들이 요구
*출처: CJ대한통운
[ 빅데이터 분석 환경 ]
132
132
유통/물류 빅데이터 구축 및 분석 시스템
나. 주요기업 동향
(1) 해외업체동향
▪ 12개 이상의 아마존 데이터 센터는 실시간으로 자사 데이터를 받아들이고 반영하여 시스템과 앱을
확장하며, 분권형 유통망 시스템 (Decentralized Distribution System)을 통해 중앙의 물류
시스템이 지역별 물류센터를 빈틈없이 연결하여 자율주행자 동차와 로봇, 드론을 이용해 라스트
마일 시스템을 실제로 적용
▪ 예측물류 기법을 통해 소비자 데이터를 분석해 구입할 가능성이 높은 물품을 예측해 배송을 미리
준비하는 시스템으로, 자사 AI 플랫폼 알렉사를 글로벌 전자 기업들의 주요 스마트 가전에 탑재하여
그 정확도를 한층 높이고 있음. 이는 아마존 물류 시스템 전체와 연결되어 소비자의 구매 예상
물품을 미리 준비할 수 있도록 전달하는 역할
활용 기술 서비스명 내용
▪ 추천, 상품배열 등의 최적화, 배송 예측 등을 통해
빅데이터, 인공지능 아마존 쇼핑(기존 상거래)
소비자 만족 극대화
▪ 인공지능 쇼핑 보조 OS로 최초에는 스피커인
알렉사(Alexa)
에코(Echo)에 탑재
IoT, 인공지능
▪ 결제과정이 없는 쇼핑으로, 등록된 이메일로
아마존 고(Amazon Go)
청구서를 받는 쇼핑 시스템
▪ 클라우드 컴퓨팅 사업을 직접 운영하여 아마존의
클라우드 컴퓨팅 아마존 웹서비스(AWS)
새로운 캐시카우로 성장
▪ 물류 시스템에 도입하여 비용 절감, 배송시간 단축
로봇 키바 로봇(Kiva robot & systems)
등을 꾀함
드론 프라임 에어 ▪ 배송 시스템에 드론을 도입
▪ 공급사슬 가시화, 리스크 평가, 사고 모니터링, 리스크 대응, 포탈시스템 등으로 구성되어 있으며, 리스크
평가는 국가 위험도와 자체 공급사슬 위험 노출도 지표 방법론, 열(온도) 지도 등을 통해 평가·구현
133
133
전략품목 현황분석
UPS의 ORION
▪ 약 46,000대의 트럭에서 나오는 텔레메틱스 센서들로부터 데이터가 수집되며 차량의 속도, 방향,
제동, 차량의 성능 등의 정보가 포함
히타치제작소
야마토 예측 시스템
▪ 야마토 예측 시스템은 과거 화물 수취시간의 데이터를 축적, 분석해 고객이 집에 있는 가능성이 높은
시간대를 예측하는 시스템으로, 20%에 달하는 첫 번째 배달 부재율을 낮출 수 있어 배송기사는 남는
시간을 활용해 배달시간을 세분화해 지정하는 등 보다 효율적인 서비스 제공이 가능
트라센(TRAXENS)
134
134
유통/물류 빅데이터 구축 및 분석 시스템
(2) 국내업체동향
▪ 첫째, 사업적 가치가 있는 데이터가 부족함. 데이터 거래 시장(Data Broker)이 전무, 해외의 경우
AggData, Contentfor Sale, Data Market 등 사업적 가치를 지닌 데이터를 판매하는 기업이
다양하게 존재하나, 국내는 개인정보보호법으로 인해 공공데이터 활용이 얕은 수준에 머물러 있으며
데이터를 생산하는 통신, 금융 등 핵심기업 또한 데이터의 개방에 아주 보수적인 태도를 보이고
있어 데이터 거래시장이 제대로 형성되어 있지 않음
▪ 현재는 머신러닝 프로세스 자동화 플랫폼인 WiseProphet을 개발을 통하여 공학화된 데이터
전처리를 제공하고 이를 통해 군 장비 및 각종 설비의 예측 정비, 보험과 금융의 부당청구 탐지,
컨텐츠 개인화 추천 등을 통하여 ‘빅데이터 분석을 넘은 예측 분석’ 서비스를 제공
135
135
전략품목 현황분석
*출처: ㈜위세아이텍
136
136
유통/물류 빅데이터 구축 및 분석 시스템
▪ 데이터 큐레이션은 데이터 수집과 정제에서 어노테이션과 분류, 학습용 데이터 생성 등 데이터의
활용 가치를 높이기 위한 모든 활동을 포함
데이터 큐레이션
품질 검사 검증 기계학습 품질평가
데
학습/분석 최적화 학습/분석 알고리즘 선정과 실험, 최적화
이
터
학습/분석 준비 데이터 집계.통계 분석, 데이터 어노테이션, 학습준비
생
명
데이터 정제, 오류/이상 데이터 식별, 분석, 학습을 위한 데이터 주
정제/변환
변환 기
관
데이터의 안전한 저장과 이질적 데이터의 통합, 중복제거,
저장관리/통합 리
데이터 셋 버전 관리
⇓
이미지, 음성, 텍스트, 센서, 웹, 소셜 데이터 등 원시 데이터
수집/구축
수집/구축 과 기본 메타데이터 생성
▪ 데이터 기반의 심층 분석과 기계학습을 위해서는 대규모 데이터의 확보뿐 아니라 기계가
읽고(readable), 학습하고(learnable), 의미 이해 가능한(understandable) 형태로 가공되어
데이터믹시의 데이터 큐레이션 서비스는 솔트룩스 20년의 데이터 품질관리와 기계학습 경험이
축적된 세계 최고 수준의 데이터 서비스를 제공
▪ 축적된 빅데이터 개발 사업수행을 바탕으로 Google Map 서비스와 빅데이터 등을 가공, 모델링해
시각화하여 전달하는 솔루션 Wiver를 출시
▪ 클라우드 기반의 머신러닝 자동화 플랫폼인 Smart AEO Platform을 개발을 통하여 공인인증
프로세스 자동화, 위험요소 모니터링, 검사일 자동 알람 등의 지원. 빅데이터 로부터 정보를 추출하고
결과를 분석, 예측하는 서비스를 제공
137
137
전략품목 현황분석
*출처: ㈜위비즈테크
*출처: ㈜위비즈테크
138
138
유통/물류 빅데이터 구축 및 분석 시스템
▪ 대용량 DB 암호화 사업에서 공공, 금융, 일반기업 등에서 고른 매출기록을 달성하고, 공공분야는
대법원, 국토부 등 굵직한 사업을 완료하였으며, 공공분야 고도화 사업과 비정형암호화 분야의
수요창출, 금융분야의 금결원 사업을 마무리하고 수중은행도 구축 완료
▪ 빅데이터 분석사업에서 글로벌 반도체사의 Machine Learning을 활용한 제조공정 빅데이터 분석시스템
및 MES 시뮬레이션 분석시스템 구축과 함께 의료/진료분야의 빅데이터 분석시스템을 구축,
공공기관에서 업무혁신 및 업무프로세스 개선을 위한 빅데이터 분석 사업에 두드러진 성과를 기록
▪ 빅데이터 분석 사업을 위하여 국내 유명 솔루션 파트너쉽을 통하여 Linux OS, ETL, CDC, BI,
Visualization, Machine Learning 등 고객의 최적의 분석 시스템 서비스를 위한 연결고리 역할을 담당
139
139
전략품목 현황분석
다. 특허 동향
주요 기술
▪ 실시간 데이터 수집 기술, 서비스 시각화 기술, 상품정보 빅데이터 구축 기술, 지능형 삼품 관리
기술, 배송경로 최적화 분석 기술, 스마트 물류 관리 시스템 기술 등이 포함됨
요소기술 코드 설명
140
140
유통/물류 빅데이터 구축 및 분석 시스템
◎ 세부 분야별 특허동향
요소기술 한국 미국 일본 유럽 ETC 계
실시간 데이터 수집 기술 23 9 0 0 3 35
서비스 시각화 기술 12 5 1 0 3 21
상품정보 빅데이터 구축 기술 49 26 2 2 18 97
지능형 상품 관리 기술 14 10 0 1 4 29
141
141
전략품목 현황분석
▪ 한국국적의 출원인의 특허 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는
경향을 보이고 있음
142
142
유통/물류 빅데이터 구축 및 분석 시스템
주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•중소기업 중심
•WORLD AWARD ACADEMY
서비스 시각화 기술 ◓ •HCL Technologies
•(주)가이온, 주식회사 나라시스템
등
•IBM
•대기업 중심
•FISHER-ROSEMOUNT
배송경로 최적화 분석 기술 ● SYSTEMS, INC.
•삼성전자. LG CNS,
한국전자통신연구원등
•Microsoft
•FISHER-ROSEMOUNT
•공공연구기관 중심
스마트 물류 관리 시스템 SYSTEMS, INC.
기술
● •IBM
•한국전자통신연구원,
국민대학교산학협력단 등
•Huawei Technologies
143
143
전략품목 현황분석
▪ 서비스 시각화 기술 분야는 출원량이 적으며 WORLD AWARD ACADEMY, HCL Technologies
등이 일부 특허를 보유
지능형 상품 관리 기술 분야 주요 출원인 동향
144
144
유통/물류 빅데이터 구축 및 분석 시스템
◎ 국가별 특허활동지수(AI) 비교
145
145
전략품목 현황분석
▪ 질적인 측면을 같이 고려한 시장력에 있어서 미국은 질적 수준도 높지만 시장성도 높은 국가 쪽으로 조사됨
▪ 한국과 일본은 시장력 면에서 미국이나 이스라엘보다 다소 뒤지고 질적 수준도 가장 낮은 것으로 나타남
PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
EU 39 1.076923 1.842105
JP 26 1.192308 0
KR 232 1.362069 0
요소기술 기술 집중도
실시간 데이터 수집 기술 ◕
서비스 시각화 기술 ◓
상품정보 빅데이터 구축 기술 ●
지능형 상품 관리 기술 ◓
배송경로 최적화 분석 기술 ●
스마트 물류 관리 시스템 기술 ●
146
146
유통/물류 빅데이터 구축 및 분석 시스템
◎ 최신 국내 특허기술 동향
요소기술 최근 핵심기술 동향
•빅데이터를 이용한 전자상거래 구매예측 통합솔루션 시스템 및
실시간 데이터 수집 기술
이를 이용한 응용 서비스 제공 기술
•사물인터넷 기반 운송 로봇 및 운송 로봇의 동작 방법 기술 및
스마트 물류 관리 시스템 기술
이를 이용한 응용 서비스 제공 기술
▪ 서비스 시각화 기술 분야는 인공 지능을 기반으로 한 컴퓨터 보안 기술, 운송 수단의 번호판 인식을
이용한 교통 정보 빅데이터 운용 기술 등이 중소기업을 중심으로 연구개발
147
147
전략품목 현황분석
▪ 향후 중소기업은 대기업들의 경쟁이 치열한 실시간 데이터 수집 기술, 배송경로 최적화 분석 기술,
스마트 물류 관리 시스템 기술 보다는 시장진입이 상대적으로 용이한 서비스 시각화 기술 분야에
집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한 상품정보 빅데이터 구축 기술과
스마트 물류 관리 시스템 기술 분야에서는 기술 매입이나 라이센싱 등을 통해 부족한
연구개발능력을 보완하는 것이 바람직할 것으로 사료됨
148
148
유통/물류 빅데이터 구축 및 분석 시스템
4. 연구개발 네트워크
가. 연구개발 기관/자원
(1) 연구개발 기관
No 참여기관 관련부서(센터) 부문
1 신한은행 빅데이터센터
2 *신한카드 빅데이터 사업본부
3 코리아크레딧뷰로주식회사 빅데이터사업부
4 KB국민은행 데이터분석부
5 KB국민카드 데이터분석부
6 CJ올리브네트웍스 빅데이터센터
7 서울아산병원 헬스이노베이션 빅데이터센터
비즈 혁신(BBC)
8 KT 빅데이터사업지원단
Business Bigdata Center
9 SKT 데이터기술원
(16개)
10 LG유플러스 빅데이터센터
11 LG CNS AI빅데이터센터
12 CJ Hello DataScience팀
13 코스콤 빅데이터AI실
14 비투엔 BigData Excellence 센터
15 삼성SDS 데이터분석사업팀
16 TNMS 빅데이터센터
17 한국에너지공단 에너지데이터분석센터
18 한국교통안전공단 교통빅데이터센터 공공혁신(PBC)
19 국민연금공단 빅데이터부 Public
20 한국수자원공사 물정보종합센터 Bigdata Center
21 국회도서관 데이터융합분석과 (6개)
22 국토연구원 빅데이터본부
23 한국보건사회연구원 빅데이터 정보연구센터
24 전자부품연구원 인공지능 빅데이터센터
25 대구경북연구원 공간빅데이터센터
연구혁신(BSC)
26 한국교통연구원 교통빅데이터사업단
Bigdata
27 강원대학교 데이터분석센터 Science Center
28 세종대학교 인공지능-빅데이터연구센터 (9개)
29 호서대학교 지능형제조빅데이터센터
30 충북대학교 빅데이터연구소
31 안양대학교 공간빅데이터연구단
32 경기도 빅파이센터(경기컨텐츠진흥원)
33 경상북도 경북빅데이터센터(영남대) 지역 혁신(RBC)
34 전라북도 빅데이터활용센터 Regional Bigdata Center
35 제주특별자치도 ICT융합팀 (5개)
36 대구광역시 빅데이터센터(대구디지털산업진흥원)
149
149
전략품목 현황분석
- 자동차 네트워크와 관련된 연구를 중심으로 수행하는 곳으로 인터넷 기반의 커넥티드 카, 지능형
자동차 등의 연구를 진행하고 있음
▪ 한국교통연구원 물류연구본부
▪ 국토교통과학기술진흥위원회 교통물류실
- 국내 유일의 국토교통 R&D 전문기관으로 국토교통 R&D의 기획, 관리, 평가와 건설·교통신기술
인증업무를 수행하고 있으며, 국민생활과 밀접한 국토교통 R&D를 통해 국민 모두가 행복해지는
기술, 창조적 국토공간을 구현하는 기술을 만들어 나가고자 설립
- SCM과 관련분야의 기업 컨설팅을 진행하고 있음. 또한 수리적 모델링을 바탕으로 TMS, WMS
등을 고객맞춤형으로 제작하고 공급하고 있음
▪ KT SAT
150
150
유통/물류 빅데이터 구축 및 분석 시스템
(2) 연구개발 자원
정부 지원 프로그램
▪ 축산차량 GPS 운영비 지원
▪ 국토교통과학기술진흥원
- 정부에서 입찰하는 물류와 관련된 연구 및 기술개발 용역을 관리하는 공공기관. RFID, GPS 기반의
수송관련 연구 또는 시스템 개발과 관련된 공고문을 확인할 수 있음
- 국토교통과학기술 육성법에 근거하여 정부에서 물류 및 교통관련 신기술 개발과 관련된 연구를
공지하고, 연구지원 대상자 선발을 주관하고 있는 기관
▪ 한국교통연구원
151
151
전략품목 현황분석
나. 연구개발 인력
기관 부서 대표번호
서울대학교 GNSS 연구실 02-888-2069
고려대학교 무선데이터통신 연구실 02-3290-3253
한국항공우주연구원 SBAS 사업단 042-870-3578
한국물류산업정책연구원 ITS첨단교통 연구본부 02-704-3736
다. 기술이전가능 기술
분류 요소기술 기관
152
152
유통/물류 빅데이터 구축 및 분석 시스템
5. 기술개발로드맵
가. SWOT 분석
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•이미 개발된 기술 활용 시 글로벌 대기업과의 경쟁
•물류 구축 및 분석시스템의 기반이 되는 국내 빅데이터
불가피
기술의 빠른 발전
•개별 기술을 넘어 전체적인 기술의 연계를 통한 빅데이터
•GPS 등의 맵핑 기술에 강점 보유
활용의 어려움
•정부의 빅데이터 지원 정책의 확대
•유통,물류에 최적화된 빅데이터 활용 지원 정책의 부재
기회(Opportunity) 위협(Threat)
•빅데이터의 중요성 부각에 따른 정부차원의 지원 확대 •개인정보보호로 인한 빅데이터 활용 규제
•다양한 산업분야로의 시장 확대 •글로벌 기업의 국내 진출에 따른 국내 시장 잠식
•유통 및 물류량의 증가로 효율적인 프로세스를 찾는 가능성
업체의 증가 •유통, 물류 업체간의 원할한 소통 플랫폼의 부재
중소기업의 시장대응전략
➜ 글로벌 플랫폼에 제공하기 어려운 실시간 데이터 수집 및 연계기술의 개발
➜ 각 산업 분야에 적합한 다양한 데이터 분석 기술의 개발로 중소기업의 경쟁력 강화
➜ 플랫폼이 아닌 빅데이터를 활용한 서비스 개발과 유료 수익 모델 개발을 통한 수익 창출
나. 중소기업핵심요소기술
153
153
전략품목 현황분석
(2) 요소기술
요소기술 출처
154
154
유통/물류 빅데이터 구축 및 분석 시스템
(3) 핵심요소기술
분류 핵심요소기술 설명
데이터 품질
고도화 및 표준화
유통/물류
배송경로 최적화 분석 빅데이터를 기반으로 배송순서, 도로정보, 위치 정보를
빅데이터 예측 바탕으로 배송경로를 최적화 하는 기술
기술
분석
155
155
전략품목 현황분석
다. 기술개발전략
(1) 우리의 현황
156
156
유통/물류 빅데이터 구축 및 분석 시스템
(2) 기술개발로드맵
157
157
전략품목 현황분석
※ 참고 : 핵심요소기술 평가결과
지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
보안 정보 및 이벤트 관리
6.7 6.3 7.5 7.2 27.7
기술
비즈니스 연속성 및 재해
7.0 7.0 7.5 6.8 28.3 선정
복구 기술
응용 프로그램 결합 보안
7.7 7.7 7.2 7.8 30.3 선정
기술
클라우드 서비스 접속 보안
8.2 8.2 7.2 7.5 31.0 선정
브로커 기술
158
158
전략품목 현황분석
빅데이터 분석 및
시각화 플랫폼
159
160
빅데이터 분석 및 시각화 플랫폼
정의 및 범위
▪ 데이터 시각화는 빅데이터를 분석하여 이용자가 필요로 하는 정보를 도출, 정보를 쉽게 이해할 수 있도록 텍스트
혹은 이미지 등, 내용 전달에 효과적인 시각적 형태를 활용
정부지원 정책
▪ 4차 산업 혁명 정책의 중심인 빅데이터 산업 활성화의 체계적 지원을 위해 ‘17년 제3차 ’민간 합동 빅데이터 TF
회의‘를 개최하여 ’21년까지 112개 분야 지능, 융합형 공공데이터 구축 및 개방을 확대하고, 창업 콜라보
프로젝트, 창업 경진대회 등을 통해 공공데이터 활용 기업을 육성하고 창업을 지원할 예정
▪ 데이터 경제 활성화 목적으로 ‘19년까지 약 1조원을 빅데이터 산업 지원에 투자할 계획, 핵심 기술 및 전략적
투자에 7,300억원, 생태계 조성에 2,400억원을 투자할 것으로 알려짐
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•(환경) 세계적 ICT 강국으로 빅데이터 수집 환경 조성
•(환경) 기업들의 빅데이터에 대한 이해도가 상대적 부족
•(기술) 세계적으로 높은 초고속 대규모 복합 미디어 정보
•(기술) 우리나라 기술은 아직 선진국에서 개발한 핵심기술을
처리기술
도입하여 적용하는 수준으로 한계가 뚜렷
•(정책) 정부의 빅데이터 산업에 대한 집중적 지원과 인재
•(정책) 빅데이터를 수집할 수 있는 매체 개발 미비
양성 노력
기회(Opportunity) 위협(Threat)
•(환경) 스마트공장, 스마트시티 등 빅데이터 기반 신사업의
•(환경) 빅데이터 정보 보안에 대한 대책 미흡
등장
•(기술) 글로벌 리더 그룹들의 국내 시장 잠식
•(기술) 빅데이터 기반 기술 개발에 대한 관심 고조
•(정책) 정보 수집을 제한하는 있는 현재 국내 정책
•(정책) 정부의 공공데이터 공개의 활성화
중소기업의 시장대응전략
➜ IoT의 발전화 보편화에 따라 수집되는 비정형 데이터의 양은 폭발적으로 증가하여 비정형 데이터
분석의 중요도는 앞으로도 높아질 전망, 따라서 산업적으로 활용할 수 있도록 비정형 빅데이터를
분석하고 가공하는 기술 개발을 통해 시장 선점
➜ 글로벌 선두 그룹들의 실시간 데이터 처리, 배치 데이터 처리 등의 기술을 도입하여 세계시장에
뒤처지지 않도록 함과 동시에 세부적 시장에 최적화된 기술 개발
전략품목 현황분석
1. 개요
가. 정의 및 필요성
데이터 시각화는 빅데이터를 분석하여 이용자가 필요로 하는 정보를 도출, 정보를 쉽게 이해할
수 있도록 텍스트 혹은 이미지 등, 내용 전달에 효과적인 시각적 형태를 활용
162
162
빅데이터 분석 및 시각화 플랫폼
나. 범위
(1) 제품분류 관점
빅데이터 솔루션 아키텍처는 데이터를 수집, 저장, 처리, 분석, 시각화와 같은 일련의 단계를
위한 각종 솔루션들의 논리적 구성
* 출처: Microsoft
[ 빅데이터 아키텍처 ]
163
163
전략품목 현황분석
▪ 배치 데이터 처리와 실시간 데이터 처리를 분리하는 람다 아키텍처가 소개된 이후 계층별 적합한
솔루션이 제공
- 예를 들어, 실시간 데이터 처리로 Apache Spark, Apache Storm 등의 솔루션이 활용.
[ 람다 아키텍처 ]
데이터 시각화 기술은 유용한 데이터 분석 결과를 시각적으로 표현하는 기술로 기업용 보고
도구부터 시작해 최근 오픈 소스 이용 확대로 R, Python을 이용한 다양한 시각화 도구로 확장
164
164
빅데이터 분석 및 시각화 플랫폼
(2) 공급망 관점
* (출처: https://learnbigdatatools.com
165
165
전략품목 현황분석
2. 외부환경 분석
가. 산업환경 분석
(1) 산업의 특징
▪ 앞으로 몇 년간 3세대 플랫폼에 기반한 혁신과 가치 창조가 크게 증가할 것으로 전망되며 새로운
핵심 기술이 혁신 가속기로 작용하면서 이 단계를 견인할 것이고 그러면 전 산업에 걸쳐 3세대
플랫폼의 힘과 애플리케이션이 확대될 전망
빅데이터/DB 시스템의 보급과 언어처리 기술의 발달로 다양한 기업에서 다양한 형태의
비정형데이터들이 정형화되어 기록
▪ 유통 분야는 오프라인, 온라인, 모바일, 콜센터 등 폭넓은 옴니 채널의 활용과 온오프라인을 넘나드는
고객과 소통 강화를 위해 빅데이터 분석에 투자를 확대하고 있는 추세
166
166
빅데이터 분석 및 시각화 플랫폼
(2) 산업의 구조
[ 데이터산업 범위 ]
구분 범위
데이터 솔루션에는 데이터 수집, 데이터 설계, DBMS, 데이터 관리, 데이터 품질, 데이터
분석, 데이터 플랫폼이 포함됨. 이 중 데이터 분석 관련한 시장 규모는 전체 빅데이터
시장에서 약 8%를 차지
[ 2017년 데이터솔루션 시장 규모 비중 ]
167
167
전략품목 현황분석
데이터 분석에는 정형 데이터 분석, 비정형 데이터 분석, 실시간 데이터 분석, 데이터 시각화 분석이 포함
[ 데이터 솔루션 정의 ]
분류 정의 관련 예시
CEP(Complex Event
실시간
▪ 데이터 분석을 통해 위험 신호 또는 징후를 감지하여 위기나 재난에 Processing),
데이터
대처할 수 있도록 예측하는 솔루션 BAM(Business Activity
분석
Monitoring)
168
168
빅데이터 분석 및 시각화 플랫폼
나. 시장환경 분석
(1) 세계시장
빅데이터 시장 내에서 비정형 데이터가 전체의 90% 이상을 차지, 사물인터넷, 웨어러블
디바이스의 이용 증가와 미디어 매체의 증가에 따라 하루 수집되는 빅데이터의 양은 약
1,000만건을 상회할 것으로 예측 (1년이면 약 40억 건 이상의 데이터 수집)
빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 ’22년 900억
달러로 성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용
빅데이터 세계 시장은 2023년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)
169
169
전략품목 현황분석
[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용
세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)
▪ ‘17년에는 171억 달러 수준에 그쳤으나, ’18년에는 243억 달러, ’19년에는 346억 달러로 크게
성장할 것으로 전망되며, 성장추세는 매년 지속적이거나 더 큰 성장세를 보일 것으로 예측
120
99.3
100
백 80 69.8
만 60 49.1
달 34.6
40
24.3
러 17.1
20
0
2017 2018 2019 2020 2021 2022
170
170
빅데이터 분석 및 시각화 플랫폼
(2) 국내시장
빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 ’20년
4,468억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)
*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용
[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0
국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억원로 연평균 7.6% 성장 예상 (데이터 산업 활성화 전략, 2018.6)
171
171
전략품목 현황분석
▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출
▪ 빅데이터 도입 및 활용을 원활하게 수행하기 위해서는 일정 수준 이상의 투자 여력이 있어야 하고, 분석할만한
데이터의 품질과 양이 충분하게 준비되어 있어야 하며, 데이터 경제 추진에 따라 점차 기반 마련 예상
172
172
빅데이터 분석 및 시각화 플랫폼
3. 기술 분석
가. 기술개발 이슈
IoT 데이터 처리 및 분석 이슈
- 첫 번째로 IoT 사이트에 독립형 클러스터를 배포하여 분석하는 것이나 이 방법은 자동차와 같이
공간 제약적인 환경에 적용할 수 없고 여러 자동차의 데이터를 함께 분석하는 데에는 한계
- 두 번째는 클라우드와 같은 중앙 클러스터에 데이터를 보내어 분석하는 것이나 이 방법은 네트워크
연결과 대역폭이 제약적인 환경에 적용할 수 없고 실시간 분석하는 데에는 한계
▪ MapR Technologies社는 MapR Converged Data Platform을 경량화한 MapR Edge 제품을 출시
173
173
전략품목 현황분석
◎ 기술개발트렌드
* 출처: https://becominghuman.ai
174
174
빅데이터 분석 및 시각화 플랫폼
데이터 큐레이터는 데이터 보호, 데이터 거버넌스 및 데이터 품질, 메타데이터를 관리하며
해당 데이터로 작업하기 위한 모범 사례를 결정하고 대시보드, 도표 또는 슬라이드 쇼
형식의 시각적으로 표시되는 프레젠테이션을 담당
* 출처: Freitas A., Curry E. (2016) Big Data Curation. In: Cavanillas J., Curry
E., Wahlster W. (eds) New Horizons for a Data-Driven Economy.
Springer, Cham
[ 데이터 큐레이션 효과 ]
175
175
전략품목 현황분석
* 출처: https://www.wowrack.com
176
176
빅데이터 분석 및 시각화 플랫폼
나. 주요기업 동향
(1) 해외기업 동향
▪ 구글은 그래프 알고리즘의 처리를 지원하기 위한 기술인 Pregel, 대용량 데이터를 분산 처리로
빠르게 분석할 수 있는 기술인 Dremel, 검색 인덱스를 작성하기 위한 기술인 Percolator 등의
빅데이터 관련 기술 및 도구들을 직접 개발하여 사용하고 있으며, 대용량 데이터의 실시간 처리
기술인 Dremel을 BigQuery로 상용화하여 서비스 제공
▪ Cloudera Data Science Workbench는 Apache Spark와 Apache Impala에 대한 안전한 온디맨드
원격 액세스를 통해 웹 브라우저에서 Python, R, Scala를 직접 사용할 수 있도록 하는 셀프 서비스
177
177
전략품목 현황분석
데이터 플래닛
178
178
빅데이터 분석 및 시각화 플랫폼
(2) 국내업체동향
▪ 실시간으로 발생하는 다양한 형태의 머신/휴먼데이터를 수집하여 데이터에 기반한 신속한 비즈니스
의사 결정을 지원하는 Lean Stream 솔루션을 제공
179
179
전략품목 현황분석
기타 국내 중소기업 사례
▪ ㈜빅오이는 빅데이터, IoT, 제조, 빅데이터 컨설팅 및 서비스를 주된 사업에 주력하는 업체로 다양한
IoT 솔루션과 토털 RFID 시스템 제공. 스포츠 빅데이터 의사결정시스템 'Big SASS' 개발하여
세계적인 기업으로 성장. 산업 전 분야에 빅데이터 부문의 사업확장. 항만터미널 내 차량을
제어하는 차량 제어 서버, 시스템 및 방법 특허 출원
▪ (주)사이람은 네트워크와 관련된 최첨단 지식과 기술을 체화하고 있느 기업으로서 네트워크 모델링,
분석, 시각화와 관련된 전문지식과 솔루션을 개발 및 보유한 업체. 최근. 조직 분석, 인터넷
커뮤니티 분석, 전염병 확산경로 분석, 게놈 연구, 범죄 수사 등의 분야에 활발하게 응용되면서 최근
전 세계적인 주목
180
180
빅데이터 분석 및 시각화 플랫폼
다. 특허동향
주요 기술
▪ 분산 스토리지 기술, NoSQL 데이터베이스 기술, 배치 데이터 처리 기술, 실시간 데이터 처리 기술,
머신 러닝 기반 데이터 분석 기술, 데이터 시각화 기술 등이 포함
요소기술 코드 설명
181
181
전략품목 현황분석
◎ 세부 분야별 특허동향
요소기술 한국 미국 일본 유럽 ETC 계
분산 스토리지 기술 45 6 1 2 2 54
NoSQL 데이터베이스 기술 16 3 0 0 5 19
배치 데이터 처리 기술 31 14 0 3 11 48
실시간 데이터 처리 기술 45 18 0 4 15 67
머신 러닝 기반 데이터 분석 기술 96 83 9 15 46 203
데이터 시각화 기술 76 15 3 0 10 94
182
182
빅데이터 분석 및 시각화 플랫폼
▪ 한국국적 출원인의 특허 출원량은 2010년 초반부터 급격히 출원량이 높아지는 경향을 보이고
있으며 머신 러닝 기반 데이터 분석 기술 분야는 2014년부터 출원량이 급격히 증가
183
183
전략품목 현황분석
주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•공공연구기관 중심
•Oracle
NoSQL 데이터베이스 기술 ◓ •ZTE Corporation
•한국과학기술정보연구원,
성균관대학교산학협력단 등
•Qualcomm •공공연구기관 중심
배치 데이터 처리 기술 ● •FISHER ROSEMOUNT •한국전자통신연구원,
SYST INC 전자부품연구원, 케이티 등
•IBM •공공연구기관 중심
머신 러닝 기반 데이터 분석
기술
● •Intel •한국전자통신연구원,한국과학
•Aerion Corporation 기술원 등
•WORLD AWARD
ACADEMY •공공연구기관 중심
데이터 시각화 기술 ◕ •FISHER ROSEMOUNT •가톨릭관동대학교산학협력단,
SYST INC 국민대학교산학협력단 등
•AT&T
184
184
빅데이터 분석 및 시각화 플랫폼
분산 스토리지 기술 분야 주요 출원인 동향
배치 데이터 처리 기술 분야 주요 출원인 동향
머신 러닝 기반 데이터 분석 기술 분야 주요 출원인 동향
185
185
전략품목 현황분석
◎ 국가별 특허활동지수(AI) 비교
186
186
빅데이터 분석 및 시각화 플랫폼
▪ 질적인 측면을 같이 고려한 시장력에 있어서 유럽(독일, 프랑스)은 질적 수준은 높지만 시장성은
낮은 국가 쪽으로 조사
PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
EU 24 1.833333 0.571429
JP 13 1.307692 0
KR 309 1.190939 0
요소기술 기술 집중도
분산 스토리지 기술 ●
NoSQL 데이터베이스 기술 ◓
배치 데이터 처리 기술 ●
실시간 데이터 처리 기술 ●
머신 러닝 기반 데이터 분석 기술 ●
데이터 시각화 기술 ◕
※ ●: 50건 이상, ◕: 30~49건, ◓: 20~29건, ◔: 10~19건, ◯: 10건 미만
187
187
전략품목 현황분석
◎ 최신 국내 특허기술 동향
요소기술 최근 핵심기술 동향
▪ 분산 스토리지 기술 분야는 빅데이터의 저장기술, 실시간 분석을 위한 스마트 스토리지 플랫폼 기술,
빅데이터 처리 장치 및 이를 저장하는 기록매체 기술 등이 공공연구기관을 중심으로 집중 연구개발
▪ 데이터 시각화 기술 분야 빅데이터 스트림 모델링 시스템 기술, 스마트 빅데이터 기반 조기보안
관제 시스템 기술, 빅데이터 시각화 시스템 및 방법 기술 등이 공공연구기관을 중심으로 연구개발
188
188
빅데이터 분석 및 시각화 플랫폼
189
189
전략품목 현황분석
4. 연구개발 네트워크
가. 연구개발 기관/자원
(1) 연구개발 기관
▪ 행정안전부 공공데이터 포털
▪ 한국빅데이터학회
▪ K-ICT 빅데이터센터
▪ 다음소프트
- 인공지능 대화기술과 자연어 처리 기술을 보유하고 있으며, 이를 기반으로 데이터 수집, 정보검색,
텍스트 마이닝, e-비즈니스, 소셜분석 등의 솔루션과 서비스를 제공하고 있음
- KB국민카드의 소셜미디어 수집/분석, SBS 통합리스닝 플랫폼, 국민건강보험공단 국민건강알람서비스,
KT 고객 니즈 관리 시스템 등을 개발하여 서비스 중
190
190
빅데이터 분석 및 시각화 플랫폼
(2) 연구개발 자원
191
191
전략품목 현황분석
나. 연구개발 인력
기관 부서 대표 전화번호
정보통신기술진흥센터 기반 SW·컴퓨팅 CP -
다. 기술이전가능 기술
(1) 기술이전가능 기관
분류 요소기술 기관
192
192
빅데이터 분석 및 시각화 플랫폼
(2) 이전 기술에 대한 세부 내용
분류 세부내용
기술성숙도(TRL) •단계: 6
193
193
전략품목 현황분석
분류 세부내용
가. 기술이전의 내용
A. 가상머신 기반 메모리 확장 시스템 SW
나. 기술이전의 범위
A. 가상머신 기반 메모리 확장 시스템 SW
A-1. 메모리 확장 모듈 기술
o 하이퍼바이저 패치 모듈
o 메모리 확장 리눅스 모듈
o RDMA 기반 노드간 통신 모듈
o 소스코드, 상세설계서, 시험계획서, 시험 절차서, 기타 기술문서
A-2. 고속 통신 기반 원격 메모리 블록 디바이스 기술
o 메모리 제공자 서버 모듈
o RDMA 기반 노드간 통신 모듈
o 원격 메모리 블록 디바이스 모듈
o 소스코드, 상세설계서, 시험계획서, 시험 절차서, 기타 기술문서
•특허 2건
1) 클라우드 컴퓨팅 시스템의 메모리 관리 장치 및 방법
(출원번호 : 10-2014-0069643)
2) 대용량 메모리 기반 데이터 처리를 위한 원격 메모리 데이터 관리 방법 및
관련지적재산권
장치
(출원번호 : 2014-0002836)
성능가속 시스템 SW 서브시스템 메모리 확장 기술 상세 설계서 등 기술문서
20건
194
194
빅데이터 분석 및 시각화 플랫폼
분류 세부내용
계약기간 •계약체결일로부터 5 년간
※경상기술료
•세부기술별 착수기본료
기타특기사항 - 메모리 확장 모듈 기술: 20백만 원(중소기업기준)
- 고속 통신 기반 원격 메모리 블록 디바이스 기술: 12백만 원(중소기업기준)
•고성능컴퓨팅SW연구실 김원영
•기술개발 발표당시
042-860-6847
기술관련
•고성능컴퓨팅연구그룹 김원영
•현재
042-860-6847
세부
문의
•기술이전팀 김영규
•기술개발 발표당시
042-860-4960
계약련
•기술이전팀 김영규
•현재
042-860-4960
195
195
전략품목 현황분석
5. 기술개발로드맵
가. SWOT 분석
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•(환경) 세계적 ICT 강국으로 빅데이터 수집 환경 조성
•(환경) 기업들의 빅데이터에 대한 이해도가 상대적 부족
•(기술) 세계적으로 높은 초고속 대규모 복합 미디어 정보
•(기술) 우리나라 기술은 아직 선진국에서 개발한 핵심기술을
처리기술
도입하여 적용하는 수준으로 한계가 뚜렷
•(정책) 정부의 빅데이터 산업에 대한 집중적 지원과 인재
•(정책) 빅데이터를 수집할 수 있는 매체 개발 미비
양성 노력
기회(Opportunity) 위협(Threat)
•(환경) 스마트공장, 스마트시티 등 빅데이터 기반 신사업의
•(환경) 빅데이터 정보 보안에 대한 대책 미흡
등장
•(기술) 글로벌 리더 그룹들의 국내 시장 잠식
•(기술) 빅데이터 기반 기술 개발에 대한 관심 고조
•(정책) 정보 수집을 제한하는 있는 현재 국내 정책
•(정책) 정부의 공공데이터 공개의 활성화
중소기업의 시장대응전략
➜ IoT의 발전화 보편화에 따라 수집되는 비정형 데이터의 양은 폭발적으로 증가하여 비정형 데이터
분석의 중요도는 앞으로도 높아질 전망, 따라서 산업적으로 활용할 수 있도록 비정형 빅데이터를
분석하고 가공하는 기술 개발을 통해 시장 선점
➜ 글로벌 선두 그룹들의 실시간 데이터 처리, 배치 데이터 처리 등의 기술을 도입하여 세계시장에
뒤처지지 않도록 함과 동시에 세부적 시장에 최적화된 기술 개발
나. 중소기업 핵심요소기술
196
196
빅데이터 분석 및 시각화 플랫폼
(2) 요소기술
요소기술 출처
197
197
전략품목 현황분석
(3) 핵심요소기술 도출
분류 핵심요소기술 개요
빅데이터 저장
빅데이터 처리
머신 러닝 기반 데이터 분석
빅데이터 분석 추천, 분류, 군집 등과 같은 머신러닝 기반 빅데이터 분석 기술
기술
198
198
빅데이터 분석 및 시각화 플랫폼
다. 기술개발전략
(1) 우리의 현황
199
199
전략품목 현황분석
(2) 기술개발로드맵
200
200
빅데이터 분석 및 시각화 플랫폼
※ 참고 : 핵심요소기술 평가결과
지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
통계 기반 데이터
6.7 6.2 6.2 6.8 25.8
분석 기술
머신 러닝 기반 데이터 분
7.0 6.7 6.2 6.7 26.5 선정
석 기술
201
201
202
전략품목 현황분석
데이터 3D 변환
시각화 도구
203
204
데이터 3D 변환 시각화 도구
정의 및 범위
정부지원 정책
▪ 고용노동부와 안전보건공단은 2017년 시뮬레이터를 활용한 건설현장 가상체험 콘텐츠 1종과 증강현실을
활용한 콘텐츠 2종을 추가 개발할 계획
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•(환경) 거대자본의 대기업 중심의 산업 생태계 조성으로
•(환경) 빅데이터 관련 우수한 전방, 후방 인프라 구축
인한 산업 내 약한 중소기업의 입지
•(기술) 데이터 3D 변환에 활용 가능한 글로벌 수준의
•(기술) 세계 선두 기업에 비하여 핵심 원천기술 미흡
ICT 및 IoT 경쟁력
•(정책) 산업계 연계성이 낮은 법과 세계 트렌드에 뒤쳐진
•(정책) 중앙정부의 해당 산업 지원 정책 수립
제도적 지원
기회(Opportunity) 위협(Threat)
•(환경) 시각 데이터 활용 기반의 교육 및 의료 시장의
확대에 따라 기대되는 수요 증가 •(기술) 글로벌 업체와의 기술격차 심화
•(기술) 기반기술 연구·개발로 누적된 기술 데이터 활용 가능 •(정책) 빅데이터 활용에 따른 보안 문제 대두
•(정책) 정부와 업계의 높은 니즈에 따라 높은 발전가능성
중소기업의 시장대응전략
➜ AR/VR 기술을 기반으로 건축, 의료, 교육, 제조, 조선 등에 적용한 제품 개발로 시장대응
1. 개요
가. 정의 및 필요성
▪ 데이터를 얼마나 보유하고 있는가가 중요하지 않고 어떻게 분석해서 활용하는 것이 중요하며 방대한
양의 데이터를 쉽게 파악할 수 있는 시각화 기술이 중요해짐
▢ 데이터 시각화란 인지를 증폭시키기 위해 인간의 시지각 능력을 이용하는 데이터의 표현과
설명방식으로 정의하며, 데이터의 표현, 데이터의 설명방식, 시지각 능력의 이용, 인지 증폭의
속성을 포함1)
▪ 데이터 시각화: 수많은 데이터를 도표와 그래프등을 이용하여 시각적으로 표현하는 방식으로
접근하기 어렵고 이해하기 힘든 정보들을 알아보기 쉽도록 도와주는 역할을 함. 정보 시각화,
과학적 시각화, 인포그래픽으로 분류
1) Andy Kirk, 2012, Data Visualization : A Successful Design Process, Packt Publishign, pp. 16-17
206
206
데이터 3D 변환 시각화 도구
▪ 가상현실은 사용자가 가상으로 생성된 객체만을 경험하도록 기본적인 감각인 시각에 대해 실세계가
차단되도록 시야 전체를 가상 영상으로 채우는 착용형 디스플레이를 이용
▪ 가상현실은 실세계 영상이 차단되므로 고정된 자세에서 영상 시청에는 무리가 없으나, 사용자의
이동이나 가상 객체와의 상호작용을 위해서는 부수적인 요소기술 활용이 필요
▪ 실제 세상과 가상 세계를 통합, 물체와 디지털 개체가 공존하고 실시간으로 상호작용을 하는 새로운
시각화 환경
▢ 빅데이터 시각화 서버 기술
▪ GPU 데이터베이스는 GPU의 병렬 처리를 이용해 데이터의 처리 속도를 향상. GPU는 SQL의
데이터세트의 모든 행에 대해 동일한 작업을대개 검색 수행하기 때문
207
207
전략품목 현황분석
나. 범위
[ 제품분류 관점 기술범위 ]
▢ 데이터 시각화의 장점
▪ 많은 양의 데이터를 한눈에 파악 가능
208
208
데이터 3D 변환 시각화 도구
2. 외부환경 분석
가. 산업환경 분석
▪ 모든 각도에서 실시간으로 제품을 검사하거나 위치나 환경을 조사할 수 있으며, 실제로 눈앞에서
펼쳐지는 것처럼 다양한 시뮬레이션을 오버레이할 수 있음. VR을 통해 설계, 엔지니어링, 기술
전문가들은 물리적 모델과 관련된 비용을 절약 가능
▪ Autodesk의 VRED, 3ds max 및 Maya, Luxion의 KeyShot, Chaos Group의 VRAY, Dassault
Systems 3DExcite 및 CATIA Live Render 같은 시스템은 현대 시각화 기술 산업 부문에서 적극 활용
▪ Autodesk, Luxion 및 Dassault Systems 같은 솔루션 업체가 제공하는 CPU 기반의 시스템을 통해
점점 더 많은 디자이너가 실제와 같은 조건 하에 제품의 성능을 시뮬레이션해 보고, 최종 제품이
어떤 모습일지 자세한 시각화를 통해 확인
209
209
전략품목 현황분석
▢ AR과 VR은 게임, 교육, 의료, 영상, 방송·광고, 제조·산업 등 다양한 분야에서 활용
산업 활용 예시
· 영화: 기술영화(Tech-Film)
· 내비게이션: 3차원 가상경로, 실사영상기반 실감 내비게이션
영상
· 드론: 1인칭시점(FPV) 영상, e-스포츠 등
· 부동산: 가상 모델하우스, 부동산 영상 등
▢ 혼합현실 활용
▪ 포드 : 디자이너들이 진흙으로 프로토타입을 만들지 않고 가상으로 프로토타입을 만들어 각종
실험과 테스트
▪ 인터랙티브 건축 모델
▪ 의료용 스캔 데이터
▪ 3D 데이터 시각화
210
210
데이터 3D 변환 시각화 도구
나. 시장환경 분석
(1) 세계시장
빅데이터 세계 시장은 연평균 10.6% 성장하고 있으며, ‘17년 534억 달러에서 ’21년 814억
달러로 성장할 전망(’17, IDC)
[ 빅데이터 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC’s Smeiannual Big Data and Analytics Software Tracker, May 2017, IITP ICT R&D 기술로드맵 2023 재인용
빅데이터 세계 시장은 2023년까지 꾸준한 성장세가 예상되며, EMC, IBM, Oracle, SAP,
Google 등 글로벌 메이저 업체들이 핵심기술 개발에 주력하여 빅데이터 시장을 선점 (‘16,
지식산업정보원)
▪ 2016년 기준, 빅데이터 인프라, 소프트웨어, 서비스 부문은 각각 51.4%, 22.4%, 26.2%의
비중으로 시장 형성
- 인프라 시장의 경우, ’16년 136억 달러 규모에서 연평균 19.6% 성장하여 ’22년 439억 달러 시장
형성을 예측
211
211
전략품목 현황분석
[ 빅데이터 품목별 세계 시장 규모 및 전망 ]
(단위: 백만 달러, %)
*출처: IDC, 세계 빅데이터 기술 및 서비스 2014-2018 전망, 2019년 이후는 CAGR 18.2% 적용
세계 데이터 시장은 빅데이터 시장의 3-4배 정도 규모로 ’17년 1,508억 달러에서 ’20년
2,100억 달러로 연평균 11.9% 성장할 것으로 예측 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 산업별 시장 규모 : 뱅킹, 조립제조, 공정제조, 연방/중앙정부, 전문서비스 분야 순(5개 분야 724억 달러)
▪ 빅데이터 애플리케이션 및 분석 시장은 2018년 50억 달러에서 2026년 194억 달러로 크게 증가하여
연평균 15.49%의 성장률을 달성할 전망
212
212
데이터 3D 변환 시각화 도구
교육 소프트웨어
교육 0.3 7 0.7 15
및 서비스
등록된 등록된 훈련 및
국방 0.5 1.4
HMD수로 추정 HMD수로 추정 시뮬레이션
213
213
전략품목 현황분석
(2) 국내시장
빅데이터 국내 시장은 연평균 24.7% 성장하고 있으며, ‘17년 2,442억 원에서 2022년
6,948억 원으로 성장할 전망(’16, IDC) 향후 사물인터넷, 클라우드와 빅데이터 연계가
이루어지면서 성장세는 지속될 전망
[ 빅데이터 국내 시장 규모 및 전망 ]
(단위: 십 억원, %)
*출처: IDC Korea Big Data Technology and Services 2015-2019 Forecast, Feb 2016, IITP ICT R&D 기술로드맵 2023 재인용
[ 빅데이터 제품별 국내 시장 규모 ]
(단위: 억 원, %)
구분 시장규모 비중
서버 1,004.9 22.1
인프라 스토리지 1,217.9 26.8
네트워크 320.0 7.1
소프트웨어 소프트웨어 1,053.6 23.2
서비스 서비스 949.7 20.9
합계 4,547.0 100.0
국내 데이터 시장은 빅데이터 시장의 10배 이상의 규모로 ’17년 6조 2,973억원에서 ’20년
7조 8,450억원로 연평균 7.6% 성장 예상 (출처: 데이터 산업 활성화 전략, 2018.6)
▪ ’17년 부문별 시장 규모 : 데이터구축/컨설팅(2조 9,291억원), 데이터 서비스(1조 7,146억원),
데이터 솔루션(1조 6,536억원) 순
▪ 정부·공공 시장은 빅데이터 산업 활성화 법안 등을 기반의 40% 이상의 성장을 주도하고 있으며,
민간시장은 금융, 통신 등 일부 대기업에서 한정된 수요를 도출
214
214
데이터 3D 변환 시각화 도구
▪ 일반 기업의 빅데이터 시스템 도입률은 ‘15년 4.3%에서 ‘16년 5.8%로 상승하였고 ’17년 국내
전체 사업체 빅데이터 이용률은 7.5%에 이름
[ VR 분야의 국내 시장규모 및 전망 ]
(단위 : 억 원, %)
215
215
전략품목 현황분석
[ AR/VR 세부 분야별 매출 구성 현황 ]
(단위 : 백만 원, %)
구분 ‘15 ‘16 증감
3. 기술 분석
가. 기술개발 이슈
산업 전반에서 활용
▪ 홀로렌즈 도구를 활용하여 건축가, 소매 디자이너, 공장 레이아웃 디자이너들이 물리적인 현장에서
계획서와 프로젝트를 확인하기 위해 AR를 활용
216
216
데이터 3D 변환 시각화 도구
▪ 증강현실 헤드셋은 2021년 말 가상현실 헤드셋을 웃도는 1,560만대가 출하되어, 전체의 26%를
차지할 것으로 예상
◎ 국내 AR/VR산업 이슈
스노보드 기기는 다리에 힘을 줘 좌우로 움직이면 실제로 미끄러져 나가는 느낌을 체험할 수 있으며,
봅슬레이 기기에서는 시속 135km로 달리는 체험을, 롤러코스터에서는 HMD(Head Mounted
Display)를 쓴 채 360도 회전하는 기구를 타고 실제 롤러코스터를 타는 것 같은 체험이 가능
217
217
전략품목 현황분석
▪ ‘평창 5G 빌리지’ 중심에 ‘꽃밭양지카페’를 조성해 1층에는 네트워크 기반의 AR 기술을 활용한
터치게임을 제공하고, 2층에는 AR 쇼핑 플랫폼인 5G AR 마켓을 제공
◎ 기술 동향
데이터의 시각화
시각화 기술 예
도표와 통계 분석 도구 마이크로 소프트 엑셀이나 태블로
Adobe사의 일러스트레이트
Adobe사의 이펙트
전문가 도구 SAP
마이크로소프트의 PowerBi
구글의 구들트렌드, Visualizing Google Data
ElasticSearch는 Kibana(https://www.elastic.co/kibana)
자연어 처리
HTC는 Vive Tracker(https://www.vive.com/eu/vive-tracker)
218
218
데이터 3D 변환 시각화 도구
업체 개 요
Virtualitics Virtualitics(https://www.virtualitics.com
Disney Research
iKinema(https://ikinema.com/Orion)
LA
과학 시각화
▪ 시뮬레이션 데이터 등 복잡한 데이터를 쉽게 탐색할 수 있도록 그래픽 기술을 활용해 시각화하는
분야로서 의학이나 공학, 분야에서 활용, 특히 건축분야는 AR기반의 BIM(Building Information
Modeling)모델링 기술을 적극 활용
분야 개 요
의학 Insight Heart(http://www.insight-heart.com)
SmartReality(http://smartreality.co)
건축
DottyAR
주도업체 기술 개요
Fove O
기타
Razer OSVR
▪ AR/VR 서비스 생태계 구축의 필요성이 커짐에 따라 글로벌 기업들은 PC와 모바일을 대체할 컴퓨팅
플랫폼으로 관련 플랫폼 개발에 몰두
▪ 레노버가 CES 2018에서 세계 최초의 독립형 가상현실 헤드셋인 미라지 솔로(Mirage Solo)를 공개
▪ 미라지 솔로는 HMD에 적용된 센서와 카메라, 배터리 덕분에 PC나 스마트폰이 필요하지 않음
219
219
전략품목 현황분석
220
220
데이터 3D 변환 시각화 도구
나. 주요기업 동향
(1) 해외업체 동향
데이터 플래닛
▪ MR은 물리적인 현실과 가상 세계를 혼합한 광범위한 개념으로 기존의 VR과 AR을 모두 포함
221
221
전략품목 현황분석
uDCV, uinnova
▪ 3D 시각화 플랫폼
- 시각화 기능, 대화형 드론 방식 전시 비행, 자산 관리, 용량/공간, 물리적 접근 보안, 환경, 케이블
▪ Logical View
- 비즈니스, 응용프로그램, DB, 소프트웨어, 시스템, 호스트, 보안, 인터넷 등 종합적인 논리 아키텍처 시각화
▪ Holistic View
- 장애 영향 및 원인에 대한 진단과 분석
▪ Alarm Alerting
222
222
데이터 3D 변환 시각화 도구
▪ VR 산업화 적용도구
223
223
전략품목 현황분석
(2) 국내업체 동향
[ 넷마이너 3D 네트워크 맵 ]
가상현실 솔루션 제공 업체 넥스트이온은 한국전자통신연구원(ETRI)과 협력해 모바일
기기에서 전용 하드웨어 없이 360도 VR 콘텐츠를 제작할 수 있는 유브이알(YouVR) 기술을
개발·상용화
▪ 360도 VR 콘텐츠를 제작하려면 멀티카메라 리그와 같은 전용 하드웨어와 여러 개 카메라로 동시에
사진을 찍고 이 사진을 연결하는 스티칭(stitching) 소프트웨어가 필요
▪ ETRI가 개발한 유브이알은 무선으로 연결된 로테이터(rotator)를 이용해 360도 VR 사진을 촬영하면
자체 개발된 스티칭 알고리즘이 사진을 생성해 360도 VR 콘텐츠를 제작 가능
KT는 IPTV 서비스 ‘올레 tv’에서 업계 최초로 ‘실시간 모션인식 증강현실(AR)’ 기술을 적용,
양방향 놀이학습 서비스가 가능한 ‘TV쏙 2.0’을 시범 출시
▪ ‘TV쏙 2.0’은 KT가 출시한 IPTV ‘하이퍼 VR’ 서비스 ‘TV쏙’에 ‘실시간 모션인식 AR’ 기술을 적용해
양방향 놀이학습 기능을 강화한 서비스
224
224
데이터 3D 변환 시각화 도구
데이터킹
225
225
전략품목 현황분석
다. 특허 동향
주요 기술
▪ 데이터 3D 변환 시각화 도구 기술 분야는 데이터의 이미지 변환 및 정보 추출, 2D-3D BIM 맵핑,
가상현실(VR), 증강현실(AR), 빅데이터 수집기술, 빅데이터 시각화 처리기술, 빅데이터 시각화 서버
기술 등을 포함함
요소기술 코드 설명
데이터의 이미지 변환 및 정보 수집된 데이터를 이미지로 시각화하여 필요한 정보를
A
추출 추출하는 기술
2D 시각 데이터를 BIM (Building Image Modelling)을
2D-3D BIM 맵핑 B
이용하여 3D로 변환하는 기술
226
226
데이터 3D 변환 시각화 도구
◎ 세부 분야별 특허동향
요소기술 한국 미국 일본 유럽 기타 계
데이터의 이미지 변환 및 정보 추출 117 47 98 20 34 316
2D-3D BIM 맵핑 19 12 6 2 12 51
가상현실(VR) 21 22 18 10 9 80
증강현실(AR) 19 15 0 7 8 49
227
227
전략품목 현황분석
▪ 한국 국적의 출원인의 특허 출원량은 등락을 거듭하긴 하지만 비교적 꾸준히 출원량이 높아지는
경향을 보이고 있음
228
228
데이터 3D 변환 시각화 도구
주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•Toshiba •대기업 중심
데이터의 이미지 변환 및
정보 추출
◓ •SAMSUNG MEDISON •SAMSUNG MEDISON,
•Toshiba Medical Systems 연세대학교, 홍익대학교 등
•HITACHI MEDICAL
•한국건설기술연구원 •공공연구기관 중심
2D-3D BIM 맵핑 ◯ •SHENZHEN MINDRAY •한국건설기술연구원,
BIO-MEDICAL 서울시립대학교, 차후 등
ELECTRONICS
•Toshiba Medical Systems
•중소기업 중심
가상현실(VR) ◯ •Sirona Dental Systems
•(주)뮤테이션, (주)부품디비,
•Verizon Patent and
(주)휴톰 등
Licensing
•Siemens Healthcare
•대기업 중심
증강현실(AR) ◯ •WORLD AWARD
ACADEMY
•LG Electronics,, SAMSUNG
MEDISON 등
•Lytro
•대기업 중심
•Hitachi
빅데이터 수집기술 ◕ •IBM
•포스코아이씨티,
한국전자통신연구원,
•포스코아이씨티
에스케이텔레콤 등
•Toshiba Medical Systems •대기업 중심
빅데이터 시각화 처리기술 ● •Toshiba •Samsung Medison, Samsung
•Samsung Medison Electronics등
229
229
전략품목 현황분석
가상현실(VR) 기술 분야 주요 출원인 동향
▪ 가상현실(VR) 기술 분야는 Toshiba Medical Systems가 가장 많은 특허를 보유하고 있으며, 그
다음으로는 Sirona Dental Systems, Verizon Patent and Licensing 등이 많은 특허를 보유
증강현실(AR) 기술 분야 주요 출원인 동향
▪ 빅데이터 시각화 처리기술 분야는 Toshiba Medical Systems가 가장 많은 특허를 보유하고 있으며
그 다음으로는 Toshiba, Samsung Medison 등이 많은 특허를 출원
230
230
데이터 3D 변환 시각화 도구
◎ 국가별 특허활동지수(AI) 비교
231
231
전략품목 현황분석
▪ 이스라엘은 시장성과 질적인 수준에서 평균 이상인 것으로 나타났으나 출원량은 높지 않은 것으로 나타남
PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
JP 548 1.096715 0.532258
IL 11 1.545455 2.75
요소기술 기술 집중도
데이터의 이미지 변환 및 정보 추출 ◓
2D-3D BIM 맵핑 ◯
가상현실(VR) ◯
증강현실(AR) ◯
빅데이터 수집기술 ◕
빅데이터 시각화 처리기술 ●
빅데이터 시각화 서버 기술 ◓
※ ●:추출건수의 30%이상, ◕: 30~20%, ◓: 20~10%, ◔: 10~5%, ◯: 5% 미만
232
232
데이터 3D 변환 시각화 도구
◎ 최신 국내 특허기술 동향
요소기술 최근 핵심기술 동향
233
233
전략품목 현황분석
▪ 향후 중소기업은 대기업들의 경쟁이 치열한 빅데이터 시각화 처리기술 보다는 시장진입이 상대적으로
용이한 증강현실(AR) 기술과 중소기업을 중심으로 연구개발되고 있는 가상현실(VR) 기술 분야에
집중하여 연구개발하고 특히 공공연구기관의 연구개발이 활발한 2D-3D BIM 맵핑 기술 분야에서 기술
매입이나 라이센싱 등을 통해 부족한 연구개발능력을 보완하는 것이 바람직할 것으로 사료됨
234
234
데이터 3D 변환 시각화 도구
4. 연구개발 네트워크
가. 연구개발 기관/자원
◎ 연구개발 기관
▪ 한국전자통신연구원
▪ 전자부품연구원
▪ 한국과학기술연구원
- 로봇미디어연구소 영상미디어연구단
▪ 동신대학교
- 실감미디어기반조성사업단
▪국민대학교
- 데이터 분석 및 설계 연구실
▪ 미래기술교육연구원
235
235
전략품목 현황분석
◎ 연구개발 자원
서울대학교(주관),
(병렬-1세부과제, 인하대학교, 숭실대학교, ▪ 2세부과제에서 개발되는 AR 스마트글래스와
AR수술) AR기반 4년, 분당서울대학교병원, 총괄과제에서 개발되는 핵심알고리즘을 기반으로,
수술용 개발툴킷 37.5억 원 연세대학교, 증강현실기반 수술응용시스템을 위한 개발툴킷 및
및 응용개발 ㈜에스디옵틱스, 응용시스템을 개발
㈜다울이엔에스
(병렬-2세부과제,
AR디바이스)
가상·증강현실 4년, ㈜엘비전테크(주관), ▪ 디바이스 원천과제의 연구결과를 활용하여 환자의
핵심 부품/모듈을 적용한 AR 20억 원 ㈜세솔, 한국광기술원 처치(수술, 진단 등)를 위한 스마트글래스를 개발
수술지원
스마트글래스 개발
나. 연구개발 인력
▪ 전자부품연구원
▪ 한국정보통신연구원
▪ 동신대학교
▪ 국민대학교
▪ 한국과학기술연구원
236
236
데이터 3D 변환 시각화 도구
5. 기술개발로드맵
가. SWOT 분석
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•(환경) 거대자본의 대기업 중심의 산업 생태계 조성으로
•(환경) 빅데이터 관련 우수한 전방, 후방 인프라 구축
인한 산업 내 약한 중소기업의 입지
•(기술) 데이터 3D 변환에 활용 가능한 글로벌 수준의
•(기술) 세계 선두 기업에 비하여 핵심 원천기술 미흡
ICT 및 IoT 경쟁력
•(정책) 산업계 연계성이 낮은 법과 세계 트렌드에 뒤쳐진
•(정책) 중앙정부의 해당 산업 지원 정책 수립
제도적 지원
기회(Opportunity) 위협(Threat)
•(환경) 시각 데이터 활용 기반의 교육 및 의료 시장의
확대에 따라 기대되는 수요 증가 •(기술) 글로벌 업체와의 기술격차 심화
•(기술) 기반기술 연구·개발로 누적된 기술 데이터 활용 가능 •(정책) 빅데이터 활용에 따른 보안 문제 대두
•(정책) 정부와 업계의 높은 니즈에 따라 높은 발전가능성
중소기업의 시장대응전략
➜ 빅데이터와 AR/VR 기술을 기반으로 건축, 의료, 교육, 제조, 조선 등에 적용한 제품 개발로
시장대응
나. 중소기업 핵심요소기술
237
237
전략품목 현황분석
(2) 요소기술
산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처 로드맵, 중소기업 기술수요를 바탕으로
로드맵 기획을 위하여 요소기술 도출
요소기술 출처
238
238
데이터 3D 변환 시각화 도구
(3) 핵심요소기술 도출
분류 핵심요소기술 설명
AR/VR 기술
컴퓨터로 만든 가상공간 내에서 사용자의 시각·청각·촉각 등
감각정보를 확장·공유함으로써 공간적, 물리적 제약에 의해
증강현실(AR)
현실세계에서 실질적으로 경험하지 못하는 상황을 실감적으로
체험할 수 있게 하는 총체적 기술
239
239
전략품목 현황분석
다. 기술개발전략
(1) 우리의 현황
240
240
데이터 3D 변환 시각화 도구
(2) 기술개발로드맵
241
241
※ 참고 : 핵심요소기술 평가결과
지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
데이터의 이미지 변환 및
정보 추출 8.4 7.6 7.8 8.6 32.4 선정
242
전략품목 현황분석
감성정보 분석 서비스
243
244
감성정보 분석 서비스
정의 및 범위
정부지원 정책
▪ 국가 빅데이터 지원체계 확립(공공·민간 빅데이터 전문센터 구축 등), 핵심 네트워크 인프라 구축(5G 세계최초
상용화), 핵심인력 양성(~‘22, 4.6만명)
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•세계수준의 ICT 인프라, 역량, 제조 경쟁력 보유 •대기업 중심의 기업 생태계로 중소·벤처 활성화를 통한
산업의 다양성과 기술력·성장역량 확보 부진
•정부의 혁신형 중소기업 육성, 신기술·신산업 창출 지원
- 간접지원(세액공제 등)을 확대하고 바우처 등 중소기업의 •우수 기술인력의 중소기업 기피로 산업 활력 저하 우려
시장경쟁력을 높여주는 R&D지원 확대 •기술수준·교육시스템 등 4차 산업혁명 적응도 평가, 세계
- ‘22년까지 중소기업 전용 R&D ’17년 대비 2배 확대 추진 25위에 불과(UBS, ‘16)
기회(Opportunity) 위협(Threat)
•핵심 선도사업 등에 대하여 ‘규제 샌드박스’ 본격 추진 •사업관리 중심의 연구제도, 창의·도전적 연구를 가로막는
•정부 중소·중견기업 대상 인공지능 전문기업 육성 연구관리 행정부담 개선 필요
(‘19년 총 26.25억 원, 총 7개 과제 내외)•시장의 급성장에 따라 정부의 주도권이 상실되었음에도
•혁신성장 옴부즈만을 본격 운영하여 현장의 애로사항을 불구하고 여전히 정부 주도의 추격형 전략을 지속하여
해소하고 기업의 혁신 지원을 위한 규제개선 추진 민간과 중복 문제 발생
중소기업의 시장대응전략
➜ 규제 샌드박스 제도를 활용하여 중소기업의 장점인 속도와 유연성으로 대기업보다 빠르게 시장 선점
➜ 산학연 및 대-중견-중소기업 협력에 기반해 자체적으로 진행하기 어려웠던 R&D 진행
➜ 정부 R&D사업과 현장실습 프로그램 연계로 부족한 인력 확충하여 경쟁력 제고
전략품목 현황 분석
1. 개요
가. 정의 및 필요성
감성 분석은 통상 3단계로 구성
▪ 첫 번째는 각종 소셜 미디어 매체에서 정보를 수집하는 ‘데이터 수집(data collection)’ 단계
▪ 두 번째는 이렇게 총체적으로 수집된 정보에서 사용자의 주관이 드러난 부분만을 걸러 내는 ‘주관성
탐지(subjectivity detection)’ 과정
246
246
감성정보 분석 서비스
나. 범위
(1) 제품 분류 관점
[ 감성분석 종류별 기술 ]
감성분석 분류 세부기술
247
247
전략품목 현황 분석
(2) 공급망 관점
감성정보 분석 서비스는 교육, 의료, 자동차, 안전, 게임, 건강, 면접 등과 인간과 밀접한
분야의 대부분에 적용되어 사용 가능
공급망 관점 세부기술
▪ 얼굴 감정, 표정, 긍정·부정 표정, 졸음 분석 등과 음성을 통한 자극적인 표현을 종합하여
운전자의 감정 상태와 졸음상태를 파악하여 안전한 주행을 도와줌.
자동차
▪ 한층 더 나아가 운전자의 감정상태와 졸음상태를 위험수준에서 안전수준으로 만들기 위해
자체적으로 음향, 조명, 온도 등을 설정
248
248
감성정보 분석 서비스
2. 외부환경 분석
가. 산업환경 분석
(1) 산업의 특징
[ 감성정보 분석 서비스 예상 시장 규모 ]
249
249
전략품목 현황 분석
소규모 창업자뿐만 아니라 대기업도 10년 이상 감성 AI에 투자해 왔으며 컴퓨터 비전이나
음성 분석을 통해 인간의 감정을 인식
▪ 글로벌 리더 그룹들은 시장 조사, 제품 또는 TV 광고에 대한 응답으로 인간의 감정을 분석하고
캡쳐하는 데 초점을 두기 시작. 상업용 배포는 개인 보조 장치(VPA), 자동차, 콜센터, 로봇 및
스마트 장치에서 서서히 출현 중
250
250
감성정보 분석 서비스
(2) 산업의 구조
전방산업은 의료, 교육, 헬스케어, 자동차, 콜센터, 마케팅, 게임, 신뢰도 등의 분야에서
소프트웨어 및 서비스 부문으로 성장
▪ 의료 부문은 음성분석을 통한 조울증 치료, 자폐증과 같이 표정으로 감정이 드러나지 않는 질환에서
음성정보를 통하여 환자 내면상태 파악
▪ 자동차 부문은 자동차 안전과 밀접한 관련. 운전석 카메라와 마이크를 사용하여 얼굴과 음성을
분석하여 졸음운전 방지 및 운전자의 감정을 완화시켜주는 조명, 음향, 온도를 조절
▪ 시장조사 부문은 기존 방식보다 시간, 비용적인 측면들이 매우 효율적으로 변함. 대규모, 실시간
텍스트로부터 감성 분석이 가능하기 때문에 기업 정책에 대한 대중들의 불만과 인식을 이해하고
선제적으로 대응이 가능
▪ 신뢰도 부문은 기업 면접이나, 사건에 대한 진술이 필요한 상황에서 표정, 음성, 생체신호의 변화를
측정하여 발화자의 내용에 대한 신뢰도를 더 자세하게 평가 가능
▪ 각각 후방산업의 개별적인 분야의 기술 즉, 텍스트, 음성, 이미지, 생체신호 분석기술이 더 발전되고 정교한
분석이 가능해지고 상호 간의 보완이 더 잘됨의 따라 전방산업의 발전이 비약적으로 될 것이라 예상
251
251
전략품목 현황 분석
나. 시장환경 분석
(1) 세계시장
기존의 ICT 산업에 감성 기술이 적용되어 새로이 발생하는 산업인 감성 ICT 산업의 세계
시장 규모는 ‘17년 1조 2,078억 달러 규모에서 연평균 9.9% 성장하여 ’22년에는 1조
9,324억 달러 규모로 확장될 것으로 예측
기존에 ICT 산업에 포함되지 않았던 분야에 감성 기술이 융합되어 새로이 탄생하는 산업으로
정의되는 감성 ICT 융합 산업 세계 시장은 ‘17년 1조 732억 달러 규모에서 연평균 9.2%
성장하여 ’22년에는 1조 6,695억 달러 규모에 이를 전망
[ 세계 감성 ICT 시장 ]
(단위: 억 달러, %)
252
252
감성정보 분석 서비스
(2) 국내시장
기존의 ICT 산업에 감성 기술이 적용되어 새로이 발생하는 산업인 감성 ICT 산업의 국내
시장 규모는 ‘17년 29 조 원 규모에서 연평균 10.0% 성장하여 ’22년에는 46.8 조 원
규모로 확장될 것으로 예측
기존에 ICT 산업에 포함되지 않았던 분야에 감성 기술이 융합되어 새로이 탄생하는 산업으로
정의되는 감성 ICT 융합 국내 산업은 ‘17년 29.5조 원 규모에서 연평균 8.8% 성장하여
’22년에는 44.9 조 원에 이를 전망
[ 국내 감성 ICT 시장 ]
(단위: 조 원, %)
253
253
전략품목 현황 분석
3. 기술 분석
가. 기술개발 이슈
[ 멀티모달 딥러닝 융합 방식 예시 ]
▪ 교육용 소프트웨어 프로토 타입은 아이들의 감정에 적응하도록 개발. 예를 들면 어린이가 과제가
너무 어렵거나 너무 간단해서 좌절을 보일 때, 프로그램이 과제의 난이도를 조절하는 형식
▪ 비디오 게임은 컴퓨터 비전을 사용하여 게임 콘솔/비디오 게임은 얼굴 표정을 통해 감정을 감지하고 적응
254
254
감성정보 분석 서비스
▪ 자동차 안전은 컴퓨터 비전 기술을 사용하여 운전자의 감정 상태를 모니터링. 극도의 정서적 불안정
상태 또는 졸음 상태를 파악하여 운전자에게 경고할 수 있음
▪ 콜센터 지능형 라우팅은 분노한 고객을 처음부터 감지할 수 있으며, 대화가 어떻게 진행되고
조정되는지 실시간으로 모니터링이 가능하여 이에 대한 내용들을 상담원에게 전달할 수 있음
▪ 현재의 정보추출 기술은 의미손실이 크며, 구문분석 수준의 문법으로는 의미처리에 한계가 명확하기
때문에 의미분석 기술이 필요
255
255
전략품목 현황 분석
(2) 기술환경 분석
인공지능 전문기업 육성
▪ 국내 기업들의 인공지능 활용 제품·서비스 연구개발 과제 자원을 통해 다양한 분야 인공지능
전문기업 육성
인공지능 정책 동향
▪ 주요국 인공 지능 정책 내용을 AI 기술기반 확보, AI 인력양성, AI 인프라 조성, AI 시장 확대
등으로 분류 가능
256
256
감성정보 분석 서비스
▪ 빅데이터센터(100개), 플랫폼(10개) 대거 구축 계획
257
257
전략품목 현황 분석
(3) 기술개발 이슈
▪ Rule-based 기법에 의한 기술들은 수많은 생체신호를 분석하고 감성을 표현하는 감성특성을 추출한
후, 감성별로 Rule에 해당하는 조건을 설정하고 이를 통해 감성을 분류
258
258
감성정보 분석 서비스
나. 주요기업 동향
◎ 해외 업체 동향
Affectiva社는 Affectiva Automotive AI, Affdex for Market Research, Emotion SDK
등의 서비스를 제공 중
- Mars, Kellogg’s and CBS와 같은 1,400 개의 브랜드를 포함하여 Millward Brown, LRW,
Added Value and Unruly와 같은 주요 시장 조사 회사와 Fortune Global 100의 1/3은 시장
조사를 위해 Affdex를 사용하여 콘텐츠 및 미디어 지출을 최적화 중
- 75개국에서 분석된 2만4천 개의 광고와 5백만 개 이상의 얼굴을 가진 세계 최대 감정
데이터베이스를 사용하여 제작
259
259
전략품목 현황 분석
▪ 얼굴 정보를 처리하는 기능은 보안, 자연스러운 사용자 인터페이스, 이미지 콘텐츠 분석 및 관리,
모바일 앱, 로봇과 같은 다양한 소프트웨어 시나리오에서 중요하게 활용
Softkinetic社는 벨기에 스타트업 회사로 3차원 카메라를 이용해 사람의 몸짓을 분석한 후
감정을 파악하는 기술을 개발
260
260
감성정보 분석 서비스
◎ 해외 업체
261
261
전략품목 현황 분석
◎ 국내 업체 동향
▪ 온라인 문서와 SNS, 일반 문서 등 다양한 비정형 빅데이터를 분석 대상으로 하며, 긍/부정 분석에도 탁월한 성능
▪ 감성분석용 언어처리(형태소 분석, 자연어처리, 적합문서 필터링, 개체명 인식, 표현어 추출)
아크릴社 Jonathan Brain은 텍스트, 이미지, 음성을 통해 사람의 감성을 이해하고 공감하는
딥러닝 기술을 제공하는 지능형 프레임워크로 자연어처리 기술을 기반으로 텍스트가 내포한 단어,
감성, 주제, 사람, TPO 등 다양한 의미를 추출하고 고도화된 딥러닝 알고리즘 서비스j 제공
▪ 로봇에 멀티모달 감성 인식 기술 적용
262
262
감성정보 분석 서비스
[ 넷마이너 3D 네트워크 맵 ]
263
263
전략품목 현황 분석
다. 특허 동향
주요 기술
▪ 감성정보 분석 서비스 기술 분야는 축적된 인간의 감정 관련 빅데이터를 바탕으로 이용자의 감성
패턴을 분석, 이용자의 감성에 맞는 음악, 서비스 또는 현재 상태에서 필요한 정보를 추천·제공하는
서비스 등이 포함
요소기술 코드 설명
264
264
감성정보 분석 서비스
◎ 세부 분야별 특허동향
요소기술 한국 미국 일본 유럽 기타 계
동작(제스처)인식을 통한 분석 기술 89 51 16 18 19 193
음성에서의 감성 인식 기술 48 31 10 7 9 105
265
265
전략품목 현황 분석
266
266
감성정보 분석 서비스
주요 기술별 출원인 동향
기술
요소기술 주요출원인 국내 특허동향
집중도
•PHILIPS •공공연구기관 중심
이미지(얼굴 및 표정)에서의
◓ •한국전자통신연구원 •한국전자통신연구원, 건국대학교,
분석 기술
•ZAdvanced Computing 스마트올웨이즈온 등
•한국전자통신연구원 •공공연구기관 중심
동작(제스처)인식을 통한
◓ •ZAdvanced Computing •한국전자통신연구원, (주)다울,
분석 기술
•PHILIPS 건국대학교 등
•ZAdvanced Computing •중소기업 중심
음성에서의 감성 인식 기술 ◔ •Kawasaki Jukogy •스마트올웨이즈온, 한양대학교,
•스마트올웨이즈온 중앙환경기업 등
•PHILIPS •중소기업 중심
감성신호 측정을 통한 분석
◓ •(주)바인테크 •(주)바인테크, 한국전자통신연구원,
기술
•한국전자통신연구원 (주)다울 등
•한국전자통신연구원 •공공연구기관 중심
언어분석 기반의
◕ •IBM •한국전자통신연구원, (주)바인테크,
소셜미디어 분석 기술
•Tata Consultancy (주)다울 등
•ZAdvanced Computing
언어분석 기반의 개인성향 •중소기업 중심
◔ •Hartford Fire
분석 기술 •(유)중앙환경기업, (주)모노시스 등
•IBM
•한국전자통신연구원 •공공연구기관 중심
감성응용서비스기술 ◓ •Hartford Fire •한국전자통신연구원,
•Tata Consultancy (주)시엠아이코리아, 건국대학교 등
267
267
전략품목 현황 분석
동작(제스처)인식을 통한 분석 기술 분야 주요 출원인 동향
음성에서의 감성 인식 기술 분야 주요 출원인 동향
감성응용서비스 기술 분야 주요 출원인 동향
268
268
감성정보 분석 서비스
◎ 국가별 특허활동지수(AI) 비교
269
269
전략품목 현황 분석
▪ 한국은 출원량은 많지만 시장력 면에선 미국에 뒤지며 질적 수준도 낮은 것으로 나타남
PFS CPP
국가 특허수
(Σ패밀리수/Σ특허수) (Σ피인용수/Σ특허수)
JP 133 1.195489 0
DE 53 1.283019 0.384615
CN 37 2.621622 7.5
요소기술 기술 집중도
이미지(얼굴 및 표정)에서의 분석 기술 ◓
동작(제스처)인식을 통한 분석 기술 ◓
음성에서의 감성 인식 기술 ◔
감성신호 측정을 통한 분석 기술 ◓
감성응용서비스기술 ◓
270
270
감성정보 분석 서비스
◎ 최신 국내 특허기술 동향
요소기술 최근 핵심기술 동향
▪ 감성신호 측정을 통한 분석 기술 분야는 단말기를 이용한 맞춤형 테라피 시스템, 이어폰을 이용한
필터링된 외부 소리 전달 서비스 제공 방법 등이 연구개발되고 있음
271
271
전략품목 현황 분석
272
272
감성정보 분석 서비스
4. 연구개발 네트워크
가. 연구개발 기관/자원
◎ 연구개발 기관/자원
다음소프트
▪ 키워드 감성 조회 할 수 있는 Contextual Finder 서비스
솔트룩스
▪ 개인 맞춤형 AI ‘에바(EVA)’ 7월 출시 예정
아크릴
현대기아자동차
네우로데이터 랩
▪ ‘프로모 봇’과 제휴해 사람 기분 파악하는 로봇 시연, 해당 로봇은 음성언어, 행동, 표정, 눈 움직임,
심장박동, 호흡 등을 분석해 사람 기분을 파악
쿨디
마인즈랩
273
273
전략품목 현황 분석
나. 연구개발 인력
기관 부서 대표전화번호
다. 기술이전가능 기술
요소기술 기관
생체신호 수집 및 분석 기술 한국전자통신연구원
얼굴 정보 인식 기술 한국전자통신연구원
274
274
감성정보 분석 서비스
5. 기술개발로드맵
가. SWOT 분석
중소기업 시장대응전략
강점(Strength) 약점(Weakness)
•세계수준의 ICT 인프라, 역량, 제조 경쟁력 보유 •대기업 중심의 기업 생태계로 중소·벤처 활성화를 통한
•정부의 혁신형 중소기업 육성, 신기술·신산업 창출 지원 산업의 다양성과 기술력·성장역량 확보 부진
- (간접지원(세액공제 등)을 확대하고 바우처 등 중소기업의 •우수 기술인력의 중소기업 기피로 산업 활력 저하 우려
시장경쟁력을 높여주는 R&D지원 확대 •기술수준·교육시스템 등 4차 산업혁명 적응도 평가, 세계
- ‘22년까지 중소기업 전용 R&D ’17년 대비 2배 확대 추진 25위에 불과(UBS, ‘16)
기회(Opportunity) 위협(Threat)
•핵심 선도사업 등에 대하여 ‘규제 샌드박스’ 본격 추진 •사업관리 중심의 연구제도, 창의·도전적 연구를 가로막는
•정부 중소·중견기업 대상 인공지능 전문기업 육성 연구관리 행정부담 개선 필요
(‘19년 총 26.25억 원, 총 7개 과제 내외) •시장의 급성장에 따라 정부의 주도권이 상실되었음에도
•혁신성장 옴부즈만을 본격 운영하여 현장의 애로사항을 불구하고 여전히 정부 주도의 추격형 전략을 지속하여
해소하고 기업의 혁신 지원을 위한 규제개선 추진 민간과 중복 문제 발생
중소기업의 시장대응전략
➜ 규제 샌드박스 제도를 활용하여 중소기업의 장점인 속도와 유연성으로 대기업보다 빠르게 시장 선점
➜ 산학연 및 대-중견-중소기업 협력에 기반해 자체적으로 진행하기 어려웠던 R&D 진행
➜ 정부 R&D사업과 현장실습 프로그램 연계로 부족한 인력 확충하여 경쟁력 제고
나. 중소기업 핵심요소기술
275
275
전략품목 현황 분석
2) 요소기술
산업·시장 분석, 기술(특허)분석, 전문가 의견, 타부처 로드맵, 중소기업 기술수요를 바탕으로
로드맵 기획을 위하여 요소기술 도출
요소기술 출처
276
276
감성정보 분석 서비스
(3) 핵심요소기술 도출
분류 핵심요소기술 설명
감성분석
감정변화에 따라 변화하는 음성의 질, 높이, 강도, 속도, 템포,
음성에서의 감성 인식 기술 억양, 악센트, 어휘 사용 등의 빅데이터를 분석함으로써 감성을
인식하는 데 활용하는 기술
277
277
전략품목 현황 분석
다. 기술개발전략
(1) 우리의 현황
278
278
감성정보 분석 서비스
(2) 기술개발로드맵
279
279
전략품목 현황 분석
※ 참고 : 핵심요소기술 평가결과
지표별 평가결과
요소기술 기술개발 기술개발 단기개발 중소기업 비고
합계
시급성 파급성 가능성 적합성
이미지
(얼굴 및 표정)에서의 8.7 8.2 8.0 8.0 32.8 선정
분석 기술
동작(제스처)인식을 통한
8.7 8.8 7.5 8.2 33.2 선정
분석 기술
음성에서의 감성 인식
8.5 8.7 6.7 7.8 31.7 선정
기술
감성신호 측정을 통한
8.0 8.3 7.0 8.2 31.5 선정
분석 기술
언어분석 기반의
7.7 8.3 7.5 8.0 31.5 선정
소셜미디어 분석 기술
280
280
감성정보 분석 서비스
※ 붙임
1. 참여위원 명단
소속 직위 성명
단국대학교 교수 나연묵
전북대학교 교수 이말례
애드잇 대표 배지은
대구가톨릭대학교 교수 이종혁
가천대학교 교수 이강윤
시엠아이코리아 대표 이상훈
위세아이텍 부장 박병훈
T3Q 대표 박병훈
281
281
2. 전략품목 선정평가 결과
전략품목 후보 지표별 평가결과
4차
중소 일자리 비고
산업
No 명칭 기술성 시장성 기업 창출 합계
혁명
적합성 효과성
대응성
빅데이터 내 데이터 품질
2 7.8 7.4 8.4 8.2 7 38.8 선정
검사 자동화 시스템
유통/물류 빅데이터 구축 및
4 7.8 8.8 8.2 8 8.2 41 선정
분석 시스템
다종/이중의 복합 Interface
6 Data 빅데이터 통합 처리 6.6 5.6 4.8 5.6 6.2 28.8
시스템
빅데이터 분석 및 시각화
8 6.6 7 7.6 8 8.2 37.4 선정
플랫폼
감성정보 분석
감성정보 수집 및 분석
9 8 7.4 6.2 7.8 6.8 36.2 서비스
플랫폼
품목명 변경
빅데이터 수집·저장·처리·관리
10 5.8 6 6 6 5.2 29
시스템
282
282
전략품목 후보 지표별 평가결과
4차
중소 일자리 비고
산업
No 명칭 기술성 시장성 기업 창출 합계
혁명
적합성 효과성
대응성
데이터 3D 변환
14 3D 시각화 도구 9 8.75 9.25 7.75 8.5 42.6 시각화 도구
품목명 변경
283
283