SlideShare a Scribd company logo
5
Most read
11
Most read
15
Most read
Project Proposal
Team: Argo
B411051 김종욱
B471008 김지현
Sign language recognition translator
Sign language recognition translator
프로젝트 제목 : A Real-time Sign language recognition translator (실시간 수화 인식 번역기)
프로젝트 목적 : Gesture recognition과 신경망 모델(CNN, RNN) 활용
è 청각 장애인들의 의사소통을 돕는 AI 앱 / 소프트웨어 개발
Sign Language Recognition translator
개발 내용 및 방법
개발 내용
• 스마트폰의 카메라를 이용하여 수화 동작 인식
• 모바일 디바이스에서 추론이 가능하도록 머신 러닝 모델을 사용한 지능형 앱 구현
• 인식한 동작에 대한 결과를 텍스트로 화면에 출력
개발 환경
- iOS / MacOS(MacBook Pro 13 inch, 2018 과 MacBook Pro Retina 13 inch, Early 2015)
언어: C++ , Swift, Python
Development details and methods
- 개발 방법
신경망 모델 + OpenCV + Mediapipe + Core ML 활용
• 신경망 모델 training / test data 제작
• Hand detection을 위해 Google ML framework (Mediapipe) 사용
• CNN/RNN을 이용한 신경망 모델 제작
• Web Server를 만든 이후 학습이 완료된 신경망 모델을 Web Server에 구축함
• Apple ML framework (CoreML)을 사용하여 모바일 디바이스에 학습이 완료된 신경망 모델을 구축함
• 수화 인식률을 높이기 위한 다양한 테스트 시행
Development details and methods
Difficulties
Sign Language Recognition translator
예상되는 결과물
Gesture to Text or Audio
“
Simple UX/UI
동작을 인식할 구간을 카메라 버튼으로 지정
인식한 결과를 텍스트나 오디오로 출력
1. Take a video of
sign language
2. Train a machine
learning model
3. Recognize gestures and
display text on app
What time is it?
Project model flow
이 름 역할
김종욱
• 딥러닝 모델 분석 및 수정(영상데이터에서 단어 추출)
• 머신 러닝 모델 앱 통합 (CoreML 활용)
• 데이터 전처리(Hand detection API에서 들어오는 데이터를 처리하는 방법 구현)
• 웹 서버 구축
• 학습/테스트용 데이터 만들기
김지현
• iOS 앱 개발(UX/UI)
• 머신 러닝 모델 앱 통합 (CoreML 활용)
• Hand detection API수정(OpenAPI를 프로젝트의 방향에 알맞게 수정하는 작업이 필요)
• 문장 생성 언어 모델 분석 및 수정(추출된 단어를 이용하여 문장을 생성)
• 학습/테스트용 데이터 만들기
팀원 별 업무 분담 및 일정
Sign Language Recognition translator
현재까지 개발한 내용
현재까지 개발한 내용
1. 기존의 RNN과 CNN을 이용한 수화 인식 신경망 모델을 활용하여 (github 소스코드 참고)
수화 단어(아르헨티나) 12개를 학습시키고 결과값 도출
기존 모델 정확도 87.3%
è 기존의 수화 인식 신경망 모델 수정 / 개선이 필요
자체 제작한 데이터셋으로 학습 / 평가가 필요
현재까지 개발한 내용
2. Google의 hand tracking 오픈소스를 활용하여 손 인식 수행
아이폰에서 hand tracking 테스트
è 나오는 손의 좌표 값들의 사용 방법 연구 필요
Reference
• 수화 인식 신경망 모델 코드
https://github.com/hthuwal/sign-language-gesture-recognition
• Google AI에서 공개한 hand tracking 코드
https://github.com/google/mediapipe/blob/master/mediapipe/docs/hand_tracking_mobile_gpu.md
Thank You

More Related Content

PDF
디지털 트윈 플랫폼 기술과 사례(LX공사 특강)
SANGHEE SHIN
 
PDF
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
BOAZ Bigdata
 
PDF
Ndc2010 김주복, v3. 마비노기2아키텍처리뷰
Jubok Kim
 
PDF
공간정보 최근 동향과 디지털트윈, 메타버스
SANGHEE SHIN
 
PDF
디지털트윈 기술 및 스마트시티 적용 사례
SANGHEE SHIN
 
PPT
Building an Agile framework that fits your organisation
Kurt Solarte
 
PPTX
UiPath Test Suite
Cristina Vidu
 
PPTX
Autonomous driving system (ads)
Justin Jacob
 
디지털 트윈 플랫폼 기술과 사례(LX공사 특강)
SANGHEE SHIN
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Hands-on 팀] : 수어 번역을 통한 위험 상황 속 의사소통 시스템 구축
BOAZ Bigdata
 
Ndc2010 김주복, v3. 마비노기2아키텍처리뷰
Jubok Kim
 
공간정보 최근 동향과 디지털트윈, 메타버스
SANGHEE SHIN
 
디지털트윈 기술 및 스마트시티 적용 사례
SANGHEE SHIN
 
Building an Agile framework that fits your organisation
Kurt Solarte
 
UiPath Test Suite
Cristina Vidu
 
Autonomous driving system (ads)
Justin Jacob
 

What's hot (20)

PPTX
NDC2012_마비노기 영웅전 카이 포스트모템_시선을 사로잡는 캐릭터 카이 그 시도와 성공의 구현 일지
영준 박
 
PDF
End-to-end dialogue systems, or a feature which wasn’t meant to happen | Rasa...
Rasa Technologies
 
PPTX
NDC 2011 영웅전 런칭팀 박영준
영준 박
 
PDF
디지털트윈, 스마트시티, 메타버스
SANGHEE SHIN
 
PDF
고대특강 게임 프로그래머의 소양
Jubok Kim
 
PPTX
AI & Robotic Process Automation (RPA) to Digitally Transform Your Environment
Cprime
 
PDF
디지털 트윈(Digital Twin) - 도시와 공간정보 관점에서
SANGHEE SHIN
 
PDF
게임제작개론 : #6 게임 시스템 구조에 대한 이해
Seungmo Koo
 
PDF
NDC2012 - 완벽한 MMO 클라이언트 설계에의 도전, Part2
Jubok Kim
 
PPTX
Self Driving Autopilot Car
Vaibhav Koli
 
PDF
Testing strategy for RPA implementation
ARJUN S MEDA
 
PPT
모바일 게임 최적화
tartist
 
PPTX
Humanoid robots
Tdjaqajgtpd
 
PPTX
정보공학(IE) 방법론.pptx
Seong-Bok Lee
 
PDF
swig를 이용한 C++ 랩핑
NAVER D2
 
PPTX
presentation on robotic technology
Ashar Gill
 
PPTX
실리콘 밸리 데이터 사이언티스트의 하루
Jaimie Kwon (권재명)
 
PPTX
Intelligent parking assist system
SARATH PRAKASH
 
PPT
Robot operating systems (ros) overview & (1)
Piyush Chand
 
PPTX
Script less automation
Mukund Wangikar
 
NDC2012_마비노기 영웅전 카이 포스트모템_시선을 사로잡는 캐릭터 카이 그 시도와 성공의 구현 일지
영준 박
 
End-to-end dialogue systems, or a feature which wasn’t meant to happen | Rasa...
Rasa Technologies
 
NDC 2011 영웅전 런칭팀 박영준
영준 박
 
디지털트윈, 스마트시티, 메타버스
SANGHEE SHIN
 
고대특강 게임 프로그래머의 소양
Jubok Kim
 
AI & Robotic Process Automation (RPA) to Digitally Transform Your Environment
Cprime
 
디지털 트윈(Digital Twin) - 도시와 공간정보 관점에서
SANGHEE SHIN
 
게임제작개론 : #6 게임 시스템 구조에 대한 이해
Seungmo Koo
 
NDC2012 - 완벽한 MMO 클라이언트 설계에의 도전, Part2
Jubok Kim
 
Self Driving Autopilot Car
Vaibhav Koli
 
Testing strategy for RPA implementation
ARJUN S MEDA
 
모바일 게임 최적화
tartist
 
Humanoid robots
Tdjaqajgtpd
 
정보공학(IE) 방법론.pptx
Seong-Bok Lee
 
swig를 이용한 C++ 랩핑
NAVER D2
 
presentation on robotic technology
Ashar Gill
 
실리콘 밸리 데이터 사이언티스트의 하루
Jaimie Kwon (권재명)
 
Intelligent parking assist system
SARATH PRAKASH
 
Robot operating systems (ros) overview & (1)
Piyush Chand
 
Script less automation
Mukund Wangikar
 
Ad

Similar to 수화 인식 자동 번역 iOS 앱 프로젝트 제안서 (8)

PPTX
Introduction of NUGO's vision and business model
NickPark19
 
PDF
Sharing development experience of educational apps for the hard of hearing (P...
Youngki Moon
 
PDF
구글의 머신러닝 비전: TPU부터 모바일까지 (Google I/O Extended Seoul 2017)
Jeongkyu Shin
 
PDF
Nnstreamer stream pipeline for arbitrary neural networks
NAVER Engineering
 
PDF
Chapter 12 applications - 1
KyeongUkJang
 
PDF
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
Hye-rim Jang
 
PDF
Sequence to Sequence Learning with Neural Networks
Hoon Heo
 
PPTX
Ready~ Action! on Google
Lee WonJae
 
Introduction of NUGO's vision and business model
NickPark19
 
Sharing development experience of educational apps for the hard of hearing (P...
Youngki Moon
 
구글의 머신러닝 비전: TPU부터 모바일까지 (Google I/O Extended Seoul 2017)
Jeongkyu Shin
 
Nnstreamer stream pipeline for arbitrary neural networks
NAVER Engineering
 
Chapter 12 applications - 1
KyeongUkJang
 
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
Hye-rim Jang
 
Sequence to Sequence Learning with Neural Networks
Hoon Heo
 
Ready~ Action! on Google
Lee WonJae
 
Ad

More from Anna Kim (6)

PDF
Rdma 1
Anna Kim
 
PPTX
Eccploit solution
Anna Kim
 
PDF
iOS App development for sign language recognition
Anna Kim
 
PDF
챗봇(Chatbot) 서비스 구축하기 | 개발 예시
Anna Kim
 
PDF
HS애드 숨고 IMC전략 제안서
Anna Kim
 
PDF
경제성장률과 GDP 갭 관계
Anna Kim
 
Rdma 1
Anna Kim
 
Eccploit solution
Anna Kim
 
iOS App development for sign language recognition
Anna Kim
 
챗봇(Chatbot) 서비스 구축하기 | 개발 예시
Anna Kim
 
HS애드 숨고 IMC전략 제안서
Anna Kim
 
경제성장률과 GDP 갭 관계
Anna Kim
 

수화 인식 자동 번역 iOS 앱 프로젝트 제안서

  • 1. Project Proposal Team: Argo B411051 김종욱 B471008 김지현 Sign language recognition translator
  • 2. Sign language recognition translator 프로젝트 제목 : A Real-time Sign language recognition translator (실시간 수화 인식 번역기) 프로젝트 목적 : Gesture recognition과 신경망 모델(CNN, RNN) 활용 è 청각 장애인들의 의사소통을 돕는 AI 앱 / 소프트웨어 개발
  • 3. Sign Language Recognition translator 개발 내용 및 방법
  • 4. 개발 내용 • 스마트폰의 카메라를 이용하여 수화 동작 인식 • 모바일 디바이스에서 추론이 가능하도록 머신 러닝 모델을 사용한 지능형 앱 구현 • 인식한 동작에 대한 결과를 텍스트로 화면에 출력 개발 환경 - iOS / MacOS(MacBook Pro 13 inch, 2018 과 MacBook Pro Retina 13 inch, Early 2015) 언어: C++ , Swift, Python Development details and methods
  • 5. - 개발 방법 신경망 모델 + OpenCV + Mediapipe + Core ML 활용 • 신경망 모델 training / test data 제작 • Hand detection을 위해 Google ML framework (Mediapipe) 사용 • CNN/RNN을 이용한 신경망 모델 제작 • Web Server를 만든 이후 학습이 완료된 신경망 모델을 Web Server에 구축함 • Apple ML framework (CoreML)을 사용하여 모바일 디바이스에 학습이 완료된 신경망 모델을 구축함 • 수화 인식률을 높이기 위한 다양한 테스트 시행 Development details and methods
  • 7. Sign Language Recognition translator 예상되는 결과물
  • 8. Gesture to Text or Audio “ Simple UX/UI 동작을 인식할 구간을 카메라 버튼으로 지정 인식한 결과를 텍스트나 오디오로 출력
  • 9. 1. Take a video of sign language 2. Train a machine learning model 3. Recognize gestures and display text on app What time is it? Project model flow
  • 10. 이 름 역할 김종욱 • 딥러닝 모델 분석 및 수정(영상데이터에서 단어 추출) • 머신 러닝 모델 앱 통합 (CoreML 활용) • 데이터 전처리(Hand detection API에서 들어오는 데이터를 처리하는 방법 구현) • 웹 서버 구축 • 학습/테스트용 데이터 만들기 김지현 • iOS 앱 개발(UX/UI) • 머신 러닝 모델 앱 통합 (CoreML 활용) • Hand detection API수정(OpenAPI를 프로젝트의 방향에 알맞게 수정하는 작업이 필요) • 문장 생성 언어 모델 분석 및 수정(추출된 단어를 이용하여 문장을 생성) • 학습/테스트용 데이터 만들기 팀원 별 업무 분담 및 일정
  • 11. Sign Language Recognition translator 현재까지 개발한 내용
  • 12. 현재까지 개발한 내용 1. 기존의 RNN과 CNN을 이용한 수화 인식 신경망 모델을 활용하여 (github 소스코드 참고) 수화 단어(아르헨티나) 12개를 학습시키고 결과값 도출 기존 모델 정확도 87.3% è 기존의 수화 인식 신경망 모델 수정 / 개선이 필요 자체 제작한 데이터셋으로 학습 / 평가가 필요
  • 13. 현재까지 개발한 내용 2. Google의 hand tracking 오픈소스를 활용하여 손 인식 수행 아이폰에서 hand tracking 테스트 è 나오는 손의 좌표 값들의 사용 방법 연구 필요
  • 14. Reference • 수화 인식 신경망 모델 코드 https://github.com/hthuwal/sign-language-gesture-recognition • Google AI에서 공개한 hand tracking 코드 https://github.com/google/mediapipe/blob/master/mediapipe/docs/hand_tracking_mobile_gpu.md