본문 바로가기

국내지식정보

전문가와 전문 지식전문가가 4차 산업혁명 국내 지식정보를 제공하는 코너입니다.

정보

인공지능 기반 음성인식, 사람보다 낫다

작성자 : oksug10 분류 : AI | 공통 작성일 : 2019.06.17 17:24:38 추천 : 0 조회 : 1202 키워드 : 음성인식문자,빅데이터,인공지능,비서로봇

[소개글]

(핵심주제)

음성인식기술은 앞으로 인간의 삶을 더욱 편리하게 만들어 주는 핵심적인 사용자 인터페이스로서 UI 경쟁의 룰을 따를지, 국내외 주요사업자들은 인공지능 시대에 어떻게 활용하여 기업의 미래를 준비하고 있는지, 해외 사업자 비즈니스 사례 중심으로 시사점을 도출해 보고자 한다.

-

(핵심 내용)

  1. 음성인식과 인공지능의 결합

인공지능 분야의 중요한 기술적 변화는 ‘대화형 인터페이스’(Conversational Interface)로 요즘 홈비서로 가장 인기를 끌고 있는 대화형 인공지능 비서 아마존 ‘에코’ 등 각 기업에서는 음성인식 기술을 활용하여 각자의 사업영역에서 전략적으로 활발히 움직이고 있다.

인공지능과 결합하면 개인별 사용자 경험에 최적화된 맞춤형 서비스도 가능할 것이다.

  1. 음성인식 기술 및 활용 분야

음성인식 과정은 입력받은 음성을 분석, 특징을 추출한 다음 미리 수집된 음성모델 데이터베이스(DB)와의 유사도를 측정해 가장 유사한 것을 텍스트로 혹은 명령어로 변환 하는 방식으로 작동한다. 이는 일종의 패턴 인식 과정과 흡사한데 사람마다 목소리와 발음, 억양 등이 달라 최대한 많은 사용자들로부터 음성모델 데이터베이스(DB)를 수집 해 이로부터 공통된 특성을 추출해 기준 패턴을 생성한다.

2010년에 시스템의 음성인식 정확도는 70% 안팎에 그쳤으나 2016년에는 95% 를 넘어섰고 억양, 음정, 다양한 화자의 특성, 원거리, 배경 소음 등 방해 요소를 극복하고 동음이의어 구별, 새로운 단어의 학습 등으로 정확도가 높아지고 있다. 자동통역 및 번역 분야에서도 개발이 활발한데, 1960년대 1세대 텍스트 자동번역, 2세대 제한 영역 단문 자동통역, 3세대 실시간 동시통역으로 발전되고 있다. 콜센터 분야에서는 단순처리 및 정량 데이터 분석에 머물렀던 VOC를 STT(Speech to Text)와 TA(Text Analytics) 기술을 통해 고객의 소리를 분석, 고객 니즈를 파악하고 대응함으로 성과를 향상시키며, 나아가 인공지능 상담원이 보조 역할을 하며 향후에는 무인 상담 콜센터로 발전할 전망이다.

III. 국내외 음성인식 서비스 현황

애플 ‘시리’(Siri) 타이핑 입력 또는 카메라를 이용해 텍스트 정 보를 입력하는 단순한 방법에서 음성을 인식해 곧 바로 번역해 주는 통역앱이나 번역이 앱과 연동해 개인 맞춤형 통역 서비스를 제공한다.

구글 ‘나우’(Google Now)는 특화된 카드 기능으로는 이벤트/교통/예약/관광/가족 퇴근여부 등 알림, 스포츠/날씨/ 뉴스/주식 등의 정보 전달, 걷기 등의 행동 분석, 주차 위치 자동 기억 기능, 검색한 물 건 판매처 근처에 도달했을 때 이를 알려주는 기능 등이 있다. 미국의 과학 잡지인 파 퓰러사이언스(Popular Science)는 구글 ‘나우’를 2012년 올해의 혁신기술로 선정하였다. 그 외, MS ‘코타나’(Cotana), 바이두 ‘딥스피치2(Deep speech2), 아마존 ‘알렉사’8, 자동 통역비서 ‘지니톡’(GenieTalk), Skype 실시간 번역기(Skype Translator), NTT 도코모 샤베테콘쉐루(しゃべってコンシェル)’ 외국어 통역 서비스, 알리바바 ‘RX5’, 로봇, 콜센터 음성인식, Dragon Medical 360,

  1. 시사점

대충 얘기하거나, 사투리로 말하거나, 멀리서 말하거나 그리고 아무 때나, 시끄러운 환경, 여러 명 중에서 내 목소리를 정확히 인식하고 마이크가 사람의 귀처럼 되기 위해서는 또 한 번의 획기적인 발전이 필요한 것 같다.

-

(전문가가 보는 시사점)

음성인식 기능은 4차 산업 혁명에 중요한 부분이다. 음성인식의 현황을 알고 음성인식을 사업에 적용시킬 수 있는 다양한 방안을 연구하여 사용하도록 하기 위해 이 글을 읽어 보길 바란다.

-

(보고서 작성 기관 또는 작성자에 대한 견해)

빅데이터센터는 교육 및 세미나, 수요조사, 뉴스, 자료실, 빅데이터 보고서, 뉴스, 교육 발표자료등에 관한 전문자료를 제공한다.


[보고서 목차]

  • 음성인식과 인공지능의 결합
  • 음성인식 기술 및 활용 분야
  • 국내외 음성인식 서비스 현황
  • 시사점


[초록 요약]

최근 음성인식문자 기능을 활용하여 문자를 주고받는 사용자가 많이 늘고 있다. 빅데이터 및 인공지능과 결합하여 한층 높은 음성 인식률과 지능화로 생활 곳곳에 새로운 사용자 인터페이스(User Interface)로 주목 받고 있다. 2007년 애플의 아이폰이 기계와 인간의 혁신적인 인터페이스로 ‘Touch’를 공개한 이래 이제는 기계와 자연어로 편안하게 대화하는 것이 새로운 패러다임으로 자리 잡아 가고 있다.

지난 8월 페이스북 CEO '마크 저커버그'는 영화 ‘아이언맨’(Iron Man)에 나오는 인공지능 비서 로봇 ‘자비스’(Jarvis)와 같은 인공지능 개인비서를 제작 중이며 오는 9월에 공개할 예정이라고 밝혔고, 바이두 리서치를 이끌고 있는 스탠퍼드대 ‘앤드류 응’(Andrew Ng) 교수도 음성인식 기술이 앞으로 웨어러블 디바이스는 물론 자동차와 전자기기 등 사물인터넷 시장 자체를 바꾸어 놓을 것이라고 말했다.

음성인식기술은 앞으로 인간의 삶을 더욱 편리하게 만들어 주는 핵심적인 사용자 인터페이스로서 ‘사용자의 게으름을 더 많이 지원하는 쪽이 이긴다’는 UI 경쟁의 룰을 따를지, 국내외 주요사업자들은 인공지능 시대에 어떻게 활용하여 기업의 미래를 준비하고 있는지, 해외 사업자 비즈니스 사례 중심으로 시사점을 도출해 보고자 한다.


[관련 지식]

인공지능 기반 음성인식 서비스, 누가 누가 잘하나

https://www.boannews.com/media/view.asp?idx=52910

에이아이더, AI 음성복제 솔루션 ‘와이즈클로닝 봇’ 출시

http://www.inews24.com/view/1175117


[관련 동영상]

음성인식 / 자동 자막제작 프로그램 - 브루 Vrew

https://www.youtube.com/watch?v=rXDg2XGJkls

음성인식 - 음성언어분야 AI 기술/산업 현황 및 구현기술의 이해 | T아카데미

https://www.youtube.com/watch?v=XhjPqGKF9Zs


[서지사항]

digico https://www.digieco.co.kr/KTFront/index.action


[원문보기]

https://www.digieco.co.kr/KTFront/report/report_issue_trend_view.action?board_id=issue_trend&board_seq=11167


#음성인식문자 #빅데이터 #인공지능 #비서로봇