4차 산업혁명의 빅데이터 기술
작성자 : nhk2050 분류 : 연구개발 | IT 작성일 : 2018.02.21 15:23:30 조회 : 735 키워드 : 4차산업혁명,빅데이터,정형데이터,비정형데이터,반정형데이터
(질문배경)
빅데이터란, 이름의 뜻 그대로 기존 방식으로 저장·관리·분석하기 어려울 정도로 큰 규모의 데이터를 의미한다. 빅데이터의 크기를 보기 위해서는 데이터의 크기를 표시하는 단위로 짐작할 수 있다. 1024TB(테라바이트)는 1PB(페타바이트)가 된다. 일반적으로 빅데이터란 현재 페타바이트 단위를 의미한다. 그렇다면, 기존에도 인터넷의 발전과 함께 많은 큰 데이터들이 존재하였는데 왜 새로운 빅데이터란 이름이 나오게 된 것일까?
그림1. 빅데이터기술을 이용한 쿠팡기업의 매출상승효과(단위: 억달러)
(빅데이터의 효과)
빅테이터 분석기업의 서비스인 ‘로켓 배송’은 주문 정보가 주문을 한 소비자의 지역에 있는 ‘캠프’라고 불리는 물류센터로 간다. 그렇게 되면 주문 정보를 받은 ‘캠프’에서는 미리 포장을 완료한 상품을 즉시 배송을 하여 불과 2~3시간 만에 소비자에게 물건이 배달된다. ‘캠프’에서 미리 포장 완료된 상품을 준비할 수 있었던 이유가 바로 빅데이터 분석을 활용하였기 때문이다. ‘로켓 배송’에서는 각 지역별로 주문했던 지난 내역들을 빅데이터 분석을 통해 주문이 들어올 상품들을 미리 포장을 완료하여 ‘캠프’라는 물류창고에 보관하고 있었기 때문에 빠른 시간 안에 주문부터 배송까지 완료를 할 수 있었던 것이다. 빅데이터 분석을 통한 주문상품 예측으로 빠른 배송이 완료되어, 소비자들의 기업에 대한 만족도가 ‘로켓 배송’을 안 하는 다른 업체에 비해 월등하게 높게 나타났다. 빅데이터 분석을 통한 주문물량 예측이 완벽하게 맞는 것이 아니기 때문에, 재고에 대한 기업 손해는 엄청나다. 결론적으로, 빅데이터 분석을 통한 주문 예측으로 ‘로켓 배송’에 성공하여 1조원의 투자를 받아 크게 성공했다.
그림2. 서울심야버스의 빅데이터 이용 노선도
(심야버스 노선도 및 은행 신용평가)
2013년 개통한 서울시 심야버스의 노선도는 직관적으로 만들어진 것이 아니라 빅데이터를 통한 철저한 분석에 의해 도출된 것이다. 심야시간대의 통화량 등을 이용하여 서울시 각 지역의 유동인구 밀집도를 수집하고 이를 분석한다. 그리고 결과에 따른 최적의 노선을 도출한다. 이렇게 도출된 노선을 기준으로 다시 한 번 유동인구 빅데이터를 이용하여 배차 간격을 조절한다. 이러한 과정을 거쳐 탄생한 심야버스는 하루 평균 1000명 이상의 승객이 이용하고 있다. 금융에서도 널리 이용되고 있다. 최근의 신용평가 모델은 기존의 복잡한 과정과 인터뷰 등을 거치지 않고 온라인상으로 제공하는 서비스가 등장하고 있다. 빅데이터를 기반으로 한 새로운 신용평가 모델은 이 최소한의 신청자 정보만을 가지고 해당 신청자의 소셜네트워크 활동 데이터를 수집하여 이를 기준으로 평가하는 방식이다. 예를 들면, 신청자가 소셜네트워크상에서 “부정적인 단어의 사용이 많다”라는 것이 빅데이터 수집, 분석을 통해 도출되었다면 신청자의 신용도에 대해서 다시 한 번 고려해 볼 만한 사항이 될 수 있을 것이다. 만약 A라는 사람이 꾸준히 택배를 이용하는 사람이라면 A는 일정한 소득이 있을 것을 신용도평가요소로 활용한다. 즉 빅데이터는 기존의 정형적인 데이터를 넘어서 비정형적인 데이터에서도 의미를 갖는다.
Tip
최근, 쿠팡기업은 빅데이터 분석을 통한 주문 예측으로 온라인판매 성공하여 1조원의 투자를 받아 크게 성공했다. 빅테이터분석에 의한 온라인 상거래 서비스 방식은 향후의 유통시장을 지배할 수 있음.
<참고자료>☞ 본문 답변과 관련된 사이트, 문헌자료
http://pub.chosun.com/client/news/viw.asp?cate=C03&mcate=m1002&nNewsNumb=20170424158&nidx=24291
<전문용어>
빅테이터, 로켓 배송, 최적 노선, 신용평가모델