스타트업의 빅데이터 확보 방법
작성자 : m0mksii 분류 : 연구개발 | 공통지식 작성일 : 2018.02.26 16:06:58 조회 : 1622 키워드 : 4차산업혁명,데이터수집,빅데이터,데이터구축,스타트업
(요약/배경) 대기업이 아닌 스타트업에서 빅데이터를 확보하기 위해 데이터를 수집, 구축할 수 있는 방법은 무엇이 있을까? 스타트업 입장에서 빅데이터 기반의 서비스를 기획하기 위해서는 어떻게 접근해야 하는가?
(빅데이터 확보의 요건)
빅데이터의 정의로 접근해보면 빅데이터를 적용하기 위해서는 “큰 규모의 데이터”와 “데이터를 처리하기 위한 IT기술”의 두 가지 요건이 필수적이라 할 수 있다.
- (맥킨지앤컴퍼니, McKinsey & Company)“일반적인 데이터베이스 관리도구가 저장관리·분석할 수 있는 범위를 초과하는 규모의 데이터”
- (위키백과)“기존 데이터베이스 관리도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형 또는 심지어 데이터베이스 형태가 아닌 비정형의 데이터 집합조차 포함한 데이터로부터 가치를 추출하고 결과를 분석하는 기술”
(빅데이터의 확보 방법)
스타트업에서 빅데이터를 자체적으로 확보하기 위해서는 우선 빅데이터의 4가지 특징인 4V를 기준으로 요건을 충족하는 데이터를 확보할 수 있는지를 확인 하여야 한다.
- 4V : 데이터의 크기(Volume: 통상 수십 테라바이트에서 수 페타바이트에 이르는 사이즈여부), 데이터 입출력 처리 속도(Velocity: 실시간 처리 또는 준실시간 처리여부), 데이터 종류의 다양성(Variety: 구조화된 정형데이터 외에도 음성과 이미지와 같은 비정형데이터도 포함여부), 데이터의 가치(Value: 데이터가 새로운 가치를 제공하는지)
데이터 원천의 확보하기 위한 방법은 크게 아래 그림과 같이 나누어 접근할 수 있다.
그림 : 빅데이터의 확보 방법 (출처: 저자 작성)
(데이터를 처리하기 위한 IT기술의 확보 방법)
빅데이터를 처리하기 위한 IT기술은 아래의 그림과 같이 “빅데이터 수집, 처리기술(하둡플랫폼)”, “클라우드를 고려한 IT 인프라(하드웨어)”, “빅데이터의 분석기술”로 분류하여 확보가능성을 판단할 수 있다.
그림 : 빅데이터 처리기술의 분류 (출처: 저자 작성)
(빅데이터 센터 활용 방법)
초기 자원투자의 진입장벽 완화를 위해 정부나 공공기관에서 빅데이터의 활용센터와 교육 등을 지원하는 K-ICT 빅데이터 센터 오픈랩(https://kbig.kr/), 보건의료 빅데이터센터(http://opendata.hira.or.kr) 등을 활용 할 수 있다.
Tip
정부3.0, 공공데이터, 빅데이터 등의 키워드로 기획기사, 기술자료 등을 검색하여 더 많은 활용방법을 조사 할 수 있다.
<참고자료·문헌>
☞ “2016 중소기업 데이터 활용 지원 우수 사례집”
- 한국데이터진흥원 (https://www.kdata.or.kr/files/the_best_data_business.pdf)
☞ “2015 중소기업 빅데이터 활용지원사업 우수사례집”
- 한국정보화진흥원의 중소기업 빅데이터 지원 사례집 PDF파일 (https://www.data.go.kr/comm/file/download.do?atchFileId=FILE_000000001315682&fileDetailSn=0)
<전문용어>
하둡, 클라우드, 지능정보기술