한국클라우드컴퓨팅연구조합에 오신것을 환영합니다.
 
작성일 : 14-04-01 09:09
[머니투데이] 빅데이터? 적정데이터!
 글쓴이 : 최고관리자
조회 : 1,905  
   http://www.mt.co.kr/view/mtview.php?type=1&no=2014033115052336697&outl… [5505]
물 부족에 시달리는 아프리카의 한 마을에 구호단체에서 대형 정수기를 설치해 줬다. 처음 얼마간은 주민들이 깨끗한 물을 마실 수 있었지만, 시간이 흐르면서 정수기는 아무쓸모 없는 쓰레기가 됐다. 정수기 운영을 위한 필터나 전기가 제대로 공급되지 않았고 기술지원도 없어 결국 정수기가 쓸모없는 상자로 전락한 것이다.
 
이런 문제에서 나온 대안적 개념이 적정기술(Appropriate Technology)이다. 좋은 기술이라도 한 공동체의 문화적·정치적·환경적 요소를 고려하지 않으면 아무 쓸모없다는 것이다. 특정 맥락(Context)에 맞고, 사용자의 니즈에 맞는 적절한 기술이 가장 훌륭한 기술일 수 있다. 아프리카의 특정 공동체에 필요한 것은 비싼 정수기가 아니라 물을 즉석에서 소독할 수 있는 1∼2달러짜리 키트나 우물에서 물을 길어 안전하고 빠르게 옮길 수 있는 운반 기구였을 것이다.
 
빅데이터가 신성장동력으로 주목받고 장밋빛 전망을 쏟아내고 있다. 하지만 동시에 적지 않은 부작용도 나오면서 빅데이터의 대안으로 적정기술 개념에서 도출된 적정 데이터(Appropriate Data)가 거론되고 있다.
 
빅데이터가 모든 문제를 만능적으로 해결해 줄 것 같지만, 데이터란 현실이나 현상에 대한 제한적인 그림을 부분적으로 암시할 뿐이다. 제한된 데이터를 통해 현실을 유추해내는 일은 연구자에 달려있고, 적절한 틀을 통해 최선의 분석을 해내는 것이다.
데이터 자체는 아무 의미 없는 숫자들의 모임일 뿐이며 패턴을 찾아내 의미를 부여하고, 가치를 도출하는 것은 인간의 몫이다. 그러나 데이터의 본질적 한계와 근본적 단점으로 100% 이상적인 분석은 현실적으로 불가능하다. 그렇기 때문에 양질의 적정 데이터로 최적의 분석을 하는 것이다.
 
빅데이터에 대한 과도한 기대로 그 자체를 완벽한 데이터라고 생각하는 경향이 있는 것 같다. 정부기관에서 의제를 띄우고, 언론에서 앞 다퉈 의제를 증폭하는 과정에서 사람들은 빅데이터가 인류의 제반문제를 해결해 줄 것 같은 막연한 기대를 한다.
데이터를 이용한 통계분석에서 가장 기본적 전제가 되는 것은 모수의 추정이다. 즉 분석하려는 대상의 전체크기와 속성이 어떠하다는 추정이 있어야 기본 분석과 제한적이나마 예측이 가능한 것이다.
 
빅데이터는 그 전반적 크기와 속성에 대한 추측이 쉽지 않다. 모든 데이터를 무작위로 포함하다 보면 전체 흐름과 패턴을 왜곡하는 극단치(outlier·아웃라이어)가 포함돼 전체적 평균과 그림을 완전 왜곡시키게 된다.
빅데이터 시대라 해서 마구잡이식 의미 없는 데이터를 포함하다 보면, 전체 데이터의 질을 떨어뜨리고, 왜곡된 분석이 나올 수도 있다. 반드시 빅데이터란 틀에 집착할 필요는 없다. 충분한 분석을 통해 가장 적절한 사이즈의 데이터를 양적 또는 질적 방법론을 이용해 수집 분석하는 것이 중요하다.
 
빅데이터란 그 자체가 결과나 프로젝트가 아닌 하나의 과정, 프로세스다. 빅데이터를 통해 최대 효과를 얻으려면 구체적 목표가 있어야 한다. 즉 빅데이터를 통해 무엇을 하려는지 명확해야 어떤 데이터를 수집 분석해야 하는지 전술적 문제들이 확실해진다.
빅데이터에 대한 오해와 부푼 기대가 팽배한 상황에서 시급한 것은 빅데이터에 대한 현실적 개념을 도출하는 것이다. 10여년전 엄청난 관심과 예산을 투자했다가 결국 시들해진 CRM(고객관계관리)의 기억이 생생하다. CRM이 실패한 이유는 데이터 분석이 아닌 단순 수집에 불과했기 때문이다. 데이터 분석은 데이터로부터 비즈니스 의미와 가치를 도출해야 한다. 데이터가 분석되지 않고 집계되고 단순망라되는 수준이라면 빅데이터는 실망만 안겨줄 뿐이다.