빅데이터에 대한 국내 기업의 관심이 점점 커지는 가운데, 하둡에 매몰되지 말고 큰 그림에서 빅데이터를 검토해 시스템 구축에 나서야 한다는 지적이다.
10일 국내 대표적인 빅데이터 전문가로 꼽히는 장동인 한국테라데이타 부사장에 따르면, 국내 기업의 빅데이터 접근법의 가장 큰 문제는 '빅데이터가 곧 하둡'이라는 인식이다. '하둡(Hadoop)'은 대규모 데이터를 처리할 수 있는 오픈소스 프레임워크로, 데이터베이스 관련 업체와 기업용 소프트웨어 업체 상당수가 이를 후원하고 자사 제품을 통해 지원한다.
그러나 장 부사장은 "많은 기업이 '공짜'인 오픈소스 하둡을 도입했지만 하둡은 30여종의 컴포넌트를 알아야 제대로 사용할 수 있는, 실제로는 쓰기 까다로운 기술"이라며 "뒤늦게 이를 깨닫고 일부 기업은 하둡 전문가를 대거 고용해 데이터 분석 모델을 개발하는데 집중하고 있다"고 말했다. 이어 "그러나 가장 중요한 것은 개발이 아니라 데이터를 분석해 그 인사이트를 비즈니스에 활용하는 것"이라며 "유독 우리나라만 하둡 개발에 매몰돼 이상한 형태로 빅데이터를 도입하고 있다"고 말했다.
장 부사장은 그 대안으로 '통합 데이터 아키텍처'를 제시했다. 정형 데이터와 비정형 데이터를 마치 하나인 것처럼 묶어 분석할 수 있는 기술로, 시장조사업체 가트너는 이를 '로지컬 DW'라고 설명한다. 장 부사장은 "통합 아키텍처로 빅데이터 시스템을 구현하면 데이터 중복 등 기존 빅데이터 시스템의 문제를 상당 부분 보완할 수 있다"며 "특히 '가상 마트'(Virtual Mart) 개념을 지원해 기존 DW에 저장돼 있는 정형 데이터는 물론 하둡과 같은 비정형 데이터까지 유연하게 통합 분석할 수 있다"고 말했다.
국내 시장 상황도 새로운 빅데이터 시스템을 구축하기에 적기라는 것이 장 부사장의 판단이다. 현재 우리 기업들이 사용하는 DW 시스템 대부분이 구축된 지 10년 이상 됐고, 특히 스마트폰과 같은 모빌리티 개념 자체가 없던 시절에 만들어진 것이어서 하드웨어는 물론 소프트웨어까지도 업그레이드해야 할 시점이라는 것이다. 장 부사장은 "많은 국내 기업의 CIO가 폭증하는 데이터 때문에 큰 고민에 빠져 있다"며 "다양한 현업 부서의 빅데이터 분석 요구에 대해 개별적으로 대응하는데도 한계를 느끼고 있다"고 말했다.
이러한 장 부사장의 분석에 대해 일부 반론도 있다. 특히 하둡을 정제되지 않은 소스 데이터의 단순한 저장소 정도로 보는 것은 의도적인 평가절하라는 지적도 있다. 하둡 기술은 아직 완성되지 않았고, 이 기술이 고도화 될수록 테라데이타 같은 DW 업체의 시장을 잠식할 가능성이 크기 때문이다. 기존 DW 업체 입장에서는 하둡이 지나치게 성장하는 것이 오히려 위협요소인 것이다. 또한, 한국테라데이타 조차 국내에서 아직 통합 데이터 아키텍처 구축사례를 갖고 있지 않다. 아직은 수요가 확인되지 않은 여러 빅데이터 방법론 중 하나인 셈이다.
장 부사장은 이제 기존 DW 시스템의 수명이 한계에 달한만큼 우리 기업들이 어떤 형태로든 대안을 마련하는 작업에 나서야 한다고 말했다. 그는 "지금은 많은 기업이 부서별로 빅데이터 분석을 시도하고 있고 이를 IT 부서가 지원하는 형태지만, DW가 EDW로 발전한 것처럼 빅데이터도 결국은 전사적으로 묶는 움직임이 나타날 것"이라며 "특히 기업 경데이터 중심의 의사결정의 중요성이 커지면서 이를 구현할 수 있는 플랫폼에 대한 요구가 더 커질 것"이라고 말했다.