드라이브, 클라우드, 스토리지.. 이들은 모두 다른 말이지만 한 가지의 공통점이 존재한다. 바로 데이터를 저장할 수 있는 공간이다. 이러한 저장소들은 디지털 데이터의 증가와 함께 그 형태를 달리하며 발전하고 있다.
빅데이터 시대가 도래했다는 소식은 이미 오래 전부터 우리 곁을 지켜왔고, 그렇다면 빅데이터란 무엇이고 빅데이터 시대에 대처하는 우리의 알맞은 자세는 무엇일까. 빅데이터란 이름에서 알 수 있듯이 대규모 데이터를 뜻하는데, 디지털 환경에서 생성되는 데이터로 짧은 시간과 방대한 양, 거대한 수치 등을 포함한다.
많은 것들이 디지털화 된 요즈음, 생각해보면 빅데이터의 생성은 그리 놀라운 일이 아니다. 평소 아무렇지도 않게 사용하는 휴대폰을 예로 들자면, 나도 모르는 사이에 사용량, 사용 주기, 사용 형태가 시간과 날짜별로 누적된 데이터를 어렵지 않게 접할 수 있다. 즉, 내가 휴대폰에서 하는 일련의 행위들이 디지털화 되어 저장되고 있다는 것이다. 이 데이터들은 결국은 빅데이터가 되어 저장될 공간이 필요할 것이다.
이 거대한 데이터를 담을 안전하고 믿음직스러운 저장소 역시도 빠른 속도로 발전을 거듭하고 있다. 대규모 데이터를 효과적으로 처리하기 위한 전략은 대표적으로 스케일 업(Scale-up)과 스케일 아웃(Scale-out) 방식이 꼽힌다. 스케일 업은 컴퓨터 성능을 향상시키기 위해 성능이 더 좋은 장비를 도입하는 방식이다. 이전 장비들은 성능이 좋은 새 장비로 교체되고 새 장비에서 데이터는 더욱 신속하고 효율적으로 데이터를 처리하지만, 비용이 많이 든다는 점이 단점이다. 반면, 스케일 아웃은 장비의 수를 늘려 데이터를 분산시키는 방식을 말한다. 상대적으로 비용이 저렴하고 많은 양의 데이터를 저장할 수 있다는 점이 특징이며, 대신 성능을 이끌어내기 위한 소프트웨어가 있어야 시너지 효과를 낼 수 있다.
최근 이 스케일 아웃 방식이 실용적인 시스템으로 대두되고 있는데 그 대표적인 예가 구글이다. 구글은 대량의 데이터를 효과적으로 저장하는 전략으로 스케일 아웃 방식을 선택하고 분산파일 시스템(GFS)이라는 독자적인 기술을 개발했다. 가격이 저렴한 하드웨어를 이용하는 대신, 소프트웨어 개발에 투자하여 질을 높인 것이다. 세계적인 스토리지 기업인 시놀로지(Synology)도 최근 클러스터를 구성하는 방법으로 스케일 아웃을 지원한다고 밝혔다. 시놀로지 역시 합리적인 가격의 하드웨어 수를 늘리고 자사가 개발한 소프트웨어를 사용하여 성능을 높인 경우이다.
늘어나는 데이터를 손실 없이 안전하게 저장하고, 빠르게 처리하는 공간을 구축하는 것은 크고 작음을 떠나 모든 기업에게 주어진 과제이다. 한정된 예산 안에서, 최대한의 공간을 확보할 수 있는 스케일 아웃은 빅데이터 시대의 도래에 대처하는 우리의 현명한 선택일 것이다.