'클라우드용 DBMS는 따로 있다' 데이터스택스의 도전
Thor Olavsrud | CIO ciokr@idg.co.kr
[2016.04.18]
데이터스택스가 다양한 데이터 모델을 위해 키 값부터 태뷸러, 제이슨(JSON), 그래프까지 운영 데이터베이스 지원을 강화하고 있으며, 자사 제품군에 데이터스택스 엔터프라이즈 그래프를 추가했다.

아파치 카산드라와 아파치 팅커팝의 오픈소스재단에 구축된 클라우드 애플리케이션용 데이터베이스 소프트웨어 전문업체인 데이터스택스(DataStax)는 데이터 문제에 대한 포인트 솔루션의 시대가 지나갔다는 주장을 내놨다.
미국 캘리포니아 산타클라라에 있는 신생벤처인 데이터스택스의 엔지니어링 담당 수석 부사장 마틴 반 라이스윅은 “대신 운영 DBMS의 미래는 다양한 데이터 모델을 지원하는 것”이라고 밝혔다.
그는 “아주 놀라운 새 기술로 사람들은 이전까지 해결하지 못했던 문제들을 해결하기 위해 처음에는 포인트 솔루션을 사용하려 한다. 하지만 시간이 지나면 통합 제품군을 원한다”며 “현재 우리가 보는 추세는 진정세에 가깝다. 사람들은 수많은 문제 공간을 보완할 수 있는 플랫폼을 원한다”고 말했다.
가트너 애널리스트 닉 휴데커, 머브 애드리안, 에티샴 자이디도 반 라이스윅과 비슷한 의견을 이미 내놓은 바 있다. 이들 셋은 작년 8월에 발표한 ‘NoSQL DBMS의 시장 가이드’에서 “DBMS 아키텍처와 배치의 미래는 멀티 모델이 될 것이다”고 적었다.
또 가트너 세 애널리스트들은 “2017년까지 모든 선도적 운영 DBMS가 멀티 데이터 모델, 관계형 DBMS, NoSQL을 단일 플랫폼에서 제공할 것”이라고 덧붙였다.
<중략>
그는 RDBMS(relational DBMS) 생태계가 수많은 점에서 유리하다고 덧붙였다. RDBMS 생태계는 DBMS의 논리적 개발자와 물리적 사용자(DBA)를 잘 구분해 정리한 SQL 형태에서 개발자가 특정 업체에 종속되지 않는 언어를 사용하게 하고, 어떤 애플리케이션이 데이터베이스와 상호작용할 수 있느냐에 따라 움직이기 때문이다.
반면 RDBMS는 클라우드 애플리케이션과는 잘 맞지 않는 것으로 알려졌다. 그 이유는 다음과 같은 어려운 점들 때문이다.
• 업타임과 복원성에 대해 요구하는 마스터-슬레이브 아키텍처
• 클라우드 애플리케이션 작업 부하를 위한 라이트-앤-디스트리뷰트-애니웨어(write-and-distribute-anywhere) 제약과 규모
• 애플리케이션 민첩성보다 스토리지 효율성에 더 가치를 두는 논리적 데이터 레이어에 대한 엄격한 고수
• 준-비정형 데이터의 활용을 엄두도 못 낼 정도로 가격을 올리는 융통성 없는 데이터 모델
• 운영 비용을 기하급수적으로 높이는 샤딩 아키텍처의 ‘임시방편 처방’
NoSQL 기술은 이런 문제점들을 해결하지만, 기업 고객들에게 매우 파편화된 솔루션을 제공한다는 2가지 문제점을 안겨 준다.
• 다중 언어 고집은 고객이 데이터 모델(키 값, 태뷸러, 제이슨, 그래프)의 제한된 세트 중 하나를 활용하거나 데이터 스토어에 걸쳐 ETL(extract-transform-load) 운영해야 함을 의미한다. MDM(master data management)과 고객-360도-시야 권한 ETL을 포함한 수많은 사용 사례는 총소유비용(TCO)의 상승으로 이어질 수 있다.
• 데이터스토어와 소통하기 위한 NoSQL 업체의 메커니즘 각각은 방언과 논리적/물리적 분할이 어디에 있는지에 따라 달라진다. 이는 애플리케이션 개발자가 자신의 애플리케이션에 단일 모델 이상을 필요로 할 때 추상화 계층을 작성할 수밖에 없게 만들고, 추상화 계층은 논리적/물리적 스펙트럼의 각기 다른 레벨에 걸쳐 작동해야 애플리케이션 개발이 부합하게 된다.
반 라이스윅은 멀티-모델 데이터베이스가 NoSQL 기술의 차세대 진화라고 주장했다. 멀티-모델 데이터베이스는 단일의, 통합된 백엔드와 달리 수많은 데이터 모델을 지원하는 것이 특징이다. 데이터스택스는 멀티-모델 데이터베이스 플랫폼이 다음과 같아야 한다고 전했다.
• 애플리케이션 개발자들의 개발 편리성을 위해 한가지 관계형 데이터 모델(예를 들어, 태뷸러, 제이슨, 그래프) 이상을 논리적 레이어에서 지원해야 한다.
• 모든 모델이 결합적 메커니즘에 노출되도록 해 개발자들의 인지적 맥락 전환을 방지해야 한다.
• 지리적 중복, 지속해서로 사용할 수 있는 특성, 보안, 프로비저닝, 재난 복구 등의 운영 측면을 위한 공통 프레임워크를 제공하는 통일된 지속 레이어를 가져야 한다.
• OLTP와 OLAP 작업부하에 걸쳐 다양한 사용 사례를 가능케 한다.
• 중앙집중된 IT팀 내에서 광범위하게 채택될 수 있게 하려고 오랜 기간 높은 TCO 효율을 제공해야 한다.
데이터스택스 엔터프라이즈 그래프
지난 12일 데이터스택스는 자체 멀티-모델 기능성에 고도로 연결된 데이터를 관리해야 하는 클라우드 애플리케이션용의 확장 그래프 데이터베이스인 DSE(DataStax Enterprise) 그래프를 추가로 발표했다.
그래프 데이터베이스는 관계형 데이터를 해결하려는 의도지만 효율성과 확장에서 훨씬 효율적인 NoSQL 데이터베이스의 특별 형태다.
<중략>
DSE 그래프에는 다음의 기능이 들어 있다.
o 데이터스택스 기업 서버. 적응적 쿼리 옵티마이저, 자동 그래프 데이터 분할, 분산 쿼리 실행 엔진, 그래프-특정 인덱스 구조 등을 포함한 고급 그래프 데이터베이스 기능성을 제공한다.
o 데이터스택스 Ops센터. Ops센터(OpsCenter)는 풀 프로비저닝, 관리, DSE그래프의 모니터링을 제공하기 위해 업데이트됐다.
o 데이터스택스 스튜디오. 새로운 웹-기반 솔루션으로 개발자들이 그래프를 시각화하고 그래프 쿼리를 작성/실행하는 데 도움을 준다.
o 데이터스택스 드라이버. 드라이버들이 모든 인기 개발 언어에 맞춰 준비돼 있고, CQL, DSE 애널리틱스/검색 API 등에 추가로 그렘린(Gremlin) 그래프 언어 지원을 위해 향상됐다.
DSE 그래프는 DSE 스탠다드(Standard) 혹은 DSE 맥스(Max) 사용료 지급 모델로 판매될 예정이다. 반 라이스윅은 2/4분기에 시장에 회복될 것으로 전망했다.
기사 상세 내용 보기_클릭