국내 연구진이 빅데이터78 분석이 가능한 통계 패키지를 개발했다. SAS 등 고가의 외산 소프트웨어(SW) 대체 효과가 기대된다. 최근 빅데이터에 관심이 커지면서 국내에서도 빅데이터 분석용 통계SW 수요가 커지고 있으나 대학이나 연구소·기업 등이 주로 사용하는 통계 프로그램 대부분은 외국 제품이어서 매년 상당 수준의 저작권료를 내야 하는 실정이다.
미래창조과학부는 서울대 데이터과학과지식창출연구센터(센터장 이영조 교수)가 빅데이터78 분석이 가능한 통계 패키지 `SRC-STAT`(가제)를 개발, 외국에 지급하는 저작권료를 아낄 수 있게 됐다고 25일 밝혔다.
미래부 지원을 받아 제작된 통계 패키지는 평균, 분산과 같은 기초통계부터 의학 분야의 생존자료, 사회과학 분야의 다변량 자료와 다수준 모형, 금융 분야의 시계열 자료 등을 모두 분석할 수 있는 범용 프로그램이다. 실제로 센터는 패키지를 활용해 서울의대와 공동으로 대용량 고차원 뇌영상 기술을 개발한 뒤 급성허혈증 뇌졸중 응급환자의 혈압데이터 20만건을 분석하는 데 적용해 뇌졸중 내원 후 증상이 악화되는 사례를 예측했다.
이러한 복잡한 기능을 수행하면서도 사용자 인터페이스는 직관적으로 설계해 쉽고 빠르게 데이터의 구조와 변수의 관계를 보여준다는 게 연구팀의 설명이다. 특히 국내 사용자에 맞춰 분석 기법을 한글화해 더욱 친숙하게 프로그램을 사용할 수 있도록 했다.
미래부는 국산 통계 패키지가 빅데이터 시대 핵심인 국내 SW산업의 촉매제 역할을 할 것으로 내다봤다. 이영조 센터장은 “분석도구인 통계SW가 없다면 빅데이터에서 의미 있는 지식을 발견할 수 없다”며 “SRC-STAT 개발이 국내 통계SW산업 발전의 계기가 될 것”이라고 말했다.
센터 측은 국내 교육기관에 통계 패키지를 무상으로 보급하고 있으며 이용을 희망하는 기관은 센터 홈페이지(srcdsc.snu.ac.kr/srcstat)에서 내려 받으면 된다.