경희대학교 박재홍 교수는 지난 11일 서울 코엑스에서 개최된 투이컨설팅 Y세미나의 발표자로 나와 금융권의 빅데이터 도입 성공을 위해선 소셜데이터에 편중된 데이터 분석은 위험하다는 주장을 제기했다. 특히 박 교수는 금융권에서 빅데이터 분석을 위해서는 정교한 분석 모델 선정이 중요하다고 강조했다.
박 교수에 따르면, 실제로 예측을 필요로 하는 의사결정에는 복잡하고 정교한 분석 모델이 필요하다. 예를 들어 수백억원의 펀드를 운영하는 펀드매니저가 단순히 SNS를 통해 오고가는 정보만을 분석해 투자를 결정하는 것은 매우 위험하다는 것이다.
실제로 미국의 경우 트위터에서 오고가는 사람들의 기분 상태를 주가 지수와 연동한 분석 모델을 개발한 인디애나 공과대학 연구를 더웬트 캐피탈이라는 업체가 적용한 펀드운영서비스를 진행한 바 있다. 하지만 결과적으로 더웬트 캐피탈은 문을 닫으면서 이러한 예측 모델은 실패한 것으로 결론 났다.
이에 대해 박 교수는 “더웬트 캐피탈은 부정확한 분석 모델을 사용해 실패한 것”이라며 “금융권에서 빅데이터 예측 모델은 보다 복잡하고 정교한 분석 모델이 필요하다”고 밝혔다.
물론 그렇다고 소셜 데이터가 금융권 빅데이터 분석에 있어 무의미하다는 것은 아니다. 다만 소셜네트워크와 같은 빅데이터와 기존의 내외부 데이터를 통합해 분석하면 이러한 오류를 줄일 수 있다는 것.
박 교수는 “SNS를 통해 오고가는 정보보다 펀드매니저가 가지고 있는 정보가 더 신뢰성이 높은 경우가 대부분”이라며 “다만 온라인에서 누가 정확한 정보를 가지고 있는 지 가중치를 분석에 적용하는 등 정교한 분석 모델이 만들어지면 도움이 될 것”이라고 밝혔다.
한편 박 교수는 최근 빅데이터 분석이 국내에서 확산되지 않는 이유로 빅데이터 프레임워크 구축의 고비용과 분석기법의 모호성, 데이터 분석과 해석의 어려움 등 세 가지를 지적했다.
빅데이터를 성공적으로 도입하기 위해선 ‘충분히 적은 양(enough small data)’의 데이터로 시작해 경제적 효과 검증이 우선돼야 한다고 박 교수는 설명했다. 우선 적은 양의 데이터를 통해 효과를 검증하고 빅데이터에 대한 이해도가 떨어지는 초기에는 데이터 사이언티스트를 확보하고 있는 컨설팅 기업에 의뢰할 필요가 있다는 설명이다.