SNS(소셜네트워크서비스) 열풍에 이어 빅 데이터(Big Data) 바람이 거세다. 인터넷과 디지털을 모태로 한 이 쌍동이 태풍은 정치와 기업 마케팅 분야에서 위력을 떨친 데 이어 금융 시장에서도 진동이 시작됐다. 천문학적인 돈이 오가는 곳이라 여파는 훨씬 더 크다. 지난 23일 AP의 트위터 해킹으로 인한 오보로 뉴욕증시가 7분 만에 152조원의 주가가 출렁인 것은 단적인 예였다.
그 바람이 국내에도 불어닥칠 조짐이다. 최근에는 소셜미디어와 빅 데이터 분석을 결합해 주식 투자에 활용하는 프로그램이 국내 연구진에 의해 개발됐다. 강형구 한양대 경영학부 교수팀과 디지털 데이터 분석 기업인 다음소프트는 트위터 분석을 주식 매매에 활용하는 프로그램을 만들어 실전 투자 실험까지 마쳤다. 일명 ‘소셜 메트릭스 펀드’ 투자 기법을 26일 일반에 처음 공개한다. 트위터에 쏟아지는 단문 속에 나타난 집단 감성에 따라 주식을 투자하는 새로운 기법이다. ‘소셜 감성 기반 트레이드’가 국내에서 소개되는 것은 이번이 처음이다.
◆ 감성 투자 매매 시스템 어떻게 설계하고 투자하나
트위터 같은 SNS 메시지를 활용한 투자는 이미 현실이다. 그 정도와 방법에 차이가 있을 뿐이다. 미국에서는 트위터 메시지의 분석 결과를 투자에 이용하는 투자 자문사들도 우후준순처럼 생겨난 상태다. 트위터에 나타난 감성지수와 다우존스 지수의 상관 관계를 연구한 논문들도 적지 않다. 현실은 제도 변화까지 낳고 있다. 이달 초 미국 증권거래위원회(SEC)는 상장 기업들이 SNS을 통해 투자 정보와 관련된 정보를 서비스할 수 있도록 허용하기도 했다.
빅 데이터(Big Data) 분석이란 대규모 디지털 데이터에서 일정한 패턴을 읽고 해석하는 것을 말한다. 과거에는 불가능했던 대량의 정보를 순식간에 처리할 수 있게 되면서 초를 다투는 투자에도 빅 데이터가 응용되기 시작했다. 빅 데이터 분석과 SNS 분석, 이 둘을 결합해 응용한 ‘소셜 메트릭스 펀드’는 집단 감성에 기반한 투자 매매 원리를 활용한다.
환율이나 금리 변동 같은 경제 지표는 투자 변수에서 제외된다. 일반인들이 트위터에서 주고받는 ‘우울해’ ‘짜증 나’ ‘행복하다’ 같은 감성 표현을 담은 엄청난 양의 데이터만 분석해 매수 종목과 매도 종목을 고른다. 윤 부사장은 “투자자(사람) 판단은 원천적으로 배제하도록 아예 증권사 홈트레이딩시스템과 연동하는 안드로이드 앱을 만들어 주식을 자동 매매했다”고 말했다.
이번 시스템 개발에는 최신 금융공학 기법과 데이터 마이닝 기술이 총동원됐다고 연구진은 밝혔다. 트위터 메시지를 ‘알짜 정보’로 탈바꿈시키기 위해서는 정교한 모델링이 필요하기 때문이다. 모델을 개발한 강 교수는 금융에 수학적 모델을 적용하는 금융공학 전문가이고, 윤 부사장은 대량의 데이터를 분석해 유의미한 정보를 추출하는 데이터 마이닝 전문가이다.
강 교수팀은 매일 수집한 약 15만개가량 트위터를 ‘즐거움’ ‘행복’ ‘기쁨’ ‘슬픔’ ‘무서움’ ‘부끄러움’ ‘증오’ ‘싫어함’ ‘분노’ 등 총 9가지 감성어로 분류했다. 그 다음, 최근 100일 동안 트위터 감성어 데이터와 코스피 200개 종목, 코스닥 10개 종목의 주가 데이터가 어떤 상관관계가 있는지 일일이 추적했다. 통계적으로 유의미한 종목들을 골라 매수·매도 목록을 만들기 위해서였다.
소셜 메트릭스 펀드는 지난해 8월 6일부터 12월 28일까지 약 5개월 동안 실제 주식 매매를 통해 검증까지 거쳤다. 같은 기간 코스피 등락률보다 3% 가량 높은 수익률을 기록해 주식 시장에서 금언으로 통하는 ‘경제는 심리’라는 명제를 다시 확인했다고 연구진은 밝혔다.
◆ ‘경제는 심리다’ 입증…대선 등 돌발 변수엔 취약
우여곡절도 있었다. 지난해 12월 18일까지 소셜 메트릭스 펀드의 수익률은 13.1%로 코스피 상승률보다 월등히 높았다. 펀드의 순항에 허를 찌른 것은 같은 달 19일 치러진 대통령 선거였다. 박근혜 후보가 대통령에 당선된 후 많은 사람들이 트위터에서 계정 탈퇴를 하는 등 트위터 공간에서는 일대 지각 변동이 일어났다. 이런 변화에 제때 대응하지 못한 소셜 메트릭스 펀드 수익률은 곤두박질쳤다. 잠깐이었지만 마이너스 수익률을 기록하기도 했다.
강 교수는 “한국 트위터엔 야권 성향을 가진 사용자가 많다. 여권 후보가 당선되자 대선 결과에 대해 부정적인 메시지가 쏟아지고 이에 따라 자동 매매한 소셜 메트릭스 펀드의 수익률도 좋지 않았다”고 분석했다. 강 교수는 “대선과 같은 돌발 변수에 베팅을 잘 하는 것은 관심 분야가 아니다”면서도 “정치적 위험을 회피할 수 있는 매매 전략을 시스템에 추가할 필요가 있다는 교훈을 얻었다”고 했다.
연구진은 현재 감성 투자 기법에 절대 수익을 추구하는 헤지펀드 매매 전략까지 접목시키는 연구를 진행 중이다. 강 교수는 “감성 투자를 이용한 세계적인 헤지펀드를 수립하는 것이 연구팀의 목표”라고 했다.
◆ 최근 빅데이터 연구 주제는
빅 데이터를 활용한 영역은 앞으로도 갈수록 확대될 것으로 보인다.
올초엔 현대증권이 뉴스가 주가에 영향을 미친다는 점에 착안해 초보적인 형태의 주가 예측에 나서기도 했다. 개별 종목을 언급한 뉴스 발생 건수가 1년 전보다 많고 긍정적일 경우 개별 종목 주가는 코스피 지수보다 약 3% 초과 수익률이 발생하는 것으로 나타났다.
다음소프트는 26일 빅 데이터를 각 영역에서 활용한 사례를 소개하는 ‘오니피언 마이닝 워크숍(
www.omw.or.kr)’을 역삼동 라움에서 오전 9시부터 오후 5시까지 연다. 다양한 성과가 소개된다. 유원상 유유제약 상무가 헬스 케어 분야에서 빅 데이터를 활용한 사례를 발표한다. 교보문고의 안병현 부장은 콘텐츠와 미디어 분야의 빅 데이터 활용 사례를 소개한다. 삼성경제연구소의 채승병 수석연구원은 ‘빅 데이터 큐레이션과 시장 읽어내기’를 발표한다.
윤 부사장은 “데이터가 폭발적으로 증가하고 있어 가치 있는 정보를 찾아내는 일이 갈수록 중요해지고 있다”면서 “소셜 메트릭스 펀드도 추가적인 검증과 보완 작업을 거쳐 조만간 상용 서비스에도 나설 계획”이라고 말했다.