5회말 원아웃에 스코어는 1대1로 백척간두의 상황. 원볼 투스트라이크 상황에서 류현진이 힘차게 71번째 공을 뿌린다.
91마일짜리 패스트볼이 뱀처럼 꿈틀거리며 홈플레이트 바깥을 타고 쏜살같이 지나간다. 볼인지 스트라이크인지 쉽게 분간을 할 수 없다. 그 순간 주심의 팔이 한 치 망설임 없이 힘차게 올라간다. 결과는 삼진 아웃.
이 극적인 순간 이면에 `빅데이터 분석`이 있었다. 경기 전 포수 A J 엘리스는 더그아웃에 붙은 구심 스트라이크존 분석자료를 외우다시피 들여다봤다. 좌타자인지 우타자인지, 투스트라이크 이전인지 이후인지 등 모든 상황을 가정해 분석한 스트라이크존이 확률과 통계의 힘을 빌려 붉은 옷과 푸른 옷으로 꽃단장을 하고 있다. 붉은색은 스트라이크 가능성이 높은 영역, 푸른색은 그 반대다. 오늘 구심이 판정한 수백 수천 번의 경기자료를 토대로 나온 자료다.
경기 전 포수 엘리스는 투스트라이크 이후 오른쪽 타자 먼 곳에 찍히는 직구가 스트라이크 판정을 받을 확률이 높다는 걸 파악했고, 사인을 받은 류현진이 칼날 같은 제구력으로 화룡점정을 찍어 이날의 여섯 번째 삼진이 탄생한 것이다.
140년 역사의 메이저리그(MLB) 구단 사이에 `빅데이터 없이 우승은 없다`는 인식을 공유하고 있을 정도다. 메이저리그에서 가장 가난한 팀으로 탈꼴찌를 걱정해야 했던 오클랜드 성공비결이 바로 `빅데이터`였다.
1999년 단장에 오른 `빌리 빈`과 그의 장자방 `피터 브랜든`은 야구장에 떠돌던 기존 속설을 무시하고 철저하게 빅데이터 관점에서 야구를 봤다.
냉철한 빅데이터 분석을 토대로 본 승리와 직결된 최우선 변수는 출루율이었다. 둘은 시장에서 저평가된 출루율 높은 선수를 싼 가격에 긁어모았고, 메이저리그 역사를 새로 썼다.
한국 프로야구 역사상 처음으로 3년 연속 정규시즌 우승의 위업을 달성한 삼성 라이온즈 성공 스토리 이면에도 `빅데이터`가 숨어 있다.
2010년 말 삼성SDS에서 라이온즈로 옮긴 김인 사장은 빅데이터 솔루션 `스타비스(STABIS)`를 구축하라는 엄명을 내렸다. 투수 구질, 타자 성향 등 데이터를 모아 상관관계를 분석하는 솔루션이다. 24일 개막한 한국 프로야구 한국시리즈를 두고 `빅데이터 대전`이라는 말이 나오는 이유다.