구글번역은 현존하는 번역 프로그램 중 가장 많은 언어를 다루면서도 원문에 가장 가까운 번역을 해 주는 인터넷 서비스일 것이다. 유럽 언어 간 번역은 거의 완벽하게 이뤄지고 있다. 동양어나 제3세계 언어 번역이 아직 매끄럽지 않지만 시간이 지날수록 오류는 줄어들 것이다.
이는 수십억 건에 달하는 자발적 데이터 수정이 실시간 이뤄지고 있는 덕분이다. 지구촌 곳곳에 있는 사람들이 구글번역을 돌려본 후 이상한 번역에 대해 "구글은 아직 멀었다"며 고쳐 준다. 이런 데이터가 전 지구적으로 쌓이면서 구글번역은 더 정확한 프로그램으로 진화한다. 빅데이터의 경이로움이다.
`독감 경로를 예측하는 구글`도 마찬가지다. 독감이 어느 지역으로 유행할지 보건당국보다 신속히 파악할 수 있는 것도 수많은 사람이 구글을 통해 독감 관련 정보를 검색했기 때문에 가능하다. 인터넷 광고만 해도 구글은 다른 기업들과 차원이 다르다. 자기 사이트에 광고를 유치하겠다는 발상에서 벗어나 구글은 전 세계 인터넷 사이트의 빈 공간을 팔아 광고를 수주한다.
그렇다고 전 세계를 돌아다니며 광고 영업을 하는 게 아니다. 모든 작업은 수십억 명에 달하는 이용자들이 스스로 한다. 구글은 사람들이 입력하고, 내려받고, 등록한 엄청나게 많은 데이터를 분석하는 알고리즘을 만들어 운영하기만 하면 된다. 그게 구글의 힘이다.
그런데 그 역학관계에 변화가 올 수 있는 사건이 생겼다. 한 스페인 남성이 구글에 요구한 `잊힐 권리(right to be forgotten)`를 유럽사법재판소가 인정한 판결이다. 인터넷 발상지인 미국을 비롯해 수많은 인터넷 기업들이 유럽재판소의 이 판결에 대해 우려하고 있다. 인터넷의 가치인 개방과 공유, 그리고 알 권리와 표현의 자유가 침해될 수 있다고 보기 때문이다.
하지만 지난해 벌어진 에드워드 스노든 사건에서 보듯이 인터넷은 이제 개방과 공유라는 가치와 함께 은밀한 감시와 개인정보 침해 문제로 몸살을 앓는 공간이 돼 버렸다. 마녀사냥식 신상 털기와 무분별한 해킹은 정치ㆍ경제ㆍ사회적으로 심각한 악영향을 주고 있다.
잊힐 권리가 인정된 마당에 사람들이 일제히 자신의 개인정보 삭제를 요구하고 나서면 어떻게 될까. 빅데이터를 활용해 돈을 벌던 구글에 빅데이터 분량의 정보 수정ㆍ삭제 요청이 들어오는 상황을 상상해 보자는 것이다.
데이터를 받기만 했던 그들이 저마다 각양각색인 수십억 건 규모의 데이터 삭제ㆍ변경 요청에 일일이 대응할 수 있는 시간과 비용을 감당할 수 있을까. 빅데이터의 역습, 아니 빅데이터 쓰나미라 해도 틀리지는 않을 것 같다.