
구글, 그 모든 이야기 #1
by 김상훈
오늘(22일) 스티븐 레비 인터뷰가 신문에 실렸다. 이 사람에 대한 개인적인 존경은 전에도 한 번 따로 쓴 적이 있는데, 직접 얼굴을 보면서 대화를 하며 든 생각도 기존의 생각과 크게 다르지 않았다. 글은 언제나 그 사람의 영혼을 반영하게 마련이다. 무엇보다 이번 인터뷰의 계기가 된 건 1년도 지나서야 국내에 번역돼 나온 그의 책 인 더 플렉스 In the Plex였다. 2년 동안 구글 내부를 마치 구글 직원이 된 것처럼 돌아다니면서 쓴 책이니 기대를 모으기도 했지만, 막상 읽으면서 느낀 건 치우침 없는 평가였다. 기업의 탄생 순간부터 지금 이 순간까지 단 한번도 혁신적이지 않았던 적이 없던 구글이 '페이스북'이란 경쟁자 앞에서는 따라쟁이처럼 꽁무니를 좇아야만 했던 모습이 신랄하게 비판되고 있고, '사악해지지 말자'(Don't be evil)가 기업의 핵심가치면서도 중국 시장에 진출하기 위해 중국 정부의 검열 요구를 받아들였던 이율배반적인 상황과 당시의 고뇌 또한 진솔하게 소개된다. 구글을 이해하는데 이만한 책은 전에도 없었고, 앞으로도 쉽게 나오긴 힘들 거라 생각한다. 책을 읽은 독후감을 몇 차례에 나눠서 쓸 생각인데, 그럴 수밖에 없는 게 책 자체가 워낙 길다. 책을 읽으면서 정리해 두고 싶어서 접어두었던 부분들을 정리하는 것 만으로도 분량이 만만치 않다. 그리고 신문에 실린 인터뷰는 레비와의 대화를 반도 소개하지 못했다. 1600자 분량 제한을 두고서 기사를 쓰는 건 쉬운 일이 아니다. 특히 버리기 싫은 얘기들 가운데 뭔가를 버려야만 할 때는 더더욱. 그러니 그 얘기들도 함께 소개할 예정이다. 결국 이번에도 다소 지루한 구글 이야기가 이어질 수밖에 없을 듯.
우선, 세계에서 가장 혁신적이어서 모든 걸 다 창조해내는 것 같은 구글이 남들에게 배워온 것들을 알게 됐다. 책을 읽기 전에는 몰랐던 것들인데 대표적인 게 20% 법칙이다. 많은 사람들이 '구글의 일하는 문화'로 아는 20%의 개인 업무 시간을 떼어내 자신을 위한 일에 활용하는 문화는 구글이 만든 게 아니다. 원래 3M과 HP(오늘날에는 전혀 혁신적이지 않아보이는)에서 도입했던 제도인데, 우리가 흔히 사용하는 포스트잇이 이 제도에서 태어난 3M의 히트상품이다.
구글이 자신들의 번역 기술을 자랑할 때 늘 하는 얘기가 바로 "우리는 외국어를 몰라도 그 언어를 번역한다"는 얘기다. 서로 다른 언어를 이해하고 두 언어 사이의 법칙을 조사해 번역기를 만드는 대신 구글은 동일한 내용을 두 가지 이상의 언어로 기술한 유엔 공식문서 같은 자료를 수집한다. 그리고 이런 문서의 문장과 단어를 서로 비교한다. 이렇게 비교한 데이터를 잔뜩 쌓아놓고 통계적으로 분석한다. 예를 들어 동일 문서의 같은 위치에서 "Hello"와 "안녕하세요"가 반복된 경우가 많다면 이 두 말이 동일한 뜻이라고 생각하는 방식이다. 구글은 그렇게 언어는 모르지만 번역은 할 수 있는 통계번역 시스템을 만들었다. 그런데 이게 구글의 독창적인 생각이 아니었다. 알고보니 1980년대 후반, IBM이 이렇게 번역기를 만들면 어떨까 하는 생각에 연구개발을 진행하던 기술이었다. 하지만 IBM은 연구를 더 이상 진행시키지 못했다. 이렇게 많은 공식문서를 비교하기가 너무 힘들었기 때문이다. 결국 월드와이드웹이 보편화돼 인터넷으로 수많은 언어의 공식문서를 긁어올 수 있게 된 구글의 시기에 와서야 통계번역을 위한 재료가 쌓인 셈이다. 당연한 얘기지만, 역시 구글은 인터넷이 만든 회사다.
초창기 구글 검색의 핵심 경쟁력은 '페이지 랭크'였다. 마치 학술논문에 많이 인용되는 논문이 중요한 논문인 것처럼 하이퍼링크가 많이 걸린 웹문서가 중요한 문서라는 논리였다. 래리 페이지와 세르게이 브린은 웹을 거대한 학술논문 모음집으로 본 덕분에 비슷한 시기의 다른 검색엔진을 압도했는데, 그 때 미국 동부에서도 그런 생각을 하는 사람이 있었다. MIT의 존 클라인버그였다. 그는 IBM 연구소에 취업했는데, 링크가 많이 걸린 웹페이지가 중요한 문서라는 생각을 해냈다. 1996년의 일이었으니 구글과 아주 비슷한 시기였다. 그는 당시 연구소를 찾아오는 IBM 임원들에게 클라인버그는 최대한 열심히 자신의 연구를 시연했다. 하지만 IBM 임원들은 "그건 우리가 할 일이 아니다"라고 말했다. 세계 최대의 거대 IT 기업이 '한낱' 웹페이지의 링크 따위나 연구하는 한가한 일을 할 이유가 없다는 뜻이었다. 1997년 클라인버그는 래리 페이지를 만났고, 1999년과 2000년에는 구글 입사제안도 받았다. 하지만 지금 그는 그냥 코넬대에서 연구를 하면서 훌륭한 학자로 살아가고 있다.
비슷한 시기 중국에서도 페이지 랭크 같은 생각을 하는 사람이 있었다. 학술논문이야말로 웹이라는 생각 말이다. 이 사람은 링크와 앵커텍스트(중요한 키워드)의 빈도로 연관성을 계산하는 검색방법을 만들어냈고 특허도 냈다. 이 기술은 '랭크덱스'라고 불렸다. 이 기술을 개발한 사람의 이름은 리옌홍, 그가 세운 회사가 중국 최대의 검색업체 바이두다. 페이지랭크 같은 기술의 전제 조건은 웹 전체를 색인으로 만들어 저장할 수 있는 거대한 시스템의 존재 유무다. 그래서 구글은 처음 페이지랭크를 만들고 나서 하드웨어 인프라 확장에 모든 신경을 썼다. 반면 클라인버그에겐 그런 자원이 없었다. 그래서 그는 포기했다. 리옌홍은 이 기술을 만들 땐 미국 다우존스에서 일했지만 미국 기업은 기술의 미래를 보지 못했다. 그래서 중국으로 돌아가 바이두를 세웠다. 당시 한국 기업들은 색인이 지나치게 생성되는 것을 제한하기 위해 '검색 등록'을 받았다. 야후 같은 기업의 방식이었다. 이런 방식은 국내에서는 지금도 계속되고 있다. 얼마전에 이 블로그도 한 번 검색 등록이 거부돼 색인 생성이 제한되기도 했고. 하여튼 오늘날 야후는 한 때 구글을 인수할 뻔 했다가 지금은 구글과 비교도 되지 않는 수준으로 찌그러들었다. 그리고 구글 직원이 CEO로 부임해 회사 부활을 이끌고 있다. 아이러니다.
구글은 창업자인 래리 페이지와 세르게이 브린이 투자자에게 복잡한 회계 문서 대신 쉬운 평단어로 작성한 편지를 쓴다. 구글이 어째서 특별한지를 일반인의 언어로 설명하는 것이다. 멋진 방식이지만 월스트리트 '전문가'들은 별로 좋아하지 않았다. 그래도 이건 실리콘밸리 방식이라서 인기를 끌었다. 얼마 전 페이스북도 상장을 앞두고 마크 저커버그가 '해커의 길'이라며 쉬운 단어로 된 편지를 써서 투자자들에게 보낼 정도였다. 래리 페이지와 마크 저커버그의 편지를 보면 공통점이 있다. "돈은 좀 덜 벌어도, 우리는 우리가 올바른 일이라고 생각하는 일을 하겠습니다." 생략된 말은 이렇다. "돈 벌라고 채근하지 말고, 우리한테 투자하면 손해를 볼 수도 있으니 알아서 위험을 감수하세요." 그런데 이 멋진 편지쓰기는 사실 실리콘밸리 방식이라기보다는 오마하 방식이었다. 워렌 버핏이 버크셔해서웨이 주주들에게 보내는 편지가 시작이었던 것이다. 컴퓨터 천재든, 투자의 천재든간에 천재들은 통한다.