과연 왓슨 때문에 시리가 조심해야 할까?

Siri Beware: IBM Envisions Watson for Mobile Business – Businessweek.
IBM이 만든 인공지능 컴퓨터 왓슨이 2015년까지 모바일에서 사용되는 걸 목표로 하고 있다는 얘기다. 따지고보면 왓슨은 오늘날의 제록스 PARC 같은 곳이 되어가고 있는데,(본인들은 이렇게 되면 큰일나기 때문에 계속 부인하지만) 그 이유는 IBM이 자랑하는 요크타운과 호손의 왓슨연구소가 계속해서 상업화 가능성은 낮지만 연구 자체는 매력적인 기술들을 만들어내고 있기 때문이다.

사실 왓슨은 전에 이 블로그에서 다룬 바 있는 주제고, 나도 왓슨이 제퍼디에서 인간을 묵사발내기 전에 연습시합 준비하던 모습을 뉴욕에 가서 직접 보기도 했다. 그리고 이 기술이 얼마나 대단한지, 왓슨의 가능성이 얼마나 엄청난지에 대해서도 강조했다. 문제는 바로 그 대단함 때문에 모바일로 가겠다는 왓슨의 방향이 아무리 생각해도 이상해 보인다는 데 있다.

왓슨의 특징은 독립형 컴퓨터라는데 있었다. 네트워크에 연결되지 않은 채 컴퓨팅 파워를 엄청나게 사용해 마치 사람이 그렇게 하는 것처럼 순간적인 판단을 내린다. 또 판단에 이르는 알고리듬도 과거와는 전혀 다른 방식으로 설계돼 정답 대신 수많은 가능성을 두고 확률적 선택을 한다. 간단히 말하면 긴가민가 싶을 때 사람처럼 답을 ‘찍는다’는 게 왓슨이 훌륭한 점이었다.

이게 서비스에 응용되기 시작하면서 좀 달라졌다. 퀴즈쇼에 등장하는 왓슨은 정말 인간을 한없이 닮으려고 노력했지만, 금융회사나 보험회사, 의료기관에 사용되기 시작하면서 왓슨은 확률을 제시만 할 뿐 찍는 능력은 더 이상 강조하지 않게 됐다. 기계가 직관적으로 찍어준 결과를 믿을 인간은 없는 노릇이니까. 그래서 이 놀라운 컴퓨터는 그냥 좀 똑똑한 인공지능을 갖춘 평범한 지식 보조 기구가 됐는데, 이게 모바일로 온다는 얘기는 왓슨의 훌륭함을 더 줄이고, 평범함을 더 늘리겠다는 뜻이다. 실제로 왓슨은 처리를 서버에서 하고, 결과를 모바일로 전송해주는 구글 검색엔진이나 애플 시리의 방식을 그대로 따라한다.

문제는 서비스 레벨에서는 왓슨의 장점이 사라진다는 데 있다. 구글은 모두가 알다시피 어마어마하게 방대한 색인을 실시간에 가까운 속도로 만들어내면서 동시에 이를 검색해내는 게 핵심기술이다. 정확한 답을 찾기 위한 알고리듬이야 왓슨이 구글에 뒤질 게 없다고 쳐도, 이런 색인 및 검색 스피드에서 IBM은 경험이 없다. 시리의 장점은 우리 모두가 알고 있듯, 사람처럼 느껴질 정도로 자연스러운 자연어 처리 능력이다. 심지어 시리는 농담까지 던진다. 말도 안 되는 수많은 입력을 하루에도 수없이 쏟아내는 아이폰 사용자들이 이런 능력을 시리에게 학습시킨다. 게다가 시리의 시작은 IBM보다 훨씬 앞서서 음성 관련 기술을 만들어오던 스탠포드연구소(SRI). 동부의 천재들이 학습 기능에 방점을 찍는 동안 서부의 괴짜들은 자연스러운 기계를 만드는데 열을 올렸다. 그리고 사람들은 알고리듬보다 UI에 더 열광하게 마련이다.

왓슨이 성공하면 좋겠지만, 왜 IBM은 스스로의 장점을 강화하는 대신 경쟁자들이 만들어 놓은 규칙으로 운영되는 링 위에 올라가는지 알다가도 모를 일이다. 생각해 보면 이 회사는 소비자 대상 서비스를 만들 때마다 판판이 깨졌던 듯. 차라리 왓슨을 구글과 애플에 라이선싱하는 게 어떨까.

스스로 학습하고 생각하는 컴퓨터, 왓슨.


2010년 스페이스 오디세이 中, HAL이 죽음을 맞이하는 장면

“데이지, 데이지. 뭘 어찌 해야 할지 대답을 들려줘. 나는 반쯤 미쳐버렸어. 당신을 사랑하니까….” 스탠리 큐브릭 감독이 1968년 만든 영화 ‘2001년 스페이스 오디세이’에서 인공지능 컴퓨터 할(HAL)은 주인공 데이브에게 애원합니다. 데이브가 할의 모듈(부품)을 하나씩 뽑으며 시스템을 중단시켜 나가자 “그만둬요, 데이브”라며 점점 자신이 처음 만들어지던 초기 상태로 퇴행해 일종의 ‘어린 시절 부르던 노래’를 부르게 된 거죠.

이 노래의 이름은 ‘데이지 벨’입니다. 1961년 미국 IBM이 만든 컴퓨터 ‘IBM 7094’가 음성과 반주를 합성해 실제로 불렀던 노래였죠. 이는 ‘컴퓨터가 부른 최초의 노래’로 기록돼 있습니다. 할의 기원이 IBM에 있다는 은유입니다. 뿐만 아니라 HAL이라는 이름 각 글자의 바로 다음에 오는 알파벳을 모으면 ‘IBM’이 됩니다. 1960년대의 IBM은 그렇게 ‘두려운 신기술’을 가진 첨단 기업이었습니다.


IBM 7094가 부르는 데이지 벨

하지만 이런 놀라운 컴퓨터를 만들어낸 IBM의 신화는 그동안 별로 주목받지 못했습니다. 1970년대 말 스티브 잡스가 개인용 컴퓨터인 ‘애플II’를 만들어 새로 생긴 시장을 휩쓸자 그때까지도 컴퓨터를 개인이 쓸 이유가 없다고 생각하던 IBM은 뒤늦게 이 시장에 뛰어듭니다. 그 뒤에는 운영체제(OS) 소프트웨어라는 건 그냥 ‘아웃소싱’하면 되는 거라고 안이하게 생각하다가 결국 MS-DOS를 IBM에게 판매한 마이크로소프트의 젊은 빌 게이츠에게 뒤통수를 맞은 뒤 개인용 컴퓨터 시장에서 철수합니다.

그 뒤 IBM은 조용해집니다. 주력 사업은 개인용 컴퓨터 판매 대신 기업에 대한 IT 컨설팅과 메인프레임이라는 기업용 컴퓨터 판매로 바뀝니다. 자연스레 일반 소비자의 시선에서 사라지게 됐습니다. 하지만 지난해 IBM은 엉뚱한 곳에서 다시 주목을 받습니다. 그들이 모두가 잊고 있던 할을 현실 세계로 불러낸 덕분입니다. 스스로 학습하고 생각하고 문제의 답을 찾아내는 인공지능 컴퓨터가 IBM에 의해 마침내 탄생한 셈입니다. 단지 이름만 ‘왓슨’으로 바뀌었을 뿐 왓슨은 할과 그다지 다르지 않아 보였습니다.

지난해 미국 뉴욕주 IBM 왓슨연구소에서 이 기계를 직접 취재한 일이 있습니다. ‘기계’라고 부르려니 약간 미안하네요. 당시 연구원 가운데 누구도 왓슨을 얘기할 때 사물을 뜻하는 ‘그것(it)’이라 부르지 않았거든요. 왓슨은 이 연구소에서 사람처럼 이름으로 불리거나 아니면 ‘그(he)’라고 불렸습니다. 약간 섬찟했지만 이런 호칭을 이상하게 여긴 건 오직 저뿐이었죠.

당시 IBM은 왓슨을 ‘제퍼디’라는 유명 TV 퀴즈쇼에 출연시키기 위해 연습시합을 벌이던 중이었습니다. 그리고 왓슨은 드디어 14일(현지시간) 제퍼디쇼에 출연합니다. 상대는 제퍼디쇼에서 74회 우승한 역대 최다 우승자 켄 제닝스, 그리고 ‘왕중왕’전에서 제닝스를 꺾은 역대 최다 상금 수상자 브래드 러터였습니다. 첫 대결에서 왓슨은 러터와 함께 5000달러를 벌어 공동1위가 됐고 제닝스는 2000달러밖에 못 벌었습니다. 이 대결은 사흘 동안 이어질 예정입니다.

그저 흥밋거리로 치부하기에는 왓슨의 의미는 생각보다 큽니다. 예전 기사에도 썼지만 정답을 찾아내기 위해 기존의 컴퓨터는 인터넷의 지식을 이용합니다. 말하자면 이런 방식의 인공지능은 교과서를 펼쳐놓고 ‘오픈북’ 시험을 치는 것과 유사합니다. 예를 들어 대표적인 인터넷 인공지능에 해당하는 구글은 직접 정답을 찾아주지는 않지만 사람이 질문에 해당하는 검색어를 입력하면 가장 관련있다고 스스로 판단한 결과를 맨 위에 보여준다는 점에서 왓슨과 유사합니다. 하지만 구글은 인터넷을 검색하죠.

반면 왓슨은 독립된 개체입니다. 네트워크에 연결돼 있지 않은 채 새로 받아들이는 모든 정보를 학습하면서 지식을 키웁니다. 왓슨은 영화를 보고, 신문을 읽고, 스캐닝된 책을 탐독합니다. 그리고 이렇게 받아들이는 정보를 쌓아두는 게 아니라 마치 사람이 지식을 구조화하듯 통계적 분류를 통해 지식을 재분류하고 관련 지식을 모읍니다. 질문에 빨리 답하기 위해, 즉 사람처럼 빠른 판단을 하기 위해서죠. 기계가 매년 빠른 속도로 소형화되면서 동시에 성능이 높아진다는 걸 감안하면 왓슨은 몇 년 뒤 우리 옆에 다가와 스스로 생각하고 말을 거는 존재가 될지도 모릅니다.

사람들은 왓슨을 보면서 영화 터미네이터에 등장하는 ‘스카이넷’을 떠올립니다. 하지만 제 생각에는 약간 잘못된 비유가 아닌가 싶습니다. 터미네이터 시리즈에 따르면 스카이넷은 쉽게 파괴되지 않는 네트워크형 컴퓨터입니다. 한 무더기의 데이터센터를 폭파시켜도 네트워크를 통해 다른 곳의 데이터센터에서 복원된다는 점에서 스카이넷은 오히려 거대한 클라우드 컴퓨터인 구글에 가깝죠. 반면 왓슨은 사람처럼 생각하고 존재하며 물리적인 이동도 가능한 개별적 존재입니다. 스카이넷이라기보다는 미래의 인류가 다시 프로그래밍해 어린 시절의 존 코너를 지키기 위해 과거로 돌려보낸 ‘터미네이터2’에 등장하는 아놀드 슈왈제네거에 더 가깝습니다.

그렇다고 기계가 지능을 갖고 사람과 대립하는 식의 미래까지 상상하는 건 아닙니다. 아직 우리의 기술은 제약이 많습니다. 설악산 대청봉 등반이 목표라고 친다면 이제 겨우 속초에 도착한 수준이라고 할 정도죠. 왓슨연구소에서 취재를 도와줬던 에릭 브라운 박사는 “왓슨이 사람의 두뇌를 흉내내 고안된 프로그램이라는 건 맞지만 사람과 비교하면 아직 부족한 부분이 많다”고 설명했습니다. 예를 들어 사람은 수많은 정보를 의식적으로 받아들이지 않아도 무의식에 저장해 둡니다. 그리고 무심코 흘려보냈던 정보를 필요한 순간에 놀랍게 끄집어내죠. 우리는 그 정보를 기억하고 있었다는 사실도 모르는 경우가 많습니다. 하지만 이는 인간의 뇌에서는 일상적으로 일어나는 일입니다. 왓슨은 이런 일을 할 수 없습니다. 왓슨은 받아들여야 할 정보를 철저히 의식적으로 선택한 뒤 한 번 선택된 정보는 100% 흡수합니다. 사람의 뇌는 끝을 모르는 용량으로 엄청난 지식을 무의식에 옮긴 뒤 이를 순간적으로 꺼내어 활용하지만 왓슨의 저장공간에는 명확한 물리적 한계가 있고 이를 제 때 꺼내어 쓰기 위해 엄청난 처리속도의 프로세서를 쓰면서도 수 초의 처리 시간이 필요해지는 것이죠. 다만 왓슨이 사람보다 나은 점도 있습니다. 사람의 기억은 수없이 왜곡되는 과정을 거칩니다. ‘아는 만큼 보이기’ 때문이죠. 또 번득이는 영감이 문제를 해결하는 주요 능력이긴 하지만 떠오르지 않는 영감을 며칠이고, 몇달이고 기다려 본 사람들은 차라리 왓슨처럼 기억의 저장장치를 하나하나 훑어보고 싶어질 지도 모릅니다. 왓슨은 건망증을 모르니까요.

참, 여담인데, 이 모든 왓슨 이벤트로 가장 큰 덕을 본 사람은 누구일까요? 왓슨을 개발한 완슨연구소의 데이빗 페루치 박사? 갑자기 제퍼디쇼에 다시 불려나온 켄 제닝스와 브래드 러터? IBM CEO인 새뮤얼 팔미사노? IBM 사람들은 왓슨 이벤트를 만들어낸 PR팀의 마이클 로런이 가장 덕을 본 게 아닐까 생각하는 것 같습니다. 원래 왓슨은 페루치 박사팀이 10년 정도 연구해 오던 인공지능 프로젝트 가운데 하나였거든요. 이걸 제퍼디쇼에 내보내자고 아이디어를 낸 사람이 바로 로런이었다고 합니다. ‘스타’가 된 셈이죠.