여러분은 아침에 눈을 뜨거나 사무실에 출근하면 제일 먼저 하는 일이 무엇인가요?
사람마다 조금은 다르겠지만, 저는 플래너를 펼치고 오늘 해야 할 일들과 일정들을 생각해보고 간단한 메모를 한 뒤에는 거의 예외 없이 컴퓨터를 켜고, 이메일을 열어 [받은 편지함]을 살펴 봅니다. 

많은 분들이 스팸 메일이 하도 많아서 정상적인 메일도 못보고 놓치는 경우가 자주 생긴다고 하소연하시는데, 저는 메일은 기본적으로 [MS오피스]에서 제공하는 [MS아웃룩]을 이용하면서 [규칙] 설정 기능을 통해 스팸을 걸러내고, 메일의 주제나 발송처에 따라 카테고리를 트리구조로 세분하여 관리하기 때문에 하루에 보통 100통~200통이 넘는 메일을 수신하지만 스팸과 정품(?) 메일을 구분하기 위해 고생하는 일은 별로 없습니다.

간혹 메일 송신자의 이름이나 메일의 제목이 영문으로 불규칙하게 표기되어 있거나, 성인 취향의 키워드가 섞여 있어서 저도 모르게 [정크메일]함이나 [자동 이동] 필터링 규칙에 걸려 [지운편지함]으로 직행해버린 메일 중에 업무 관련 메일이 끼어 있는 경우가  발생하긴 하지만 크게 문제될 정도는 아닙니다.

다만 아웃룩의 [규칙] 설정 기능을 이용해서 메일을 자동 분류하고 카테고리별 폴더로 넣어버릴 경우에 문제가 되는 것은 정작 어떤 메일들이 왔는지를 한꺼번에 보여주지 않기 때문에, 해당 폴더들을 하나하나 따로 들여다보아야 한다는 점입니다. 그러다 보면 중요하고 읽어볼만한 메일을 뒤늦게 찾아보게 되는 경우가 종종 생깁니다. 아웃룩에서는 이런 단점을 보완하기 위해, [메일] 메뉴의 [즐겨찾기 폴더] 하단에 [읽지 않은 메일] 폴더를 제공합니다.


이는 수신한 메일을 내가 아직 읽지 않았을 경우, 미개봉 메일들의 목록만을 수신시각 순으로 몽땅 한꺼번에 보여주는 기능입니다. 하루에 한두 번 이 폴더를 열어보면 설령 자동분류 규칙에 따라 하위의 하위 폴더에 숨어 들어가 있는 경우라 하더라도 혹시 중요한 메일이 왔는데 미처 놓친 것이 없는지 한 눈에 다시 살펴볼 수 있지요.

이 기능을 이용하면 평소 즐겨보던 웹메일진 등을 제목만 추려서 본 다음 꼭 읽어야 할지 스킵해도 될지를 대충 판단할 수 있는데, 가끔씩 "아이쿠! 이런 기사를 놓쳤으면 아쉬웠겠는걸..." 하는 마음이 드는 메일들이 섞여 있습니다. 아래 첨부하는 메일도 제가 [다산연구소] 메일과 함께 즐겨 찾는 [과학 향기] 폴더로 오늘 아침에 배달되어 온 따끈한 메일입니다.

메일 발행호수가 이미 932호를 넘길 만큼 나름대로 역사가 쌓인 메일인데, 살펴보니까 이제는 YTN과 사이언스TV에서도 방영될 만큼 인기가 높아진 것 같네요. 최근에 마이크로소프트에서 빙(BING)이라는 새로운 지능형 검색엔진(결정엔진)을 내놓았다고 잠시 시끌했는데, 오늘 [과학향기] 에서는 세계적인 수학자이자 물리학자께서 개발했다는 또다른 개념의 검색엔진을 소개하고 있군요. 인터넷 검색엔진의 진화ㅡ 과연 어디가 끝일까요?



Home > 과학향기 기사보기 > SCI-FUSION

신개념 검색엔진 울프럼알파, 구글에 도전장
[제 932 호/2009-06-24]
인터넷 검색엔진 시장의 절대 강자는 단연 구글(Google)이다. 미국의 닐슨 온라인에 따르면 미국인들은 인터넷에서 검색 100건 중 64건을 구글을 통해 하고 있는 것으로 나타났다. 시장조사기관 콤스코어는 전 세계 검색엔진 시장에서 지난 4월 구글의 점유율이 무려 81.4%에 달한다고 발표했다. 서비스를 시작한 지 불과 10년만의 일이다.

1998년 구글은 검색엔진의 새로운 세대를 열며 화려하게 등장했다. 당시 야후가 인터넷에서 디렉터리 검색 엔진을 주도하고 있었다. 사람이 좋은 사이트를 선별하여 정리하는 이 방식은 정보량이 많아지면서 관리하는데 한계에 다다랐다. 또한 알타비스타처럼 키워드 매칭(keyword matching)을 기반으로 자동화된 검색엔진이 등장했지만 사용자들의 호응을 얻지 못했다. 키워드만 일치하면 무작위로 펼쳐놓는 수 백 페이지의 쓰레기 검색 결과(Junk results) 때문이었다.

이러한 시대의 변화를 절묘하게 파고든 것이 구글이었다. 당시 스탠포드 대학원생인 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin) 두 사람은 사용자가 원하는 내용과 가장 근접한 결과부터 보여주는 검색엔진을 생각해 냈다.

이를 위해 그들은 웹 페이지를 생산해내는 사람들과 사용자들이 웹 페이지에 접근하는 행태를 분석해 자동으로 랭킹이 계산되는 구조를 만들어 냈다. 해당 페이지의 중요도는 다른 웹페이지에서 해당 페이지를 가리키는 인바운드 링크(inbound link)의 수로 결정되었다. 이는 중요한 논문일수록 인용하는 횟수가 높다는 원리를 응용한 것이다. 이들의 아이디어는 적중했다.

구글은 야후의 디렉터리 엔진과는 비교할 수 없을 정도로 훨씬 더 많은 데이터들을 검색했다. 하지만 자동화된 랭킹을 부여하기 때문에 대부분의 사용자들은 불과 1~2페이지 안에 자신이 원하는 정보를 찾았다. 사람들은 환호했고, 탁월한 검색 알고리즘에 대규모 투자가 이어졌다. 기업을 공개하고 서버에 대한 엄청난 투자가 이뤄지면서 ‘인공지능에 의한 단순 웹 검색으로는 구글을 따라갈 서비스가 나오기가 힘들다’는 평판을 얻었다. 일단 끌어오는 웹페이지의 수가 다르니 게임이 될 리가 없었다.

그런데 지난달 서비스를 시작한 검색엔진 울프럼알파(www.wolframalpha.com)는 색다른 검색 서비스로 눈길을 끌고 있다. 이 검색엔진은 스티븐 울프럼(Stephen Wolfram· 50) 박사가 개발했다는 이유로 서비스 시작 전부터 세간의 관심을 모았다. 그는 이미 16세 때 입자 물리학에 대한 논문을 썼고, 17세 때 옥스퍼드에 입학해 물리학 분야의 세계적인 논문을 발표하기 시작했다. 또한 20세 때 미국 캘리포니아 공과대학(Caltech)에서 박사학위와 함께 교수로 임용되어 천재로 알려진 인물이기도 하다.

그의 손을 거처 탄생한 검색엔진은 구글과는 전혀 다른 접근방식을 택하고 있다. 구글이 수집한 정보들을 나열하는 방식이라면, 울프럼알파는 정보를 재분석한 지능형 답변을 제공한다. 즉 창에 검색어를 넣었을 때 구글은 답이 있을 법한 관련 사이트를 수 만개 검색한 다음 이를 중요도 순서로 나열해 준다. 반면 울프럼알파는 수집해 놓은 방대한 정보를 활용해 자신이 직접 간략한 형태의 답을 만들어 제공한다.

예를 들어 ‘서울의 날씨’을 검색창에 넣으면 구글은 날씨 정보를 제공하는 다양한 웹사이트들을 나열한다. 반면 울프럼알파는 기온, 풍속, 기상 조건 등을 일목요연한 표로 보여줄 뿐만 아니라, 과거의 날씨를 그래프로 만들어 시각적으로 제공하기까지 한다. 울프램 박사가 자신의 검색엔진에 대해 “전통적 검색엔진이 아니라 연산능력을 갖춘 지식엔진”이라고 자평하는 것도 이 때문이다.

실제로 울프럼알파는 천재 물리학자의 작품답게 복잡한 수학 계산과 통계, 차트처리에서 탁월한 역량을 자랑한다. 구글 검색에서 ‘$250 + 15%’는 별 의미가 없다고 판단하지만, 울프럼알파에서는 250달러와 이의 15%인 37.5달러를 합한 287.5달러를 표시해 준다. ‘250 USD + 100,000KRW’만 입력해도 합을 414,800원으로 한국 원화로 환산하여 알려줄 수 있는 것도 울프럼알파만이 갖고 있는 강점이다. 검색창에 20inch(인치)를 치면 feet, cm, mm, m 등 다른 단위로 변환된 값은 물론 폭, 너비, 전자기 복사 파장 등과 비교했을 때의 값도 함께 검색되는 서비스도 제공하고 있다.

<울프럼 알파에서 250달러와 10만원을 더한 결과. 원화와 달러는 물론 엔화, 유로화, 위완화와
홍콩달러 등 다양한 화폐 단위로 환산한 값을 보여준다.>

이는 울프럼 박사가 1988년 선보인 매스매티카(Mathematica)에 기반을 둔 검색엔진이기 때문이다. 수학, 물리학과 관련해서는 전 세계적으로 가장 유명한 소프트웨어의 하나인 매스매티가는 약간의 과장을 섞자면 수학에 대해서는 모든 것을 처리해 주는 소프트웨어라고 할 수 있다.

매스매티카는 수치계산(numerical computation), 기호계산(symbolic calculation), 그래픽 처리(graphical operation) 등의 연산이 가능하다. 특히 기호 계산은 가장 큰 강점이다. 간단히 말하자면 매스매티카는 우리가 연필로 종이 위에 계산하는 것과 같은 결과(가령 분수식의 약분, 인수분해와 부정적분 등)를 제공하는 것이다.

이번에 서비스를 시작한 울프럼알파는 이런 매스매티카의 프로그래밍을 대중화한 것이다. 실제로 울프럼알파는 직접 답변을 제공하기 위해 세계에서 44번째로 빠른 슈퍼컴퓨터를 비롯해 많은 컴퓨터를 돌리고 있다.

그렇다면 울프럼알파가 구글의 검색분야에서의 절대적인 지위를 위협할 수 있을까? 전문가들의 평가는 그리 호의적이지 않다. 새로운 개념의 검색엔진임에는 틀림이 없지만 약점도 많다. 우선 울프럼알파는 검색 결과로 가는 길을 보여주는 게 아니라 검색한 결과를 재구성해 보여주기 때문에 상대적으로 반응 속도가 느리다. 드라마 속 등장인물 등을 검색하면 검색 결과를 내놓지 못하는 경우도 있다. 또 아직까지 다국어를 지원하지 않는다는 것도 단점으로 꼽힌다.

게다가 구글의 반격이 만만치 않다. 실제로 구글은 최근 검색 결과에 관련 도표를 제공하고, 많은 양의 결과를 특정 범위를 지정해 볼 수 있는 서치 옵션 기능을 더하는 등 서비스를 보강하고 있다.

지난 10년간 끊임없이 진화발전하면서 사용자들의 호감을 얻어온 구글의 평판은 울프럼알파가 넘기 힘든 장벽이 될 것이지만, 울프럼알파의 서비스로 인해 검색엔진 서비스에 새로운 바람이 일고 있는 것은 분명하다. 한국의 포털사이트 운영회사들은 이런 변화를 어떻게 바라보고 있을까?

글 : 유상연 과학칼럼니스트

정보(전산) ; 통신 ; 전기/전자 ; 수학(통계)
구글; 검색엔진; 울프럼알파
Posted by 렛츠고
,