길에게 세상구경을 물어본다./도둑질하기

구글신은 모든 것을 알고 있다? 남들 몰래 우리끼리만 놀자, 폐쇄형 SNS 대세

草霧 2013. 12. 17. 11:25

 

 

 

 

 

구글신은 모든 것을 알고 있다?

정하웅 카이스트 석좌교수


‘원자의 구성입자와 그것들의 상호작용’에 관한 연구로 1969년에 노벨물리학상을 수상한 머리 겔만(Murray Gell-Mann) 박사는 복잡계(Complex Systems)에 대한 연구가 미래에 가장 촉망받는 분야이며 관심을 가지고 연구해야 할 분야라고 주장한다. 겔만 박사는 현재 미국 산타페연구소에 복잡계에 대한 연구팀을 이끌고 있다. 그들의 연구 대상은 정치학, 사회학, 경제학, 생물학, 물리학, 컴퓨터공학 등등 학문의 모든 분야에 걸쳐 있다고 말할 정도로 다양하다. 그럼 이렇듯 많은 사람들이 중요하게 말하고 있으며, 실제로 다양한 분야에서 연구가 이루어지고 있는 복잡계란 과연 무엇일까?

 흔히 인용되는 복잡계의 정의도 그 적용 분야만큼이나 다양하지만 공통요소만 정리하자면, 복잡계란 다양하고 많은 수의 구성요소들이 서로간의 상호작용에 의해서 구성요소 하나하나의 특성과는 사뭇 다른 새로운 복잡한 현상이지만, 나름대로의 질서를 보여주는 시스템이라고 할 수 있다.

 사실 우리 주변을 둘러보면 거의 모든 것들은 다양하고 수많은 구성요소로 이루어진 복잡계이다. 예를 들어 많은 사람들이 서로의 이해관계에 의해 얽혀 있는 사회, 우리 몸속에서 여러 종류의 물질들이 여러 가지의 생화학반응을 통해 에너지를 만들어 우리를 살아 있게 만드는 생명현상, 또 수많은 컴퓨터들이 여러 가지의 통신수단을 통해 연결되어 있는 인터넷 등이 복잡계의 대표적인 예라 할 수 있다. 신경세포들이 연결되어 구성하는 뇌(Brain) 또한 예외는 아니다. 이렇듯 다양한 복잡계에 대한 연구는 새로운 밀레니엄을 맞아 여러 가지 방법을 통해 활발히 연구되고 있다. 최근 들어 주목받는 새로운 방법론은 네트워크 과학인데, 네트워크 과학이란 복잡계의 구성요소들과 그들 간의 상호작용을 점과 선으로 단순화시켜서, 네트워크 (또는 그래프)로 바꾸어 연구하는 것이다. 특히나 일련의 연구를 통해 전혀 다른 분야에서 발견되는 네트워크들의 모양이 신기할 정도로 거의 똑같다는 것이 알려지면서, 자연스럽게 다양한 연구 대상의 공통점에 대한 관심이 늘어났고, 타학문 분야와의 접촉도 빈번해졌는데 결국, 다양한 학문 분야에 펼쳐져 있던 복잡계의 연구 대상들이 간단히 “네트워크”라는 하나의 주제로 통일되면서, 자연스럽게 학제간 연구로 발전하고 있는 것이다.

 
 ‘여섯 단계 분리(Six degrees of separation)’라는 말이 있다. 그것은 온 세상 사람들을 5명만 거치면 다 알 수 있다는 것을 의미한다. 지구의 인구가 60억 명을 넘어섰는데 그 많은 사람들을 5명만 거치면 다 알 수 있는 좁은 세상이라는 것은 정말 놀라울 따름이다. 이는 1967년 하버드대학교 사회학과 스탠리 밀그램(Stanley Milgram) 교수의 편지전달 실험을 통해 처음 밝혀졌는데 1920년대에 헝가리의 작가 커린시의 소설 “연쇄”를 통해 처음 등장했던 ‘여섯 단계 분리’가 처음으로 입증된 셈이다. 이렇듯 여섯 단계의 분리는 엄연히 우리가 살고 있는 세상의 특징으로, 그 이후에도 여러 가지 간접적인 실험을 통해서도 사실임이 계속 확인되고 있다.[3] 우리가 살고 있는 사회는 복잡해 보이지만 사람들이 서로 얽혀있는 네트워크로 해석될 수 있는 결국 좁은 세상 네트워크로 이해할 수 있다. 그럼 좁은 세상이라는 개념이 단지 우리가 살고 있는 사회에만 적용되는 것일까? 최근 들어 이러한 질문에 관한 많은 연구가 진행되면서, 놀랍게도 좁은 세상 현상이 사회만이 아닌 여러 다른 분야에서도 발견되고 있다. 좁은 세상 현상의 대표적인 예를 좀 더 살펴보자.

 

  네트워크란 말이 보편적으로 쓰이게 된 데는 인터넷의 공로가 매우 크다. 그렇기 때문에 인터넷상의 가상세계인 ‘www’(World-Wide-Web)은 네트워크 연구에서 빼놓을 수 없는 대상이다. 과연 지구상에 몇 개의 웹페이지가 있을까? 1999년 미국의 뉴욕 근처에 위치한 NEC연구소의 리 자일스(C. Lee Giles) 라는 과학자는 전 세계 웹페이지의 개수를 약 10억 개로 추산했다. 물론 ‘www’의 기하급수적인 증가를 생각하면 현재는 아마도 100억 개 이상일 것으로 쉽게 추측할 수 있다. (2005년 Google이 검색하고 있는 웹페이지만 해도 80억 개를 넘어섰다고 알려져 있다). 하지만 정확한 숫자는 아무도 모르는 것이 현실이다. 논의의 편의상 전체 웹페이지의 숫자를 10억 개로 한정해보자. 그렇다면 10억 개의 홈페이지는 웹서핑을 통해 몇 단계를 거치면 서로 도달할 수 있을까? 1999년 필자의 연구 결과에 따르면 10억 개의 홈페이지는 단지 19번의 마우스 클릭을 통하면 모두 도달할 수 있다. 물론 어느 웹사이트는 2번의 클릭을 통해 다가갈 수 있고, 어떤 웹사이트는 60번의 클릭을 통해 다가갈 수 있다. 그러나 평균적으로 19번이면 웬만한 웹사이트는 도달할 수 있는 좁은 세상이라는 것이 연구 결과의 핵심이다.[4] 60억의 인구를 5명만 거치면 다 알게 된다는 것과 비교하면 다소 비효율적이라고 생각할 수 있다. 그러나 평균적으로 한 사람이 일생 동안 3천 명 정도를 알고 지내는 반면 한 홈페이지에 연결된 링크 수는 평균적으로 7개 정도로 매우 적다. 따라서 19번의 링크로 웬만한 웹사이트에 도달할 수 있다는 것은 상당히 놀라운 사실이다. 아무튼 6명을 통해서나 19번의 클릭을 통해서나 모든 사람이나 모든 웹사이트에 다가갈 수 있다는 사실에서 보듯이, 세상은 참으로 좁다. 이러한 좁은 세상 효과 때문에 세상에서 일어나는 일들은 주변 사람들이나 웹을 통해 손쉽게 다가갈 수 있다. 좁은 세상은 비단 인간사회와 인터넷상에서만 찾아볼 수 있는 것은 아니다. 흥미롭게도 박테리아와 같은 아주 작은 세포 안에서도 좁은 세상이 펼쳐지고 있었다. 연구 결과에 따르면, 박테리아와 같은 단핵생물이나 그보다 고등한 진핵생물 할 것 없이 생물체의 신진대사 네트워크의 거리는 그 생물체를 구성하고 있는 화합물의 개수에 관계없이 짧은 거리로 일정했다.[5] 결국 세포 내 신진대사 네트워크도 좁은 세상인 셈이다. 이와 같은 사실은 생명체가 생존하기 위해서 여러 가지 화합물을 만드는 경로를 짧게 유지해서 빠른 시간 내에 필요한 화합물들을 만들 수 있어야 하기 때문이다. 이러한 짧은 경로의 좁은 세상 네트워크를 갖지 못한 생명체는 적응력이 떨어져 자연도태 됐을 것이다. 이처럼 우리가 살고 있는 거의 모든 세상은 매우 좁으며 알게 모르게 서로 링크되어있는 네트워크이다. 이러한 좁은 세상은 어떻게 생겼으며 왜 만들어지는 것일까? 이러한 좁은 세상에서는 무슨 흥미로운 일들이 벌어지고 있을까? 좀 더 깊이 들어가 보자.

 

 앞서 소개한 바와 같이, 우리가 살고 있는 사회를 단순화시키면 사람을 점(點)으로 그 인맥을 선(線)으로 나타낼 수 있다. 이것은 바둑판위에 교차되어있는 선과 점들 유사하다. 그러나 바둑판처럼 생긴 네트워크는 결코 좁은 세상이 되지 못한다. 예를 들어 한쪽 구석에 있는 점 A에서 반대편 모서리에 있는 점 B로 간다고 생각해보자. 이 경우 바둑판의 많은 점들을 거쳐 가야 하므로 짧은 거리에 의해 연결될 수가 없다. 따라서 바둑판 모양의 네트워크는 우리의 좁은 세상을 잘 나타내주지 못한다. 그렇다면 실제 네트워크는 어떻게 생겼을까? 실제 네트워크의 모양을 알아보기 위해 1999년 필자는 미국 노트르담대학교의 라즐로 바라바시(Albert-Laszlo Barabasi) 교수와 함께 다음과 같은 실험을 주도했다. 그 당시 필자는 월드와이드웹을 자동으로 돌아다니며 정보를 모으는 프로그램인 로봇(또는 크롤러, crawler)을 만들어 월드와이드웹의 연결 지도를 얻었다. 즉 각 웹페이지가 어떤 웹페이지와 어떻게 연결(하이퍼링크)되는지를 알아낸 것이다. 월드와이드웹의 지도를 통해 먼저 웹페이지가 평균적으로 19번의 링크만으로 서로 연결돼 있는 좁은 세상이라는 점을 연구팀은 알아냈다. 하지만 더 재미있는 점은 실제 네트워크가 어떻게 생겼는지를 알 수 있었다는 것이다. 실제 네트워크인 월드와이드웹의 지도를 손에 넣었기 때문이었다.[4] 연구를 시작하기 전 연구팀은 기존의 그래프 이론인 무작위적 네트워크 이론의 지배를 받았던 탓에 웹페이지들이 모두 비슷한 갯수의 연결선을 가질 것이라고 예상했다.[6] 아마 독자들도 웹페이지들에 링크된 다른 웹페이지의 개수가 대부분 비슷할 것이라고 예상하기 쉬울 것이다. 그러나 결과는 놀랍게도 각 점들에 연결된 연결수의 분포함수인 “연결선 분포함수”가 포아송(Poisson) 분포가 아닌 멱함수(power-law)라고 불리는 새로운 분포함수를 따르는 것으로 밝혀졌다. 멱함수 분포는 평균 주위에 정점(頂點)이 없고 계속 감소하는 모양을 갖는다(P(k)~k-γ). 따라서 멱함수 분포를 따르는 네트워크에서는 연결선이 적은 점들이 대부분이지만, 동시에 연결선이 많은 점, 즉 허브들도 적지만 함께 존재한다. 이러한 월드와이드웹의 연결구조는 멱함수 법칙을 따르는 척도 없는 네트워크라 불린다. 더욱 재미있는 점은 척도 없는 네트워크의 구조가 월드와이드웹뿐만 아니라, 여러 네트워크에서 공통적으로 발견된다는 것이다. 네트워크에 관한 연구가 진행되면서, 주변에서 쉽게 발견할 수 있는 여러 가지 네트워크의 예들이 멱함수 법칙을 따르는 척도 없는 네트워크라는 점이 밝혀지고 있다. 우리 몸속의 신진대사망, 할리우드 배우들의 공동출연작 연결을 고려한 사회적 네트워크, 그리고 실제 물리적인 인터넷 연결망도 그랬다. 결국 1959년 이후 네트워크의 구조에 관해 우리의 사고를 지배했던 무작위 네트워크이론은 막을 내리고 좁은 세상을 설명할 수 있는 새로운 척도 없는 네트워크라는 이론이 탄생한 것이다. 

 

 코넬 대학의 스트로가츠(Steven Strogatz) 교수에 따르면, 매 10년마다 알파벳 ‘C’로 시작하는 중요한 이론들이 나타났다고 한다. 1960년대에는 사이버네틱스(Cybernetics), 1970년대에는 카타스트로피 이론(Catastrophe theory), 1980년대에는 혼돈 이론(Chaos theory), 그리고 1990년대에는 복잡계 이론(Complexity Theory)이 그것이라고 했다. 물론 약간은 억지스러운 말이긴 하지만, 최근 여기저기서 나타나고 있는 복잡계에 관한 폭발적인 관심으로 미루어볼 때, 꼭 틀린 말은 아닌 듯하다. 사실 복잡계에 대한 연구는 영국의 저명한 물리학자들이 20세기를 마무리하며 꼽은 물리학의 10대 미해결 연구과제 중 하나이다. 또한 미국 과학재단(NSF)이 선정한 4대 주요 연구과제 중 하나로 꼽힐 만큼 중요한 연구 분야임에 틀림없다. 경우에 따라서는 연구 분야라고 하기보다는 그 다양한 응용 및 적용 분야로 말미암아 여러 학문 분야에서의 새로운 패러다임으로서 방법론적인 측면이 더 강조되기도 한다. 그 중에서도 지금까지 살펴본 ‘복잡계 네트워크 이론’은 복잡계를 이해하는 새로운 방법론으로 받아들여지고 있으며, 다양한 학문분야에서 주목을 받고 있다. 지금까지 공학자이건 물리학자이건 생물학자이건 그들은 연구대상을 잘게 쪼개서 분석을 하는데 모든 노력을 경주해왔다. 이러한 환원주의적 접근 방식은 19~20세기에 걸쳐 자연이나 사회를 이해하는 데 크게 기여했다. 하지만 잘게 쪼개진 부분에 관한 수많은 정보, 즉 생태계를 이루고 있는 생물들이나 경제활동에 참가하는 개개인에 관한 정보가 아무리 많다고 해도, 전체로 모일 때 생기는 특이한 현상들을 설명해주지는 못했다. 그들은 부분이 서로 복잡한 상호작용으로 연결되어 전체라는 네트워크를 만들어낸다는 생각을 하지 못했다. 이들에게 절실히 필요한 것은 복잡한 네트워크의 구조와 작동원리를 정확히 꿰뚫어볼 수 있는 통찰력이다. 물론 구체적인 구성요소는 각 연구대상마다 판이하게 다르다. 하지만 전체적인 큰 그림으로 본다면 네트워크라는 연결구조에 대한 이해가 먼저 있어야 한다. 네트워크 과학은 각 구성성분의 세부사항 같은 가정과 추측을 최대한 줄이고, 그들의 전체적인 연결구조와 작동원리를 파악하여 제한적이나마 신뢰할 수 있는 결과를 얻어낼 것이다. 네트워크 과학은 이렇게 우리가 보고자 하는 전체를 올바른 방향으로 보게 해주는 길잡이 역할을 할 것이기 때문이다. 물론 지금까지의 네트워크 과학의 발전 단계가 복잡계의 모든 난제에 대한 해답을 정확히 제공할 수준은 아니다. 그러나 네트워크 과학이 세상의 여러 가지 문제에 대한 실마리를 가지고 있는 것은 분명하다. 당장 이러한 난제들이 풀리지 않을지도 모르지만, 복잡계 네트워크 과학은 이것들을 풀어낼 탄탄한 토대를 제공할 수 있을 것이라 믿는다.