전체 글 255

검색엔진과 링크 분석

구글이 페이지랭크에 활용해서 널리 알려지게 된 웹페이지의 링크분석 개념은 이미 웹 초기부터 얘기가 있어왔다. 알고리즘과 AI 에 훈련을 받은 사람이 웹 검색에 대해 생각하면 자연스레 도출되는 개념이었기 때문이다. 그렇다고 해서 이들의 업적이 전혀 감해지는 것은 아니다. 먼저 했으니까. 먼저 의미가 있는 것이라는 것을 보였으니까. 나는 HITS 논문을 먼저 보았고, 뒤에 거기에 있는 페이지랭크 레퍼런스를 보고 페이지랭크 논문을 보았다. 그래서 순수한 개념의 아름다움에는 아무래도 HITS에 더 점수를 주고 싶다. " 이 HITS 논문들은 1997-99 년경에 발표된 것이다. 따라서 이 즈음에 검색 품질을 높이는 방법으로 페이지내의 링크관계를 이용하려는 생각이 활발했음을 알 수 있다. 우리는 구글 검색엔진에서..

술먹은 공룡들

후배 사장과 한잔 했다. 어느덧 후배도 40 중반에 다가섰네. IT 회사의 사장 한 지도 8년이 넘었고. 사업얘기와 함께 우리들의 얘기도 반주로 하고. 전자과, 전산과인 우리가 어떻게 전공을 택했던가. 수학도 잘했고 이빨보다는 생각을 더 잘했지. 그리고 공대가 우리나라를 더 발전시키는 데 큰 역할을 한다고 정말 생각했잖아. 왜 사장을 했지? 내 사업을 잘 할 수 있다고 생각했지. 자신이 있는 편이거든. 굳이 리스크 감수를 잘 한다기 보다는 좀 더 이상적이고 조금 더 무모하지. 긍정적이라고 자위하자. 사업을 하다보니 사장이 아니었으면 평생 상대하지 않아도 될 인간들을 상대하기도 해야 하고. 얼마전에는 내가 건넨 명함을 받고는, 이런 명함은 곧 쓰레기통으로 들어간다고 말하는 인간도 있었고. 그리고, 우리는 ..

Round Here 2008.05.22

어버이날에

나같이 게으르고 무심한 사람에게는 "무슨 무슨 날" 이나 "데이"가 썩 반갑지 않다. 신경써야 하니. 그렇다고 신경쓰는 것도 아니면서. 어머니 권유도 있고 해서, 지난 4월 초 아마도 아버지 돌아가신지 25년 동안 통 털어 새해 들어 가장 일찍 국립묘지에 갔었다. 처와 아들녀석도 같이. 벚꽃이 활짝 피어, 흰꽃잎이 싸아 떨어지고 있었다. 오래전 유치원 때였던가 아니면 초등학교 저학년 때였던가 진해 살 때 아버지에게 내가 빨리 뛸 수 있다는 것을 자랑하려고 벚꽃이 활짝 핀 큰 길에서 달리던 기억이 있다. 그 때에도 벚꽃이 멋있었다. 헬리콥터가 국립묘지 위를 지나간다. 내가 큰 다음, 어느날 아버지가 자정이 넘어 집에 오셨는데, 지방에서 헬기타고 서울오다가 안개가 잔뜩끼어 고생하다 겨우 길이 보여 길따라 오..

Round Here 2008.05.08

인터넷 괴담과 information cascade

광우병, 인터넷괴담, 참 세상이 복잡하다. 우리 모두 개인들은 상식적, 합리적으로 살려고 한다. 그렇지만 우리 환경은 우리들을 그렇게 살 수 있도록 내버려두지만은 않는다. 불확실한 가운데 결정을 해야하고, 외부의 시선도 고려해 행동을 해야 할 경우가 많고. 인터넷 시대에 우리들은 난무하는 설과 정보들 중에서 이런 것들을 취득, 분석해서 더 많은, 더 빠른 의사결정을 요구받는다. 어떻게, 이런 요구에 따라 갈 있을까? 이런 것이 맞나? Slow life 운동이 앞으로 더 각광받을 것 같다. 정보화 사회에서, 개인들이 불확실한 정보에 입각해 어떻게 결정을 내리고, 또 이런 것이 어떤 경우에 집단적인 동조 의사결정/행동을 나타내는지에 관심이 있었다. Information cascade를 인터넷 사회에, 웹구조..

신이 부러워하는 직장

어제 밤 늦도록 C++ 의 friend 용법을 보았다. C를 처음 보았을 때는 책 두께가 200-300 페이지를 넘지 않았던 것 같은데 요즈음 것들은 1000 페이지에 가깝다. 갈수록 쉬어 져야 하는데, 왜 익혀야 할 것이 더 많아지지? 현대 세상이 갈수록 복잡해 져서 그런가? 공기업, 공사, 공공기관의 연봉 얘기가 라디오에서 들린다. 역시 공기업, 공사는 신이 부러워 하는 자리인가 싶다. 특히 돈을 다루는 공기업 들의 대우가 세다. 정년도 늘어나 60인 곳이 늘어난다고 한다. 돈을 관리하는 공기업들의 대우가 특급이어야 한다면, 내 머리로는 가장 큰 이유가 이곳들이 돈을 다루기에 이들이 돈의 유혹을 받지 않게 하기 위해서 잘 대우해 주어야 한다는 논리가 먼저 떠오른다. 이 것 말고는 이 곳의 일이 다른 ..

Round Here 2008.04.27

구글 검색

구글 검색 기술에 대한 글이다. 페이지랭크에 관한 것은 1998년 발표되었고, 웹검색에 관한 이 글은 2000년에, 구글 검색 엔진 구조에 관한 이글이 2001년 경에 발표되었으니 7~10 년 되는 오래 전 얘기이다. 지금은 어떻게 변했을까? 요즈음 부쩍 소프트웨어의 성능과 품질에 대해 생각을 갖는다. 하드웨어가 싸다 보니 버벅거리면 "몇 대 더 갖다놓으면 된다" 하는 생각이 퍽 널리 퍼져있다. 내가 생각해도 맞는 방법이다. 공학은 trade-off 이다. 진리를 구하는 것이 아니고, 절대 선을 추구하는 것도 아니고, 적절한 타협으로 실용적인 해를 구하는 것이 목표이다. 그렇다 해도, 가끔은 잘 만들어 보고 싶다. 브린과 페이지도 검색엔진을 연구해 보려 할 때 이런 생각을 하지 않았을까 한다. 페이지랭크..

기쁜 소식

오늘 아침 메일을 보다 "쎄트렉아이" 회사 소식을 들었다. 중소 인공위성을 만드는 회사인데, 이번에 상장을 해서 대박을 터뜨렸다는 얘기를 보았다. 특히, 내 사촌동생이 근무하는 곳이라서, 2년 전 즈음에 대덕에 있는 회사를 방문해서 사장님을 보고 인공위성 만드는 것도 보아 퍽 관심이 있는 회사라서 더욱 기분이 좋다. 사촌동생이 워낙 조용해서 자세한 말을 하지 않기에 이렇게 뉴스를 통해서 알게 되었다. 사촌동생은 카이스트 우리별 1호를 띄울때 부터 함께 한 동료들이 많이 있는 쎄트렉아이를 선택했다. 박사를 하고, 대학교와 대기업에서 교수와 좋은 조건의 오퍼가 있을 때, 나에게 의견을 물은 적이 있다. 나의 사업이 퍽 어려울 때 이어서, 사업의 어려움과 리스크를 얘기하고, 나는 대학교수직이 더 좋을 것 같다..

Round Here 2008.04.24

작은 세상 네트워크

웹을 연결성 측면에서 볼 때 크게 4 부분으로 나뉘는 것을 알았다. 그리고 웹페이지간 서로 링크를 따라 통하는 것들이 1/4 정도 밖에 되지 않지만, 만약 통한다면 그 거리가 평균 16 정도인 것을. 물론 웹의 크기가 2억개의 웹페이지일 경우지만. 이 에세이는 Watts와 Strogatz가 10년 전 쓴 것이기에, 앞서 Broder 등이 쓴 Graph Structure... 보다 2년 앞선다. 이 두 글을 서로 비교해 가면서 어떻게 연결되고, 또는 서로 충돌되는 측면이 있는 지 살펴보는 것이 재미있다. 서로 잘 맞는다. 그런데, Broder 등이 쓴 뒤의 논문에 이 small world network이 references에서 빠져 있다. Broder가 Watts와 Strogatz의 글을 알고 있었다면 더..