Round Here

알파고가 참...

이현봉 2016. 3. 10. 23:21

어제, 오늘 알파고가 이세돌과 붙어 내리 이기고, 9시 뉴스에 인공지능 얘기가 첫 소식으로 등장한다.  살다보니 이런 일도 생긴다.

바둑이 서로 상대 돌을 따 먹는 것이라고 알고 있었기에 이세돌-알파고 게임 실황 중계를 봐도 보는 재미는 없지만 해설자들의 얘기는 퍽 흥미로왔다.  이런 얘기를 한다.

"알파고에는 저런 데이터가 없을 텐데 어디서 저런 수가 나왔는지"  

"인공지능은 패턴에 따라 하는 것인데... "

"알파고가 어제 했던 행태와 매우 다르다"

이에 대한 얘기로, 알파고는;

- ConvNN으로 된 환경(바둑판) Valuation Estimator, Policy Planner에 의지하죠. 취할 수 있는 잠재/valid action은 모든 빈자리고, environment/바둑판은 완전히 관찰할 수 있고요. Russel & Norvig AIMA 첫부분, 그리고 거의 모든 Reinforcement Learning 글들에 이런 모델 설정에 관한 내용이 있죠.

- 알파고가 environment, 즉 바둑판 상태, 자기, 상대를 어떻게 인식하죠? 인공적 장치 기반이니 사람과는 다르겠죠. 복잡한 신경망이니 더욱.

- 알파고는 기존 기보에 의거 Supervised Learning도 하지만, 나중에는 강화학습들을 시작한 Policy Net/Planner 들끼리 시합하죠. Policy_SL이 인간계어서 얻은 지식으로 학습을 한다면, Policy_RL은 머신계에서 머신들 끼리 붙으면서 (인간계의 인습에서) 자유로운 학습/발전이 가능하겠죠.

- 여기에 더해, 알파고는 같은 환경상태/바둑판일때 기존에 택했던 action과 다른 새로운 action을 선호하라고 되어 있습니다. 스스로 새로운 액션, 즉 새로운 수를 찾는 것을 선호하죠.

매트릭스 느낌이 좀 나죠. 이 이상은 우리 지능에 대한 모욕이니...

30년도 더 된 때 미국 동부 조그만 도시의 대학교에서 처음으로 정규 방식으로 AI를 접했었다. 강의자가 누구였는 지 기억나지 않지만 유명한 분이었다.  했던 말 중에 AI로 부자되기 힘들 것, 하지만 멋진 분야라고. AI가 Computer Science의 주인이라고. 언젠가 우리의 baby와 흥미로운 대화를 나눌 수 있을 지 모른다고 상상해 보라고...  

인공지능 연구자가 추구하는 성배가 기억, 데이타, 과거 패턴을 뛰어넘어 이제껏 보지 못한 새로운 해결책, 세계를 보았으면 하는 것임을 사람들이 잘 모르는 것 같다.  생각같이 잘 되지는 않지만.  

설사 새로운 세계로 가기 위해서 우리가 이해하지 못하더라도 AI는 갈 수 있으면 가 주었으면 함을.  우리는 너무 과거 기억, 패턴에 익숙해 새로운 길, 이해가 되지 않는 것에 대한 본능적 거부감이 너무 크기에.  

알파고 논문은 reinforcement learning (강화학습)관련 용어들이 많이 등장한다.  이것들 설명과 함께 reinforcement learning에 대한 간단한 소개로, 

"아기가 부모로부터 두뇌를 받아 태어나, 부모 슬하에서 초등학교, 고등학교 교육을 받고 20대 즈음에는 세상에 나가 세상과 맞닥뜨리며 많을 일들을 겪게 되죠.  실패, 성공 수없이 맛볼 수 있습니다.  그러면서 성장하고 발전하고, 세상도 바뀌기를 바랍니다.  변화하는 세상에서 발전해야 하기에 그는 자신을 변화시켜야 하고 부모와 다른 자신만의 그가 되겠죠. 알파고가 그 첫걸음이었으면 합니다."    

이런 내용을 멋있게 넣었으면 어땠을까?  


'Round Here' 카테고리의 다른 글

영어 유감  (0) 2016.03.28
정말 그럴지도...  (0) 2016.03.14
Angels have gone  (0) 2016.02.10
good bye, Ziggy  (0) 2016.01.11
임금 격차  (0) 2015.12.25