장기나 체스, 바둑 등의 게임을 컴퓨터와 둬본 적이 있는 사람이라면 알파고의 대략적인 매커니즘을
이미 이해하고 있는 것이나 다름없다고 한다.
인공지능은 수많은 경우의 수를 계산한 뒤 자신이 놓을 수를 찾는다.
경우의 수는 수백, 수천 가지가 되지만 문제가 없다고 한다.
컴퓨터 성능이 좋아질수록 계산은 순식간에 이루어진다.
인간이 10수 정도를 내다본다면, 컴퓨터는 그 이상 되는 수까지 내다보며 최적의 수를 찾는다.
이처럼 경우의 수를 따져 경기에 임하는 방식을 <몬테카를로 트리서치>라고 부른다.
과거 인간과 대결을 벌였던 인공지능은 모두 이 방식을 활용했다.
1967년 인공지능 체스 프로그램인 <맥핵>과 미국 매사추세츠공과대학교 출신 아마추어
체스 선수였던 <휴버트 드레이퍼스>의 체스 대결이 이뤄졌다. 인간과 인공지능의 첫 대결이었다.
드레이퍼스는 자신만만해 했다고 전해지지만 맥핵과의 대결에서 지고 말았다.
하지만 드레이퍼스는 아마추어 선수였을 뿐 맥핵은 여러 체스 선수로부터
한 수 뒤진다는 평가를 받으며,인간과의 대결에서 패배했다고 보았다.
1990년과 1992년 미국 앨버타대학교에서 만든 인공지능 <치누크>가
당시 세계 체스 챔피언이었던 <매리언 틴슬리>와 대결을 펼쳤지만 모두 패했다.
1994년에는 승리를 거뒀지만 <틴슬리>가 암 투병 중이었기에 완벽한 승리로 인정받지 못했다.
1996년 IBM의 슈퍼컴퓨터 <딥블루>가 세계 체스 챔피언인 <가리 카스파로프>에게
도전장을 던졌지만 역시 지고 말았다. IBM은 1년뒤 업그레이드 된 <디퍼블루>를 내놓았다.
<디퍼블루>는 <가리 카스파로프>를 이기며 세계에서 체스를 제일 잘 두는 존재가 됐다.
인류와 인공지능이 대결을 펼친 지 30년 만의 일이었다.
2004년 IBM은 디퍼블루에 이은 슈퍼컴퓨터 <왓슨> 개발을 시작했다.
7년 뒤인 2011년 왓슨은 미국의 퀴즈 쇼 <제퍼디!>에 출현해 <켄 제닝스>와 <브래드 러터>를
압도하며 승리를 거뒀다. 체스뿐만 아니라 퀴즈에서도 인간에게 승리한 것이다.
이처럼 인공지능이 발전할 수 있는 이유는 연산처리 기능이 빠른 발전과 빅데이터 덕분이다.
1997년 세계 체스 챔피언인 디퍼블루의 계산 능력은, 현재 스마트폰 속으로 들어와 있다.
<알파고> 역시 기본 베이스는 이처럼 모든 경우의 수를 하나씩 찾는 것이다.
하지만 바둑은 체스와 다르다. 가로세로 각 19줄인 바둑판에 바둑돌을 놓는 자리는 총 361개
첫 돌을 내려놓는 가짓수는 361개 그다음 돌은 360개,359,358...
이들은 따로따로 일어나는 것이 아니라 연달아 발생한다.
즉 경우의 수를 합하는 것이 아니라 곱해야 한다.
바둑 경기가 시작되고 두 바둑 기사가 2개씩,
총 4개의 바둑돌을 놨을 때 컴퓨터가 계산해야 하는 경우의 수는 167억 271만 9120가지다.
디퍼블루는 이 정도 계산에 약 83초가 걸린다고 한다.
하지만 바둑판에 놓여 있는 바둑돌이 8개가 되면 상황은 완전히 달라진다.
2.66x10의20승 디퍼블루로 계산하면 4만년이 걸린다고 한다.
바둑판을 모두 채울 경우의 수는 10의150승으로 우주 전체의 원자 수인 10의80승보다도 많다.
현존하는 최고의 슈퍼컴퓨터를 동원해도 이 정도 경우의 수를 계산하려면 수 십년이 걸린다.
컴퓨터가 바둑에서 인간을 이기려면 20~30년이 걸린다는 말이 나왔던 이유입니다.
하지만 <알파고>는 달랐다. 인간의 뇌가 갖고 있는 특성을 도입했다.
바로 배움이다. 바둑에서 모든 경우의 수를 계산하려면 수십년이 걸린다.
알파고는 KGS라는 온라인 바둑 사이트에서 2~9단 바둑 고수들이 뒀던 경기들을 공부했다.
KGS서버에 저장되어 있던 16만 기보를 통해 실제 바둑 경기에서 둘 수 있는 경우의 수를 모두
학습했다. 알파고는 가치망이라는 기능도 있었다. 정책망으로 수많은 기보 학습을 통해
다음에 둘 수의 가짓수를 줄인다면, 가치망은 그 수에 대한 승률을 측정한다.
정책망과 가치망의 계산이 끝나면, 디퍼블루가 했던 몬테카를로 트리서치를 하면 된다.
정책망과 가치망을 거친 경우의 수만으로 계산을 하므로 시간은 훨씬 단축됐다.
16만 기보를 공부한 것으로 알파고가 이세돌 9단을 이겼다고 하면 인간이 너무 나약해 보인다.
알파고는 정책망과 가치망을 업그레이드 시키는 것으로 끊임없이 진화할 수 있었다.
알파고는 학습된 정책망을 복사해 또 하나의 정책망을 더 만들고 자기들끼리 경기를 했다.
딥마인드에 따르면 알파고는
이세돌과의 대국 전 하루에 혼자서 3만 번씩 바둑을 두며 정책망을 강화시켰다고 한다.
즉 단순히 모든 경우의 수를 계산하는 것이 아니라 자신이 입력한,
그리고 스스로 학습한 기보를 통해 최적의 수를 찾아낸 것이다.
2015년 10월 알파고는 유럽 바둑 챔피언 <판후이>2단과 대결에서 5대 0으로 승리했다.
판후이 2단과 알파고를 본 바둑 전문가들은
"과거 인공지능보다는 잘 두지만 이세돌 9단과 겨룰 실력은 아니라"라고 입을 모았다.
이세돌 9단 역시 기보를 본 뒤 "질 것 같지 않다"고 했다.
하지만 불과 5개월 만에 알파고는 강해졌다.
알파고와 이세돌 9단과의 경기를 지켜보던 바둑9단 기사의 말은
"이세돌은 바둑을 둘 때 10수,20수 이상을 내다본다. 머리속에 모든 수가 자연스럽게 그려진다.
그런데 알파고는 그 이상이었다. 우리가 실수라고 생각한 수가 묘수가 되어 나타나기도 했다."
그럼 이세돌 9단이 승리한 4번째 대국에서는 과연 어떤 일이 일어났을까?
78수가 묘수였다고 평가하는데,
알파고 입장에서 이세돌 9단이 놓은 78수는 정책망과 가치망에 기록되지 않은 것이었다.
그 위치에 돌을 놓을 것이라고는 배우지 못한 것이었다.
결국 78수 이후에, 알파고는 연이은 실수와 함께 패하고 말았다.
2017년 5월 알파고는 새로운 버전인 알파고 2.0으로 업그레이드 되어
세계 랭킹 1위인 <커제9단>과 겨뤘다.
이세돌 9단에게서 승리를 거둔지 1년 만이었다.
"이세돌은 인간 대표의 자격이 없다"고 외쳤던 <커제 9단>은, 바둑을 두던 중 눈물을 흘리면서
"알파고와 바둑을 두는 것은 고통이다"라고 말하며 패배를 인정했다. 3대 0의 완패였다.
세계 제패를 이룬 알파고는 바둑에서 은퇴했다.
2016년 이세돌 1승, 유일한 인간 승리
( 알파고와의 대결에서 1승4패를 기록, 당시 1승의 가치는 더욱 중요해졌다.)
2017년 커제, 209수 불계패…3연패
‘68승 1패’ 알파고, 바둑계 은퇴(1패가 이세돌 승리패)
알파고는 은퇴했지만 자신의 능력을 인류를 위해 활용할 것으로 보인다.
구글은 막대한 에너지가 사용되는 데이터센터에 알파고를 적용해
전력 사용량을 40%가까이 줄이는 방안을 찾아냈다고 한다.
알파고는 인간을 위한 도구일 뿐, 인간을 뛰어넘는 존재가 아니다.
인간의 뇌에 있는 시냅스는 약 1000조 개에 달한다.
시냅스간 연결이 인간이 학습하고 겪은 수많은 경험의 합체로 발현되는 것이다.
인간의 뇌야말로
자신이 경험한 지식들을 담은 신경세포가 시냅스로 연결돼 창조적 능력을 발휘하는
집단지성의 원조인 셈이다.
'사회' 카테고리의 다른 글
힉스입자가 무엇일까요? (20) | 2022.09.13 |
---|---|
개인유전자 정보 공유시장ㅡ개인 생태계의 혼란은 아닐까? (14) | 2022.09.12 |
이그노벨상 (16) | 2022.09.07 |
전자파차단 '거리두기'가 최선입니다! (14) | 2022.09.06 |
우주의 강력한 재난에 지구가 안전할 수 있을까? (17) | 2022.09.05 |
댓글