알파고 프로그램 다운로드

3 일간의 자기 플레이 훈련 후, 알파 고 제로는 이전에 출판 된 알파 고의 버전을 물리 치고 18 시간 세계 챔피언 리 세 돌-100 게임을 0으로 패배 시켰습니다. 40 일이 지난 후, 알파 고 제로는 세계 최고의 선수들과 월드 넘버 원 케 지를 격파 한 “마스터”로 알려진 알파 고의 버전을 능가 하 여 더욱 강해 졌습니다. 이 종이는 고 대 중국의 고 대 게임에서 세계 챔피언을 물리 치기 위한 최초의 컴퓨터 프로그램, 알파 고의 최신 진화 인 알파 고 제로를 소개 합니다. 제로는 더욱 강력 하 고 틀림 없이 역사상 가장 강력한 Go 플레이어입니다. 알파 고의 이전 버전은 이동 하는 방법을 배울 수 있는 인간의 아마추어 및 전문 게임의 수천에 처음으로 훈련. 알파 고 제로는이 단계를 건너뛰고 완전히 무작위 플레이에서 시작 하 여 게임을 자체적으로 재생 하는 방법을 배웁니다. 이를 통해 인간 수준의 플레이를 빠르게 돌파 하 고 이전에 출판 된 알파 고의 챔피언 처치 버전을 100 게임에서 0으로 격파 했습니다. 알파 고는 보드 게임 Go를 재생 하는 컴퓨터 프로그램입니다. [1] 그것은 런던에서 알파벳 i n c .의 구글 DeepMind에 의해 개발 되었다. 알파 고는 알파 고 마스터, 알파 고 제로 [2]와 알파 제로 라는 훨씬 강력한 후계자 들을 3 명 더가지고 있었습니다. 플레이 시에이 세 돌은 세계에서 두 번째로 많은 Go 국제 챔피언십 우승을 가졌다. [29] 국제 이동 중에는 하나의 공식적인 순위 지정 방법이 없지만, 일부 소식통은 당시 세계에서 4 번째로 최고의 선수로 서이 세 돌을 랭크 했다. 30 [31] 알파 고는 특별히이를 직시 하는 훈련을 받지 못했다.

[32] 1997 경기에서 IBM 컴퓨터 딥 블루 비트 세계 체스 챔피언 게리 Kasparov 후 거의 20 년 후, 인공 지능 기술을 사용 하 여 가장 강력한 Go 프로그램은 아마추어 5 단 수준에 대 한 도달, [10] 여전히 이길 수 없습니다 핸디캡 없이 전문 Go 플레이어. 3 4 4 개의 PC 클러스터에서 실행 되는 소프트웨어 프로그램 Zen은 5 개 및 4 개의 돌에 핸디캡을 두 번 2012. [14] 2013에서 미친 돌은 4 개의 돌 핸디캡으로이 시 다 요시오 (9p)를 이길. [15] 알파 고의 알고리즘은 기계 학습과 트리 검색 기법을 조합 하 여 인간 및 컴퓨터 플레이 모두에서 광범위 한 교육과 결합 하는 것을 2016. 이는 ` 가치 네트워크 ` 및 ` 정책 네트워크 `로 유도 되는 몬테카를로 트리 검색을 사용 하며, 모두 심층 신경망 기술을 사용 하 여 구현 되었습니다. 3 [10] 제한 된 양의 게임 특정 기능 검출 전처리 (예를 들어, 이동이 出 패턴과 일치 하는지 여부를 강조 하는 것)는 신경망에 전송 되기 전에 입력에 적용 된다. [10] 알 고 마 마스터 (화이트) 대 탕 웨이 싱 (12 월 31 일 2016), 알파 고는 사임으로 이겼습니다. 화이트 36는 널리 칭찬 했다. 알파 고와 그 후계자는 특히 인공 신경망 (심층 학습 방법)을 통해 기계 학습에 의해 이전에 “배운” 지식을 기반으로 하는 몬테 카를로 트리 검색 알고리즘을 사용 하 여 인간 및 컴퓨터 재생.

[8] 신경망은 알파 고의 움직임 선택과 승자의 게임을 예측할 수 있도록 훈련을 받습니다.