alphago智能圍棋軟件是李世石vs.AlphaGo圍棋世紀(jì)之戰(zhàn)中的一個(gè)智能程序,很多人都在找這款應(yīng)用的下載,雖然圍棋水平不怎么樣,但是能和alphago對(duì)戰(zhàn)一局還是很不錯(cuò)的哦!
alphago智能圍棋軟件能下載嗎?
alphago目前還不能提供給普通用戶下載使用,人家要170多個(gè)GPU,上千個(gè)CPU才能運(yùn)行,現(xiàn)在最便宜的泰坦也上萬(wàn)RMB了,下載了你的八核小電腦也運(yùn)行不起來(lái),去攢個(gè)200W美刀的集群還差不多……
AlphaGo的兩大功能:
MCTS(Monte Carlo Tree Search)
MCTS之于圍棋就像Alpha-Beta搜索之于象棋,是核心的算法,而比賽時(shí)的搜索速度至關(guān)重要。就像深藍(lán)當(dāng)年戰(zhàn)勝時(shí),超級(jí)計(jì)算機(jī)的運(yùn)算速度是制勝的關(guān)鍵因素之一。
MCTS的4個(gè)步驟:Selection,Expansion,Evaluation(rollout)和Backup
MCTS的并行搜索:
(1) Leaf Parallelisation
最簡(jiǎn)單的是Leaf Parallelisation,一個(gè)葉子用多個(gè)線程進(jìn)行多次Simulation,完全不改變之前的算法,把原來(lái)的一次Simulation的統(tǒng)計(jì)量用多次來(lái)代替,這樣理論上應(yīng)該準(zhǔn)確不少。但這種并行的問(wèn)題是需要等待最慢的那個(gè)結(jié)束才能更新統(tǒng)計(jì)量;而且搜索的路徑數(shù)沒有增多。
(2) Root Parallelisation
多個(gè)線程各自搜索各自的UCT樹,最后投票
(3) Tree Parallelisation
這是真正的并行搜索,用多個(gè)線程同時(shí)搜索UCT樹。當(dāng)然統(tǒng)計(jì)量的更新需要考慮多線程的問(wèn)題,比如要加鎖。
另外一個(gè)問(wèn)題就是多個(gè)線程很可能同時(shí)走一樣的路徑(因?yàn)榇蠹叶歼x擇目前看起來(lái)Promising的孩子),一種方法就是臨時(shí)的修改virtual loss,比如線程1在搜索孩子a,那么就給它的Q(v)減一個(gè)很大的數(shù),這樣其它線程就不太可能選擇它了。當(dāng)然線程1搜索完了之后要記得改回來(lái)。
A Lock-free Multithreaded Monte-Carlo Tree Search Algorithm》使用了一種lock-free的算法,這種方法比加鎖的方法要快很多,AlphaGo也用了這個(gè)方法。
Segal研究了為什么多機(jī)的MCTS算法很難,并且實(shí)驗(yàn)得出結(jié)論使用virtual loss的多線程版本能比較完美的scale到64個(gè)線程(當(dāng)然這是單機(jī)一個(gè)進(jìn)程的多線程程序)。AlphaGo的Rollout是用CPU集群來(lái)加速的,但是其它的三個(gè)步驟是在一臺(tái)機(jī)器完成的,這個(gè)就是最大的瓶頸。
DCNN(Deep Convolutional Neural Network)
(使用深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的Policy Network和Value Network)
神經(jīng)網(wǎng)絡(luò)訓(xùn)練的時(shí)間一般很長(zhǎng),即使用GPU,一般也是用天來(lái)計(jì)算。Google使用GPU Cluster來(lái)訓(xùn)練,從論文中看,訓(xùn)練時(shí)間最長(zhǎng)的Value Network也只是用50個(gè)GPU訓(xùn)練了一周。
給定一個(gè)輸入,用卷積神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè),基本運(yùn)算是矩陣向量運(yùn)算和卷積,由于神經(jīng)網(wǎng)絡(luò)大量的參數(shù),用CPU來(lái)運(yùn)算也是比較慢的。所以一般也是用GPU來(lái)加速,而AlphaGo是用GPU的cluster來(lái)加速的。
玩家觀點(diǎn):
1.大概也就是二十年前,IBM的deepblue戰(zhàn)勝了當(dāng)時(shí)國(guó)際象棋界的棋王,一時(shí)成為焦點(diǎn),再后來(lái)我上小學(xué)的時(shí)候,看到這個(gè)故事出現(xiàn)在了小學(xué)課本里。那時(shí)候,就在想這IBM是何許人也,畢竟連霍金老爺子都用IBM的電腦,不過(guò)等我接觸電腦接觸互聯(lián)網(wǎng)的時(shí)候,IBM卻成了陌生詞匯。不知道以后的中小學(xué)課本是否會(huì)將谷歌的這次戰(zhàn)勝圍棋大師的事例寫入課本。不過(guò),鑒于tg和谷歌的關(guān)系,估計(jì)不太靠譜。
2. 就在這個(gè)新聞之前不久,我還看過(guò)類似的東西,大意就是圍棋比國(guó)際象棋還要難下,對(duì)于人工智能的考驗(yàn)還要大,國(guó)際象棋也包括中國(guó)象棋,棋盤上的棋子是越下越少的,而圍棋則不然,圍棋棋盤上棋子越下越多,越到后面,牽一發(fā)動(dòng)全身…
3圍棋棋局本身不敢妄議了,只是因?yàn)榻舆B被邀請(qǐng),也就來(lái)答一答。
4如果答不符題,請(qǐng)點(diǎn)沒有幫助