阿爾法狗表情包是一款由谷歌研發(fā)的著名機(jī)器人AlphaGo而衍生制作的相關(guān)表情包,這款阿爾法狗表情包并不是以傳統(tǒng)的科技感而制作的,整體偏向于漫畫風(fēng)格,馬上AlphaGo就又要和柯潔進(jìn)行在一次的圍棋較量了,在觀看討論過(guò)程中和朋友斗一斗相關(guān)表情包也是極其不錯(cuò)的選擇哦,感興趣的用戶朋友可以下載試試這款表情包哦。
阿爾法狗表情包出處介紹:
阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈薩比斯、大衛(wèi)·席爾瓦、黃士杰與他們的團(tuán)隊(duì)開發(fā)。其主要工作原理是“深度學(xué)習(xí)”。
2016年3月,該程序與圍棋世界冠軍、職業(yè)九段選手李世石進(jìn)行人機(jī)大戰(zhàn),并以4:1的總比分獲勝;2016年末2017年初,該程序在中國(guó)棋類網(wǎng)站上以“大師”(Master)為注冊(cè)帳號(hào)與中日韓數(shù)十位圍棋高手進(jìn)行快棋對(duì)決,連續(xù)60局無(wú)一敗績(jī)。不少職業(yè)圍棋手認(rèn)為,阿爾法圍棋的棋力已經(jīng)達(dá)到甚至超過(guò)圍棋職業(yè)九段水平,在世界職業(yè)圍棋排名中,其等級(jí)分曾經(jīng)超過(guò)排名人類第一的棋手柯潔。
2017年1月,谷歌Deep Mind公司CEO哈薩比斯在德國(guó)慕尼黑DLD(數(shù)字、生活、設(shè)計(jì))創(chuàng)新大會(huì)上宣布推出真正2.0版本的阿爾法圍棋(AlphaGo)。其特點(diǎn)是擯棄了人類棋譜,只靠深度學(xué)習(xí)的方式成長(zhǎng)起來(lái)挑戰(zhàn)圍棋的極限。
阿爾法狗相關(guān)程序原理:
深度學(xué)習(xí)
阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。其主要工作原理是“深度學(xué)習(xí)”!吧疃葘W(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會(huì)把大量矩陣數(shù)字作為輸入,通過(guò)非線性激活方法取權(quán)重,再產(chǎn)生另一個(gè)數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過(guò)合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣。
阿爾法圍棋用到了很多新技術(shù),如神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、蒙特卡洛樹搜索法等,使其實(shí)力有了實(shí)質(zhì)性飛躍。美國(guó)臉書公司“黑暗森林”圍棋軟件的開發(fā)者田淵棟在網(wǎng)上發(fā)表分析文章說(shuō):“‘阿爾法圍棋’這個(gè)系統(tǒng)主要由幾個(gè)部分組成:一、走棋網(wǎng)絡(luò)(Policy Network),給定當(dāng)前局面,預(yù)測(cè)/采樣下一步的走棋;二、快速走子(Fast rollout),目標(biāo)和走棋網(wǎng)絡(luò)一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比走棋網(wǎng)絡(luò)快1000倍;三、估值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面,估計(jì)是白勝還是黑勝;四、蒙特卡洛樹搜索(Monte Carlo Tree Search),把以上這三個(gè)部分連起來(lái),形成一個(gè)完整的系統(tǒng)!盵2] [3]
兩個(gè)大腦
阿爾法圍棋(AlphaGo)是通過(guò)兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來(lái)改進(jìn)下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識(shí)別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過(guò)濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過(guò)過(guò)濾,13 個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對(duì)它們看到的局面判斷。這些層能夠做分類和邏輯推理。
這些網(wǎng)絡(luò)通過(guò)反復(fù)訓(xùn)練來(lái)檢查結(jié)果,再去校對(duì)調(diào)整參數(shù),去讓下次執(zhí)行更好。這個(gè)處理器有大量的隨機(jī)性元素,所以人們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練后能讓它進(jìn)化到更好。
第一大腦:落子選擇器 (Move Picker)
阿爾法圍棋(AlphaGo)的第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)” ,觀察棋盤布局企圖找到最佳的下一步。事實(shí)上,它預(yù)測(cè)每一個(gè)合法下一步的最佳概率,那么最前面猜測(cè)的就是那個(gè)概率最高的。這可以理解成“落子選擇器”。
第二大腦:棋局評(píng)估器 (Position Evaluator)
阿爾法圍棋(AlphaGo)的第二個(gè)大腦相對(duì)于落子選擇器是回答另一個(gè)問(wèn)題。不是去猜測(cè)具體下一步,它預(yù)測(cè)每一個(gè)棋手贏棋的可能,再給定棋子位置情況下。這“局面評(píng)估器”就是“價(jià)值網(wǎng)絡(luò)(Value Network)”,通過(guò)整體局面判斷來(lái)輔助落子選擇器。這個(gè)判斷僅僅是大概的,但對(duì)于閱讀速度提高很有幫助。通過(guò)分類潛在的未來(lái)局面的“好”與“壞”,AlphaGo能夠決定是否通過(guò)特殊變種去深入閱讀。如果局面評(píng)估器說(shuō)這個(gè)特殊變種不行,那么AI就跳過(guò)閱讀。