Re: [新聞] 下戰帖 AlphaGo將單挑《星海爭霸》消失

看板Gossiping作者bob30727時間8年前 (2016/03/14 14:54)推噓9(9推 0噓 4→)

留言13則, 11人參與討論串7/8 (看更多)

大家好在版上潛水許久本魯在資工所修的就是機器學習難得看到這類型的議題在板上這麼熱門正好我的碩論就是做星海爭霸的人工智慧所以碩班都是讀相關PAPER 先來跟大家說明一下我的碩論是怎麼做出來承接自一個很厲害的大專生類神經網路結合基因演算法類神經的輸入有: 現在的各類型資源數量各兵種目前數量遊戲時間各科技升級情況已偵察到的隊方各兵種數量...等經過中間隱藏層的計算後類神經的輸出有: 是否生產各類型兵種是否升級各種科技是否開礦區是否出擊...等實驗一開始一開始先隨機產生許多組類神經隱藏層的權重勝率最低的組別淘汰淘汰後被贏最多的兩組混種產生子代取代就這樣一直跟內建AI學習大約500場之後網路會開始收斂 (阿這就是基因演算法啦也就是他會從輸贏知道怎麼樣來運算這個遊戲只是我的樣本不夠多不過齊全網路的輸入輸出也不夠多隱藏層也只有一層所以提升的勝率有限原本還要結合一些看過的論文有些是用Bayesian network來預測對手的科技樹進而反制另一篇則是用戰場上各單未遭遇的危險度來訓練控兵並依照殺敵數來做reinforcement learning 只是時間有限大家有興趣我可以補上兩篇論文的網址打這篇簡陋的文章來讓大家了解一下這領域其實已經很多人在做了而且也辦過不少次AI之間互相較量的比賽我想有學過機器學習的人都知道圍棋只是人在和運算時間的競爭只要整個網路學習的樣本夠大夠完整並且演算法讓它能在兩個小時內運算完畢電腦贏也是在正常不過的事情何況alphago是採兩層的運算就算你用策略欺騙它非監督式的第一層到第二層它還是會依照擺棋點的勝率來進行修正在星海在圍棋甚至可以把樣本全部換成對手從以前到現在所有的比賽直接對你這個人的遊戲方式進行學習我想之後要人機對抗可以限制電腦每秒可以下的指令數這樣雙方在戰術上的互相較量也會比較有看頭 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.146.47.80 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1457938477.A.927.html

→

kuninaka

03/14 14:56, , 1^F

03/14 14:56, 1^F

推

bluebluelan

03/14 14:56, , 2^F

03/14 14:56, 2^F

推

chogosu

03/14 14:57, , 3^F

03/14 14:57, 3^F