[新聞] 阿爾法狗今年將正式挑戰柯潔

看板GO作者 (逍遙山水憶秋年)時間7年前 (2017/01/06 15:40), 7年前編輯推噓35(35045)
留言80則, 27人參與, 最新討論串1/1
阿爾法狗今年將正式挑戰柯潔 AI引圍棋觀念轉變 肆虐了棋壇近一周後,“Master(大師)”脫下馬甲,宣佈暫時閉關。中國最火的圍棋對 戰平臺奕城,在給AlphaGo保密了一周後,也放鬆了下來。這一周,AlphaGo和中國本土圍 棋AI(人工智慧)打擂,打出名頭,也留下被攪亂的圍棋世界;連高曉松等“圈外人”也 在思索著被“大師”改變的人生。不過人生總要繼續,有消息稱,就在今年,谷歌AI會正 式挑戰柯潔。 有保密沒協議 奕城CEO李哲勇把“Master”身世的秘密守了一周,但他告訴北京青年報記者,谷歌並沒 有和奕城簽任何書面協議。 去年12月29日,“Master”初登奕城。令人迷惑的是,他自稱來自韓國。李哲勇介紹,這 是AlphaGo開發者放的煙幕彈,不希望棋手們這麼快猜出它的來歷。“畢竟還在測試, AlphaGo團隊開始想隱藏身份,於是就托我們註冊了一個韓國號。”李哲勇說。 為了方便挑戰棋手,奕城還為初登平臺的“Master”準備了九段帶P(職業)的號。李哲 勇介紹,“他們團隊先找到我們的韓國合作方,想註冊個號,方便和職業棋手下棋。後來 我這邊幫助註冊的。” 為什麼谷歌會選擇奕城?李哲勇說,黃士傑博士作為AlphaGo開發者之一,也是圍棋愛好 者,“第一個想到我們很正常。所以這次也沒有簽什麼書面協議,就是私交不錯。只是要 求別透露身份,只是約定,沒有正式協議。” 臺灣出生的黃士傑博士,畢業于臺灣師範大學,博士論文就是“應用於電腦圍棋之蒙地卡 羅樹搜索法的新啟發式演算法”。他本身也是業餘六段,很早就在奕城下棋。這也解釋了 在與“棋聖”聶衛平對弈結束後,“Master”為何用繁體字打出“謝謝聶老師”。 有煙霧有“督戰” 一邊保守著秘密,奕城一邊為人機大戰造勢,先是在自己網站上發了含混的消息,後在圍 棋貼吧裡發了含混的帖子。可隨著“Master”連戰連捷,圍棋的一切都在瞬間捲進了風暴 。那一刻,谷歌創始人布林就身在北京。 這次來訪北京,布林並沒有公開自己的來意。有媒體透露,其身邊人稱他是來休假的,屬 於個人性質的旅遊,結果引來了一陣調侃,“布林是不是沒看天氣預報……” 如今“Master”完成60連勝,職業六段棋手樊麾同時也是谷歌DeepMind團隊測試工程師, 代表DeepMind團隊發表公告:“我們最近很努力地開發阿爾法圍棋,剛過去的幾天我們在 網路的對弈平臺進行了一些非正式的快棋對局,目的是為了檢驗我們最新版本的阿爾法圍 棋是否如我們的預期。” 不費“一槍一彈”,谷歌進行了對升級版AlphaGo的測試。眾多中日韓頂尖棋手帶著對圍 棋的熱愛,甘心充當了免費程式測試員。不過北青報記者瞭解到,就在今年,谷歌將邀請 中國圍棋第一人柯潔正式和AlphaGo進行人機大戰。 AI打擂棋手作陪 其實“Master”並非唯一“踢館”的AI。歲末年初,好幾個高水準圍棋AI現身奕城等平臺 。借助各自對人類棋手的勝率,AI們也分出了高下。 表現最積極的當屬日本的Ddeepzengo,至今年1月3日,已經下了超過200盤棋,輸了20盤 。雖然勝多負少,但主要是勝不帶P標誌的業餘棋手,對職業棋手輸得多,還沒有世界冠 軍級棋手出手測試。 騰訊野狐圍棋的“絕藝”和“刑天”作為本土AI,更加引人注目。2016年11月上線的騰訊 AI“絕藝”勝了柯潔一盤,5比1勝朴廷桓,但此後高手們摸清了“絕藝”的路數,柯潔對 “絕藝”的戰績達到3比1。此後“絕藝”再沒下過棋,下線研發升級去了。 一個月後,升級版本“刑天”又上線開始下棋,對柯潔戰成5比2,對樸廷桓4比1。雖然“ 刑天”死活還是有問題BUG(漏洞),但職業棋手感覺其實力已和去年初的AlphaGo相當。 就在職業棋手們認為找到了“刑天”的漏洞就是找到所有AI的漏洞之時,“Master”的登 場打消了棋手的念頭。人類一勝難求,“Master”早早領先10多目甚至20目以上,收官時 再“讓”給人類一些目數保成4目半、2目半或者半目勝。參考人類棋手的成績,AlphaGo 在這場AI打擂中更勝一籌。 從挑戰到學習 AlphaGo團隊選中奕城的重要原因,是這裡聚集了世界最頂尖的棋手和最多的棋迷。雖然 “Master”穿著馬甲,但柯潔第一天就猜到了真相。 李哲勇對北青報記者表示,最開始奕城是對棋手保密的,包括對柯潔,但“Master”鋒芒 太露,“我們除了提供了號,其他都不管。AlphaGo是自己挑對手的,結果上線第一天就 是全勝,有的棋手不服氣,再下,又被切。到第二天,所有棋手就知道肯定是機器了。” 柯潔其實第一天就知道了真相。“因為在他瞭解的範圍,沒人這麼下棋,也沒人這麼厲害 ,他就去問了我們總經理,跟人家說告訴我吧,我肯定保密。我們經理回復說呵呵,不能 說啊,他就自己感覺到了。”李哲勇說。 因為“Master”成績太過突出,棋手早已收起昔日的矜持,排隊等著“翻牌”過招。去年 首次人機大戰,柯潔曾豪言“阿爾法狗贏不了我”,這次兩敗于對手後,柯潔醉心于對手 別出心裁的棋路,以至於一夜不眠。而唐韋星敗于對手後則說,“朝聞道夕死可矣。” 有敬仰有口水 60盤30秒一次的快棋對局,遠遠沒有逼出“Master”的極限,可也逼出了不少下限。一邊 是對人工智慧敬仰的口水,一邊是肆意踩踏職業棋手尊嚴的口水,這次人機大戰引發了別 樣的風波。 比如高曉松就在微博上表示,“作為自幼學棋、崇拜國手的業餘棋手,看了Master橫掃中 日韓頂尖高手的對局,難過極了。多少代大師上下求索,求道求術,全被破解。未來一個 八歲少年只要一部手機就可以戰勝九段,榮譽信仰灰飛煙滅。等有一天,機器做出了所有 的音樂與詩歌,我們的路也會走完。” 高曉松的微博“激怒”了唐韋星。後者回應道:“職業棋士就算下不過電腦也是你一輩子 比不上的,別說手機,高考讓帶手機嗎?比賽也不會讓你帶的。真搞不懂有狗了就覺得職 業棋士差的人是怎麼想的。” 某圍棋教育創始人這樣說:“頂尖職業棋手都認識到了,自己以為對的,其實都是錯的。 自己以為的高明,其實都是笑談。老師,還是不懂的,最好。” 從求勝變求道 職業棋手一朝被機器打敗,奕城在考慮AI未來對自己平臺的衝擊,職業棋手則開始思考, 被心中只有勝率和演算法的機器打敗後,是不是說明圍棋在求勝之餘也有求道之路需要探 索。 高曉松的話逆耳,卻吻合專家的預言,比如圍棋比賽的網路預選賽制將很難再搞。這只是 信念危機,還有信任危機。李哲勇說:“下棋本來是公平對決,如今要是大家都不再相信 對手,都猜疑對手會使用AlphaGo作弊,怎麼辦?” 好在,人工智慧的衝擊也讓圍棋人想起求道之路。“當今活躍的一流棋手,幾乎都在奕城 上從小練棋成長,包括柯潔,從小孩開始,就用‘潛伏’這個用戶名在這上面練棋。這裡 仍是棋迷們手談、心靈交流的平臺,這種情感不是一場勝負可以取代的。”李哲勇說。 但求勝仍是職業棋手的終極目標。轉換思路,如今打敗了棋手的AI,也正是棋手探索圍棋 未知領域的最佳助手。陳耀燁兩盤不敵“Master”後說,下了還想再下。他認為與AI過招 ,正是有利於打破思維定式的訓練方式,“AI錯誤更少,如果將來有單機版能用於訓練的 話,以後訓練模式肯定會不一樣。越接觸AI越感到圍棋的深奧,未來提升空間很大。” 同樣樂觀的還有柯潔。他說:“人類數千年的實戰演練進化,電腦卻告訴我們人類全是錯 的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但我想說,從現在開始,我們棋手將結 合電腦,邁進全新的領域,達到全新的境界。”面對AI來襲,擁有樂觀和開放的心態,這 至少是一個好的開始。 文/本報記者褚鵬 http://xw.qq.com/sports/20170106012058/SPO2017010601205800 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.73.138 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1483688442.A.C74.html ※ 編輯: zkow (140.112.73.138), 01/06/2017 15:43:53

01/06 15:46, , 1F
旁邊要有醫護人員待命 怕又嘔出幾兩血了
01/06 15:46, 1F

01/06 15:47, , 2F
有消息稱... 這也能當新聞呀 有確定再PO
01/06 15:47, 2F
  不費“一槍一彈”,谷歌進行了對升級版AlphaGo的測試。眾多中日韓頂尖棋手帶著 對圍棋的熱愛,甘心充當了免費程式測試員。不過記者瞭解到,就在今年,谷歌將邀請中 國圍棋第一人柯潔正式和AlphaGo進行人機大戰。 http://sports.sina.com.cn/go/2017-01-06/doc-ifxzkfuk2449090.shtml 新浪記者有消息 ※ 編輯: zkow (140.112.73.138), 01/06/2017 15:56:36 ※ 編輯: zkow (140.112.73.138), 01/06/2017 15:56:59

01/06 16:07, , 3F
沒看天氣預報XDDDD
01/06 16:07, 3F

01/06 16:15, , 4F
摔下又爬上去,邊碎唸邊樂此不疲,這樣的慕道者不該被酸的.
01/06 16:15, 4F

01/06 16:16, , 5F
雖然大概很難贏了 不過有勇氣去挑戰才是真佩服
01/06 16:16, 5F

01/06 16:20, , 6F
圍棋棋王對決alphaGO,這才是今年的重頭戲
01/06 16:20, 6F

01/06 16:21, , 7F
希望柯潔能發揮全力,至少不能比卡斯帕洛夫差
01/06 16:21, 7F

01/06 16:40, , 8F
推詳細
01/06 16:40, 8F

01/06 16:48, , 9F
看AlphaGo要讓幾子 一面倒大屠殺不精彩
01/06 16:48, 9F

01/06 16:58, , 10F
這如果不限時且別人(如古力)在旁推演討論的話,就蠻有戲!
01/06 16:58, 10F

01/06 16:59, , 11F
怎可能不限時,也太早承認人類贏不過alphaGO了吧
01/06 16:59, 11F

01/06 17:00, , 12F
慢棋會好很多 不過大概勝算不高就是了
01/06 17:00, 12F

01/06 17:01, , 13F
至少不會馬上就崩盤 但中盤不取得領先 大概還是會被
01/06 17:01, 13F

01/06 17:01, , 14F
到輸幾目
01/06 17:01, 14F

01/06 17:03, , 15F
而且柯潔說不定會下出如小李第78手那樣的年度妙手呀
01/06 17:03, 15F

01/06 17:04, , 16F
也是 如果有神之一手 又會創新歷史XD
01/06 17:04, 16F

01/06 17:06, , 17F
有人比我樂觀呀 XD 如果八位棋聖附體 也許柯基能贏一盤吧
01/06 17:06, 17F

01/06 17:08, , 18F
如果去看看這些快棋,會發現master收官時讓得超誇張的..
01/06 17:08, 18F

01/06 17:10, , 19F
有些很誇張 有些其實還好 我感覺阿狗官子平均虧一貼目
01/06 17:10, 19F

01/06 17:48, , 20F
虐好虐滿 先準備救護車吧,不過還是期待柯潔最後一招XD
01/06 17:48, 20F

01/06 18:11, , 21F
上次贏了李世石就算GOOGLE講白要測試也一定是大家搶著上吧
01/06 18:11, 21F

01/06 18:12, , 22F
只是有神秘感比較有趣而已,有些人還是一直不信是AG XD
01/06 18:12, 22F

01/06 18:35, , 23F
又要住院了嗎....
01/06 18:35, 23F

01/06 18:35, , 24F
我以為是染金毛的小屁孩泡網咖,怎麼可能是黃博士
01/06 18:35, 24F

01/06 18:47, , 25F
挑戰吧 這次希望能贏 酸民要放下成見
01/06 18:47, 25F

01/06 19:43, , 26F
柯潔住院也只是之前腸胃炎惡化 不會再住院啦XD
01/06 19:43, 26F

01/06 19:48, , 27F
柯潔年尾賽程很累吧 不然輸朴永訓那手失誤也有點驚人
01/06 19:48, 27F

01/06 20:16, , 28F
柯基又和升級的絕藝幹上了 結果絕藝出 bug gg
01/06 20:16, 28F

01/06 21:13, , 29F
真的是逼出了下限
01/06 21:13, 29F

01/06 21:13, , 30F
不知道google他們考不考慮打升降賽
01/06 21:13, 30F

01/06 21:20, , 31F
感覺DM要的是全勝 全勝對科學有意義 讓幾子是棋界才關注
01/06 21:20, 31F

01/06 21:29, , 32F
絕藝還是不行 奇怪 不是進化過了嗎...
01/06 21:29, 32F

01/06 21:33, , 33F
阿狗不是誰都能做出來的 但也已經很強了
01/06 21:33, 33F

01/06 22:00, , 34F
雖然說不行 但也已經屌打非頂尖的95%棋手了吧
01/06 22:00, 34F

01/06 22:01, , 35F
絕藝比升級前還弱 連毛毛都輸呀 = =
01/06 22:01, 35F

01/06 22:02, , 36F
柯潔如果要跟阿法狗下,我覺得至少前一個禮拜要好好休息
01/06 22:02, 36F

01/06 23:24, , 37F
DM那個論文裡,很多都沒細講,中國AI可能會碰到瓶頸
01/06 23:24, 37F

01/06 23:25, , 38F
就是木遙所說的過擬合,不知DM是如何跨越這個瓶頸的
01/06 23:25, 38F

01/06 23:56, , 39F
標題應該是柯潔挑戰阿狗吧...
01/06 23:56, 39F

01/07 00:07, , 40F
標題倒過來應該比較合適。如果是第一次人機,這樣取還ok
01/07 00:07, 40F

01/07 00:54, , 41F
不考慮升降十番棋嗎?不然這版AlphaGo可以全殲李世石
01/07 00:54, 41F

01/07 00:55, , 42F
的舊版,柯潔要是連吃五盤中押敗也沒什麼意思啊
01/07 00:55, 42F

01/07 01:02, , 43F
看到百度吧,連笑有接受訪問,說不願意接受讓先跟讓子
01/07 01:02, 43F

01/07 01:02, , 44F
網友就在說,或許多數棋手都不願意接受這樣
01/07 01:02, 44F

01/07 01:10, , 45F
柯潔有說過他想下升降 輸贏一盤 增減2目這樣
01/07 01:10, 45F

01/07 01:12, , 46F
不過我猜DM沒興趣 分先全勝 跟 讓子輸棋 一定選前面吧
01/07 01:12, 46F

01/07 01:35, , 47F
讓目沒辦法, 它只會下中國規則
01/07 01:35, 47F

01/07 01:38, , 48F
任何會影響勝負判斷的規則改動 都需要重新訓練
01/07 01:38, 48F

01/07 01:42, , 49F
master這次下的是韓國規則
01/07 01:42, 49F

01/07 01:44, , 50F
它內部判斷用的還是貼七目半啊 少貼一目又不影響判斷
01/07 01:44, 50F

01/07 01:46, , 51F
但是要多貼就不行了 所以沒辦法動態調整
01/07 01:46, 51F

01/07 01:48, , 52F
少貼一目就相當於執白虧一目
01/07 01:48, 52F

01/07 01:48, , 53F
所以只能下讓子吧?不過要柯潔接受讓子有點難
01/07 01:48, 53F

01/07 01:49, , 54F
所以有人說可以利用這點,當Master執白時跟他逼到他以為
01/07 01:49, 54F

01/07 01:50, , 55F
會半目贏,他搞不好會讓你,但是要逼到半目談何容易
01/07 01:50, 55F

01/07 01:56, , 56F
收官的時候rollout/value network的比例調整一下也不難吧..
01/07 01:56, 56F

01/07 01:56, , 57F
. master進化了什麼又還沒公佈,總之韓國規則還沒人擊敗它
01/07 01:56, 57F

01/07 01:56, , 58F
過,就先別如此肯定它只會中國規則了
01/07 01:56, 58F

01/07 01:57, , 59F
這個是之前論文裡講的啊 @@ 而且 DCNN 部份的確是如此
01/07 01:57, 59F

01/07 02:00, , 60F
之前論文適用master?
01/07 02:00, 60F

01/07 02:14, , 61F
這部份沒什麼道理會變, 訓練很多份更是不合成本
01/07 02:14, 61F

01/07 02:16, , 62F
之前有公開過準備要拋棄初始階段的人類棋譜重新訓練一邊
01/07 02:16, 62F

01/07 02:18, , 63F
算算時間應該差不多 程式表現出來的行為也和預測差不多
01/07 02:18, 63F

01/07 02:25, , 64F
說不定不用重新訓練,可以直接用中國規則類推韓國規則
01/07 02:25, 64F

01/07 02:27, , 65F
不用重新用微調的也是一種常見方法
01/07 02:27, 65F

01/07 02:33, , 66F
數子法黑貼3又3/4子,與比目法貼6.5目大多情況勝負結果是一致
01/07 02:33, 66F

01/07 02:34, , 67F
讓AI自行類推也是一種AI法,深度學習的翻譯,只要訓練
01/07 02:34, 67F

01/07 02:34, , 68F
翻譯成英文,即可自己類推兩種沒訓練過的語言翻譯
01/07 02:34, 68F

01/07 02:36, , 69F
說不定圍棋規則也可以用同套技術XD
01/07 02:36, 69F

01/07 02:51, , 70F
上面原本是說輸贏一盤增減兩目啊 @@ 怎麼想都很複雜
01/07 02:51, 70F

01/07 02:56, , 71F
數子法數目法應該多少有差,不然不會現在覺得6.5差不
01/07 02:56, 71F

01/07 02:58, , 72F
多,但貼7.5目幾乎有共識黑棋劣勢
01/07 02:58, 72F

01/07 03:57, , 73F
差別就是白177可能是半目勝或半目敗,唯一一盤半目對朴的是
01/07 03:57, 73F

01/07 03:57, , 74F
白177半目勝,所以也看不出來有沒有作調整...
01/07 03:57, 74F

01/07 04:08, , 75F
不過想想差一目好像rollout調整就好,policy net應該沒差
01/07 04:08, 75F

01/07 04:09, , 76F
如果要下讓先之類的就不能只調rollout
01/07 04:09, 76F

01/07 08:41, , 77F
....黑盤7 比目法勝 數子法敗 這不是數學可證明的嗎??
01/07 08:41, 77F

01/07 10:26, , 78F
盤七要看誰收後
01/07 10:26, 78F

01/07 10:38, , 79F
更正,是白177可能是盤六或盤七,看收後
01/07 10:38, 79F

01/08 13:30, , 80F
期待
01/08 13:30, 80F
文章代碼(AID): #1ORqdwnq (GO)