午夜av网址在线观看免费,欧洲久久久久久免费免费,欧美午夜一区二区福利视频,肥婆老熟妇精品视频在线

明知AlphaGo變得無(wú)法戰(zhàn)勝,柯潔為何還迎難而上?

圍棋如同所有競(jìng)技賽事一樣,柯潔也是專業(yè)的運(yùn)動(dòng)員。對(duì)于運(yùn)動(dòng)員來(lái)說(shuō),勝敗乃兵家常事,面對(duì)實(shí)力懸殊很大的對(duì)手,任何人都很難取勝?,F(xiàn)在柯潔面對(duì)的就是這樣一個(gè)對(duì)手。
明知AlphaGo變得無(wú)法戰(zhàn)勝,柯潔為何還迎難而上?
柯潔與AlphaGo對(duì)弈

   柯潔輸了,在與AlphaGo的第一場(chǎng)對(duì)決中,以四分之一子的落后惜敗。

  這個(gè)結(jié)果在很多人意料之中,其中也包括柯潔。

  第一場(chǎng)賽后發(fā)布會(huì)上,柯潔直言AI的進(jìn)步速度太快了,并且每一次都是巨大的進(jìn)步。這也是為什么他在大賽前夕發(fā)布微博稱,此次將是他與人工智能的最后三盤對(duì)決。

  柯潔心中已經(jīng)清晰的知道,人類已經(jīng)無(wú)法戰(zhàn)勝AlphaGo。他形容AlphaGo越來(lái)越像“圍棋上帝”,想贏它只能去找一些BUG,但目前,他還沒(méi)看到AlphaGo的任何弱點(diǎn)。

  這里引用搜狗CEO王小川在知乎上發(fā)布的內(nèi)容,再向大家科普一下AlphaGo。

  去年的AlphaGo 混合了三種算法,即蒙特卡洛樹搜索+監(jiān)督學(xué)習(xí)+增強(qiáng)學(xué)習(xí)。

  其中蒙特卡洛樹搜索是一種優(yōu)化過(guò)的暴力計(jì)算;監(jiān)督學(xué)習(xí),是通過(guò)學(xué)習(xí)3000萬(wàn)部人類棋譜,對(duì)六段以上職業(yè)棋手走棋規(guī)律進(jìn)行模仿,也是AlphaGo獲得突破性進(jìn)展的關(guān)鍵算法;而增強(qiáng)學(xué)習(xí)作為輔助,是兩臺(tái)AlphaGo從自我對(duì)戰(zhàn)中學(xué)習(xí)如何下棋。

  每當(dāng)獲取棋局信息時(shí),AlphaGo 會(huì)根據(jù)策略網(wǎng)絡(luò)探索哪個(gè)位置同時(shí)具備高潛在價(jià)值和高可能性,進(jìn)而決定最佳落子位置。在分配的搜索時(shí)間結(jié)束時(shí),模擬過(guò)程中被系統(tǒng)最頻繁考察的位置將成為AlphaGo 的最終選擇。

  簡(jiǎn)單來(lái)說(shuō),AlphaGo下棋依靠的是概率,而概率的得出則依靠前期學(xué)習(xí)。而這次與柯潔對(duì)戰(zhàn)的AlphaGo相較于去年,已經(jīng)判若兩人。

  最初的AlphaGo主要依靠監(jiān)督學(xué)習(xí),即學(xué)習(xí)對(duì)象幾乎全部來(lái)自人類棋手,而新版的AlphaGo則強(qiáng)化了增強(qiáng)學(xué)習(xí),主要對(duì)機(jī)器自我對(duì)弈產(chǎn)生的棋局進(jìn)行學(xué)習(xí)。

  難怪柯潔會(huì)覺(jué)得,去年AlphaGo的下法還很接近人類,但今年自己對(duì)戰(zhàn)時(shí),AlphaGo已變得更加不合乎“常理”,下了很多人類棋手不可能下的棋子。

柯潔與AlphaGo對(duì)弈
  第一局結(jié)果

  DeepMind創(chuàng)始人、AlphaGo之父Demis Hassabis證實(shí)了這一點(diǎn),他說(shuō)與柯潔對(duì)戰(zhàn)的AlphaGo更多的是根據(jù)自身學(xué)習(xí),對(duì)人類數(shù)據(jù)的依賴性越來(lái)越小。

  除了開始脫離人類數(shù)據(jù),更讓人類望塵莫及的是其恐怖的進(jìn)步速度。我們常說(shuō)要“取長(zhǎng)補(bǔ)短”,AlphaGo則可以把這個(gè)過(guò)程加快成百上千倍。

  取長(zhǎng)方面暫不多說(shuō),AlphaGo的研發(fā)團(tuán)隊(duì)一直在找它的缺口。去年輸給李世石之后,他們回去馬上改善了AlphaGo的知識(shí)缺口,并且投入更多精力去改進(jìn)算法,讓AlphaGo變得更強(qiáng)。

  這次的AlphaGo在算法上就強(qiáng)大了很多。去年,AlphaGo還是通過(guò)分布式的計(jì)算機(jī)來(lái)運(yùn)作,而今年只用了一個(gè)單一的機(jī)器。所以,柯潔非但沒(méi)有讓AlphaGo的CPU因?yàn)轱w速運(yùn)轉(zhuǎn)而發(fā)熱,相反,今天的AlphaGo的計(jì)算能力比去年要小10倍。

  從比賽用時(shí)上來(lái)看,柯潔幾乎是AlphaGo的兩倍。雙方第一場(chǎng)比賽共耗時(shí)4小時(shí)17分37秒,其中柯潔用時(shí)2小時(shí)46分43秒,AlphaGo用時(shí)1小時(shí)30分54秒。

  學(xué)的又多又快,人類棋手確實(shí)很難看到勝算??聺嵰部吹搅诉@一點(diǎn),但他為什么還要應(yīng)戰(zhàn)。

  這也是普通網(wǎng)友最關(guān)心的問(wèn)題了,柯潔的輸贏到底是否需要將其上升到“人類尊嚴(yán)”這種高度?答案肯定是不能。

  圍棋如同所有競(jìng)技賽事一樣,柯潔也是專業(yè)的運(yùn)動(dòng)員。對(duì)于運(yùn)動(dòng)員來(lái)說(shuō),勝敗乃兵家常事,面對(duì)實(shí)力懸殊很大的對(duì)手,任何人都很難取勝。

  現(xiàn)在柯潔面對(duì)的就是這樣一個(gè)對(duì)手。所以對(duì)于比賽接下來(lái)的關(guān)注點(diǎn)不該是柯潔能否勝一局,而是AlphaGo所代表AI技術(shù)將為人類帶來(lái)什么。

  目前來(lái)看,AlphaGo已經(jīng)顛覆了傳統(tǒng)的圍棋??聺嵲诒荣愔幸矅L試了一些“非常規(guī)”下法,他認(rèn)為AlphaGo已經(jīng)改變了自己很多最初的看法,現(xiàn)在覺(jué)得比賽中沒(méi)有什么棋是不能下的。

  Demis Hassabis在賽前的致辭中說(shuō)道,圍棋的樣式變化繁多,可能再過(guò)一萬(wàn)年,人類也無(wú)法窮盡圍棋的打法。

  而AlphaGo可以作為一個(gè)工具,通過(guò)它去幫助人類對(duì)于圍棋的理解,讓偉大的棋手去發(fā)現(xiàn)圍棋更多的奧妙。

  這確實(shí)是一種很奇妙的感覺(jué)。當(dāng)你認(rèn)為一件幾乎是唯一的事情,突然有了另外一種可能,這就像哥倫布發(fā)現(xiàn)新大陸后,給未來(lái)開啟了一扇新的大門。

  柯潔說(shuō)活到現(xiàn)在,最大的榮幸是和AlphaGo進(jìn)行了對(duì)戰(zhàn),很感謝能有這樣的對(duì)手。他從AlphaGo身上獲得了很多比賽的快樂(lè),這種快樂(lè)來(lái)自于競(jìng)技,而非結(jié)果。

  比賽結(jié)束以后,柯潔更希望把AlphaGo當(dāng)做幫助自己提升棋藝的工具。在人與機(jī)器之間,他選擇跟人類下棋,他笑著說(shuō),“我跟人類比賽的勝率還是可以的。”
讀者們,如果你或你的朋友想被手機(jī)報(bào)報(bào)道,請(qǐng)狠戳這里尋求報(bào)道
相關(guān)文章
熱門話題
推薦作者
熱門文章
  • 48小時(shí)榜
  • 雙周榜
熱門評(píng)論
闸北区| 陆河县| 凌源市| 英吉沙县| 仁化县| 万州区| 马山县| 广德县| 古浪县| 井研县| 普陀区| 宣汉县| 松江区| 衡阳市| 山阳县| 吴堡县| 宁晋县| 漳州市| 云霄县| 会同县| 渝中区| 延长县| 红河县| 平利县| 措美县| 炉霍县| 广州市| 瓮安县| 隆回县| 金门县| 长治县| 芜湖县| 宜川县| 平昌县| 上杭县| 大关县| 海兴县| 海阳市| 马公市| 潜江市| 湟源县|