建設(shè)和運(yùn)營小而精的網(wǎng)站需從幾個方面入手 |
發(fā)布時間:2016-02-10 文章來源: 瀏覽次數(shù):3212 |
作者:劉鋒 計算機(jī)博士,互聯(lián)網(wǎng)進(jìn)化論作者,人工智能學(xué)家主編 ”把大象關(guān)進(jìn)冰箱要幾步“涉及的科學(xué)漏洞
在討論谷歌圍棋AI及其比賽題目之前,我們先看那個聞名的笑話“把大象關(guān)進(jìn)冰箱要幾步“,2000年中國春晚,趙本山、宋丹丹的小品《鐘點(diǎn)工》,曾經(jīng)用到了這個笑話:問“把大象放進(jìn)冰箱總共分幾步?”答:“三步,第一步把冰箱門打開;第二步把大象放進(jìn)去,第三步把冰箱門帶上”。 小品中的情景只是一個笑話,從科研角度看,由于故意忽視最為樞紐的第二步,使得這個原本偉大的科學(xué)實驗,變成了笑話段子。本文提出谷歌圍棋AI及其比賽有科學(xué)欺詐表現(xiàn),根源也在這里。 谷歌圍棋AI在Nature上畢竟說了什么 谷歌在Nature發(fā)表論文闡述了其圍棋AI程序AlphaGo的運(yùn)行原理,這個原理描述相對專業(yè),這里我們也力爭用通俗易懂的語言描述谷歌畢竟說了什么,谷歌圍棋AI程序AlphaGo在下棋過程中主要通過四步完成工作,它們分別是: 第一步快速判定:用于快速的觀察圍棋的盤面,類似于人觀察盤面獲得的第一反應(yīng) 第二步深度模仿 :AlphaGo學(xué)習(xí)近萬盤人類歷史高手的棋局來進(jìn)行模仿學(xué)習(xí),用得到的經(jīng)驗進(jìn)行判定。這個深度模仿能夠根據(jù)盤面產(chǎn)生類似人類棋手的走法。 第三步自學(xué)成長:AlphaGo不斷與“自己”對戰(zhàn),下了3000萬盤棋局,總結(jié)出經(jīng)驗作為棋局中的評估依據(jù)。 第四步全局分析:利用第三步學(xué)習(xí)結(jié)果對整個盤面的贏面判定,實現(xiàn)從全局分析整個棋局。 判定欺詐的第一個原因,谷歌的把大象關(guān)冰箱題目 Nature論文闡述的AlphaGo基本原理,按照人工智能專家的評價:”其基本原理并沒有新東西“,但核心價值是學(xué)習(xí)了近萬盤人類歷史高手的棋局,和自我對戰(zhàn)下的3000萬盤棋局總結(jié)的經(jīng)驗。 請留意,這個樞紐內(nèi)容,也就是AlphaGo到底終結(jié)出什么圍棋規(guī)律,或者其神經(jīng)網(wǎng)絡(luò)的權(quán)重值是什么,谷歌并沒有發(fā)表出來。也就是谷歌在”大象關(guān)進(jìn)冰箱要幾步“題目上,說出了如何打開圍棋擊敗人類的冰箱大門,和如何關(guān)上圍棋擊敗人類的冰箱大門,但唯獨(dú)在第二步 圍棋如何擊敗人類的方法塞進(jìn)冰箱,同樣做了躲藏。 我們知道,圍棋之所以很難被人工智能攻破,擊敗人類高手,就是其可能的組合數(shù)異常龐大。至于多么異常,2016年1月普林斯頓的研究職員給出了最新研究結(jié)果:對于一個19x19的圍棋棋盤而言,一共有361個位置,而每個位置可以單獨(dú)放置黑棋、白棋或者留空,理論上所有的可能組合是3^361種。但根據(jù)圍棋規(guī)則,不是所有位置都可正當(dāng)落子,例如在圍棋術(shù)語中沒有氣的位置就不能落子。那么排除掉這些不正當(dāng)?shù)钠寰趾罂偣策剩多少種呢? 普林斯頓的研究職員給出的19x19格圍棋的精確正當(dāng)棋局?jǐn)?shù):208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935 我們給它多分幾行: 2081681993819799846 9947863334486277028 6522453884530548425 6394568209274196127 3801537852564845169 8519643907259916015 6281285460898883144 2712971531931755773 6620397247064840935 不用數(shù)了,一共171位數(shù)! 這個數(shù)字比我們地球所有的沙粒數(shù)目還要多!比人類已知宇宙的所有星球數(shù)目還要多!對比一下,谷歌學(xué)習(xí)的近萬盤人類棋局是5位數(shù),谷歌自行對戰(zhàn)的3000萬盤是8位數(shù)。而圍棋所有可能的棋局盤數(shù)是171位數(shù)。假如規(guī)避還有可能的重復(fù)變化,我們把大頭去掉,那也有70位數(shù)的棋局變化。 第一也就是說谷歌以幼兒園規(guī)模的知識量,就要獲得諾貝爾獎級的知識規(guī)律,這是違反科學(xué)發(fā)展規(guī)律和常識的,第二,假如谷歌通過學(xué)習(xí)和自行對戰(zhàn)學(xué)到了超出平常的規(guī)律,或者其神經(jīng)網(wǎng)絡(luò)權(quán)重值達(dá)到新的高度狀態(tài)。但谷歌不愿意公然這個最重要最樞紐的內(nèi)容,其他研究者就無法真正了解谷歌圍棋的真實水平。在這種情況下,匆忙舉辦獲得巨大貿(mào)易利益,沒有第三方真正監(jiān)視,無法洗脫作弊嫌疑的世界冠軍比賽。受到科學(xué)欺詐指控也屬必定。 判定欺詐的第二個原因,密室實驗與棋手放水 從科學(xué)實驗的嚴(yán)謹(jǐn)性說,谷歌在論文中闡述的實驗方法,表現(xiàn)不及格甚至惡劣,我們知道在物理,化學(xué),生物,計算機(jī)等領(lǐng)域,進(jìn)行實驗時,要求實驗對象必需達(dá)到一定數(shù)目,并進(jìn)行多次獨(dú)立實驗。才能相對確保結(jié)果的不亂性和可靠性。譬如一個受到污染的試管,不管我們重復(fù)多少次實驗,其結(jié)果也一定是不可靠的。 谷歌在這篇論文中 對其他圍棋程序選取了眾多測試對象,并進(jìn)行了495次實驗,但對人類測試者,卻只選取了一位曾經(jīng)獲得歐洲圍棋冠軍的棋手,并簽署嚴(yán)格的保密協(xié)議,原本可以很輕易邀請更多選手,但卻沒有按照科學(xué)規(guī)范進(jìn)行多次實驗。先不談谷歌和棋手之間有無利益交易,就這一點(diǎn),谷歌在Nature發(fā)表的論文從實驗角度是分歧格的。 更重要的題目出在與谷歌對戰(zhàn)的歐洲圍棋冠軍樊麾身上,在對戰(zhàn)棋譜宣布后的二個月里,大量職業(yè)圍棋高手蘊(yùn)藉或公然指出樊麾水平施展變態(tài),或不求進(jìn)取,或就是放水。 多次擊敗李世石,當(dāng)前世界最優(yōu)秀的圍棋選手柯潔評價道:“他可能也是好久不下棋了,實力表現(xiàn)非常糟糕”。前北京市高校圍棋冠軍王爍在財新發(fā)布的文章中評價道:“這五局棋下得反而是很平庸。樊麾抵擋不足,五盤棋沒有什么激烈的戰(zhàn)斗,開局、定式、占大場、小規(guī)模接觸戰(zhàn),收官,對抗度很差。” 固然歐洲圍棋冠軍樊麾多次辯解“我施展變態(tài),當(dāng)時崩潰了“,但更多棋友評價歐洲圍棋冠軍樊麾,“施展有技術(shù)變形”,“樊麾的表現(xiàn)只有業(yè)4水準(zhǔn),樞紐地方顯著放水”,“很顯著樊麾是谷歌公司的托,全是50年前的招法極其守舊,不輸才怪”,“對于谷歌,沒有什么假話是不能用1千萬美金解決的”。 除此之外,谷歌也沒有向Facebook那樣把圍棋程序放到互聯(lián)網(wǎng)上,光明磊落的接受大眾的考驗,作為與谷歌AlphaGo原理相同facebook圍棋程序DarkForest,目前水平相稱于業(yè)余5段,與職業(yè)選手依然有巨大的差距。 同時谷歌的論文結(jié)論也存在不可重復(fù)題目,F(xiàn)acebook圍棋項目負(fù)責(zé)人田淵棟在評價谷歌圍棋AI最為樞紐的快速走子策略時講到”對此AlphaGo只提供了局部特征的數(shù)量,而沒有說明特征的詳細(xì)細(xì)節(jié)。我最近也實驗了他們的辦法,達(dá)到了25.1%的正確率和4-5微秒的走子速度,然而全系統(tǒng)整合下來并沒有復(fù)現(xiàn)他們的水平。我感覺上24.2%并不能完全概括他們快速走子的棋力,由于只要走錯樞紐的一步,局面判定就完全錯誤了“。 從上述情況看,谷歌圍棋實驗刻意違背科學(xué)規(guī)范,采用密室孤立實驗,這些題目在3月9日與韓國選手李世石的比賽中沒有消除。人們常說,互聯(lián)網(wǎng)上,你不知道你的對面坐的是人仍是條狗。同樣對于谷歌圍棋比賽,我們完全可以質(zhì)疑,與李世石對弈的畢竟是程序仍是人?如何保證李世石沒有被利益收買?谷歌即使不贏,實在也是勝了,魯迅的那個故事,乞丐:趙老爺今天打了我。 判定欺詐的第三個原因,過度追求市場影響與進(jìn)步股價
谷歌選擇歐洲圍棋冠軍和前圍棋冠軍李世石進(jìn)行世界轟動的比賽,而且沒有嚴(yán)格的第三方監(jiān)視,排除作弊的可能,表明谷歌并不是追求科學(xué)的嚴(yán)謹(jǐn)和榮譽(yù),而是在追求品牌和影響力最大化,從而獲得巨大的經(jīng)濟(jì)利益。 事實也證實這一點(diǎn),2016年1月28日曝出了谷歌人工智能圍棋戰(zhàn)勝歐洲冠軍的動靜,隨后是谷歌拿出100萬美元作為獎金挑戰(zhàn)李世石。當(dāng)日谷歌股價大幅上漲,漲幅4.42%,換算成市值漲了200億美元。從宣傳效果是看,谷歌這次的“廣告”做非常巧妙。2016年2月26日彭博社報道,谷歌旗下人工智能公司DeepMind正推進(jìn)自身醫(yī)療技術(shù)發(fā)展,由于其在圍棋領(lǐng)域的影響,已經(jīng)獲得不菲的訂單。 谷歌的技術(shù)期貨路徑和消除欺詐指控的方法
西方諺語說”一個動物,假如它走起來像鴨子 叫起來像鴨子 它就是鴨子“,同樣,對于谷歌圍棋Ai及其比賽,假如它回避公然如何從3000萬盤(8位數(shù))棋局獲得171位天文數(shù)字棋局的規(guī)律或神經(jīng)網(wǎng)絡(luò)權(quán)重值,回避不愿大范圍邀請棋手介入實驗,回避收買選手嫌疑,回避不在互聯(lián)網(wǎng)上公然對戰(zhàn)接受監(jiān)視,那么谷歌的圍棋比賽可以看作一場精心策劃的科學(xué)騙局或有欺詐嫌疑。 貿(mào)易中有一種做法叫產(chǎn)品期貨,消費(fèi)者購買商品后,要等到半年或一年后才能拿到,那時技術(shù),原料本錢大幅下降,商家因此獲得利潤。同樣,谷歌的圍棋程序應(yīng)該獲得一定進(jìn)展,但遠(yuǎn)沒有到達(dá)能夠挑戰(zhàn)職業(yè)選手或九段高手的地步,谷歌通過市場和技術(shù)手段,拔高其圍棋水平。故意回避公然監(jiān)視或公然大范圍對戰(zhàn)。等待未來水平繼承晉升后,可能會進(jìn)行公然,這種做法也可以稱作 ”技術(shù)期貨路徑。 谷歌可以消除欺詐指控的嫌疑,不是與李世石下棋,而是: 1.完整宣布或開源其利用3000萬盤棋局和學(xué)習(xí)人類棋譜總結(jié)的規(guī)律,或公然其神經(jīng)網(wǎng)絡(luò)權(quán)重值參數(shù),讓其他實驗者可以重復(fù)谷歌的實驗結(jié)果,還原谷歌對戰(zhàn)成績。 2.將谷歌圍棋AI程序AlphaGo放在互聯(lián)網(wǎng)上,接受百人,千人的同時對戰(zhàn)。并檢測對戰(zhàn)結(jié)果,消除作弊嫌疑。 這兩條谷歌能做出任意一條都可以看作是消除欺詐指控的強(qiáng)有力證據(jù),但在未來一年或更長時間里,谷歌沒有任何動作,那么谷歌將持續(xù)背負(fù)有科學(xué)欺詐嫌疑,利用科學(xué)炒作獲得巨大經(jīng)濟(jì)利益的指控。 |
|