封殺這個(gè)公式,AI智商將為零
當(dāng)前位置:點(diǎn)晴教程→閑情逸致
→『 微信好文 』
本文節(jié)選自《人類最美的54個(gè)公式》 我思故我在 AI背后的神秘公式 近代哲學(xué)奠基人,偉大的笛卡爾說(shuō)出“我思故我在”時(shí),上帝震驚了。 第一個(gè)被賦予公民身份的機(jī)器人Sophia(索菲婭)被問(wèn)到:你怎么知道自己是機(jī)器人?Sophia的回答是:你怎么知道自己是人類? 機(jī)器人會(huì)反駁了,這到底是新世紀(jì)的福音,還是人類的轉(zhuǎn)折? AI(人工智能)已經(jīng)不再是完全被動(dòng)地向人類表述世界,而開始主觀性地表達(dá)意見。 Google自動(dòng)駕駛汽車的操縱系統(tǒng),G-mail對(duì)垃圾郵件的處理,MIT主導(dǎo)的人類“寫字”系統(tǒng),以及最新的SIRI智能語(yǔ)音助手平臺(tái),還有挑戰(zhàn)人類最后智慧堡壘的AlphaGo系統(tǒng),都已經(jīng)開始了“深度學(xué)習(xí)”暴風(fēng)雨式革命。 這幾年,機(jī)器智能向“我思故我在”這個(gè)哲學(xué)命題步步逼近,一只神秘之手躲在后面操縱,它就是貝葉斯公式。 當(dāng)科學(xué)在證明自己對(duì)世界的客觀認(rèn)知時(shí),貝葉斯公式卻融入了人類的主觀性。 “不科學(xué)”的貝葉斯-拉普拉斯公式 貝葉斯定理是18世紀(jì)英國(guó)數(shù)學(xué)家托馬斯·貝葉斯提出的概率理論。 該定理源于他生前為解決一個(gè)“逆概”問(wèn)題寫的一篇文章,在貝葉斯寫這篇文章之前,人們已經(jīng)能夠計(jì)算“正向概率”,如“假設(shè)袋子里面有P只螃蟹,Q只蜘蛛,你伸手進(jìn)去摸一把,摸到螃蟹的概率是多大”。但反過(guò)來(lái)看:“如果我們事先并不知道袋子里面螃蟹和蜘蛛的比例,而是閉著眼睛摸出一只(或好幾只)螃蟹,那么我們可以就此對(duì)袋子里面的螃蟹和蜘蛛的比例作出什么樣的推測(cè)。”這個(gè)問(wèn)題就是逆向概率問(wèn)題。 這個(gè)研究看起來(lái)似乎簡(jiǎn)單而平淡無(wú)奇,直到他死后的兩年才于1763年發(fā)表。它的數(shù)學(xué)原理很容易理解,就像一個(gè)迷信星座的HR,如果你碰到一個(gè)處女座的應(yīng)聘者,你會(huì)推斷那個(gè)人多半是一個(gè)追求完美的人。這就是說(shuō),當(dāng)你不能準(zhǔn)確知悉某個(gè)事物本質(zhì)時(shí),你可以依靠經(jīng)驗(yàn)去判斷其本質(zhì)屬性的概率。與其他統(tǒng)計(jì)學(xué)方法不同,貝葉斯方法建立在主觀判斷的基礎(chǔ)上,讓人感覺不科學(xué),這也是它200多年來(lái)不為科學(xué)家們待見的原因。 除了貝葉斯,1774年,法國(guó)數(shù)學(xué)家拉普拉斯也非常“不科學(xué)”地發(fā)現(xiàn)了貝葉斯公式。這位創(chuàng)立了大名鼎鼎的諦聽神獸拉普拉斯獸的科學(xué)家,給出了我們現(xiàn)在所用的貝葉斯公式的表達(dá):
該公式表示在B事件發(fā)生的條件下A事件發(fā)生的條件概率,等于A事件發(fā)生條件下B事件發(fā)生的條件概率乘以A事件的概率,再除以B事件發(fā)生的概率。公式中,P(A)也叫做先驗(yàn)概率,P(A/B)叫做后驗(yàn)概率。 像微積分公式的全稱是“牛頓-萊布尼茨公式”一樣,貝葉斯公式至少應(yīng)被稱為“貝葉斯-拉普拉斯公式”才科學(xué)。 今天天氣怎樣? 貝葉斯公式是這樣工作的 貝葉斯定理并不好懂,它到底是如何為人民服務(wù)的? 對(duì)于貝葉斯定理,參照上面的公式,首先要了解各個(gè)概率所對(duì)應(yīng)的事件。 P(A│B)是在B發(fā)生的情況下A發(fā)生的概率; P(A)是A發(fā)生的概率; P(B│A)是在A發(fā)生的情況下B發(fā)生的概率; P(B)是B發(fā)生的概率。 就知道你沒看懂……那我還是舉個(gè)經(jīng)常用到的例子吧! 大老板CEO良心發(fā)現(xiàn)放假10天,芙蓉妹約定帥哥去爬梧桐山,希望玩到人約黃昏后占點(diǎn)便宜,然而天公不作美,一大早天空多云。
這可怎么辦?60%的雨天的早上是多云的。帥哥說(shuō),不玩了吧。 芙蓉妹當(dāng)然不甘心,勸說(shuō)帥哥: 1、多云不見得會(huì)下雨,大約30%日子早上是多云的! 2、深圳天氣平均一個(gè)月才會(huì)3天下雨,10%的概率而已。 帥哥并不是繡花枕頭,非常科學(xué)地用“貝葉斯公式”計(jì)算: 用“雨”來(lái)代表今天下雨,“云”來(lái)代表早上多云。 當(dāng)早上多云時(shí),當(dāng)天會(huì)下雨的可能性是P(雨│云)。 P(雨│云) = P(雨)·P(云│雨) /P(云) P(雨) 是今天下雨的概率 = 10% P(云│雨) 是在下雨天早上有云的概率 = 60% P(云) 早上多云的概率 = 30% 那么,貝葉斯定理的答案就出來(lái)了 P(雨│云) =0.1×0.6/0.3=0.20 帥哥毫無(wú)表情地說(shuō):今天下雨的概率是20%,可以去爬山。 芙蓉妹看著美得不食人間煙火的帥哥,怯生生地問(wèn):你真的是人嗎? 帥哥毫無(wú)表情地回答:我不是人,我是貝葉斯狼。 貝葉斯公式如何逐步取得人類信任 今天的貝葉斯理論開始遍布一切。從物理學(xué)到癌癥研究,從生態(tài)學(xué)到心理學(xué)。 物理學(xué)家提出了量子機(jī)器的貝葉斯解釋,以及貝葉斯捍衛(wèi)了弦和多重宇宙理論。 哲學(xué)家主張作為一個(gè)整體的科學(xué)可以被視為一個(gè)貝葉斯過(guò)程。 貝葉斯定理就快成像“熱力學(xué)第二定律”一樣放之四海皆準(zhǔn)了。 特別是在IT界,AI大腦的思考和決策過(guò)程,被更多工程師設(shè)計(jì)成一個(gè)貝葉斯程序。 但貝葉斯誕生以來(lái)命途多舛,長(zhǎng)期以來(lái)因?yàn)楸砻娴牟豢茖W(xué),并沒有得到主流學(xué)界認(rèn)可。 其實(shí)在日常生活中,我們也常使用貝葉斯公式進(jìn)行決策。比如我們到河邊釣魚,根本就看不清楚河里哪里有魚或者沒魚,似乎只能隨機(jī)選擇,但實(shí)際上我們會(huì)根據(jù)貝葉斯方法,利用以往積累經(jīng)驗(yàn)找一個(gè)回水灣區(qū)開始垂釣。這就是我們根據(jù)先驗(yàn)知識(shí)進(jìn)行主觀判斷,在釣過(guò)以后對(duì)這個(gè)地方有了更多了解,然后再進(jìn)行選擇。所以,在我們認(rèn)識(shí)事物不全面的情況下,貝葉斯方法是一種非常理性且科學(xué)的方法。
貝葉斯公式得到主流科學(xué)界的認(rèn)可,主要因?yàn)閮杉拢?/p> 1、《聯(lián)邦黨人文集》作者揭密 1788年,《聯(lián)邦黨人文集》匿名出版,作者漢密爾頓和麥迪遜寫作風(fēng)格幾乎一致。兩個(gè)人都逝世后,要找出每一篇文章的作者極其困難,哈佛大學(xué)通過(guò)對(duì)詞匯的貝葉斯研究方法最終找出了每一篇的文章作者,研究方法在統(tǒng)計(jì)學(xué)界引發(fā)震動(dòng),被禁錮了200年的貝葉斯公式從魔盒里被釋放出來(lái)。 2、美國(guó)天蝎號(hào)核潛艇搜救 1968年5月,美國(guó)海軍天蝎號(hào)核潛艇在大西洋亞速海海域失蹤。軍方通過(guò)各種技術(shù)手段調(diào)查無(wú)果,最后不得不求助于數(shù)學(xué)家John Craven,John Craven提出的方案使用了貝葉斯公式,他召集了數(shù)學(xué)、潛艇、海事搜救等各個(gè)領(lǐng)域的專家,一邊擲骰子一邊通過(guò)貝葉斯公式一一排除小概率發(fā)生意外事故的搜索區(qū)域。
2014年初馬航MH370航班失聯(lián)后,科學(xué)家想到第一個(gè)方法就是利用貝葉斯定理開始區(qū)域搜索,這個(gè)時(shí)候,貝葉斯公式已經(jīng)名滿天下了。 語(yǔ)音識(shí)別 貝葉斯公式開始展示“神跡” 科大訊飛因?yàn)檎Z(yǔ)音識(shí)別成為千億級(jí)市值公司,首先得感謝貝葉斯公式和馬爾科夫鏈。 自然語(yǔ)音處理一直是科學(xué)家面臨的最大難題,在計(jì)算機(jī)語(yǔ)言處理領(lǐng)域,近幾年引入了貝葉斯公式和馬爾科夫鏈才有了長(zhǎng)足進(jìn)步(這里不詳細(xì)介紹馬爾科夫鏈)。 文字翻譯尚可理解,但語(yǔ)音涉及各種動(dòng)態(tài)語(yǔ)法,機(jī)器怎么知道你在說(shuō)什么鳥語(yǔ)? 但當(dāng)你在現(xiàn)場(chǎng)看到機(jī)器翻譯的準(zhǔn)確性,會(huì)感嘆這簡(jiǎn)直就是“神跡”,比大部分現(xiàn)場(chǎng)翻譯要強(qiáng)得多。 統(tǒng)計(jì)機(jī)器翻譯的問(wèn)題可以描述為:給定一個(gè)句子e,它可能的外文翻譯f中哪個(gè)是最靠譜的。即我們需要計(jì)算:P(f│e)。 P(f│e) ∝ P(f) * P(e│f) 這個(gè)式子的右端很容易解釋:那些先驗(yàn)概率較高,并且更可能生成句子e的外文句子f將會(huì)勝出。我們只需簡(jiǎn)單統(tǒng)計(jì)就可以得出任意一個(gè)外文句子f的出現(xiàn)概率。然而 P(e│f)卻不是那么好求的,給定一個(gè)候選的外文局子f,它生成(或?qū)?yīng))句子e的概率是多大?我們需要定義什么叫“對(duì)應(yīng)”,這里需要用到一個(gè)分詞對(duì)齊的平行語(yǔ)料庫(kù)。 隨著大量數(shù)據(jù)輸入模型進(jìn)行迭代,隨著計(jì)算能力的不斷提高、大數(shù)據(jù)技術(shù)的發(fā)展,貝葉斯公式巨大的實(shí)用價(jià)值愈發(fā)體現(xiàn)出來(lái)。 語(yǔ)音識(shí)別僅僅只是貝葉斯公式運(yùn)用的一個(gè)例子,其實(shí)貝葉斯定理的思想已經(jīng)滲透到AI的方方面面。 貝葉斯網(wǎng)絡(luò) AI智慧的“蜂群效應(yīng)” 單個(gè)語(yǔ)音模型的建立讓我們看到了貝葉斯定理解決問(wèn)題的能力,但貝葉斯網(wǎng)絡(luò)的拓展讓我們隱約感覺到了AI背后“天網(wǎng)”的恐怖。 人類相對(duì)簡(jiǎn)單的問(wèn)題已經(jīng)解決得差不多了,剩下的都非常復(fù)雜。 龍卷風(fēng)的形成,2的50次方可能的最小參數(shù)值比對(duì)。 面對(duì)這樣數(shù)理級(jí)的運(yùn)算,科學(xué)家別無(wú)選擇,必須從可能的法則中選擇一些可以信任的,并以此為基礎(chǔ)建立理論模型。貝葉斯公式正好以嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)形式幫他們實(shí)現(xiàn)了這一點(diǎn)。科學(xué)家把所有假設(shè)與已有知識(shí)、觀測(cè)數(shù)據(jù)一起代入貝葉斯公式,就能得到明確的概率值。而要破譯某種現(xiàn)象的成因網(wǎng)絡(luò),只需將公式本身也結(jié)成網(wǎng)絡(luò),即貝葉斯網(wǎng)絡(luò),接下來(lái)只需要向這個(gè)模型代入觀測(cè)數(shù)據(jù),通過(guò)網(wǎng)絡(luò)節(jié)點(diǎn)間的貝葉斯公式重新計(jì)算出概率值。為每個(gè)新數(shù)據(jù)、每個(gè)連接重復(fù)這種計(jì)算,直到形成一個(gè)網(wǎng)絡(luò)圖,讓任意兩個(gè)原因之間的連接都得到精確的概率值為止。人類認(rèn)知的缺陷越大,貝葉斯網(wǎng)絡(luò)展示的力量越讓人震撼。
但這還不是最可怕的,這里我們要引入“蜂群效應(yīng)”,一只個(gè)體蜜蜂,基本上沒有智力,但當(dāng)它們組建成一個(gè)蜂群時(shí),就會(huì)爆發(fā)出一種整體智力,擁有記憶能力,能制造出巧奪天工的蜂巢。貝葉斯網(wǎng)絡(luò)的每一個(gè)節(jié)點(diǎn)就像一只蜜蜂,這種群體的連接不僅生動(dòng),而且非常嚴(yán)謹(jǐn),一旦這個(gè)群體達(dá)到一定數(shù)量級(jí)別,有沒有可能產(chǎn)生整體智慧?這不僅是哲學(xué)家需要思考的問(wèn)題,生命學(xué)家需要討論的問(wèn)題,AI圈的科學(xué)家也應(yīng)該直接去面對(duì)。 今天一場(chǎng)轟轟烈烈的“貝葉斯革命”正在AI界發(fā)生:貝葉斯公式已經(jīng)滲入到工程師的骨子里,分類算法也成為主流算法。在很多人眼中,貝葉斯定理就是AI進(jìn)化論的基石。 封殺這個(gè)公式, AI智商將為零? AI人工智能第一課,都是從貝葉斯定理開始。 我們無(wú)法預(yù)測(cè)到貝葉斯公式與計(jì)算機(jī)結(jié)合的真正威力,因?yàn)橐磺胁艅倓傞_始。 貝葉斯公式與AI的結(jié)合,這到底是一場(chǎng)科學(xué)的革命,還是一場(chǎng)理念的革命?到底是生產(chǎn)方式的革命,還是人類在革自己的命? 當(dāng)年人類科學(xué)家總結(jié)出客觀的貝葉斯公式,而AI卻利用這個(gè)公式給自己注射主觀基因,兩者顛倒,在未來(lái)到底會(huì)演繹怎樣的相愛相殺故事? 如果真的到了決戰(zhàn)的一天,人類到底該如何給自己留一把殺手锏?是否應(yīng)該像NSA在算法里留下后門一樣,抽離出這個(gè)公式,讓AI無(wú)法“我思故我在”。 這似乎有點(diǎn)杞人憂天了,縱觀整個(gè)社會(huì),現(xiàn)在不用太擔(dān)心AI像人一樣思考,最應(yīng)該擔(dān)心人類已經(jīng)失去了思考。 該文章在 2018/4/2 12:45:22 編輯過(guò) |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |