萬物皆可“貝葉斯”:不確定性時代的知識哲學(xué)

蘇婉2021-10-24 10:46

蘇婉/文 你在黃昏的小區(qū)散步,突然看到草叢中有一個毛茸茸的東西在動。接近夜晚,光線不好,你憑借直覺判斷,這大概率是那只你經(jīng)常碰到的貍花貓。你繼續(xù)觀察,看到了它小而尖的耳朵,你加深了這就是那只花貍的信念。這時它條紋相間的尾巴露出并卷曲著晃動,你幾乎可以肯定它就是那只貓了。最后這個毛茸茸的身影一閃而過,消失在灌木叢中。你回到家告訴家人:“我剛才很可能又碰到了前兩天的那只大花貍!”

一個典型的貝葉斯主義者可能會告訴你,這個平常到不能再平常的觀察和推測,反映了你了不起的大腦剛剛進行過一次復(fù)雜的貝葉斯計算:你從自己的直覺出發(fā),基于依次出現(xiàn)的視覺信息,做出了一次對特定現(xiàn)象出現(xiàn)的原因的判斷。

貝葉斯的博弈

貝葉斯的博弈:數(shù)學(xué)、思維與人工智能
作者: 黃黎原
出版社: 圖靈|人民郵電出版社
譯者: 方弦
出版時間: 2021-3

18世紀的英國哲學(xué)家休謨在自己的懷疑論中指出,“我們無從得知因果之間的關(guān)系,只能得知某些事物總是會關(guān)聯(lián)在一起。”這種“相關(guān)非因果”的思想,體現(xiàn)在他在1748年寫的一篇《論神跡》的文章中,他關(guān)于目擊者的證詞永遠無法證明神跡(即基督復(fù)活)的論斷,可能引起了當時作為加爾文宗教會牧師的托馬斯?貝葉斯(ThomasBayes)的注意:我們真的無法通過觀察到的結(jié)果來推出引起它的真正原因嗎?如果我們預(yù)先形成了某種信念,需要觀察到多少證據(jù)才能確定這一信念的正確性?

貝葉斯在論文中想象自己背對著一張桌子,桌子上放有一個白球,隨后讓助手隨機在桌面上放黑球,每放一個就問白球相對于黑球的方位。白球的位置就是引起黑球處在某個相對方位的原因,這個在已知黑球相對白球位置的情況下確定白球可能位置的過程,就是一個能夠回應(yīng)休謨之問的典型的逆概率推算過程。對貝葉斯而言,只要放置黑球的數(shù)目足夠多,對于白球絕對位置的歸納性推測就能無限逼近準確,因此,由果推因的歸納思維模式,不但有用,且并不如休謨所說,并非是非理性的。

主業(yè)是神學(xué)的貝葉斯不會想到,他自己都沒有信心高調(diào)發(fā)表的概率理論(雖然按理說,他的結(jié)論與他的信仰并不違背,即神跡可以通過足夠多的證據(jù)逆向證明),在他身后的數(shù)學(xué)界經(jīng)歷了爭論與沉寂,最終在兩個世紀之后,計算機甫一出現(xiàn)就獲得重生,在人類越來越依賴并擅長處理大量數(shù)據(jù)的年代,由他命名的定理被廣泛地用于醫(yī)學(xué)診斷、機器學(xué)習(xí)、認知神經(jīng)科學(xué)等尖端領(lǐng)域當中。這個原本粗略的理論雛形,經(jīng)過眾多天才的修正和推廣,如今被看做一種主義,一種知識哲學(xué),乃至于能夠概括人類大腦認知工作的抽象模型。

《貝葉斯的博弈:數(shù)學(xué)、思維與人工智能》就是一本詮釋貝葉斯定理“宇宙通用性”的著作。這本書的法語原版書名為《知識的公式:基于貝葉斯定理的統(tǒng)一性知識哲學(xué)》(LaFormuledusavoir:Unephilosophieunifiéedusavoirfondée surle théorème deBayes),作者是年輕的亞裔法國數(shù)學(xué)家黃黎原(LêNguyênHOANG),他畢業(yè)于巴黎綜合理工學(xué)院,現(xiàn)在是瑞士洛桑聯(lián)邦理工學(xué)院的研究人員。

黃黎原長期關(guān)注人工智能倫理問題,同時也是一個活躍且受歡迎的科普視頻博主,他開設(shè)的法語視頻頻道“Sci-ence4All”涉及數(shù)學(xué)、計算機科學(xué)和物理學(xué)等多個領(lǐng)域。他在書中充滿激情地盛贊了貝葉斯公式的實際有效性和哲學(xué)啟發(fā)性,將之稱之為“智慧方程”。這本書告訴我們,從貝葉斯公式引申出的貝葉斯方法和貝葉斯知識哲學(xué),就像能夠游遍天下的思維通票,我們甚至可以說,萬物皆可“貝葉斯”。

貝葉斯公式用以描述在已知條件下某事件的發(fā)生概率,它的表達式是P(A|B)=P(A)P(B|A)/P(B)。我們可以把貝葉斯公式理解為這是一種基于現(xiàn)有的可靠證據(jù)(比如一些觀察、數(shù)據(jù)、信息),對所持信念(比如一些假設(shè)、主張或論點)的有效性進行計算的方法,簡單來講就是,原本的信念+新證據(jù)=改進后的新信念。其中P代表概率,A表示原本的信念,B代表新證據(jù)或新條件。P(A)是A為真的概率,也被稱為先驗概率,是貝葉斯主義者引以為優(yōu)勢的“主觀偏見”,但也是貝葉斯主義反對者用來攻擊貝葉斯統(tǒng)計科學(xué)性的“弱點”所在;P(B)則是B為真的概率,也稱為邊緣概率或配分函數(shù),是公式中最難計算的一項,P(B|A)表示A為真時B的概率,也被稱作似然度或“需要一些想象力”的思想實驗項。這個公式實際上是由法國數(shù)學(xué)家皮埃爾-西蒙·拉普拉斯(Pierre-SimonLaplace)重新發(fā)掘貝葉斯的概率思想得到的,他被認為是貝葉斯主義之父。也許像微積分公式的全稱是“牛頓-萊布尼茨公式”一樣,貝葉斯公式至少應(yīng)被稱為“貝葉斯-拉普拉斯公式”。

貝葉斯公式如何應(yīng)用?以醫(yī)學(xué)領(lǐng)域為例。醫(yī)學(xué)檢測通常以檢測結(jié)果是陽性或陰性來初步斷定受試者是否患病。在現(xiàn)實世界中,測試很少是完全可靠的,會出現(xiàn)假陽性和假陰性的問題。假設(shè)一個75歲的人對某項癌癥進行檢測,而這種癌癥在75歲的發(fā)病率為1%,這時他的檢測結(jié)果呈陽性,那么這個人可能會非常絕望,覺得自己一定要寫遺囑了。但是測試往往并不完全可靠,假設(shè)準確率有99%,也就是說100名患有癌癥的人中有99人的檢測結(jié)果呈陽性,而健康的100人中有99人的檢測結(jié)果呈陰性。如果測試呈陽性,癌癥的真正可能性有多大?貝葉斯定理告訴你,如果只檢測一次,得到的結(jié)果為陽性,那么他患癌的概率只有50%。

貝葉斯公式是如何計算出50%這個相對樂觀的概率的呢?先驗概率P(A)即75歲癌癥的發(fā)病率1%;P(B|A)即患有癌癥的情況下檢測呈陽性的概率99%。所以 P(A)乘以 P(B|A)等于0.01乘以0.99,即0.0099。分母P(B)是無論是否患有癌癥,其檢測結(jié)果呈陽性的概率,包括真陽性和假陽性,運算稍復(fù)雜,結(jié)果為0.0198。那么最終P(A|B)=P(A)P(B|A)/P(B)的結(jié)果,即檢測呈陽性的同時患癌的概率P(A|B)為0.5,也就是50%。但是如果二次接受檢測結(jié)果仍為陽性,再一次應(yīng)用貝葉斯公式進行運算,那么患癌癥的概率就會從50%提高到99%。我們看到,第一次的檢測結(jié)果會影響到第二次的檢測結(jié)果,這就說明迭代貝葉斯定理可以逐漸產(chǎn)生更為精確的信息,這同時也提示我們,任何醫(yī)學(xué)診斷的做出都需要經(jīng)過多次檢測,以防誤診。

然而,就是這樣一個擁有無限潛力的公式,也曾經(jīng)歷過被學(xué)術(shù)權(quán)威冷落排擠的跌宕歷史。在統(tǒng)計學(xué)界,頻率主義者曾把貝葉斯主義當做勁敵。誕生于1920年代的頻率主義,其實就是我們在數(shù)學(xué)課本里學(xué)到的最經(jīng)典的統(tǒng)計學(xué)框架。頻率主義假設(shè)概率就是對頻率的測量,強調(diào)當樣本數(shù)量變得足夠大時,誤差就會逐漸消失。頻率主義的核心是用p值來對某個理論模型的可信度進行統(tǒng)計檢驗,只有經(jīng)歷過足夠多的新數(shù)據(jù)的檢驗,這個理論模型才科學(xué)。

頻率主義當時在遺傳學(xué)研究方面表現(xiàn)出色,更加確信客觀性為唯一的金科玉律,對帶入先驗概率的貝葉斯主義非常反感,因為這就相當于在未經(jīng)檢測之前就將某個理論賦予了主觀的置信度。他們將這種主觀性(在書中被作者稱之為是“偏見”)視為洪水猛獸,認為包含主觀性的統(tǒng)計方法根本就不算是科學(xué)。

在埃貢·皮爾遜、羅納德·費希爾等頻率主義統(tǒng)計學(xué)家主導(dǎo)的整個20世紀中期,“主觀”、“先驗”和“貝葉斯”等術(shù)語都被逐出了統(tǒng)計學(xué)系。曾有醫(yī)學(xué)科學(xué)家用貝葉斯定理證明了煙草在導(dǎo)致肺癌方面的危害,但是接受了煙草行業(yè)資助的頻率主義大佬費希爾,則指責這位科學(xué)家在研究中缺少頻率主義方法要求的對照組和重復(fù)實驗,繼而顛倒因與果的順序,提出潛在的肺癌會導(dǎo)致人傾向于吸煙。

然而頻率主義也有無法回避的弱點。首先p值是可以通過大量實驗來操控的,同時,對于很多小概率事件的預(yù)測,比如地震,我們能夠獲得的測量數(shù)據(jù)和實驗機會是很少的。而貝葉斯統(tǒng)計的神奇之處,正是在于可以在數(shù)據(jù)稀少的情況下去靠近準確值。因此,在信息更難收集和處理的前計算機時代,貝葉斯仍然是人們試圖把握稀有事件的不確定性時所能依賴的工具。除了通過對單詞的使用偏好確定《聯(lián)邦黨人文集》匿名作者身份,以及在茫茫大西洋中尋找天蝎號核潛艇的位置這兩個廣為人知的事例之外,貝葉斯計算還用來估計過核電站發(fā)生重大事故的概率,預(yù)測火箭發(fā)射出現(xiàn)重大事故的概率等等。

貝葉斯主義是關(guān)于概率的哲學(xué),它重新發(fā)問,概率是什么?頻率主義認為的概率需要依靠事件重復(fù)發(fā)生的頻率來計算。但是當重復(fù)量,也就是數(shù)據(jù)不足時,我們很難根據(jù)之前的規(guī)律準確預(yù)測未來。比如把之前事件的發(fā)生看做一組數(shù)列“1,2,4,8,16”,那么在簡單的推理下,下一個出現(xiàn)的事件應(yīng)該是32。但是當數(shù)字代表圓被圓周上2、3、4、5個點所連成的若干直線分成的份數(shù)時,當點數(shù)為6時,下一個出現(xiàn)的份數(shù),也就是事件,應(yīng)該是31,而不是32。

貝葉斯公式

貝葉斯公式

我們確信自己通曉的規(guī)律將在哪一點上的預(yù)測突然告敗?大多數(shù)情況下人們不愿意面對這個問題。人類對確定性和可控性的渴望寫在基因里。前科學(xué)時代的巫術(shù)就是對確定性追求的極致。比如按照阿贊德人前現(xiàn)代時期的生活邏輯,是把小概率發(fā)生的厄運歸因于仇人故意施加的巫術(shù),也就是一個可以追溯的確定性外因。而科學(xué),尤其是概率認知,相對于巫術(shù)最大的不同,就是在接受不確定性存在的前提下,逐漸掌握一套與不確定性相處的動態(tài)方法。一個良好的預(yù)測,應(yīng)能計算上述數(shù)列中下一項的所有候選數(shù)值的出現(xiàn)概率,而這里的概率應(yīng)該是對這些可能性所賦予的置信度。這就是貝葉斯公式試圖達成的效果。

書中強調(diào),我們探索世界、積累知識的思維模式,很大程度上是可以被貝葉斯定理所概括的。比如看到的烏鴉都是黑的,便推論世界上所有烏鴉都是黑的,提出假設(shè)并根據(jù)觀察結(jié)果修正這些假設(shè),這種修正或者是提高這個推論正確的概率,或者是削減它。貝葉斯之父拉普拉斯曾說,概率論本質(zhì)上不過是化為計算的常識。它以準確的方式評價那些正常的頭腦通過某種直覺領(lǐng)會到東西,而這種直覺領(lǐng)會經(jīng)常不被察覺。

說到底,貝葉斯公式指向了一種知識哲學(xué),作者甚至認為:“理性”本質(zhì)上可以歸結(jié)于貝葉斯公式的應(yīng)用,以至于可以將信奉這種哲學(xué)稱為貝葉斯主義。貝葉斯主義就是假設(shè)“現(xiàn)實”的所有模型、理論或概念都只不過是某種信念、虛構(gòu)或詩歌,尤其要指出的是,“所有模型都是錯的”;然后,實際數(shù)據(jù)應(yīng)該迫使我們調(diào)整賦予不同模型的重要性,即置信度;關(guān)鍵在于,調(diào)整這些置信度的方式應(yīng)該盡可能嚴謹?shù)刈裱惾~斯公式。貝葉斯比波普爾的可證偽理論,更能準確地定義科學(xué)。

貝葉斯在今天顯得尤其重要,由于計算機性能的提高,數(shù)據(jù)收集及處理技術(shù)已經(jīng)遠遠超過人腦,商業(yè)、政策等領(lǐng)域無不更加依賴大數(shù)據(jù)分析的結(jié)果,“技術(shù)的演變讓我們重新審視貝葉斯公式以及它在知識大廈中的位置”。

貝葉斯計算特別有益于在對海量數(shù)據(jù)進行分析中的刪繁就簡,抓大放小。從天體物理學(xué)、航空航天,到基因組測序和蛋白質(zhì)研究;從醫(yī)學(xué)領(lǐng)域中的癌癥溯因、病毒檢測,到計算機科學(xué)中的圖像識別、信息加密;從商業(yè)領(lǐng)域的保險、廣告、物流,到社會政治領(lǐng)域的選舉和資源分配等等。貝葉斯的應(yīng)用無所不在。

在純粹的數(shù)學(xué)框架和尖端科技的應(yīng)用領(lǐng)域之外,貝葉斯哲學(xué)非常適合作為個人生活在當下這個快速更迭時代的思維指南。貝葉斯哲學(xué)反映了人類對不確定性的焦慮,也為應(yīng)對不確性提供了一種方法,即接納不確定性,在防止過度自信的前提下大膽進行直覺性假設(shè),同時也不忘用新證據(jù)來對自己的假設(shè)進行不斷更新,讓自己處在追尋答案的過程中。正如諾貝爾物理學(xué)獎獲得者費曼曾說:“我能帶著疑問、不確定和無知活著……我有些近似的答案,對于各種問題也有些確定程度或高或低的合理信念,但我不會絕對確信任何事情。”

貝葉斯也并非絕無缺陷。它雖然給主觀性一席之地,但如果主觀的出發(fā)點是偽科學(xué)或謠言,那么后續(xù)則有可能引用可疑的證據(jù)來支持乃至強化這個可疑的信念。但是貝葉斯主義最強大的地方是在于它在哲學(xué)層面上的包容性,強調(diào)“互不相容的模型組成的森林比其中每一棵樹都要睿智。”

書中提到,“根據(jù)貝葉斯定理,任何理論都不完美。取而代之的是一項未盡的工作,它永遠處于推敲與測試之中。”貝葉斯狀態(tài)就是一種平衡于確信與懷疑之間的狀態(tài),在這種狀態(tài)下,人們不會輕易確信謠言,可以對壞運氣感到釋懷,也可以勇敢向不公正對待提出抗辯。貝葉斯公式也許并不完美,但貝葉斯主義,也許正是最適宜這個不確定性時代的知識哲學(xué)。