決策中的“噪聲”與“降噪”

吳晨2021-09-08 13:08

(圖片源于網(wǎng)絡(luò))

吳晨/文

在幫助決策者理解偏見的重要性之后,跨界心理學(xué)和經(jīng)濟學(xué)的諾獎經(jīng)濟學(xué)家卡尼曼又把關(guān)注點投射到“噪聲”上?!对肼暎喝祟惻袛嗟娜毕荨肥强崧跁充N書《思考,快與慢》之后的又一巨著。選擇噪聲作為切入點,不僅因為這是導(dǎo)致決策偏頗甚至失誤僅次于偏見的又一主要原因,也因為在“人加機器”的時代,人工智能與大數(shù)據(jù)為降低噪音,提升決策清晰度,提供了更多有效的工具。

什么是干擾決策的噪聲?大致可以分為兩類。

一類是針對同類型的問題,給出的答案卻波動性非常大。保險是常見的例子,如果類似案例在受理過程中估算的保費有很大的波動,就可能因為噪聲。法庭審案子是另一個例子,類似的案件,法官在量刑時給出的懲罰差別很大,也可能出于噪聲。這類問題的出現(xiàn),一方面有違公正性,法律面前人人平等,犯類似的錯誤也應(yīng)該懲罰相當(dāng);另一方面則有可能給公司帶來巨大的財務(wù)和商譽的風(fēng)險,保費應(yīng)該對未來風(fēng)險有一個比較科學(xué)的評估,如果保費忽上忽下,過高的保費顯然有壓榨客戶的嫌疑,過低的保費則可能帶來虧損。

另一類則體現(xiàn)在對同一個人或者事物未來的預(yù)測,不同的人的評判有很大的波動性。如何考核一個人的工作?如何評價一個候選人的能力?不同人對同一位同事,同一個候選人給出差別很大的考核或者評價,很大原因是因為噪聲的存在。同樣,醫(yī)生診斷過程中也可能存在噪聲。病人被診斷出重病,通常都會找另一個醫(yī)生再看一次,如果兩個醫(yī)生給出不同的診斷,至少一位醫(yī)生是錯的。

考核一個人的工作、評價一個候選人的能力,其實是在對未來做預(yù)測,員工是否稱職甚至值得提升,候選人是否合適特定崗位,可以為未來發(fā)展助力,這些判斷在未來會被檢驗。同樣診斷的準(zhǔn)確度在未來也會被驗證。問題是,如果噪音導(dǎo)致最初的判斷有偏差甚至失誤,可能導(dǎo)致職業(yè)發(fā)展脫軌、任用非人,甚至病人有性命之虞。

那到底什么會導(dǎo)致噪聲呢?

卡尼曼這本書的一大重要的意義就是讓我們?nèi)徱曇恍┪覀兘?jīng)常忽略的問題,即人在做出判斷的時候,常常會有很大的自由裁量的空間。

自由裁量本身沒有好和壞。但是如果不同的人對自由裁量規(guī)則的理解和尺度的把握不同,就可能產(chǎn)生偏差。同樣,人在做出判斷的時候,也容易被先入為主的觀念影響或者被不相干的信息誤導(dǎo),可能受到外部環(huán)境的影響,甚至被心情好壞左右。一個人在過度勞累的情況下也可能判斷失去準(zhǔn)頭。大多數(shù)人通常不愿意承認(rèn)類似問題的存在??崧退暮献髡咔∏≡诒緯悬c出了這些問題,而且一再強調(diào),這樣的問題貌似瑣碎,卻可能對決策帶來巨大的擾動。

既然找到了問題,就得提出解決方案?!对肼暋愤@本書本質(zhì)上是一本研究如何讓決策更科學(xué)的書。關(guān)于降噪,這本書提出了中肯的建議。

其中一個最主要的建議就是提出“決策衛(wèi)生”的概念,非常具體又實用。

把復(fù)雜的問題分解成為幾組相對簡單的問題,然后再去行使個人的判斷力,就是很實用的增強“決策衛(wèi)生”,降低噪聲的方法。醫(yī)院里衡量一個新生兒是否健康,在把問題分解之前,完全取決于醫(yī)生的整體判斷,存在一定的誤判率。當(dāng)兒科醫(yī)生把衡量新生兒健康的問題分解到五大因素,涵蓋心率、體表顏色、反射程度、靈活度和呼吸時,就把判斷健康的問題拆解了。其中一些因素可以直接用數(shù)據(jù)來衡量的,比如心率,而另一些主觀判斷也更簡單客觀。用單項打分加總后的總分?jǐn)?shù)來評價新生兒是否健康,既容易又準(zhǔn)確,因為這么做給出了細(xì)化的規(guī)則,降低了醫(yī)生的自由裁量權(quán),卻仍然依賴醫(yī)生對具體因素的判斷。

另一個比較簡單有效的降噪方法是把不同評價人的打分評價加總后平均。當(dāng)然這么做的前提是要確保多位判斷人能夠各自獨立地形成判斷,而不是相互干擾。給出明確的決策指引和規(guī)則也很重要。同樣的問題,每個人內(nèi)心判斷的尺度不同,有的人打分很松,另外一些人打分比較緊,明確的指引能夠有效降低打分的偏差。

體育賽事中體操和跳水項目的打分就貫徹了降噪的原則。把對運動員表現(xiàn)的評價拆解成不同的部分。難度系數(shù)、連接和完成質(zhì)量,都有具體的指引,分別讓裁判打分,之后再加總,這樣就可能盡量減少每個裁判決策時的噪音。同時在計算運動員總分的時候,通常要去掉一個最高分,去掉一個最低分,然后再平均,這樣又把不同裁判打分過程中可能的偏見(偏袒某個運動員)和噪音進一步減少。

大數(shù)據(jù)和人工智能也能規(guī)避人類受情緒影響決策波動的問題。許多研究都證明,機器模型比人的判斷更準(zhǔn)確,而人工智能又優(yōu)于機器模型,因為人工智能的數(shù)據(jù)量更大,更能從海量數(shù)據(jù)中找出相關(guān)性。

但有些時候保留一點噪聲是有益的。

在大多數(shù)情況下,限制人的自由裁量權(quán),引入流程和機器,甚至用人工智能替代人類做決策,的確能提高決策的科學(xué)度。但也有例外。

人類社會永遠(yuǎn)存在一組矛盾:規(guī)則的準(zhǔn)確效率和人情的模糊變通之間的矛盾。明確的規(guī)則會盡可能壓縮人的自由裁量權(quán)。但是給人變通的空間少了,一方面會讓人覺得缺乏人情味,對于特定案例也沒有融通的空間,在另一些場合下,甚至?xí)屓擞X得自己就是流水線上的螺絲釘,沒有任何創(chuàng)新的空間,壓抑人的價值。人情給了人更大的自由裁量空間,也會讓人覺得決策是有溫度的,被尊重,出了問題總能找人去評評理,面對的也不是冷冰冰執(zhí)行規(guī)則的機器人。但做出這些判斷可能費事費力,也可能帶來不公,甚至引發(fā)“走后門”這樣的貓膩。

不過,在一些情況下,的確可以保留一定的自由裁量權(quán),讓規(guī)則變得模糊一點,留下人判斷的空間。

強調(diào)標(biāo)準(zhǔn)而不是具體的規(guī)則,可以避免給人鉆空子的機會。比如稅法如果條目太具體明確,就可能留下鉆空子的空間,催生表面上合乎規(guī)定,但實質(zhì)上違反法律精神的行為。同樣,在學(xué)校里強調(diào)禁止學(xué)生抄襲的原則,但并不明確規(guī)定哪些行為屬于抄襲行為,由老師來對具體事件是否涉嫌抄襲做判斷,反而更會增加一分震懾力。

歸根結(jié)底,噪聲恰恰是混亂與秩序的差別。在一個行止有序的世界里,一切都按部就班,卻讓人覺得機械乏味。在一個相對混亂的世界里,雖然充斥著噪音,卻也給了人更大創(chuàng)造性和試錯的空間。

比如在一個算法統(tǒng)治的世界就可能有盲點,被專業(yè)人士稱之為“摔斷腿”問題。周五晚上有多少人會出去看電影,算法可以根據(jù)海量大數(shù)據(jù)中的各種變量做出預(yù)測。但如果一個人碰巧當(dāng)天跌斷了腿,他就一定不可能出去看電影。但是否“摔斷腿”這一因素,如果沒有納入到機器分析模型的變量中去,就不可能被機器所考慮,去預(yù)測。相反,人的判斷是不需要因為導(dǎo)入“摔斷腿”這樣的新因素而重新建模的。

在當(dāng)下這樣快速變化不斷迭代的世界里,保持一定的模糊性,在決策過程的最終仍然保留人的判斷,非常重要。很多因素仍然無法量化,比如價值觀和潮流的變化飛速,如果不依賴人的直覺去判斷就很可能“落伍”。

當(dāng)然,這并不意味著人的判斷力不需要訓(xùn)練。恰恰相反,降噪是避免壞的流程、環(huán)境和情緒引發(fā)的噪音干擾我們的決策,但好的決策力卻取決于決策者是否有開放的心態(tài)、是否能放下執(zhí)念,是否在新的事實面前用于否定昨天的自己,是否能吸納新的信息之后更新自己的認(rèn)知,終生學(xué)習(xí),快速學(xué)習(xí)。

在劇變的時代,能夠考慮那些與自己的觀念有所沖突的事實,更愿意傾聽自己反對者的觀點,和“決策衛(wèi)生”一樣,都有助于我們更好地前瞻未來,擁抱改變。