2020-01-16

科學的界限三:太複雜的因果關係

本文亦發表在鳴人堂沃草烙哲學

科學家追求用簡單的因果關係來解釋現象發生的原因。為什麼會有火?因為氧化反應釋放化學能。為什們人們要交易?因為對雙方都有利。為什麼會下雨?因為空氣中有太多水氣。

但是這些看似簡單的答案再追問下去,會發現它們都是由更多、更複雜的因子造成的。下雨不只要看水氣,還要看雲和氣流,雲取決於相對溼度,由氣溫和水蒸氣氣壓決定,氣流則受地形、地球的自轉和公轉、以及太陽的照射影響。像這種由許多部份互相影響的系統,稱為「複雜系統」(complex systems)。

複雜系統是一個非常年輕的研究領域,這領域裡的研究往往無法直接用人腦和紙筆來做,必須藉電腦程式模擬。這些模型根據科學定律和大量已知的資料,推算接下來會發生什麼事。例如,在氣象預報的電腦模型裡,我們輸入各地觀察到的地形、氣溫、溼度、風向等等,然後讓電腦根據流體力學、柯氏力、水的比熱等原則,推算接下來幾天的天氣變化。

值得注意的是,進行上述天氣計算時,電腦擁有的資料我們都有,我們可以看到每一行程式碼和每一筆數據,但是沒有人類有辦法從這些資訊,直接在腦中推算出未來的天氣。既然如此,我們真的能說,我們知道為什麼明天會下雨嗎?

其實,在氣象研究裡,人類把握的資訊還算是比較多的。我們對大氣科學研究得很透徹,科學家知道氣象模型裡面用的每一條公式背後的原理。有些研究就沒那麼幸運了。

在研究生態組成、市場銷售、群眾行為的時候,有些科學家可以用人工智慧和大數據做出非常精確的資料分析模型,但是我們卻完全不知道背後的原理。這類模型的基本上只是從過往收集到的大數據中找出各種相關性,然後根據歸納法,以這些相關性來預測未來。

這些可能模型像是:25歲以上本國籍女性會買用宋體字型標示的產品的機率高0.2%、控制去年干貝捕撈量的時候一月平均氣溫每高一度當年八月蝦子補獲量和魚網大小的相關性就會減0.1%……這兩個例子只各描述了四個變因的影響,而現代的大數據人工智慧模型,常常牽涉到上百個變因,裡面的相關性複雜到沒辦法用語言來描述。就算能夠寫下來,人腦也無法直觀理解。在這些「弱相關」當中,每一個變因單獨的影響往往很弱,在一般人眼裡根本不會覺得它有影響結果。然而厲害的是,當我們把上百個變因和上萬件弱相關全部統合起來,確實就能預測今年會抓到多少蝦。

工具論主張科學只是在描述相關性,至於這些相關性背後有什麼因果關係,根本不是科學的目標,也不是科學有辦法解答的。但是我想大家都同意,你的電腦裡有一個預測力很好的模型,不代表你可以用科學解釋這個現象。大多數科學家想知道的不是我們可以捕到多少隻蝦,而是背後的機制,例如氣溫是否影響了蝦子和干貝各自愛吃的藻類之間的競爭結果。但是如果這個途徑對蝦子產量的影響只有0.1%,那表示這個機制本來就很弱,不但很難觀察到,而且就算證明了也感覺不到什麼重大的意義。

強弱是比較出來的,但很有影響。人類喜歡看到「每多花一年念書就會少存十萬元退休金」這種強相關,而不是「中學成績每高一分找到理想工作的機率就高0.0001%」這樣的弱相關,因為前者比較有用。

不幸的是,自然界可能充滿各式各樣的複雜系統,裡面滿是各種極難懂的弱相關。往好處想,我們還是可以用電腦模型作出精確的預測,不用浪費時間理解背後的原理。但是愛問「為什麼」的人就只能感嘆,我們可能永遠無法知道為什麼某個模型成立。

沒有留言:

張貼留言