首頁 搜尋 我的知識庫
【元瓅少年遊】理財煉金術 EP21_《全球生死大數據:一個醫生追尋70億人傷病與死亡的真相》 |方珮璀

【元瓅少年遊】理財煉金術 EP21_《全球生死大數據:一個醫生追尋70億人傷病與死亡的真相》 |方珮璀

元瓅少年遊

2022/05/07 | 00:19:56 | SoundOn #arts




Play Episode



內容描述


各位元瓅書坊的同學大家好!過完長假進入初夏,是不是有點懶洋洋的呢?我們再繼續上週特輯沒講完的故事,振奮一下精神吧(你確定?)並且補上答應大家要在文稿中附上的統計十條誡令。
在進入前一集的故事前,還是跟大家正本清源一下。之所以想把統計拉出來特別做大做好,主要因為它在財務領域是最重要的,不管是保險或投資,其實都牽涉到一個非常重要的關鍵字=風險訂價。什麼叫做風險?白話一點講叫做「不確定性」,以財務投資學的角度來說,可以說是價格的波動幅度。至於目前正熱門的通貨膨脹議題,我們留待以後談投資,談價格的作用時,再來深入。
風險訂價固然對投資的推估有很大影響,對保險更是最核心的基礎。以目前引起渲然大波的防疫險,特別是有包含居家隔離險做為例子,就知道風險訂價有多麼難了,因為要精算風險價格,必須有穩定的歷史統計數據為依據,才可能訌得夠精準。但以這次新冠疫情來看,一個國家中居家隔離的人數,會受到疫情感染速率,以及政府規定誰要居隔的政策有關,而這兩者以目前來看,各國的數據都有非常大的差異,以致於之前援用的數據未必符合台灣急遽變化的狀況,以致各產險公司哀鴻遍野,不斷上演舊保單緊急下架,新保單理賠範圍縮水或費率加高的情況;加上保險局橫插一腳,準備放寬防疫險對於輕症在家可比照住院日額來辦理的規定,這種情況更是雪上加霜,也引發了那麼一般住院醫療日額險會不會也被一體適用的疑慮?導致許多保險公司下架原有產品,可能準備提升醫療險費率的蝴蝶效應。
我忍不住想小小翻個白眼,保險公司又不是慈善團體,如果有一個巨大的精算烏龍缺口,他們當然一定要盡快止血,不然輕則重大虧損,重則是會倒閉的。所以官方自以為善意的放寬,不過是逼迫市場重新訂價,結果有需要沒需要的人都要承受漲價的結果。這可能也是官方因此到目前為止並未鬆口,範圍限縮在新出的防疫險,大概是想避免打擊面太廣。
對了,最後再為保險部分做完補充。之前提到儲蓄險有轉移資產的功能,以前說過要保人是保單價值準備金的真正擁有者,所以實務上,也有高資產的父母藉由替子女買保單,由子女為要保人,但每年保費由高資產的父母轉到子女的銀行帳戶去繳付(通常每年保費低於法定的贈與稅免稅額),這樣可以利用每年的贈與稅免稅額去交每年的保費,逐漸累積儲蓄險的保單價值準備金,成為未來子女可以動用的資產。這樣跟每年直接贈與有什麼不同呢?以前講過,儲蓄險其實在繳費期間收益不高,甚至提早解約有可能會損失已繳的保費,所以大概率可以讓太過年輕的子女不會因一時衝動隨便解約去揮霍這筆錢,比較能長期累積出一筆穩定的資產,給子女當未來的教育金或成家費用。
好,再回到上一集節目中的經典案例。
在第三本書《全球生死大數據:一個醫生追尋70億人傷病與死亡的真相》的第九章中提到了南丁格爾女士。世人可能被她為戰地護理女神的慈悲事蹟而感動,但其實她對於世界更深遠的影響,是在她服務戰地醫院的經驗中觀察到衛生環境改善和感染死亡率之間的相關性,她藉由本身的統計學識和巧思,顛覆了當時政府高層的公衛思想,讓醫院的衛生環境得到重視,大幅減少了戰地醫院中的死亡率,她的智慧和勇氣,才真的是對世界最大的貢獻!
各位可能覺得,這不是很明顯的事實,知道的人都應該會立刻採行呀,同學們
啊,為什麼本書作者一直在呼籲大家小心自己的情緒和成見的影響,就是因為它們對於我們決定要相信或不相信什麼,有絕大的影響力,所以要想改變社會約定俗成的見解,是極需要巧思和智慧的事。
以提升醫院的衛生環境來說,南丁格爾在1859年提出的玫瑰圖其實不算早,一位匈牙利醫生(Ignaz Semmelweis),他在1847年成為維也納總醫院婦產科的住院總醫師。當時是19世紀,許多孕婦在醫院生產的死亡率莫名地高於在家生產,使得許多孕婦視去醫院生產為畏途,他觀察之後發現,很多孕婦是在產後感染「產褥熱」死亡,他發現接生過「產褥熱」的孕婦後的醫護人員,再去接生其他孕婦時,感染機率大幅上升,他因此推論產褥熱是因接生人員的手或器械受到污染,接著傳染給產婦引起的敗血症。之後他便倡導接生人員要先用漂白粉溶液洗手,大家也想得到吧,果然「產褥熱」的病死率大幅下降,他因此孕婦們稱為是「母親們的救星」以及「感染控制之父」。
好,退一萬步來說,就算因果關係尚未確立(這時離法國的巴斯德由1862年逐漸發展出來的疾病細菌學說被推廣出來還有些距離,所以認真說起來,南丁格爾和這位醫生藉由觀察和統計,得到的是相關性而非再經由控制型實驗得出來的因果閞係驗證),但多做這麼簡單的洗手一步,就能大幅降低孕婦生產死亡率,先不管它是為什麼,站在人命珍貴的立場上來看,再小心也不為過對吧?
但可惜,這位醫生就是這樣觸犯了醫界的逆鱗,或許是不願承認自己以前不洗手害死患者,所以很多醫生非常抗拒這種說法也不願配合,甚至不斷打壓這位先驅的醫生,導致這位醫生崩潰被送進精神病院,結果在一次試圖逃跑時被警衛毒打,兩週後傷口感染死亡(治療他的醫生大概也沒洗手),終年才47歲(當時是1865年,不知道如果他等久一點,巴斯德和南丁格爾對於病理的發現和翻轉公衛觀念的影響蔓延到歐陸時,他能不能看到自己的平反?)。
各位想想,這位還是個受人尊敬的醫生呢,而且顯然也受病患的擁戴,南丁格爾只是一位護士,還是當時較不受學界視的女性,所以她能以一己之力,藉由巧妙呈現公正的統計數據來影響到對的人,以致她能做到匈牙利醫生做不到事情,成功地翻轉了英國高層與醫界的成見,是多麼了不起的事了吧。
這裏再提一下「數據偵探」在第七章中把大數據和演算法拉出來講的苦心孤詣。以往大家認為統計是因為母體數據太過龐大,所以要藉由抽樣的技術,試圖由小樣本合理地去推估母體,減少成本,但又能得到品質不差的數據。而電腦與網路的普及,使得大眾似乎出現一種錯覺,不必再小心挑選樣本來推估母體,因為網路可以用全數據來做比對啦,但這其實仍然是有誤區,光是能接觸到網路,或某些網站或APP的受眾,可能就具備有某些與大眾不同的特徵,這就會出現偏誤了。
再來是,科學理論是講究因果關係,雖然因果關係真的很難推估(甚至以科學否證論來說,不認為以人有限的認知能真正求出因果關係,我們能求出的,只是在特定時空環境下,尚未被否定的假說而已。從正面觀點來看,這也就是科學一直有進步的空間?)。但一般來說,流程是這樣的,我們有了疑惑,試圖由現象去推求因果關係的結構,逐漸建立一個假說,然後就是去小心實驗,來測試這個假說的解釋力如何。所以我們在上一集提到的「再現性」,也就是一個所謂科學理論/假說能否在同儕再次進行實驗時,仍然出現相同的結果,就很重要了。
而以大數據求出的,其實仍然是由過去的贠料洪流中找出的相閞性,但如果變數眾多,則A變數和C變數之間縱然具有相關性,卻可能是藉由B變數導致的,並不是真的A和C之間有因果關係,如果以後出現變動,很可能操縱A變數,未必能再影響到C變數了。
聽起來有點繞得頭暈?我舉一個簡單的例子。一個漁村,分析了歷年的數據,發現漁獲量與漁村新生兒的養育率有正向關係。所以魚群是送子娘娘嗎?可以賜福給小BABY們?經過詳細探究後,我們可能會發現,其實是漁獲量若增大,可食用的魚獲量或收入變好,該村婦孺可以得到的營養就一樣會變好,生育或養育的成功率自然就上升了。我們假設如果該村開始發展觀光業,擴增了其他收入,而且漁獲淡季反而成為觀光旺季的話,那麼這個相關性就未必會繼續存在,或是不再顯著。
對了,如果可以,請各位同學多查詢有關「統計顯著性」的解釋。很多論文會以統計顯著性來做為理論是否得證的依據,其實按照定義來說,符合顯著性定義,只代表這個假說目前找不到足以否定的證據,所以暫時接受,不一定代表它是得證為真(還記得我們剛才的科學否證論說法?)
本書的五章中其實也提到這一點,而且通常來說,能通過顯著性考驗的機率很小,所以能通得過其真確度應該相當高。可惜,有時經過一些數據的篩檢,或甚至套用的統計分配模式未必正確,很可能會使得有疑慮的情況出現。加上還有所謂「倖存者效應」的過濾,所以作者頗為憂心地在書中提出,不少在期刊上發表的論文,後來以「再現性」來做一次檢測時,竟然可能只有低於一半的論文可以挺過去,真是有點令人感到悲哀。
不過希望大家不要對科學失去信心,也不要因此認為科學論文都不可信,畢竟從本書來看,科學的好處在於有錯的話,可以藉有系統的方式去排錯和過濾,也可以藉技術或知識的進步,再做出更精確的驗證,是金子就會發光,而不會像煉金術一樣,愚人金也能濫竽充數。
所以我們能藉著科學知識的累積有系統的進步,是非常重要的,因此作者在第五章中,刻意去突顯科學VS煉金術的不同。同理可證,這也是作者為何在第七章中,要求演算法和大數據透明化的重要基礎,因為這樣我們才能藉由不斷的分析,假設,實驗,檢證,再找出更為明確更有可能的因果關係,幫助我們更有效率地掌控這個世界。
好,說到這兒,聰明的讀者如果研究過南丁格爾女士發表的玫瑰圖,再把我們上述的說法反推回去,大概會發現,其實她的圖表也只是闡述了相關性,並非因果關係的展示。就像我說的,有時因果關係到底是如何成立的,必須靜待其他的技術或不同領域的新發現,才可能有突破性的進展。像南丁格爾女士雖然從自己在1854和1855年戰地醫院的服務經歷中,碰巧發現了醫院公衛影響傷患的死傷率,但確切是如何影響的,卻必須等法國的巴斯德在顯微鏡和實驗的幫助下,逐漸確立細菌致病說,才能夠釐清。
至於上一集提到的第三本書,是我看了南丁格爾的故事之後選出來,也算向這位女神致敬吧,相信大家看了,會理解"數據偵探"作者的態度,為何他一方面覺得統計數據被誤用很令人痛心,一方面又大聲疾呼統計太重要了,而且即使能夠正確地去蒐集和使用統計數據,也還是一條非常不簡單的漫漫長路。希望大家能體會統計的重要,一起來小心使用,並好好珍惜與維護它們,公開,透明,成為大眾的公共寶庫。
第三本書《生死大數據》的資料附在文檔,請大家參考。(引述自博客來網站)
附錄:
一.全名是"全球生死大數據:一個醫生追尋70億人傷病與死亡的真相",作者是傑瑞米.史密斯,他是《發現》(Discover)雜誌、《基督科學箴言報》(Christian Science Monitor)和《芝加哥論壇報》(Chicago Tribune)等刊物撰稿。本書主要在講述全球公共衛生研究權威克里斯‧穆雷醫生的追尋之路。他一開始只是想問:人因何而病,為何而死?
有些病會致死,有些不會,卻可能讓人痛不欲生,造成失能,影響生活品質。穆雷醫師長期深入研究全球公共衛生議題,戮力發展全球公共衛生的評量指標「全球疾病負擔」,便是為了結合正確的數據,提出新的計算方式。除了統計死亡與平均餘命(Life Expectancy),也有計算失能指標的「失能年數損失」(YLDs)與「失能調整損失年數」(DALYs)等,意在明確呈現那些不致死的病症,如何造成健康的損失,影響餘生。
至今,此計畫統計全球將近兩百個國家的各年齡層與性別,超過三百項疾病,67項可能致病致死的風險因子(Risk Factors)。風險因子讓我們理解疾病、失能或死亡或背後的成因,也許是環境,也可能是行為:如空氣污染、吸菸,缺乏衛生設備,缺乏運動等等。了解導致全球各地區域的健康問題,才可能針對不同地區的衛生需求對症下藥。
本書以穆雷醫生為主角,從他的成長故事,描繪對於醫療議題的投注與熱情,並為公共衛生議題帶來大數據的應用。「人為何而死」是簡單的提問,卻牽引了複雜無比的答案──除了呈現巨幅的全球疾病分布,也更能深入了解性別、年齡、區域等因素所造成的差異,進而採取積極改善行動。了解死因,只是一切的開始
大數據是眾人爭先恐後的創新與商機,然而當大數據遇上醫療,呈現了實際存在卻從來未曾如此具象的人類生存圖譜,協助人類改善並過更好的生活。正如比爾‧蓋茲所說:「本書所指出的是,當我們獲得更多正確的資訊,便能做出更好的選擇,我們的作為也能更具影響力。」
二.統計十條誡令:
1. 聽到某種說法時,應該先停下來,注意這個說法引起自己什麼樣的情緒反應,而非一開始就憑感覺接受或拒斥。
2. 我們應該找個方法,結合"鳥之眼”和"蟲之眼"來看事物,也就是應用統計學視角,加上從個人經驗來審視。
3. 取得數據時,我們該看看上面的"關鍵字",問自己是否了解這些數據真正想描述的東西。(如何定義,如何取得資料點,有時差之毫釐,失之千里)
4. 我們該尋比較和背景,任何主張都得從更大的角度來看。(注意背景資訊,放入脈絡之中去理解)
5. 我們該看看統計數據的背後,了解這些數據是怎麼來的,還有哪些數據已經消失了。(學術期刊偏好刊載意外的發現,可能讓偶然性使得某些有問題的研究結果僥倖成功。此時最好以”再現性”來校正。特別提出來,是不少研究認為,學術發表的再現性危機,可能已高於一半了。白話來說,可能有一半的研究恐怕並不具有一致性的解釋能力?再次感到悲傷)
6. 數據擺在我們眼前時,我們要問,其中少了哪些人?如果把他們加進來,我們的結論是否會有所不同?(例如以往或甚至目前,都有許多研究忽略了女性,或者以台灣的角度來說,白種人忽略了亞洲人收集得到的資訊,套用到我們身上又是否足夠精準?)
7. 我們應該要對演算法和驅動演算法的大數據集提出尖銳的問題。我們要了解,如果不公開,如果不透明,就無法相信這些算法和數據。(不論是傳統理論或大數據得出的理論,都該接受同樣的監督和驗證,才能保證科學的品質不斷進步,不然黑箱演算法也不過是現代鍊金術,再過幾百年也未必會能系統性地成長)
8. 我們應該更關注官方統計數據的基石,以及英勇捍衛這些統計數據的統計學家。(官方應該更公開,更正確,完整,獨立地蒐集各項統計數據,它們就像基礎科學一樣,乍看之下好像無大用,卻是一切決策計算的基礎。)
9. 我們不能只看漂亮圖表的表面,還必須仔細看看圖表的底下。(不要被圖表迷惑,但若用得好,就能像南丁格爾一樣翻轉世界)
10. 我們必須保持開放的心態,問自己是不是可能錯了,以及事實是否已經有所改變。(超級預測者)
最後,請保持優質的好奇心,耶!