|
進入資訊科技年代,我們可以不斷接觸到龐大的資訊,
甚至超出我們所能承受的負載,讓我們感到無所適從。
風暴的中心並不在於這個世界會怎麼變化,
而是在於釐清該如何去思考、去感受、去理解,
並對於外界的變化,做出回應。
— 傑米(Criss Jami),《找回斷臂維納斯》(Venus in Arms) |
健康照護的提供正伴隨著許多令人炫目的新科技,進行前所未有的改變。要在雲端運算、大數據、商業智能、〈可負擔健保法〉(ACA,俗稱歐巴馬健保法案)的壓力下,去控制成本並提高品質,不僅衝擊著以不變應萬變的做法,也考驗著領導階層是否具備有效吸各種工具並加以運用的能力。麥肯錫(McKinsey & Company)在2013 年的一份報告中指出,根據估算,運用大數據減少醫療開銷的金額,每年將達3,000 億美元至4,500 億美元之譜,相當於美國每年醫療支出2.6 兆美元的12% 至17% 之間(Kayyali, knott, and Van Kuiken, 2013)。
醫療數據之怪 醫療領域可以產生非常可觀的結構化資料。在有一千張病床的醫療院所裡,每位病人的醫療紀錄可能就有足足上萬個單字,一整年下來,光是一位病人就可以累積出將近1.2 GB 的結構化資料。病歷紀錄這類型的資料不但易讀,也可直接用於資料分析,可以提供許多檢驗管理績效的指標,例如病人平均住院天數、每年每張床的接收人次、三十天內有多少人次回診等等。
不過,龐大的資料量當中,粗估約有80% 其實是欠缺結構化的,諸如文字記載、語音說明、圖像資料等。因此,難就難在如何讓這些欠缺結構化的資料產生有效的用途。我們現在正處於科技發展的十字路口,湧入的龐大新資料洪流雖然有更進一步加以分析的可能,但是我們還沒有能力有效運用這些唾手可得的資料。
這就是大數據的概念會吸引人的緣故。
在大數據的環境底下,每位病人結構化的資料不論多大,都不是問題,各種可用的分析工具都已經能夠妥善處理世界上那有限的20% 結構化資料,找出其中的趨勢和重點所在。問題的關鍵在於資料來源的取得、彙整,去蕪存菁後形成有用的資訊。我們該如何把結構化與欠缺結構的資料整合在一起,形成一套可以運用的資料庫呢? 當前的挑戰
目前,健康資訊科技系統已能做出各式各樣的報表,基本上可以用來呈現某一功能類別內的績效,譬如財務狀況或是臨床成效指標,只是這些報表的內容也複雜得讓人無法負荷。套用醫療顧問史圖德(Quint Studer, 2013)的話來說:「要監控、做決定和解決問題的領域,實在太多了,只要一個不小心,就會讓你一整天都花在被動回應問題上,無力主動出擊、聚焦在真正有成效的課題上……然後就這樣,日復一日,年復一年」。醫療主管會被多如牛毛的各種系統所產生的各種管理報表淹沒,反而看不清真正能改善績效的深入見解。
試以「系統績效」個案研究要解決的問題為例:以成本和病人滿意度的表現來看,哪個醫療院所的表現最糟糕?為什麼?這個問題的資料來源包含了將近四百萬筆紀錄,是超過一百家醫療院所,經過五年時間累積下來的,資料內容包含183 種分類方式,像是:
- 每個人的個人資料如性別、年齡和族裔
- 掛號資訊,諸如:
- 醫療院所代號
- 各種診斷與代碼
- 各種療程與代碼
- 住院時間、總成本、治療結果、醫療保險種類 病人滿意品質指標
雖然這種呈現方式完整描述了許多指標項目,但是卻沒能提供可供操作的資訊,只會讓人納悶:這些資料裡面真的有值得注意的地方嗎?我能夠看出來什麼地方為什麼出了問題嗎?如果一切照舊的話,我能夠做出什麼預測?有沒有可以用來長時間分析解決成效的關鍵點?
答案就在眼前
決策可以概分成三個漸進式的行動方案:描述問題、分析預測和提出解方(Bell, Raiffa, and Tversky, 1998)。在醫療領域中,用來深思熟慮以描述問題的資訊,包括病人人數管理、臨床醫療品質及效能、特殊的醫療院所與病人種類、輸入代碼錯誤(甚至是更嚴重的蓄意詐欺),這些都能有效衡量或反映已經發生的問題。分析預測可以處理的課題,包括30 天、60 天和90 天內的營收、回診次數(像是鬱血性心臟衰竭的病人會在30 天到90 天內回診)、病人類別的風險調整。提出解方則會影響日後的結果,像是病人流量控管、更精確的成本核銷和資產管理。背後的基本想法是:主動影響結果總比被動回應已經發生的事件來得有用。
再回過頭講一下先前提到的個案研究。醫療領域控制成本與提升品質的壓力愈來愈沉重,業內推行的研究案如美國醫學研究所的報告、以〈可負擔健保法〉為首的國家政策,再加上追求市場競爭力等的各種目標,都需要能夠對改善醫療成效的驅動力,有更進一步的瞭解。 |
摘自《醫療大數據》第一章 |