醫療衛生系統中大資料的應用研究性論文
摘要:近年來醫療衛生資訊化發展迅速,醫療衛生領域也迎來了大資料時代的潮流。簡述了醫療衛生系統中資料資源現狀,分析了透過大資料平臺構建臨床決策支援系統、提高醫藥產品研發效率、疾病監控防治等方面的應用前景。
關鍵詞:大資料;醫療衛生系統
1資料管理問題
醫療資料是持續、大量增長的大資料。根據估算,中國一箇中等城市50年所積累的醫療資料量就會達到10PB級。並且,隨著時間的推移和業務系統的不斷升級換代,醫療資料模式的一致性也無法保證。因此,每天都會有大量的資料持續不斷地匯入區域醫療資料中心,並且每當有資料模式的更改,相關的歷史資料也需要做相應的調整。由於醫療資料是多種資料來源資料的彙總,醫療資料是關係複雜的多維資料。醫療資料的多維度多粒度為各種資訊服務的多角度多層次分析提供了可能,但同時也為大資料分析帶來了挑戰。Hadoop基於開源分散式資料處理平臺,透過特殊的方式組織網路級資料,可以解決資料儲存水平擴充套件的挑戰。利用MapReduce並行處理批次事務的能力,從多個數據源(主要是醫療機構的各個業務系統)抽取資料、轉換格式、並匯入基於HBase的資料儲存模型。使用Hadoop進行多維分析,利用資料平臺中多維資料非結構化的特徵,將大量冗餘的維度資訊整合到事實表中,可以在冗餘維度下靈活地改變問題分析的角度。並結合Hadoop,MapReduce強大的並行化處理能力,無論分析中的維度增加多少,開銷並不顯著增長,不會顯著影響分析的效能。
2大資料應用
2.1構建臨床決策支援系統
臨床決策支援系統可以提高工作效率和診療質量。透過分析疾病的模式和趨勢,臨床決策支援系統分析醫生輸入的條目,比較其與醫學指引不同的地方,從而提醒醫生防止潛在的錯誤,如藥物不良反應。透過部署這些系統,醫療服務提供方可以降低醫療事故率和索賠數,尤其是那些臨床錯誤引起的醫療事故。共享的醫療大資料分析技術將使臨床決策支援系統更智慧,首先,大資料中心儲存的海量、高維和非結構化的資料能夠被檢索,由於對非結構化資料的分析能力的日益加強,從而獲取更多的決策支援資訊。比如可以使用影象分析和識別技術,識別醫療影像(X光、CT、MRI)資料,結合患者的電子病歷資訊,得到輔助的治療資訊。或者挖掘醫療文獻資料建立醫療專家資料庫和醫學知識倉庫,為醫生提供一個決策和清單,在錄入症狀和檢驗結果後,做是非判斷等集合演算法,根據不同病種,建立決策樹演算法,逐漸得出診斷結果和治療方案,為醫生的臨床操作提供建議,防止醫生忽略可能存在的罕見疾病,防止誤診。此外,臨床決策支援系統還可以使醫療流程中大部分的工作流流向護理人員和助理醫生,將常規的醫生問診程式化和模式化,結合檢驗化驗等技術手段,醫生只需參與最後的決策和治療環節。使醫生從耗時過長的簡單諮詢工作中解脫出來,從而提高治療效率。
2.2提高醫藥產品研發效率
2.2.1預測建模
醫藥公司在新藥物的研發階段,可以透過資料建模和分析,確定最有效率的投入產出比,從而配備最佳資源組合。模型基於藥物臨床試驗階段之前的資料集及早期臨床階段的資料集,儘可能及時地預測臨床結果。評價因素包括產品的安全性、有效性、潛在的副作用和整體的試驗結果。透過預測建模可以降低醫藥產品公司的研發成本,在透過資料建模和分析預測藥物臨床結果後,可以暫緩研究次優的藥物,或者停止在次優藥物上的昂貴的臨床試驗。除了研發成本,醫藥公司還可以更快地得到回報。透過資料建模和分析,醫藥公司可以將藥物更快推向市場,生產更有針對性的藥物,有更高潛在市場回報和治療成功率的藥物。
2.2.2提高臨床試驗設計的統計工具和演算法
使用統計工具和演算法,可以提高臨床試驗設計水平,並在臨床試驗階段更容易地招募到患者。透過挖掘病人資料,評估招募患者是否符合試驗條件,從而加快臨床試驗程序,提出更有效的臨床試驗設計建議,並能找出最合適的臨床試驗基地。比如那些擁有大量潛在符合條件的臨床試驗患者的試驗基地可能是更理想的,或者在試驗患者群體的規模和特徵二者之間找到平衡。
2.2.3臨床實驗資料的分析
分析臨床試驗資料和病人記錄可以確定藥品更多的`適應症和發現副作用。在對臨床試驗資料和病人記錄進行分析後,可以對藥物進行重新定位,或者實現針對其他適應症的營銷。實時或者近乎實時地收集不良反應報告可以促進藥物警戒(藥物警戒是上市藥品的安全保障體系,對藥物不良反應進行監測、評價和預防)。或者在一些情況下,臨床實驗暗示出了一些情況但沒有足夠的統計資料去證明,現在基於臨床試驗大資料的分析可以給出證據。
2.3基於大資料的疾病監控防治
大資料的使用可以改善公眾健康監控。首先,隨著移動網際網路現在的不斷髮展,越來越多的使用者開始選擇把業務和使用習慣都轉移到了移動端,那麼,在基於海量資料使用者搜尋的社交APP以及LBS等技術層面,可以建立結合原有疾病監控系統中的流行疾病法定報告資料、流行疾病病例,結合疾病、環境資料,及時發現並繪製出流行病風險地圖。在基於搜尋資料和LBS資料方面,分析不同時空尺度人口流動性、移動模式和引數進一步結合病原學、人口統計學、地理、氣象和人群移動遷徙、地域之間等因素和資訊,建立流行病時空傳播模型,確定流感等流行病在各流行區域間傳播的時空路線和規律,得到更加準確的態勢評估、預測。並且,透過醫療雲和大資料中心,公共衛生部門可以透過覆蓋全國的患者電子病歷資料庫,分析疾病的模式和趨勢快速檢測大規模傳染性疾病進行全面的疫情監測,並透過整合疾病監測和響應程式,快速採取措施進行響應。這基於大資料的疾病監控防治能使傳染病感染率降低,衛生部門可以更快地檢測出新的傳染病和疫情。透過提供準確和及時的公眾健康諮詢,將會大幅提高公眾健康風險意識,同時也將降低傳染病感染風險。大資料共享在疾病監控防治中可以做到以下幾點:
(1)提前確定一定規模的未知疾病,為疫情控制爭取時間。傳統檢測無法監測到任何沒有臨床症狀的病例的,這些經驗在醫院的臨床經驗中都是空白。但大資料可以透過醫院的共享資訊以及搜尋監控指定地區的使用者的頻繁搜尋關鍵詞,可以檢測到某個地區已經出現的疫情。比如不明原因的肺炎,某地餐館讓多少人出現嘔吐腹瀉等異常狀況等,然後再透過與疾病控制中心的病毒庫中的病毒分析,尋找吻合的病毒,進行比對分析將其找出,為判斷疾病贏取時間。建立大資料中心後,疾病預防可以真正在第一時間內去判斷出疫情的病毒源,進而為控制爭取時間。疾病監控防治的目的是及時制止其傳播的範圍,而大資料則是目前唯一的也是最佳的途徑。
(2)判斷人員流向,控制疫情。在疫情發生後,雖然國家可以第一時間控制住當地疫情,但是人員流動則是無法控制的。利用大資料的監控分析就能監測到傳染源區人員的主要流向目的地,疾控中心可以拿出對應的醫療技術和對應的治療藥品以及疫苗來防治,第一時間趕到相應地點,實施接種疫苗,這樣一來就減少了盲目的廣撒網式的全面佈局情況,透過大資料分析的提供人員流動資料,讓控制疫情在效率上大幅度提升。
(3)傳播動力學模型建立。擁有了大資料的全面監控後,疾控中心也就有了更多的實踐支援,就可以開始真正從實踐中建立有關疫情的複雜動態網路的傳播動力學。
參考文獻
[1]李國傑,程學旗.大資料研究未來科技及經濟社會發展的重大戰略領域-大資料的研究現狀與科學思考[J].中國科學院院刊,2012,27(6):647-657.
[2]鄭西川,孫宇,於廣軍,等.基於物聯網的智慧醫療資訊化10大關鍵技術研究[J].醫學資訊學雜誌,2013,(1):10-14.