臨床大數(shù)據(jù)的產(chǎn)品應(yīng)用與變現(xiàn)(一):醫(yī)院
大數(shù)據(jù)在各行各業(yè)的應(yīng)用,給業(yè)態(tài)帶來了顛覆式的改變。那么,在醫(yī)療行業(yè),大數(shù)據(jù)可以起到什么作用?
本文是《臨床大數(shù)據(jù)的產(chǎn)品應(yīng)用與變現(xiàn)》的系列文章第一篇。
醫(yī)療大數(shù)據(jù)與人工智能項目近年來非常火熱,但是很多項目在變現(xiàn)過程中遇到一些困難,大家都明白醫(yī)療數(shù)據(jù)是一座金礦,但卻不知道應(yīng)當(dāng)如何去挖。導(dǎo)致這樣局面的因素很多,有歷史原因、法律原因、產(chǎn)業(yè)原因等多個方面。
- 從歷史原因來講,醫(yī)療數(shù)據(jù)特別是臨床系統(tǒng)獨立性高,產(chǎn)生的數(shù)據(jù)難以整合。各地醫(yī)院數(shù)據(jù)結(jié)構(gòu)差異大,難以形成統(tǒng)一結(jié)構(gòu),各地方醫(yī)學(xué)用語也不規(guī)范,產(chǎn)生了大量的歧義。這是由歷史原因造成,當(dāng)前正在通過制定標準逐步改善。
- 從法律原理來講,醫(yī)療數(shù)據(jù)的歸屬和使用問題始終是一個灰色地帶,數(shù)據(jù)權(quán)利游離在患者、醫(yī)院、衛(wèi)健委之間,醫(yī)療數(shù)據(jù)利用存在患者隱私泄露的風(fēng)險,所以很少有機構(gòu)愿意承擔(dān)這樣的風(fēng)險。醫(yī)療數(shù)據(jù)上云在各地實施情況也不同,當(dāng)前大多數(shù)醫(yī)院能夠接受混合云的實現(xiàn)方案。
- 從產(chǎn)業(yè)原因來講,醫(yī)療行業(yè)是一個嚴謹不容出錯的行業(yè),關(guān)系到人的健康或者生命,當(dāng)前科技的發(fā)展還不足以能夠讓數(shù)據(jù)描述自然科學(xué),也正因為如此使得醫(yī)療大數(shù)據(jù)行業(yè)變現(xiàn)受阻。
醫(yī)療數(shù)據(jù)含義非常廣泛,所有涉及人類健康的數(shù)據(jù)都可以稱為醫(yī)療數(shù)據(jù),包括藥物數(shù)據(jù)、臨床數(shù)據(jù)、健康數(shù)據(jù)、生活飲食數(shù)據(jù)、運動數(shù)據(jù)等。本文只討論臨床數(shù)據(jù)的應(yīng)用,對于藥物數(shù)據(jù)及其他數(shù)據(jù)的應(yīng)用,在其它文章中進行討論。
一、臨床數(shù)據(jù)的應(yīng)用場景及內(nèi)容
臨床數(shù)據(jù)與藥物數(shù)據(jù)或健康數(shù)據(jù)不同,臨床數(shù)據(jù)的獲取具有極高的門檻,從這個角度來講數(shù)據(jù)本身就具有較高價值。換句話說,誰擁有了數(shù)據(jù)誰就擁有了發(fā)展臨床數(shù)據(jù)應(yīng)用的絕對主動權(quán)。
當(dāng)前臨床大數(shù)據(jù)主要服務(wù)于政府、藥企、醫(yī)院、保險四個類別。這四個類別用戶相對典型,本文僅以這四類典型場景用戶為例,說明臨床大數(shù)據(jù)的落地。
當(dāng)然,這四個類別也經(jīng)常聯(lián)動。例如藥企-醫(yī)院,就是一對典型的聯(lián)動體系,臨床數(shù)據(jù)同時服務(wù)于藥企與醫(yī)院才能構(gòu)成完整的商業(yè)模式。
本文主要討論對醫(yī)院業(yè)務(wù)產(chǎn)品與服務(wù)模式。
二、對醫(yī)院的服務(wù)
臨床科研對醫(yī)院來講算是硬指標,醫(yī)生資格晉升、新療法、新藥的科研工作都離不開醫(yī)院。但是由于歷史原因,醫(yī)院系統(tǒng)獨立性高,各個地方醫(yī)院數(shù)據(jù)格式不同,難以將數(shù)據(jù)融合形成更大價值。所以,當(dāng)前的主要認識是要按照一個確定的數(shù)據(jù)格式,先將醫(yī)院內(nèi)部的數(shù)據(jù)打通,從而推廣到區(qū)域乃至全國。
針對臨床科研問題,分為三個部分可以獨立構(gòu)成商業(yè)模式,也可以聯(lián)合形成整體商業(yè)模式。
醫(yī)療數(shù)據(jù)治理是一項大工程,也是醫(yī)療大數(shù)據(jù)應(yīng)用基礎(chǔ)。衛(wèi)健委在2019年出版了一本關(guān)于醫(yī)療數(shù)據(jù)治理的書籍,目的技術(shù)為了指導(dǎo)全國醫(yī)院進行數(shù)據(jù)治理工作。
1. 臨床數(shù)據(jù)治理
數(shù)據(jù)治理是一個非常復(fù)雜的過程,其中不僅僅是核心的技術(shù)領(lǐng)域,還有適當(dāng)?shù)臄?shù)據(jù)保障機制及相應(yīng)的組織架構(gòu)。
數(shù)據(jù)治理的核心領(lǐng)域是針對主數(shù)據(jù)、元數(shù)據(jù)進行數(shù)據(jù)服務(wù),其中包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)標準統(tǒng)一、數(shù)據(jù)安全等諸多方面;對應(yīng)于構(gòu)成這些要求需要有相應(yīng)的保障機制,包括規(guī)則制度、數(shù)據(jù)服務(wù)組織、機制流程以及相應(yīng)的技術(shù)規(guī)范。兩個方面相輔相成,是一個有機整體。
數(shù)據(jù)治理是指將數(shù)據(jù)作為組織資產(chǎn)而展開的一系列的具體化工作,是對數(shù)據(jù)的全生命周期管理。包括針對數(shù)據(jù)產(chǎn)生、存儲、加工、應(yīng)用、刪除等全流程制定一系列組織架構(gòu)、管理制度、操作規(guī)范、IT應(yīng)用技術(shù)甚至績效考核等制度來規(guī)范約束的方式。
任何一個產(chǎn)品都是基于需求痛點而存在的,人工智能類產(chǎn)品并不例外,在產(chǎn)生大量數(shù)據(jù)的同時,我們需要將原有大量數(shù)據(jù)轉(zhuǎn)化為有序、可利用的數(shù)據(jù)資產(chǎn)。經(jīng)過上述過程,才能夠利用人工智能技術(shù)來達到產(chǎn)品期望。將數(shù)據(jù)整合為數(shù)據(jù)資產(chǎn)的過程稱為數(shù)據(jù)治理。
數(shù)據(jù)治理的內(nèi)涵有如下的描述數(shù)據(jù)治理是貫穿數(shù)據(jù)采集、匯聚、存儲、處理、加工、共享交換、應(yīng)用開發(fā)和持續(xù)運營等整個生命周期的系統(tǒng)性工作,需要充分融合技術(shù)、管理和業(yè)務(wù),從而確保數(shù)據(jù)資產(chǎn)安全并探索其商業(yè)用途。
數(shù)據(jù)治理的概念中,有3個基本問題需要了解。
- 數(shù)據(jù)治理的目標
- 數(shù)據(jù)治理流程
- 數(shù)據(jù)治理的應(yīng)用
數(shù)據(jù)治理的目標是為了將數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)資產(chǎn),為實現(xiàn)更好的決策,減少操作摩擦,保護數(shù)據(jù)利益相關(guān)者的需求,構(gòu)建標準流程并提高流程透明度。實現(xiàn)數(shù)據(jù)資源在各組織機構(gòu)部門的共享;推進信息資源的整合,從而提升公司企業(yè)數(shù)據(jù)的有效應(yīng)用。
數(shù)據(jù)治理不僅需要完善的保障機制,還需要理解具體的治理內(nèi)容和數(shù)據(jù)規(guī)范、元數(shù)據(jù)管理及每個過程需要哪些系統(tǒng)或者工具來進行配合。治理后的數(shù)據(jù)具有一致性的數(shù)據(jù)標準,擁有良好的擴展性、可用性、靈活性。
數(shù)據(jù)治理的是一個復(fù)雜的過程,主要過程分為三個階段,每個階段的要求也不盡相同。
- 第一階段:數(shù)據(jù)的基礎(chǔ)管理,包括數(shù)據(jù)標準化的相關(guān)內(nèi)容,術(shù)語的統(tǒng)一、分詞及代碼表的統(tǒng)一等。同時需要確定元數(shù)據(jù)管理方案,確定標準字段與抽取原則,整合數(shù)據(jù)字典與相關(guān)的技術(shù)工具。
- 第二階段:數(shù)據(jù)交換傳輸與異構(gòu)化過程。在定義了相關(guān)數(shù)據(jù)規(guī)范與ETL工具之后,第二階段需要根據(jù)之前定義的方案進行數(shù)據(jù)處理。數(shù)據(jù)處理中包含主數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、屬于交換與集成管理。第二階段的主要工作是數(shù)據(jù)異構(gòu)化過程。
- 第三階段:數(shù)據(jù)治理的成熟階段。在這個階段已經(jīng)完成了數(shù)據(jù)倉庫的整合搭建,并可以基于數(shù)據(jù)倉庫搭建一些應(yīng)用,也可以進行數(shù)據(jù)挖掘的相關(guān)工作。
數(shù)據(jù)治理的應(yīng)用其實就是數(shù)據(jù)的應(yīng)用,只有治理過的數(shù)據(jù)才能較好應(yīng)用。數(shù)據(jù)平臺可以提供計算、以及各個業(yè)務(wù)板塊的數(shù)據(jù)能力支撐。
首先我們解釋一下什么是元數(shù)據(jù)。
元數(shù)據(jù)(MetaData)是指用來定義業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù),也就是說元數(shù)據(jù)定義了業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),各個任務(wù)之間的血緣關(guān)系等。更進一步講,所有能夠位置系統(tǒng)運行的數(shù)據(jù)都可以叫元數(shù)據(jù)。
元數(shù)據(jù)按照用途可以分為2類:技術(shù)元數(shù)據(jù)(Tehnical Metadata)與業(yè)務(wù)元數(shù)據(jù)(Business Metadata)。
- 技術(shù)元數(shù)據(jù)是管理數(shù)據(jù)倉庫使用的數(shù)據(jù),用于開發(fā)與技術(shù)細節(jié)的統(tǒng)一。包括數(shù)據(jù)倉庫結(jié)構(gòu)的描述、視圖、血緣關(guān)系、層級以及數(shù)據(jù)導(dǎo)出的結(jié)構(gòu)定義等。技術(shù)元數(shù)據(jù)也定義了算法的度量、數(shù)據(jù)顆粒度等。
- 業(yè)務(wù)元數(shù)據(jù)主要從業(yè)務(wù)角度描述了數(shù)據(jù)庫中的業(yè)務(wù)數(shù)據(jù),包括業(yè)務(wù)數(shù)據(jù)字典、對象和屬性名稱、數(shù)據(jù)來源以及數(shù)據(jù)分析方法與報表等信息。業(yè)務(wù)元數(shù)據(jù)從架構(gòu)方面也可以分為上、中、下三層,上層指的是業(yè)務(wù)概念,中層指的是業(yè)務(wù)實體描述、下層指的是業(yè)務(wù)術(shù)語;技術(shù)元數(shù)據(jù)架構(gòu)也可以分為三層,上層指的是系統(tǒng)、中層指的是技術(shù)對象、下層指的是字段名稱、表結(jié)構(gòu)等。
元數(shù)據(jù)的治理關(guān)鍵在于規(guī)范性,主要分為2個步驟:元數(shù)據(jù)采集與元數(shù)據(jù)管理。元數(shù)據(jù)治理具有非常清晰的理論框架與技術(shù)框架,本節(jié)只是簡要介紹并不過多進行展開討論。
元數(shù)據(jù)采集分為技術(shù)元數(shù)據(jù)采集和業(yè)務(wù)元數(shù)據(jù)采集。
對于技術(shù)元數(shù)據(jù),首先確定數(shù)據(jù)匯總后的元數(shù)據(jù)模型,各個系統(tǒng)中的數(shù)據(jù)結(jié)構(gòu)不同,需要用元數(shù)據(jù)模型集中關(guān)聯(lián)在一起,這樣才能起到數(shù)據(jù)級聯(lián)的作用。
業(yè)務(wù)元數(shù)據(jù)的治理則相對復(fù)雜的多,主要由于各個業(yè)務(wù)系統(tǒng)的行業(yè)性所致。業(yè)務(wù)元數(shù)據(jù)治理中,需要規(guī)范業(yè)務(wù)定義、業(yè)務(wù)名稱、描述業(yè)務(wù)需要統(tǒng)一。
數(shù)據(jù)標準化是數(shù)據(jù)治理的必要過程,通過建立標準的業(yè)務(wù)詞典來定義業(yè)務(wù)用語。作者長期從事醫(yī)藥有關(guān)大數(shù)據(jù)及人工智能產(chǎn)品工作,曾經(jīng)處理過同樣一個藥物在幾十個系統(tǒng)中擁有20多種名稱,這些問題都需要在數(shù)據(jù)治理過程中解決,否則對后期數(shù)據(jù)應(yīng)用及人工智能產(chǎn)品構(gòu)建影響極大。
高質(zhì)量的數(shù)據(jù)企業(yè)的分析決策與業(yè)務(wù)發(fā)展至關(guān)重要,只有建立了完整的數(shù)據(jù)質(zhì)量標準體系,才能夠有效提升企業(yè)整體數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量管理分為4大模塊:清洗模塊、稽查模塊、操作模塊、評估模塊。
- 準確性:準確性是指記錄的數(shù)據(jù)與事物或過程一致性。例如病例系統(tǒng)中病人人的性別、出生年月等數(shù)據(jù)的真實性。數(shù)據(jù)的準確性問題一般出自采集終端方面,所以在數(shù)據(jù)采集過程中進行數(shù)據(jù)多次核查十分必要。
- 及時性:及時性是指數(shù)據(jù)從產(chǎn)生到可以分析查閱的時間間隔,也叫延時時長。如果數(shù)據(jù)延時超出業(yè)務(wù)需求的時限,則可能導(dǎo)致數(shù)據(jù)毫無意義。例如要完成第一季度的銷售分析,但到第三季度才看到目標數(shù)據(jù),那就會變得毫無意義。數(shù)據(jù)及時性的問題一般出在政策法規(guī)或者數(shù)據(jù)安全性方面,所以需要及時保證數(shù)據(jù)合規(guī),做好數(shù)據(jù)加密脫敏工作。
- 一致性:一致性是指不同系統(tǒng)中收集的同一數(shù)據(jù)不能存在差異或相互矛盾。例如火車飛機的始發(fā)站應(yīng)該具有同樣的站名,同一藥物的名稱一致。數(shù)據(jù)一致性與規(guī)范性問題往往同時存在,確保規(guī)范性是數(shù)據(jù)一致性的前提。
- 完整性:完整性指的是數(shù)據(jù)不能存在缺失的情況。例如今天門診人數(shù)為120人,但電子病歷只有110人的數(shù)據(jù)記錄。不完整的數(shù)據(jù)會影響數(shù)據(jù)質(zhì)量,同時也影響數(shù)據(jù)特征的提取。數(shù)據(jù)的完整性問題大多發(fā)生在數(shù)據(jù)采集終端,由于人為因素或設(shè)備故障而發(fā)生的漏采集問題。
- 規(guī)范性:規(guī)范性是指數(shù)據(jù)存儲的標準化與規(guī)范性。標準有兩層含義,其一指的是以特定的格式約束數(shù)據(jù),例如手機號碼必定是13位的數(shù)字;其二是指針對特定行業(yè)需要使用標準化術(shù)語對數(shù)據(jù)加以描述。當(dāng)前醫(yī)療大數(shù)據(jù)被炒得十分火熱,筆者也是醫(yī)療大數(shù)據(jù)的從業(yè)者,深切地感受到缺乏統(tǒng)一的醫(yī)療術(shù)語標準給數(shù)據(jù)分析帶來的困難。同一種藥在不同的醫(yī)院的名字多達十幾種,如藥品“北京降壓0號”就存在“降壓0號”、“北京降壓0”等多種名稱。在構(gòu)建產(chǎn)品之前,必須確定標準術(shù)語集才能使數(shù)據(jù)具有規(guī)范性與一致性。
- 唯一性:唯一性是指數(shù)據(jù)存儲與檢索的唯一性。一般來講,數(shù)據(jù)的唯一性在檢索中至關(guān)重要。例如一位公民只有一個身份證號。數(shù)據(jù)不唯一是系統(tǒng)級錯誤,需要對采集終端和整個系統(tǒng)進行排查分析。
數(shù)據(jù)質(zhì)量的評估從以上6個方面展開,不過要注意數(shù)據(jù)的質(zhì)量管控涉及到平臺底層、整體架構(gòu)、存儲模式等很多方面的內(nèi)容,結(jié)合行業(yè)特性綜合分析才能夠改善數(shù)據(jù)質(zhì)量。
數(shù)據(jù)質(zhì)量管理是一個流程化體系,在各個階段管理重點也不盡相同。
在系統(tǒng)需求討論與概要設(shè)計階段,需要明確數(shù)據(jù)質(zhì)量的規(guī)則定義,也就需要明確需要什么樣的數(shù)據(jù)質(zhì)量,這樣才能知道數(shù)據(jù)結(jié)構(gòu)與需求邏輯設(shè)計;在開發(fā)階段需要確定數(shù)據(jù)質(zhì)量規(guī)則的落實與實施;在上線后,需要實施數(shù)據(jù)質(zhì)量監(jiān)控按照評估維度進行數(shù)據(jù)質(zhì)量評估,發(fā)現(xiàn)問題及時糾正。
數(shù)據(jù)生命周期管理(Data Life Cycle Management, DLM)是一種基于策略的方法,針對管理信息系統(tǒng)的數(shù)據(jù)在整個生命周期內(nèi)的流動。從數(shù)據(jù)創(chuàng)建與存儲,經(jīng)過一段時間流動直到過時被刪除。DLM產(chǎn)品的數(shù)據(jù)流動處理過程是自動化的,通常根據(jù)指定的策略將數(shù)據(jù)組織成各個不同的層,并基于關(guān)鍵條件自動地將數(shù)據(jù)從一個層移動到下一個層級。
數(shù)據(jù)的安全性是當(dāng)今最熱點的話題,筆者從事的醫(yī)療大數(shù)據(jù)行業(yè),數(shù)據(jù)安全一直最為首要的問題。世界各國已經(jīng)立法保證數(shù)據(jù)安全,其中法案中比較嚴格的是2018年5月25日歐盟頒布的《一般數(shù)據(jù)保護法案》(General Data Protection Regulation, GDPR)。
GDPR規(guī)制的行為主要針對個人數(shù)據(jù)的處理行為。
個人數(shù)據(jù)包括姓名、身份證號碼、手機、定位數(shù)據(jù)等常規(guī)個人信息,同時也包括種族、生理、遺傳、健康、心理、政治觀點和宗教信仰等個人敏感信息。個人數(shù)據(jù)處理是指針對個人數(shù)據(jù)的任何操作行為,這必然也包括采用自動化方式的各種處理行為,如用戶畫像的自動獲取等。
商業(yè)方面來講,醫(yī)療數(shù)據(jù)治理本身就是一門生意,是所有臨床產(chǎn)品構(gòu)建的基礎(chǔ)。
醫(yī)療數(shù)據(jù)治理通常來講需要保證底層數(shù)據(jù)庫不變,在底層數(shù)據(jù)庫的基礎(chǔ)上在搭建一套符合產(chǎn)品構(gòu)建需求的數(shù)據(jù)體系。醫(yī)療數(shù)據(jù)治理可以與臨床科研平臺合并構(gòu)成一個項目,買單方可能是醫(yī)院本身,也可能是醫(yī)院與藥企合作的項目。
2. 臨床科研平臺建設(shè)
有了數(shù)據(jù)治理的基礎(chǔ),可以著手研發(fā)院內(nèi)臨床科研平臺。臨床科研數(shù)據(jù)平臺是建立臨床實踐數(shù)據(jù)化的工具與復(fù)雜海量臨床數(shù)據(jù)管理和利用的平臺。臨床數(shù)據(jù)經(jīng)過整理、清理、裝載、轉(zhuǎn)換等過程,形成了蘊含豐富臨床經(jīng)驗和臨床規(guī)律的海量數(shù)據(jù)庫。
它是“真實世界臨床科研范式”的技術(shù)支撐,也是利用大數(shù)據(jù)實現(xiàn)臨床科研變革的有力工具。在循證醫(yī)學(xué)的基礎(chǔ)上,通過此平臺整合的不同研究中心、研究現(xiàn)場所產(chǎn)生的數(shù)據(jù),形成蘊含內(nèi)容極其豐富的大數(shù)據(jù)資源。臨床科研平臺屬于一個工程項目,平臺具有的功能應(yīng)包含以下三個要點:
- 數(shù)據(jù)匯聚
- 多組協(xié)同
- 臨床科研特征
臨床科研平臺建設(shè)過程中將通過自動化智能化代替手工整理臨床疾病數(shù)據(jù),完整集成病人院前院中和院后診療數(shù)據(jù),實現(xiàn)對所有臨床數(shù)據(jù)的深度智能化挖掘利用。
平臺功能將有效促進醫(yī)院臨床研究發(fā)展和患者隨訪率,并大幅節(jié)省臨床醫(yī)生數(shù)據(jù)檢索所需精力,利用其數(shù)據(jù)開展各類臨床循證研究,可為優(yōu)化和改進臨床實踐指南提供循證證據(jù),并為轉(zhuǎn)化醫(yī)學(xué)研究提出新方向,同時利用“互聯(lián)網(wǎng)+”技術(shù)實現(xiàn)系統(tǒng)智能化隨訪,監(jiān)測該院的高危人群病人和跟蹤疾病發(fā)展,提醒患者及時復(fù)診,更好的為患者服務(wù)。
該平臺建設(shè)還可促進區(qū)域臨床科研數(shù)據(jù)管理發(fā)展,通過建立多中心臨床科研數(shù)據(jù)中心,通過診療協(xié)同和信息共享,改善患者的診療結(jié)局;通過主動監(jiān)測和隨訪,可以改善預(yù)后;也可作為衛(wèi)生經(jīng)濟數(shù)據(jù)分析,為醫(yī)療政策制定提供咨詢。
下圖是作者參與的北京某大型三甲醫(yī)院的醫(yī)療科研平臺建設(shè)方案。
從底層的架構(gòu)來講以數(shù)據(jù)資源層為基礎(chǔ),針對院內(nèi)各個獨立的系統(tǒng),在資源層上方構(gòu)建數(shù)據(jù)治理與清洗層。
在數(shù)據(jù)平臺層,按照研究方向不同,按照臨床科研情況劃分為不同的子項數(shù)據(jù)組,通過數(shù)據(jù)洞察層融合多種算法以及機器學(xué)習(xí)等人工智能技術(shù)。應(yīng)用層主要集成各類產(chǎn)品,通常是根據(jù)醫(yī)院的需求來制定。
3. 臨床科研服務(wù)
臨床科研種類繁多,針對已有數(shù)據(jù)開展的研究屬于回顧性研究。臨床科研服務(wù)與平臺建設(shè)和數(shù)據(jù)治理密切相關(guān)。數(shù)據(jù)治理是所有工作的基礎(chǔ),平臺建設(shè)屬于臨床科研的軟件基礎(chǔ),基于上述的基礎(chǔ)工作協(xié)助醫(yī)生進行臨床研究也是一項盈利模式。
利用以往數(shù)據(jù)進行的真實世界研究是一項典型的回顧性研究工作。近年來變得非?;馃?,其對于藥企的經(jīng)濟利益甚至超過其科研價值。
還有很多與臨床有關(guān)的服務(wù)內(nèi)容,包括臨床入組篩查、單病種閉環(huán)管理、單病種的DRGs服務(wù)等內(nèi)容,將在與藥企服務(wù)中討論。
4. 影像輔助診斷與CDSS
醫(yī)療影像的人工智能產(chǎn)品,我想大家都不會陌生。醫(yī)療影像是醫(yī)療數(shù)據(jù)的重要組成部分,也是人工智能產(chǎn)品應(yīng)用中最成功的案例。
由于在影像數(shù)據(jù)數(shù)據(jù)的研究中,可以利用算力最大程度的降低對醫(yī)療知識的依賴程度,所以通過影像大量數(shù)據(jù)進行訓(xùn)練后,可以得到影像的輔助診斷能力。影像類AI產(chǎn)品最重要的是圖像數(shù)據(jù)的獲取,有標注的、高質(zhì)量的醫(yī)療影像成為各大公司能否勝出的關(guān)鍵資源。
圖像的AI處理技術(shù)方面,本文不再討論,都是非常成熟的技術(shù)方案,所有的瓶頸都在數(shù)據(jù)上。
影像診斷產(chǎn)品的商業(yè)模式方面并不成熟,當(dāng)前最大的落地買單場景是醫(yī)生的加速工具,由政府+醫(yī)院+企業(yè)的PPP模式。這些與各地興建的醫(yī)療影像中心的合作模式相似,在山東濟寧就存集中的閱片中心,其中AI輔助產(chǎn)品作為加速閱片的工具之一。
臨床輔助決策支持系統(tǒng)(CDSS)一般指凡能對臨床決策提供支持的計算機系統(tǒng),這個系統(tǒng)充分運用可供利用的、合適的計算機技術(shù),針對半結(jié)構(gòu)化或非結(jié)構(gòu)化醫(yī)學(xué)問題,通過人機交互方式改善和提高決策效率的系統(tǒng)。
CDSS是提升醫(yī)療質(zhì)量的重要手段,因此其根本目的是為了評估和提高醫(yī)療質(zhì)量,減少醫(yī)療差錯,從而控制醫(yī)療費用的支出。臨床醫(yī)生可以通過CDSS的幫助來深入分析病歷資料,從而做出最為恰當(dāng)?shù)脑\療決策。臨床醫(yī)生可以通過輸入信息來等待CDSS輸出“正確”的決策進行選擇,并通過簡單的輸出來指示決策。
需要說明的是CDSS是一個大類系統(tǒng)的總稱,在CDSS中大概可以分為以下幾個類別,智能問診、輔助診斷、輔助檢驗、治療方案推薦、診斷質(zhì)控、醫(yī)囑質(zhì)量控制、醫(yī)學(xué)知識庫、藥學(xué)知識庫、處方審查等。
從技術(shù)上來講,CDSS所使用的技術(shù)主要是以知識圖譜以及自然語言處理兩大類技術(shù)為主。對于臨床知識圖譜的構(gòu)建,已經(jīng)在業(yè)界討論過很多。
根據(jù)不用的數(shù)據(jù)源,將疾病、藥品、適應(yīng)癥、不良反應(yīng)等數(shù)據(jù)相互聯(lián)系,可以構(gòu)成一個相對完整的醫(yī)學(xué)數(shù)據(jù)支持系統(tǒng)?;跀?shù)據(jù)的積累與多元化發(fā)展,可以進行不同的AI能力訓(xùn)練,構(gòu)成問答機器人、處方審查等不同的產(chǎn)品。
從商業(yè)上講,CDSS的商業(yè)模式非常具有中國特色,在這期間涉及到幾個問題。
首先是醫(yī)療數(shù)據(jù)是否上云,對于這個問題每個地方每個醫(yī)院的看法都不盡相同。
第二個問題是中國醫(yī)療服務(wù)的總包模式。單純的CDSS系統(tǒng)很難售賣,通常只能夠包在大的醫(yī)療信息化項目作為一個模塊打包售賣,而總包商可能根本就不是一個軟件廠商,或可能是一個技術(shù)實施的運營商,每個企業(yè)都有自己的利益期望,所以項目的側(cè)重點也有所不同。所以,單純的CDSS還需要在整體信息化項目中實現(xiàn)變現(xiàn)。
總體來講,本文是系列文章的第一篇,對臨床大數(shù)據(jù)在醫(yī)院方面的工作做一個概括。
但是,臨床數(shù)據(jù)對醫(yī)院的服務(wù)不會獨立存在,必將與藥企、保險、政府疾控、社會健康團體等部門聯(lián)動構(gòu)成橫向項目,這樣能才能構(gòu)成有價值的商業(yè)模式。
下一篇將重點討論臨床大數(shù)據(jù)對藥企的應(yīng)用。
#專欄作家#
白白,人人都是產(chǎn)品經(jīng)理專欄作家。公眾號:白白說話(xiaob-talk)。醫(yī)藥行業(yè)資深產(chǎn)品專家,負責(zé)人工智能行業(yè)類產(chǎn)品綜合架構(gòu)與技術(shù)開發(fā)。在行業(yè)云產(chǎn)品架構(gòu),藥物設(shè)計AI輔助、醫(yī)療知識圖譜等領(lǐng)域有深入研究。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議
醫(yī)療大數(shù)據(jù)建設(shè)是有側(cè)重點的,本文作者主要還是偏醫(yī)藥領(lǐng)域去理解醫(yī)院大數(shù)據(jù),其實,從醫(yī)院、政府、科研機構(gòu)等不同機構(gòu)會有不同的視角,因此,對于數(shù)據(jù)處理的路徑也不盡相同。