醫(yī)療衛(wèi)生信息基礎知識解析
作為醫(yī)療行業(yè)的產(chǎn)品經(jīng)理,需要對醫(yī)療相關知識有一定的了解。本文對醫(yī)療衛(wèi)生信息基礎知識進行了解析,希望對你有所幫助。
一、醫(yī)療衛(wèi)生信息標準認知
1. 基礎介紹
標準是通過標準化活動,按照規(guī)定的程序經(jīng)協(xié)商一致制定,為各種活動或其結果提供規(guī)則、指南或特性,供共同使用和重復使用的文件。
2. 標準類型
在標準體系模型中,按照標準的適用范圍或級別,可以分為國家標準、行業(yè)標準、地方標準、企業(yè)標準。其中在GB/T 20000.1-2014中對規(guī)范文件進行了相關說明,指規(guī)范用于規(guī)定產(chǎn)品、過程或服務應滿足的技術要求的文件,可以是標準的一個部分或標準以外的其他標準化文件。標準文件類型分為:國家標準、行業(yè)標準、地方標準、團體標準與規(guī)范性文件,具體介紹如下:
3.?標準分類
目前,國內(nèi)沒有醫(yī)療健康信息標準的分類規(guī)范,國外不同的標準組織對醫(yī)療健康信息標準的分類方式也不一樣。
在2009年原國家衛(wèi)生部衛(wèi)生信息標準化專業(yè)委員會提出信息標準體系架構圖上,將衛(wèi)生信息標準分類為:
基礎類標準、數(shù)據(jù)類標準、技術類標準、安全類標準、管理類標準,這也是目前國內(nèi)通常引用的衛(wèi)生信息標準分類,具體介紹如下:
- 基礎類標準:信息模型、醫(yī)學術語、標識、體系框架;
- 數(shù)據(jù)類標準:數(shù)據(jù)元與元數(shù)據(jù)、分類與編碼、數(shù)據(jù)集、共享文檔規(guī)范;
- 技術類標準:功能規(guī)范、技術規(guī)范、傳輸與交換;
- 安全類標準:信息安全、隱私保護;
- 管理類標準:建設指南、測試評價、運維管理、監(jiān)理驗收。
結合信息標準體系架構與實際標準的發(fā)布情況,目前元數(shù)據(jù)服務中信息標準文件的分為12類,具體介紹如下:
醫(yī)療衛(wèi)生信息標準分類圖
4. 標準性質(zhì)
《標準化法》第二條規(guī)定:國家標準分為強制性標準、推薦性標準,行業(yè)標準、地方標準是推薦性標準?!缎袠I(yè)標準管理辦法》第四條規(guī)定:行業(yè)標準分為強制性標準和推薦性標準,相關標識如下:國家標準:GB為強制性標準,GB/T為推薦性標準,GB/Z為指導性標準。衛(wèi)生行業(yè)標準:WS為強制性標準,WS/T為推薦性標準。
5. 標準狀態(tài)
標準狀態(tài)分為現(xiàn)行、廢止。
二、醫(yī)療衛(wèi)生信息標準之數(shù)據(jù)元
1. 數(shù)據(jù)元概念
數(shù)據(jù)元概念(data element concept DEC)是能以一個數(shù)據(jù)元的形式表示的概念,其描述與任何特定表示法無關。一個數(shù)據(jù)元概念由對象類和特性組成。如下圖左側:
2. 數(shù)據(jù)元組成
數(shù)據(jù)元是一組屬性規(guī)定定義、標識、表示和允許值的數(shù)據(jù)單元。數(shù)據(jù)單元是信息的基本單位,例如住院病案首頁中的病案號、姓名、入院診斷、主要診斷等都是基本的數(shù)據(jù)單元,為數(shù)據(jù)單元賦予屬性就稱為數(shù)據(jù)元。
數(shù)據(jù)元的目的是建立標準化的數(shù)據(jù)表達、采集、存儲和傳輸格式,以實現(xiàn)數(shù)據(jù)的正確表達和理解。
在一定語境下,構建一個語義正確、獨立且無歧義的特定概念語義的信息單元,同時可理解為數(shù)據(jù)的基本單元。數(shù)據(jù)元是衛(wèi)生信息的最基本的結構化(標準)單元,每一項醫(yī)療衛(wèi)生業(yè)務信息都可由若干數(shù)據(jù)元組成,例如一張標準格式的病案首頁就由100多個數(shù)據(jù)元組成。圍繞一定業(yè)務主題形成的數(shù)據(jù)元集合稱為數(shù)據(jù)集,數(shù)據(jù)元的實際應用通常是以基本數(shù)據(jù)集的形式實現(xiàn)的。
一個數(shù)據(jù)元由數(shù)據(jù)元概念和表示組成,其中表示描述數(shù)據(jù)的形式,包括值域、數(shù)據(jù)類型、表示類(可選的),必要時還包括計量單位。如下圖右側:
示例一:數(shù)據(jù)概念+值域;
【數(shù)據(jù)元】黃疸部位代碼表
【數(shù)據(jù)概念】黃疸部位,黃疸是對象詞,部位是特性詞。
【值域】代碼表是表示詞。
示例二:數(shù)據(jù)概念+計量單位;
【數(shù)據(jù)元】兒童體檢年齡(月)。
【數(shù)據(jù)概念】兒童體檢,兒童是對象詞,體檢是特性詞。
【值域】年齡(月)是表示詞。
3. 數(shù)據(jù)元基本模型
數(shù)據(jù)元的基本模型是由數(shù)據(jù)元概念和數(shù)據(jù)元兩部分組成。
4. 數(shù)據(jù)元概念與數(shù)據(jù)元關系
一個數(shù)據(jù)元由數(shù)據(jù)元概念和表示組成。
一個數(shù)元概念對應多個數(shù)據(jù)元。
5. 對象
對象類是可以對其界限和含義進行明確的標識,且特性和行為遵循相同規(guī)則的觀念、抽象概念或現(xiàn)實世界中事物的集合。
它是我們希望采集和存儲數(shù)據(jù)的事物。對象類是概念,在面向對象的模型中與類相對應,在實體-關系模型中與實體對應,
例如,患者、醫(yī)生、衛(wèi)生機構等。對象類可能是一般概念。當對象類所對應的對象集有兩個或多個元素時,就是一般概念?;颊?、醫(yī)生、衛(wèi)生機構等都是一般概念對象類也可以是個別概念。
當對象類對應的對象集僅有一個元素時,就是個別概念,例如“北京市醫(yī)療機構”就是個別概念。
6. 特性
特性是一個對象類的所有成員所共有的特征。它用來區(qū)別和描述對象,是對象類的特征,但不一定是本質(zhì)特征,它們構成對象類的內(nèi)涵。特性也是概念,對應于面向對象模型或實體-關系模型中的屬性。
例如身高、體重、血壓、脈搏、血型等。特性也可是一般概念或個別概念。作為個別概念的例子有:病床總數(shù)或醫(yī)療收入。
衛(wèi)生健康信息數(shù)據(jù)元是衛(wèi)生這一特定領域的數(shù)據(jù)元,它的概念和結構遵循通用數(shù)據(jù)元的概念和結構,但具有自身的特點。醫(yī)藥衛(wèi)生領域包括基礎醫(yī)學、臨床醫(yī)學、公共衛(wèi)生、中醫(yī)藥學等多個專業(yè),其數(shù)據(jù)元的表現(xiàn)形式復雜,例如數(shù)字人體、醫(yī)學影像、基因圖譜、中醫(yī)經(jīng)絡等,除具有通用數(shù)據(jù)元的屬性外,還具有其鮮明的領域特殊性。
7. 數(shù)據(jù)類型與表示符
8. 數(shù)據(jù)元值的表示格式中字符含義描述規(guī)則
9. 數(shù)據(jù)元值的表示格式中字符長度描述規(guī)則
應用示例:
示例1:S字符型
AN10 固定為10個字符(相當于5個漢字)長度的字符。
AN..10 可變長度,最大為10個字符長度的字符。
AN4..10 可變長度,最小為4個最大為10個字符長度的字符。
AN..20X3可變長度,最多3行每行最大長度為20個字符長度的字符。
示例2:N數(shù)字型
N4固定長度為4位的數(shù)字。
N..4最大長度為4位的數(shù)字。
N6,2最大長度為6位的十進制小數(shù)格式(包括小數(shù)點),小數(shù)點后保留2位數(shù)字。
示例3:T日期時間型
T8采YYYYMMDD格式(8位定長)顯示年月日。
T15采用YYYYMMDDThhmmss格式(15位定長)表示日時分秒。時分秒之前加大寫字母“T。
如2010年1月5日8時10分9秒為20100105T081009。
資料參考:
WS/T 303-2023 衛(wèi)生健康信息數(shù)據(jù)元標準化規(guī)則
WS/T 363.2-2023 衛(wèi)生健康信息數(shù)據(jù)元目錄 第2部分:標識
三、醫(yī)療健康信息標準之值域
1. 值域基本模型
值域的基本模型由概念域和值域兩部分組成,一個概念域對應多個值域。
2. 值域
值域(vale domain,VD)是允許值的集合。一個允許值是某個值和該值的值含義的組合。該關聯(lián)含義稱為值含義。值域是一個或多個數(shù)據(jù)元有效值的集合,用于在信息系統(tǒng)和數(shù)據(jù)交換中確認數(shù)據(jù)的有效性。它也是描述一個數(shù)據(jù)元的元數(shù)據(jù)的必要構成部分。特別是,值域是數(shù)據(jù)元所表示的數(shù)據(jù)內(nèi)容、形式和結構的指南。
值域有兩種(非互斥的)子類:
可枚舉值域:由允許值列表規(guī)定的值域;
一個可枚舉值域是包含了它的所有值及值含義的一個列表,例如:患者血型類別代碼。
不可枚舉值域:由描述規(guī)定的值域。
一個不可枚舉值域是由一個描述來規(guī)定。不可枚舉值域的描述須準確描述屬于該值域的允許值。例如,“傳染病死亡率”數(shù)據(jù)元的值域是大于等于0且小于等于1的實數(shù)。
描述數(shù)據(jù)有時需要計量單位。例如描述血壓的值域記錄時,為了準確理解值含義,需要使用計量單位moHg或kPa: 年齡值域記錄的計量單位可使用年、月、周、日:血糖值域記錄的計量單位可以是mg/d或mmol/L。所以,計量單位與值域關聯(lián)。
3. 概念域
概念的外延構成了概念域,一個概念域是一個值含義集合。一個概念域的內(nèi)涵是它的值含義。概念域也有兩種(非互斥的)子類:
一可枚舉概念域:由值含義列表規(guī)定的概念域:一不可枚舉概念域:由描述規(guī)定的概念域。可枚舉概念域的值含義可以明確地列舉。該類型概念域對應于可枚舉類型的值域,例如:
不可枚舉概念域的值含義由“不可枚舉概念域描述規(guī)則”來表述。該規(guī)則描述了不可枚舉值域中允許值的含義。這種類型的概念域對應于不可枚舉類型的值域,例如:
如果一個計量單位的任何量可以轉化為另一種計量單位下等同的量,則這些計量單位彼此之間是等價的。所有等價的計量單位被認為具有相同的維。例如,長度計量單位(米,厘米等)具有相同的維,年齡計量單位(年、月、周、日) 具有相同的維。所以,維與概念域關聯(lián)。
四、醫(yī)療衛(wèi)生信息標準之數(shù)據(jù)集
在衛(wèi)生領域信息化的快速發(fā)展過程中,積累了大量來自于不同系統(tǒng)、不同機構的異構數(shù)據(jù)資源。伴隨著對這些數(shù)據(jù)資源進行整合與交流的需求不斷增長,數(shù)據(jù)集這一數(shù)據(jù)組織方式得到了應用和推廣。
1. 數(shù)據(jù)集
具有一定主題,可以標識并被計算機處理的數(shù)據(jù)集合,旨在為相關業(yè)務數(shù)據(jù)的登記提供一套術語規(guī)范、定義明確、語義語境無歧義的標準,數(shù)據(jù)元是衛(wèi)生信息的最基本的結構化(標準)單元,每一項醫(yī)療衛(wèi)生業(yè)務信息都可由若干數(shù)據(jù)元組成,例如一張標準格式的病案首頁就由100多個數(shù)據(jù)元組成。圍繞一定業(yè)務主題形成的數(shù)據(jù)元集合稱為數(shù)據(jù)集,數(shù)據(jù)元的實際應用通常是以基本數(shù)據(jù)集的形式實現(xiàn)的。
主題:圍繞著某一項特定任務或活動進行數(shù)據(jù)規(guī)劃和設計時,對其內(nèi)容進行的系統(tǒng)歸納和描述。通常數(shù)據(jù)集主題應具有劃分性和層級性。劃分性是指主題間可通過不同的命名,將相同屬性的主題歸并在一起形成相同的類,將不同屬性的主題區(qū)分開形成不同的類;層級性是指主題可被劃分成若干子主題或子子主題。
可標識:指能通過規(guī)范的名稱和標識符等對數(shù)據(jù)集進行標記,以供識別。標識與名稱的取值需要通過具體的命名或編碼規(guī)則來規(guī)范。
能被計算機處理:指可以通過計算機技術(軟硬件、網(wǎng)絡),對數(shù)據(jù)集內(nèi)容進行發(fā)布、交換、管理和算機系統(tǒng)中以數(shù)值、日期、字符、圖像等不同的類型表達。
數(shù)據(jù)集合:指由按照數(shù)據(jù)元所形成的若干數(shù)據(jù)記錄所構成的集合。例如,病案首頁數(shù)據(jù)集由主索引、基本信息、診斷信息、入出院信息、手術信息、費用信息等不同數(shù)據(jù)組成。
2. 衛(wèi)生健康信息數(shù)據(jù)集
衛(wèi)生健康信息數(shù)據(jù)集是在衛(wèi)生健康領域,為滿足政府衛(wèi)生決策、業(yè)務處理、科學研究、信息發(fā)布與績效評價等需求,按照數(shù)據(jù)集概念設計、歸納、整合的主題信息集合。衛(wèi)生健康領域的數(shù)據(jù)集主要可以
歸納為三個方面:
- 信息發(fā)布類統(tǒng)計數(shù)據(jù)集:如中國衛(wèi)生健康統(tǒng)計年鑒中衛(wèi)生機構設置及規(guī)模、衛(wèi)生人員資源的地區(qū)分布、衛(wèi)生經(jīng)費的籌集及分配等數(shù)據(jù)集,各類衛(wèi)生機構的統(tǒng)計月報、年報,以及滿足某一專項統(tǒng)計需求通過統(tǒng)計收集、歸納、整理、報告形成的數(shù)據(jù)集。例如:衛(wèi)生統(tǒng)計指標。
- 業(yè)務系統(tǒng)建設類的基本數(shù)據(jù)集:包括醫(yī)療服務、公共衛(wèi)生、藥品供應、醫(yī)療保障、衛(wèi)生管理等領域為了滿足業(yè)務信息系統(tǒng)規(guī)范化建設和領域內(nèi)部以及領域間數(shù)據(jù)交換與共享需求,設計歸納的各個子系統(tǒng)(或者功能模塊)所包含的最小數(shù)據(jù)元素的集合。如:兒童出生登記、個人健康檔案、住院病人入出轉、居民死亡登記報告電子病歷基本數(shù)據(jù)集 、疾病管理基本數(shù)據(jù)集等數(shù)據(jù)集。
- 為滿足特定目的收集整理制作的數(shù)據(jù)集:包括通過調(diào)查、觀察、監(jiān)測、檢測、試驗、實驗等方式獲取的滿足科學研究、業(yè)務咨詢或衛(wèi)生服務決策等需求的數(shù)據(jù)集。如:近年來國家投入建設的國家人口健康科學數(shù)據(jù)集、衛(wèi)生服務調(diào)查數(shù)據(jù)集、疾病及危險因素調(diào)查等內(nèi)容的數(shù)據(jù)集。
五、醫(yī)療衛(wèi)生信息標準之指標集、統(tǒng)計指標、分類方案
1. 指標集
指標集有一組統(tǒng)計指標組成,目的是衡量特定部門或地區(qū)提供、改善服務的情況。
例如,《全國醫(yī)院上報數(shù)據(jù)統(tǒng)計分析指標集 (試行)》目的是為加強醫(yī)院上報數(shù)據(jù)的分析和應用;
《病案管理質(zhì)量控制指標(2021年版)》、腫瘤專業(yè)質(zhì)量控制指標(2023年版)等,目的是為進一步加強醫(yī)療質(zhì)量管理,規(guī)范臨床診療行為,促進醫(yī)療服務的標準化、同質(zhì)化。
2. 衛(wèi)生統(tǒng)計指標
衛(wèi)生統(tǒng)計指標(indicators of health statistics ,IHS)是反映一定時期、一定地區(qū)居民健康狀況、健康影響因素、公共衛(wèi)生服務、醫(yī)療服務、藥品與材料供應保障、醫(yī)療保障、衛(wèi)生資源和計劃生育的統(tǒng)計指標。通過對衛(wèi)生統(tǒng)計指標值的分析,可以:
- 了解人群的健康狀況、衛(wèi)生系統(tǒng)績效及健康影響因素的現(xiàn)狀;
- 可以監(jiān)測人群健康整體目標的實現(xiàn)進程,為衛(wèi)生健康政策制定和資源分配等提供支持;
- 為公共衛(wèi)生政策制定和實施有效的疾病防控措施提供依據(jù);
- 對衛(wèi)生干預效果進行評估。
3. 分類方案
分類方案是根據(jù)對象具有的共同特征將對象進行排列或劃分成組的描述性信息。分類方案是一般是一種官方術語系統(tǒng),得到國家或國際機構的認可和認可,用于對數(shù)據(jù)進行分類。
如疾病分類與代碼、手術/操作分類與代碼、職業(yè)分類與代碼等。分類方案項是分類方案的內(nèi)容項,它可以是分類或本體中的一個節(jié)點,敘詞表中的一個術語等。
值域是信息層面的數(shù)據(jù),分類方案業(yè)務層面的數(shù)據(jù)。通常情況下,分類方案為值域提供相關業(yè)務參考,是值域的一個組成部分。但某種情況下,分類方案可以直接被數(shù)據(jù)元所使用。如分類方案“疾病分類與代碼(ICD-10)“等分類系統(tǒng)得到行業(yè)的一致認同與使用。如數(shù)據(jù)元“疾病診斷代碼”可以直接連接到分類方案“疾病分類與代碼”。
六、醫(yī)療衛(wèi)生信息標準之元數(shù)據(jù)
1. 數(shù)據(jù)元的元數(shù)據(jù)總體模型
數(shù)據(jù)元的元數(shù)據(jù)總體模型由概念層和表示層兩個部分組成。概念層包括數(shù)據(jù)元概念類和概念域類。這兩種類都表示概念。表示層包括數(shù)據(jù)元類和值域類。這兩種類都表示數(shù)據(jù)值的容器。
數(shù)據(jù)元的元數(shù)據(jù)總體模型
可以給出4個類(數(shù)據(jù)元、多個數(shù)據(jù)元、值域、數(shù)據(jù)元概念)的若干基本事實:
- 一個數(shù)據(jù)元是一個數(shù)據(jù)元概念和一個值域的結合體;
- 多個數(shù)據(jù)元可以共享相同數(shù)據(jù)元概念,這意味著一個數(shù)據(jù)元概念可以用多個不同方式表示。例如,患者入院時間是一個數(shù)據(jù)元概念,它可以有多個表示方法,例如用YYYYMMDD表示患者入院的年月日,如果需表示小時和分,則用YYYYMMDDhhmm表示?!盎颊咝詣e代碼-英文全稱”、“患者性別代碼-1位字母代碼”共享同一個數(shù)據(jù)元概念患者性別。
- 多個數(shù)據(jù)元可以共享相同的表示,這意味著一個值域可以被不同數(shù)據(jù)元重復利用。例如,“住院病人結算費用-元(人民幣)”和“門急診就診費用-元(人民幣)”數(shù)據(jù)元共享相同的值域“費用-元(人民幣)”。
- 值域不是必然與一個數(shù)據(jù)元關聯(lián),可以單獨管理:
- 不同值域所有允許值所對應的值含義都相同時,這些值域在概念上是等價的,因此,對應相同的概念域。例如,前述關于性別的值域:性別代碼-1位數(shù)字、性別代碼-英文全稱及性別代碼-1位字母代碼的允許值所對應的值含義相同,均表示“男性、女性、未知的性別、未說明的性別”。所以這些值域對應同一個概念域“性別”。
- 不同值域部分允許值所對應的值含義相同時,這些值域在概念上是相關的,因此,在包含有其各自概念域的概念體系中共享一個由共同的值含義構成的概念域。例如,性別代碼-符號的允許值是“♂和♀”,分別表示“男性和女性”。無其他符號表示“未知的性別”和“未說明的性別”,那么性別代碼-符號與性別代碼-1位數(shù)字、性別代碼-英文全稱及性別代碼-1位字母代碼值域在概念上相關,共享由共同的值含義“男性和女性”構成的概念域“性別”。
- 一個數(shù)據(jù)元概念僅與一個概念域相關,因此共享相同數(shù)據(jù)元概念的所有數(shù)據(jù)元共享概念上相關的表示。例如,“新生兒體重-N5,2(千克)”和“新生兒體重-N4(克)”是兩個不同的數(shù)據(jù)元,共享一個數(shù)據(jù)元概念新生兒體重。兩個數(shù)據(jù)元的表示在概念上是相關的,共享概念域“體重”。千克和克都是重量的計量單位,稱具有相同的維度。因此計量單位與值域相關,維度與概念域相關。
- 許多數(shù)據(jù)元概念可以共享相同的概念域。例如,患者體重和新生兒體重是兩個不同的數(shù)據(jù)元概念,共享一個概念域“體重”。
2. 元數(shù)據(jù)概念
元數(shù)據(jù)(Metadata)是描述其它數(shù)據(jù)的數(shù)據(jù)(data about other data),或者說是用于提供某種資源的有關信息的結構數(shù)據(jù)。元數(shù)據(jù)是描述信息資源或數(shù)據(jù)等對象的數(shù)據(jù),其使用目的在于:識別資源;評價資源;追蹤資源在使用過程中的變化;實現(xiàn)簡單高效地管理大量網(wǎng)絡化數(shù)據(jù);實現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對使用資源的有效管理。對元數(shù)據(jù)不了解的可看這邊書《元數(shù)據(jù):用數(shù)據(jù)的數(shù)據(jù)管理你的世界》[美]杰弗里·波梅蘭茨。
3. 元數(shù)據(jù)管理模型
元數(shù)據(jù)管理是領域內(nèi)數(shù)據(jù)類標準的數(shù)字化呈現(xiàn),可提升醫(yī)療數(shù)據(jù)的準確性、一致性和互操作性。這對醫(yī)療健康數(shù)據(jù),數(shù)據(jù)的治理至關重要。所有在設計醫(yī)療健康相關產(chǎn)品的數(shù)據(jù)就要有這個思維,也要這也去實施。
本文由 @牙周炎先生 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!