公務員期刊網 論文中心 正文

    冠心病中醫證候數據挖掘研究

    前言:想要寫出一篇引人入勝的文章?我們特意為您整理了冠心病中醫證候數據挖掘研究范文,希望能給你帶來靈感和參考,敬請閱讀。

    冠心病中醫證候數據挖掘研究

    [摘要]綜述因子分析、聚類分析、貝葉斯網絡、多因子降維、決策樹、人工神經網絡、支持向量機、文獻挖掘、系統評價9種數據挖掘算法及方法相關內容,認識各自優勢與不足。概括9種方法在冠心病中醫證候挖掘中的應用,闡釋冠心病中醫證候分布特征及演變規律,為冠心病中醫辨證論治提供客觀化依據。參考文獻30篇。

    [關鍵詞]冠心病;證候;因子分析;聚類分析;貝葉斯網絡;多因子降維;決策樹;人工神經網絡;支持向量機;文獻挖掘;系統評價

    1因子分析

    因子分析是簡化、分析高維數據的一種統計方法,最早由英國心理學家C.E.斯皮爾曼提出。作為一種非線性多元統計分析方法,通過尋找支配多個原始指標相關關系的有限個潛在變量,對原始指標之間的相關性或協方差關系進行闡釋。簡化變量信息,挖掘隱性變量,來讓數據“自己說話”[3]。近年來,因子分析法在系統綜合評價中顯示出優勢,分析全面,可排除各指標之間的相關重疊,能有效提取目標因子,對各因子權重具有較好的客觀評定。張琳婷[4]利用因子分析法研究冠心病患者發病早期證候要素及證候特征,從頻率>20%的88個指標變量中提取出29個發病早期指標變量,并對冠心病中醫癥狀、體征進行探索性因子分析,提取出綜合因子、胸悶因子、嘔吐因子等12個公因子,為早期冠心病中醫證候要素與證候特征奠定數據理論基礎。吳旸等[5]研究348例行冠脈造影病例信息,應用因子分析對四診信息降維處理,得出虛證是冠心病主要證型,并獲取痰濕、血瘀、脾腎氣虛、氣陰兩虛等16個公因子,為冠心病發病提前預警提供依據。因子分析法在冠心病證候綜合系統評價中彰顯優勢,分析全面,但局限在于僅適用于綜合性評價,且易受數據樣本量及成分的影響。

    2聚類分析

    聚類分析也稱點群分析、集群分析,是理想的多變量統計技術,主要有分層聚類法和迭聚類分析法兩種。同時聚類分析將搜集到的對象信息借助于數理統計方法進行歸類,是將現象分類的一種統計學方法,分指標聚類(R型聚類)和樣品聚類(Q型聚類)兩種。在中醫證候研究中,聚類分析可對疾病的一般特征、分類、分級、證型分布及癥狀組成等進行統計學分析,客觀的將信息結果進行分類,近年來被廣泛應用。王階等[6]對25l例穩定型心絞痛患者進行證候分類,采用證素組合規律研究,將癥狀總結成心氣虧虛、脾氣虛弱、氣陰兩虛、痰瘀互阻4類,發現氣虛+血瘀、血瘀+痰濁、心氣虛+痰濁+血瘀為其主要證素組合形式,特別指出運用聚類分析和對應分析方法對證候要素組合規律研究較佳。張明雪等[7]通過聚類統計發現,冠心病在發生發展中證候呈現一定規律,發展早期以氣滯心胸、氣陰兩虛證為主;發作期以氣滯痰阻、寒凝心脈、心陽不振、瘀血陽微證為主;緩解期主要以肝脾失調、心腎陽虛、心肺氣虛證為主;而恢復期則以心氣虛、氣陰兩虛、陽虛氣滯證占據多數。鄒演梅等[8]也通過聚類分析將冠心病心絞痛中醫證候歸納成6類,即氣虛血瘀、氣陰兩虛、陰虛痰瘀、寒凝血瘀、痰濁內阻、氣滯痰熱,并總結出基于特征加權的聚類分析得出的冠心病心絞痛證候分型與臨床符合度較高的結論,在疾病證候分型研究領域中值得進一步推廣。聚類分析模型簡便、直觀,適用于冠心病中醫證型、證素的分類及比較。局限在于適用樣本量小,難于有效處理大樣本數據。

    3貝葉斯網絡

    貝葉斯網絡又稱信念網絡、因果網絡,是一種基于概率推理的圖形化網絡[9]。通過將概率推理和網絡結構相結合,用概率測度的權重表達變量間的相互關系。貝葉斯網絡能將不完整、不確定的信息進行學習和推理,以條件概率加以表達。通過辨識中醫診斷證候,對中醫診斷學的發展及應用有重要意義[10]。在處理中醫臨床癥狀分類方面,準確度可達98%以上[11],近年來被應用于冠心病中醫證候研究中。吳榮等[12]利用貝葉斯網絡挖掘名老中醫診療辨證信息,建立起冠心病名老中醫診療數據庫,總結出陽虛血瘀、血瘀痰阻等冠心病心絞痛常見證候,提取到冠心病心絞痛8個證候要素,其中血瘀占到92.17%,成為冠心病心絞痛的主要病理因素,并提出氣虛痰濁血瘀證是冠心病的最常見證候。徐璡等[13]收集835例冠心病患者中醫四診信息,運用貝葉斯網絡建立融合模型進行分類識別研究,得出血瘀、痰濁、心氣虛、心陰虛、心陽虛5個證型識別率,其中陽虛、血瘀識別率最高,為冠心病中醫證候分類診斷提供依據,證實了貝葉斯網絡是中醫證候客觀化、規范化研究中的有效方法,并顯示出其良好的應用前景。貝葉斯網絡具有量化評價的優勢,評價結果更為科學、客觀。龐大的數據體系也加大了其分析處理難度,在解決復雜問題上有所局限。

    4多因子降維

    多因子降維是近年來流行的一種新的統計分析方法。其中,“因子”作為交互作用研究變量[14],“維”特指多因子組合個數。目前多因子降維主要被應用于衛生統計學、遺傳學以及流行病學中。近年來在心血管疾病及惡性腫瘤等復雜疾病中得到廣泛應用。李四維[15]運用多因子降維探究冠心病穩定期患者中醫證候演變規律,指出冠心病穩定期的主要證侯包括血瘀、痰濁、氣虛、毒證,強調毒證、氣虛證為發生心血管事件的證候特點。宋慶橋[16]應用MDR方法構建相關數據模型,分析冠心病穩定型心絞痛臨床表現與證候要素、常見證候之間以及與相關血清蛋白表達的關系,發現痰、瘀為冠心病穩定型心絞痛的主要證候要素,而氣虛血瘀證、痰瘀互結證構成其主要證候,同時總結出相關血清蛋白表達規律:血清tPAI-1、sVCAM-1、sICAM-1蛋白在痰、瘀、氣虛、陰虛證素中表達升高,在氣虛血瘀、痰瘀互結等證候中表達升高,在氣虛血瘀痰阻證、氣陰兩虛痰阻證等復合證候中也有表達升高趨勢。多因子降維能夠彌補Logistic回歸在處理高階交互作用時的局限,在分析連續變量情況下優勢明顯。但面對低維度數據,多因子降維發現交互作用的能力也會降低。

    5決策樹

    決策樹作為一種數據挖掘算法,主要用來解決分類問題[17]。通過將問題搜索空間分成若干,以樹形結構的每個結點引出與之相關問題的可能答案,并通過葉結點呈現出對問題解決方案的預測。模型直觀,描述簡單,分類速度快,效率高,結果易于理解,對輸入數據的高維屬性和分類標識彈性及穩定性較佳,可很好地擴展到中小數據樣本中,能夠同時處理數據型和常規型兩種屬性,易于推出相應的邏輯表達式,簡便快捷,特異性高,其中抽象交替決策樹(ADTree)特異性為95.99%,目前在中醫證候挖掘中得以廣泛應用。史琦等[18]用決策樹方法對89個臨床指標進行分析,提取出不穩定型心絞痛痰瘀互阻證的規律特征,并形成識別模式,檢驗正確率為79.81%。通過將總膽紅素、高敏C反應蛋白、谷氨酰轉肽酶、空腹血糖、血小板和P-R間期6個指標納入決策樹模型,發現決策樹模型模式識別清晰、直觀,能夠自動歸納識別規律,對證型-理化指標對應模式的數據挖掘具有一定優勢,在處理冠心病大樣本數據中發揮重要作用,但目前數據類型的非連續性是其局限。

    6人工神經網絡

    人工神經網絡具有較強的魯棒性、容錯性及自組織性,以神經元為基本運算單位,模擬生物神經網絡結構與功能,完成對信息的加工與處理,近年來在冠心病中醫證候數據挖掘中得以推廣應用,以徑向基神經網絡(RBFN)方法最佳,正確率可達91.49%。孫貴香等[19]以矩陣實驗室(MATLAB)為平臺建立冠心病中醫證候BP神經網絡模型,運用回顧性及前瞻性檢驗方法對該模型性能進行客觀檢測,對496例回顧性檢驗和132例前瞻性檢驗的診斷準確率分別為90.5%、91.36%,體現出中醫整體觀念與辨證論治的內涵,較好地驗證了人工神經網絡在冠心病中醫證候規律挖掘中的重要意義,表明人工神經網絡對證候內在規則挖掘性能良好,顯示其在中醫證候規范化研究方面的應用前景廣闊。神經網絡對復雜數據能夠達到精準預測,在處理類別及連續變量樣本方面具備一定優勢,但其對高維變量的處理仍有所局限。

    7支持向量機

    支持向量機作為一種新興統計分類方法,以達到結構風險最小化為基本原則,通過將非線性數據賦予高維特征性,構造出最優分類超平面,可以有效彌補傳統算法中維數災難及過擬合等的缺陷,目前主要用于小樣本、非線性及高維模式識別的問題解決[20]。研究指出,在冠心病的中醫證候數據挖掘方法中,支持向量機是其最優選擇[21],而在支持向量機中,Libsvm方法最佳。王階等[22]運用支持向量機方法從115例冠心病典型醫案中提取出血瘀、痰濁、氣虛等8個主要證素,通過量化診斷,闡釋相應證素應證組合規律,證素組合形以2、3證組合最為常見,3證組合占到47.83%,2證組合占到41.74%,且以虛實夾雜為主,占72.17%。許文杰等[23]記錄528例冠心病患者中醫脈圖,運用支持向量機方法應用脈象信號非動力學特征,結合望診、問診信息,建立冠心病證候診斷模型,發現問診、望診參數聯合脈象信號時域特征參數建立起的證候模型,平均識別準確率70.17%,脈象信號RQA特征參數代替其時域特征參數參與建立起的證候模型,平均識別準確率可達82.83%。從而揭示脈象信號非動力學特征參與冠心病證候診斷模型建立可以有效提高模型平均識別準確率的規律。支持向量機在小樣本冠心病中醫證候研究中發揮其優勢,但對于大樣本或復雜數據模型的處理有一定局限。

    8文獻挖掘

    文獻挖掘又稱文獻分析,研究對象主要是非結構化數據,是從文本中發現潛在、隱藏、歸納性知識的一種方法[24]。具體步驟主要包括對文獻的搜集、鑒別、整理、分析,形成對事實科學的認識,近年來被廣泛應用于冠心病的中醫臨床研究。田松等[25]基于現代文獻對3300篇相關文獻進行綜合收集與整理,最終篩選出58篇合格文獻,總計7680例病例,通過對近10年關于冠心病辨證與證素證型文獻檢索,挖掘出28種冠心病中醫證型,血瘀、痰濁、氣虛為其主要證素分布規律。證素組合形式以單證素和兩證素為主,分別占70.75%、26.07%,揭示冠心病主要證候要素為血瘀、痰濁,主要證型以單證素為主,而心血瘀阻型、痰濁阻滯型、心氣不足型分布最為廣泛。李艷娟[26]通過中國生物醫學文獻光盤數據庫分級檢索1994至2013年近10年國內核心期刊文獻,共檢出文獻489篇,篩選出合格文獻25篇,病例3090例,建立計量診斷表,其敏感度、特異性、準確性均得到了較好的驗證,統計分析冠心病中醫證候,發現心血瘀阻證、心氣虧虛證、痰阻心脈證為冠心病心絞痛主要證型,揭示將中醫病、證規范化與計量化的可行性,為冠心病心絞痛臨床診斷創新辨證分型模式。毛靜遠等[27]在參閱近40年308篇文獻的基礎上研究出氣虛、陰虛是冠心病虛證常見證素,血瘀、痰濁、氣滯為冠心病實證常見證素,且血瘀、痰濁等實證證候要素比重呈現出逐年增長態勢。文獻挖掘適用于大樣本、信息復雜的研究對象,在冠心病中醫證候研究工作中突顯優勢。由于樣本信息龐大且缺乏明確統一標準,因而應用文獻挖掘法難免存在較大誤差,在準確度上存在一定局限。

    9系統評價

    系統評價和Meta分析是循證醫學中的重要研究方法。系統評價從某一具體臨床問題入手,系統、全面地搜集現有已發表或未發表的臨床研究數據,以嚴謹為評價原則[28],篩選出合格文獻,通過定性、定量合成,綜述出可靠結論,同時可隨臨床研究的新近成果及時進行更新。系統評價具體步驟主要有:確立標題→收集文獻→選擇文獻→評價文獻→收集數據→分析數據→解釋結果→更新系統評價。陳小光[29]基于系統評價方法探討冠心病中醫痰證與客觀化指標的關系,通過計算機檢索文獻、篩選文獻、納入客觀化指標的步驟,對冠脈狹窄程度、血脂、C反應蛋白、同型半胱氨酸4個指標進行定性、定量分析(Meta分析),結果得出中重度冠脈狹窄以痰證、血瘀證為主要證型,三酰甘油對痰證區分其他證型特異性較強,C反應蛋白對痰證辨識度較高,同型半胱氨酸對于冠心病痰證的判斷也有較好的識別價值。系統評價方法在處理不同研究結果方面有明顯優勢,并具有一定的創新性。局限在于研究納入樣本量有限,無法完成對全部相關數據的提取,理論上容易發生偏性,且對于臨床終點定義往往不明確。

    10問題及展望

    目前,冠心病中醫證候數據挖掘工作仍處于探索階段,開展過程中也存在一些問題。數據挖掘方法各有利弊,在選取上可優勢互補,揚長避短。但目前方式單一,單一方法之間關聯度不夠,在方式選擇上仍存在缺陷,且不同方法挖掘出的結論難以有效統一,結果預測性不夠精確,缺乏系統、客觀的評價。冠心病中醫證候信息大規模數據挖掘及建立冠心病中醫證候模型技術在國內尚未成熟,從醫案中挖掘出的部分證候規律與實際臨床間存在一定偏差,數據挖掘力度不夠,僅局限于表面層次,提取出的有效信息價值不高。且中醫醫案文獻量大繁雜,加之中醫證候自身復雜、模糊以及證候信息的多重共線特點,增加了冠心病中醫證候數據挖掘工作的開展難度,仍有待進一步縱深探索。進一步加大數據挖掘研究力度并充分利用各方面優勢[30],是有效推動中醫藥防治冠心病的重要步驟。實踐證明,運用數據挖掘技術可以對冠心病中醫證候信息的收集、分析以及規律總結提供方法支持。建立冠心病中醫臨床信息采集平臺,聯合多元分析方法,完善系統評價體系,實現信息的有效輸出與歸納,是對冠心病中醫證候進行數據挖掘的四個重要環節。數據挖掘方法形式多樣,其性能各有優勢,做到正確認識不同數據挖掘方法的性能特征,對于準確選擇恰當的數據挖掘方法以及明確不同方法所表達的含義具有重要意義。不同挖掘方法在證候信息分析時呈現不同的特點,綜合多種多元統計方法聯合使用,優勢互補,能夠提高分析結果的準確性與可靠性。隨著數據挖掘技術的發展,分析方法將會更加多元,現代醫學相關指標與冠心病中醫證候相結合的微觀辨證將成為未來研究的焦點。冠心病中醫證候研究不斷深入,為中醫診斷冠心病奠定理論基礎,通過加強中西醫不同角度對于冠心病的認識,擬為冠心病中西醫結合診療提供新思路。

    [參考文獻]

    [1]王小龍,亓詠梅.基于數據挖掘探討甘草在冠心病心絞痛中的配伍應用[J].中醫藥導報,2018,24(23):74-76.

    [2]李琳,胡志希,凌智.數據挖掘在冠心病中醫證治研究中的應用[J].遼寧中醫雜志,2014,41(12):2727-2729.

    [3]李輝.城鎮居民生活水平綜合評價的因子分析研究[D].昆明:云南大學,2011.

    [4]張琳婷.基于因子分析的冠心病發病早期中醫證候研究[D].沈陽:遼寧中醫藥大學,2013.

    [5]吳旸,王軒,崔杰,等.348例冠心病患者中醫證候特點因子分析[J].中華中醫藥學刊,2009,27(2):392-394.

    作者:鐘霞 焦華琛 李運倫 趙天恩 張磊 李焱 單位:山東中醫藥大學中醫學院 山東中醫藥大學附屬醫院心病科 泰山醫學院

    主站蜘蛛池模板: 成人黄色电影在线观看| 成人免费无遮挡无码黄漫视频| 四虎永久成人免费影院域名| 成人看免费一级毛片| 成人精品一区二区三区中文字幕| 69成人免费视频无码专区| 成人毛片免费视频| 成人无码WWW免费视频| 国产麻豆成人传媒免费观看| 成人a一级试看片| 国产成人无码一二三区视频| 中文国产成人精品久久一区| 日本成人免费在线| 国产成人刺激视频在线观看| 中文国产成人精品久久久| 欧洲成人爽视频在线观看| 国产成人亚洲综合欧美一部| 欧美成人香蕉网在线观看| 成人亚洲欧美日韩中文字幕| 国产成人精品cao在线| 羞羞漫画在线成人漫画阅读免费| 成人免费大片免费观看网站| 亚洲国产成人久久一区www| 国产成人综合在线视频| 国产成人av一区二区三区不卡 | 黄色成人免费网站| 国产成人精品第一区二区| 免费看污成人午夜网站| 成人永久免费福利视频网站| 亚洲欧美成人网| 国产成人无码精品久久二区三区| 欧美成人高清ww| 桃花阁成人网在线观看| 欧美成人在线影院| 窝窝视频成人影院午夜在线| 久久成人国产精品| 亚洲伊人成人网| 2345成人高清毛片| 久久久久99精品成人片| 亚洲国产成人精品女人久久久| 国产成人性色视频|