在中医药守正创新的发展过程中,中医诊疗经验传承问题较为突出。不同于现代医学具有统一明确的诊疗规则,传统中医诊疗理论之间多存在交叉,每种辨证纲领的使用范围多存在区分界限模糊、应用场景重叠度高、辨证内容交叉等问题,不同中医学派及不同中医师的诊疗规则也往往存在交叉和重叠,导致难以储备标准化的高质量中医大数据。这导致传统的基于诊疗规则的中医专家系统所开具的处方普遍存在准确性不足的问题,给中医诊断和治疗的规范化及中医智能化研究带来很大困难。因此,迫切需要新技术辅助展示和传承规范化的中医诊疗过程,推动中医药事业走向现代化、智能化、数字化[1]。人工智能技术的发展,为解决上述问题提供了一种新的参考范式。知识图谱是人工智能的重要研究领域,本质是构建和存储不同类型数据的关联性,用图网络来表示知识及其属性和关联,可在一定程度上表征复杂的知识结构和关联,尤其适宜中医领域的知识特点,如尹丹等[2]基于知识图谱,模拟了“方证对应”的诊疗过程。目前知识图谱相关研究多基于网络爬虫技术,批量格式化爬取大量的医疗相关数据,并基于此数据构建知识图谱[3-5]。这类知识图谱普遍存在着数据一致性差,无效数据较多,数据缺失严重[6]等问题,生成的知识图谱冗余度[7]较大,对于医疗尤其是临床的实际意义和应用价值有限。中医药临床指南与共识推进了中医药标准化和规范化进程。中华中医药学会心血管病分会发布的《冠心病稳定型心绞痛中医诊疗指南》是基于大量具有独特疗效的中医诊治冠心病稳定型心绞痛临床诊疗经验制定的,能够规范中医诊疗过程和促进提升中医诊疗的整体水平[8],在冠心病稳定型心绞痛的诊疗中具有规范性和权威性。以此为模式构建中医冠心病诊疗的知识图谱,对于冠心病中医诊疗的标准化和规范化及经验的传承具有重要意义。本研究基于知识图谱技术,以《冠心病稳定型心绞痛中医诊疗指南》为模式构建知识图谱,通过编程实现以临床表现的输入调用知识图谱,可视化展示冠心病稳定型心绞痛的中医规范化诊疗过程,以期为直观地展现中医诊疗过程提供了一种可参考的范式。1 知识图谱构建方法1.1 数据和知识来源本研究所用到的数据和知识来源于中华中医药学会心血管病分会发布的《冠心病稳定型心绞痛中医诊疗指南》[8]。1.2 软件工具本研究的知识图谱使用Neo4j (www.neo4j.com)社区版实现,Neo4j是一个开源的基于java的高性能的NoSQL的图数据库,不同于传统数据库中使用的关系模型[9],其将结构化的数据存储在灵活的图网络中而不是表中,更适合表征具有复杂关联的数据及之间的关系,从而在各个行业中得到广泛应用。知识图谱构建和调用过程中使用Python的py2neo(https://github.com/py2neo-org/py2neo)来实现。Py2neo是一个Python库和工具包,用于从Python应用程序和命令行中调用或操作Neo4j。其中Node和Relationship这2个对象是py2neo的关键,他们都扩展了Subgraph类,提供了一套全面的图结构数据类型和操作支持,从而在如何调用和操作图数据方面提供了显著的灵活性。1.3 知识图谱概念知识图谱是使用图结构的数据模型或拓扑结构来集成和表示数据的知识库。知识图谱通常用于存储实体(对象、事件、情况或抽象概念)相互关联的描述,同时还对所用术语背后的语义进行编码[10]。自语义网发展以来,知识图谱往往与关联的开放数据项目相关联,侧重于概念与实体之间联系的存储和表示。利用知识图谱能够关联核心医学概念及医疗知识,从海量临床医案中对经验和知识进行提炼整理、录入标注和体系构建,以解决优质医疗资源短缺和医疗需求持续增加的矛盾。知识图谱的基本构建流程包括本体构建、实体配置、知识抽取和知识融合等。1.4 知识图谱设计1.4.1 流程设计本研究首先根据诊疗指南中的知识和信息,按照知识图谱构建的方法,从抽象的层面分别定义实体、关系和属性,然后将指南中本研究所需要的结构化数据、半结构化数据和非结构化数据,分别进行整理和提取,形成本研究所需要的数据(包含节点、属性与关系)。在此基础上,笔者进行实体消歧、实体对齐等知识融合过程。随后本研究通过Python的py2neo库调用Neo4j,将知识数据导入Neo4j中构建知识图谱。通过Python编程将程序输入的症状列表识别后转化为Neo4j专用的Cypher查询语句,实现关键词检索、中医临床辅助决策和知识图谱可视化,即实现基于中医诊疗指南的知识图谱的构建过程。研究流程设计见图1。10.13422/j.cnki.syfjx.20230312.F001图1基于诊疗指南的知识图谱构建过程Fig.1Process of building a knowledge graph based on treatment guidelines1.4.2 本体层构建本体是概念的集合和框架,类似于面相对象程序设计中的类,是知识图谱的架构,也是知识图谱结构化的基础逻辑,将本体整理成相应的结构表,有助于对知识图谱的理解。根据诊疗指南中的本体结构特征,本研究针对诊疗指南进行本体的提取,首先提取“临床表现” “证候要素” “证候类型” “治法” “方剂(方药)” “中成药”等,其中“方剂”和“中成药”都可抽象为“治疗手段”,所以将“治疗手段”作为一级本体,而“方剂”和“中成药”作为二级本体。然后根据提取的本体,提取实例,分别为“胸闷痛” “气虚” “气滞血瘀”和“冠心2号方”[11]等,最后抽取本体之间的关系,即“临床表现”提炼“证候要素”,“证候要素”组成“证候类型”,“证候类型”对应“治法”等。据此本文设计本体的结构见表1。10.13422/j.cnki.syfjx.20230312.T001表1基于诊疗指南的本体结构Table 1Ontological structure table based on diagnosis and treatment guidelines一级本体二级本体实例临床表现胸闷痛,心悸,乏力,口苦等证候要素气虚,气滞,血瘀,阳虚等证候类型气滞血瘀,气虚血瘀等治法“活血化瘀,通络止痛” “行气活血,通络止痛”等治疗手段方剂冠心2号方,八珍汤加减等中成药血府逐瘀胶囊、麝香保心丸、丹蒌片等1.4.3 实体层构建实体是本体、实例和关系的整和。比如临床表现“乏力”是本体中的一个概念,“乏力”也是一个具体的临床表现个体,称为实例,其有对应的属性如“分值”和对应的“证候要素”-“气虚”,“乏力”及本体“症状”和相关的属性,称为“实体”。本研究使用知识图谱常用的三元组数据模型来描述诊疗指南中的知识和知识之间的关系。三元组关系类似于“主谓宾”的关系,表征主语和宾语之间的关联特征。诊疗指南中的数据字段有“临床表现” “证候要素” “证候类型” “治法” “方剂” “中成药” “中药”等。他们之间的关联关系分别为从“临床表现”提炼“证候要素”,由“证候要素”组成“证候类型”,“证候类型”对应相应的“治法”,依据“治法”选择“方剂”,依据“治法”选择“中成药”,“方剂”包含“中药”。基于上述抽取的本体之间的关系,可设计三元组结构表见表2。10.13422/j.cnki.syfjx.20230312.T002表2冠心病稳定型心绞痛诊疗指南三元组结构表Table 2Triadic structure of guidelines for management of stable angina pectoris in coronary artery disease实体1关系实体2临床表现提炼证候要素证候要素组成证候类型证候类型对应治法治法选择方剂方剂治法选择中成药中成药方剂包含中药1.5 知识存储与图谱构建将从中医诊疗指南中提取的“临床表现” “证候要素” “证候类型” “方剂”和“中药”等实体和之间的“关系”信息都整理为结构化的数据。使用Python的py2neo库调用Neo4j,将结构化的数据导入到Neo4j数据库中。1.6 知识图谱查询与可视化将程序的症状输入列表中的症状词语,映射到整理好的“临床表现”词表中的词语,形成临床表现的列表,使用py2neo调用Neo4j,将临床表现的列表作为Neo4j的检索项进行知识图谱的检索,从而实现“输入症状(临床表现)-证候要素-证候类型-治法-方剂-中药”的知识图谱显示,即可视化展示从症状到中药的处方开具过程。2 结果2.1 基于诊疗指南的冠心病知识图谱使用py2neo将诊疗指南中提取整理好的结构化数据导入到Neo4j数据库中,并进而完成基于中医诊疗指南的冠心病知识图谱构建。构建的知识图谱可通过py2neo或用Cypher语句进行查询和调用。因所构建的知识图谱节点较多,并且节点之间的关联复杂,难以在一张图上做清晰地显示,而诊疗指南中,“气虚”证候要素组合为证候类型的组合可能性较多,为了便于展示尽可能多的组合方式和节点关联,以“气虚”这一个证候要素相关的知识图谱为例(包含临床表现、证候要素、证候类型、治法、中成药、方剂和中药等节点及之间的关联),对所构建的知识图谱的节点和关联进行阐述。图2为“临床表现”与“证候要素”知识图谱的示意图。其中蓝色节点代表“临床表现”实体、紫色节点代表“证候要素”实体,从“临床表现”实体指向“证候要素”实体的有向箭头代表二者之间的关联,即“临床表现”中提炼出该“证候要素”,如“神疲” “乏力”等临床表现,能够相应地提炼出证候要素“气虚”。通过所构建的知识图谱,可输入相应的临床表现,即可自动提炼组合出对应的证候要素。10.13422/j.cnki.syfjx.20230312.F002图2“临床表现”与“证候要素”的知识图谱示意Fig.2Schematic diagram of knowledge graph on "clinical manifestations" and "syndrome elements"图3为“证候要素” “证候类型”和“治法”的知识图谱示意图。其中紫色节点代表“证候要素”实体,橘黄色节点代表“证候类型”实体,灰色节点代表“治法”实体。从“证候要素”实体指向“证候类型”实体的有向箭头代表二者之间的关联,即“证候要素”组成该“证候类型”。从“证候类型”实体指向“治法”实体的有向箭头代表二者之间的关联,即“证候类型”对应的治法为该“治法”。“气虚”和“阴虚”这2个证候要素,共同组成“气阴两虚证”这一证候类型,而“气阴两虚证”对应的治法为“益气养阴,活血通络”。通过所构建的知识图谱,输入相应的证候要素列表,即可自动组合出对应的证候类型。10.13422/j.cnki.syfjx.20230312.F003图3“证候要素” “证候类型”和“治法”的知识图谱示意Fig.3Schematic diagram of knowledge graph on "Syndrome Elements", "Syndrome Types" and "Treatment Methods"图4为“证候类型” “治法” “中成药”和“方剂”的知识图谱示意图。其中橘黄色节点代表“证候类型”实体,灰色节点代表“治法”实体,深绿色节点代表“中成药”实体,粉色节点代表“方剂”实体。从“证候类型”实体指向“治法”实体的有向箭头代表二者之间的关联,即“证候类型”对应的治法为该“治法”。从“治法”实体指向8个“中成药”实体的有向箭头代表二者之间的关联,即该“治法”被选择后,推荐选择的中成药为8个“中成药”实体所对应的中成药。此外,从“治法”实体还有一个指向“方剂”实体的有向箭头,代表二者之间的关联为该“治法”被选择后,推荐选择的中药方剂为该“方剂”实体所对应的中药方剂。“气虚血瘀证”所对应的治法为“益气活血,补虚止痛”,该治法所对应的治疗手段有2种,第1种是中成药,第2种是中药方剂。该治法推荐选择的中成药有“通心络胶囊” “通心舒胶囊” “血栓心脉宁片”等8种,推荐的中药方剂为“八珍汤加味”。从诊疗指南可见,“八珍汤加味”的组成药味有“党参、白术、茯苓、甘草、当归、生地黄、赤芍、川芎、桃仁、红花、丹参”,根据《中华人民共和国药典》[12]和《中药学》[13]的药物功效分类和《方剂学》的内容,除了八珍汤的8味药组合使用具有气血双补的功效外,川芎、桃仁、红花和丹参为活血化瘀药具有活血化瘀的功效。王阶教授根据多年临床研究指出,补气强心为治疗冠心病的第一要义[14],选用八珍汤加味能够气血同补兼具活血通络,补气通络之法为王阶教授治疗冠心病的宝贵经验[15]。通过所构建的知识图谱,输入相应的证候类型,即可自动组合出对应的治法,推荐的中成药和中药方剂。10.13422/j.cnki.syfjx.20230312.F004图4“证候类型” “治法” “中成药”和“方剂”的知识图谱示意Fig.4Schematic diagram of knowledge graph on "Syndrome Types", "Treatment Methods", "Proprietary Chinese Medicine" and "Prescription"图5为“证候类型” “治法” “中成药” “方剂”和“中药”的知识图谱示意图。其中橘黄色节点代表“证候类型”实体,灰色节点代表“治法”实体,粉色节点代表“方剂”实体,绿色节点代表“中药”实体。联结“证候类型”实体和“治法”实体之间的边表示“证候类型”对应该“治法”,联结“治法”实体和“方剂”实体之间的边表示该“治法”推荐选择该“方剂”,联结“方剂”实体和“中药”实体之间的边表示该“方剂”由该“中药”组成。如图5所示,“气虚血瘀证”所对应的治法为“益气活血,补虚止痛”,该治法所对应的治疗手段中的中药方剂推荐“八珍汤加味”。方剂“八珍汤加味”的组成中药有“党参” “白术” “茯苓” “甘草” “当归” “红花” “赤芍”等11种。通过所构建的知识图谱,输入相应的证候类型,即可自动组合出对应的治法,推荐中药方剂,及显示中药方剂所用的中药药味。10.13422/j.cnki.syfjx.20230312.F005图5“证候类型” “治法” “中成药” “方剂”和“中药”的知识图谱示意Fig.5Schematic diagram of knowledge graph on "Syndrome Types", "Treatment Methods", "Proprietary Chinese Medicine", "Prescription" and "Herb"上述知识图谱的几个模块,即为依据中医诊疗指南进行辨证论治的过程。通过症状(临床表现)的组合文本,提炼出相应的证候要素,在证候要素的基础上组合出相应的证候类型,根据相应的证候类型即可推断相应的治法,确立治法后,即可推荐相应的中成药和中药方剂,并进一步可视化展示中药方剂所用的中药列表。这个过程即模拟了中医辨证论治冠心病稳定型心绞痛的过程,是诊疗指南的可视化和网络化的展示。下面将使用知识图谱的查询检索功能进行展示。2.2 知识图谱检索功能示例构建的基于中医诊疗指南的知识图谱,支持基于图数据库的查询功能。以诊疗指南中第一个证候对应的第一个临床表现(胸固定性痛)为例来说明。如查询“临床表现”为“胸固定性痛”,则展示如图6所示的知识图谱。蓝色节点为查询的症状“胸固定性痛”,其对应的“证候要素”为“血瘀”,“血瘀”能够组成“气虚血瘀证” “气滞血瘀证” “心血瘀阻证” “痰瘀互结证”4个证型。4个证型又分别对应治法和方剂及中成药等。从而实现基于中医诊疗指南和专家经验的知识图谱可视化展示过程,为直观地展现中医诊疗过程提供一种新的方式。10.13422/j.cnki.syfjx.20230312.F006图6“临床表现”为“胸固定性痛”的知识图谱示例Fig.6Example of a knowledge map with "clinical presentation" as "fixed chest pain"3 讨论人工智能近年来在深度学习领域取得了重大进展,所构建的模型训练数据集动辄所需存储空间为太字节(TB)量级,所构建的模型的训练参数则动辄上亿级别,如OpenAI最新开发的ChatGPT[16] (https://openai.com/blog/chatgpt/)。这些人工智能模型在预测速度和准确性等方面都有显著突破,但已无法支持对模型参数或模型特征等内容的可解释性[17-18],尤其是训练数据集显著不足,无法支持此类模型训练所需的情况下,具有较强可解释性的知识图谱逐渐也成为关注的热点。冠心病因其发病率和危害已经成为全球重大公共卫生问题[19],给公共医疗带来很大负担[20]。临床指南作为综合当前最佳研究证据和指导临床实践的文件,是医疗水平稳定的重要保证。《冠心病稳定型心绞痛中医诊疗指南》是由中华中医药学会心血管病分会组织相关专家编撰的。编撰过程参照国际最新的临床指南的制订方法,并在相关法律法规和技术文件指导的框架下,通过辨证论治的数据和关系突出体现了传统中医辨证论治的思想。编撰过程深度结合循证医学原理,在古今文献的回顾分析、临床流行病学调查、中成药系统综述、名老中医经验总结、专家咨询等系统研究工作的基础上,对冠心病稳定型心绞痛的基本证候特点、辨证用药规律等进行了系统地梳理、归纳和总结。《冠心病稳定型心绞痛中医诊疗指南》为中医、中西医结合临床医师规范化开展冠心病的防治工作提供权威指导。本研究结合目前中医诊疗经验传承中存在的问题,针对冠心病稳定型心绞痛这个单一病种,提出了一种基于凝结了中医行业专家经验和循证证据所形成的诊疗指南,来构建知识图谱的方法。与一些相关的研究不同的是,该方法没有选择使用基于网络爬虫的大数据来构建知识图谱,而是选择使用规范化、规则化程度较高的中医诊疗指南中的医学知识和术语构建知识图谱并可视化的展示和描述中医诊治冠心病稳定型心绞痛的过程。而知识图谱通过描述实体及其关系来表示语义,知识图谱可以使用本体作为模式层,通过这样的设计,基于知识图谱设计的模型将不仅支持显示知识相关的查询,同时也支持与隐式知识相关的逻辑推理。该方法能够从患者的输入症状出发,经过知识图谱的查询和计算,得到患者可能的证候类型及应该选择的治法和方剂。这是一种构建中医临床辅助决策系统的有益尝试。本研究将冠心病稳定型心绞痛中医诊疗指南中所规定的分条罗列的知识模式,通过知识图谱可视化的方式实现,这有助于将凝结了专家经验和循证证据所形成的医学模式和诊疗过程直观的展示给中医医师,系统精确地展示指南中的医学模式和医疗知识之间的相互关联和模式之间先前隐含的潜在联系,有助于中医、中西医结合诊疗经验的规范化传承和共享,为构建中医临床辅助决策系统提供研究基础。此外,该研究方法作为一种技术框架,不局限于这一项诊疗指南的知识图谱构建和研究,可以作为基础框架推广到其他诊疗指南,为诊疗指南的推广和指南中的标准化诊疗规范的普及提供参考范式。本研究也存在一些不足之处,一是因为诊疗指南是医学知识的高度凝练,能够抽取并用来构建知识图谱的知识的数量较为有限,后续将进一步扩充相关的高质量的知识来源,不断对本研究所构建的知识图谱进行丰富和扩展。二是因为目前诊疗指南中的部分数据和关联从知识图谱构建的角度而言存在一定的交叉重叠,为了解决这个问题,笔者在数据收集、本体构建和知识融合等环节,需要临床医师根据知识图谱开发的要求,完成交叉知识的拆解和融合才能够更合理地构建知识图谱。三是目前本研究构建的知识图谱中使用的输入症状词语必须与临床指南中用语一致才能识别,还未能支持输入症状列表进行中医临床辅助决策,下一步应在此研究基础上实现自然语言处理功能,训练与指南数据和知识图谱适配的自然语言处理模型,实现从自然语言中自动抽取知识图谱能够识别的用语,并基于知识图谱实现症状列表输入功能。四是目前还未能支持证候的兼夹性和患者更加个体的信息,下一步将开发设置支持多证候显示的知识图谱,以支持兼夹证候的显示,并且从本体层设计纳入更多的体现患者个体差异的数据结构,将临床中患者的个体差异体现在知识图谱展示的诊疗过程中从而将模型整合成为功能更贴近真实临床的中医临床辅助决策系统。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览