浏览全部资源
扫码关注微信
1.湖南科技大学 数学与计算科学学院,湖南 湘潭 411201
2.中国中医科学院 中医临床基础医学研究所,北京 100700
3.河南中医药大学 第一附属医院 河南省中药临床应用、评价与转化工程研究中心,郑州 450000
4.中国检验检疫科学研究院,北京 100123
5.佛罗里达大学 公共卫生学院,佛罗里达 32601
6.波士顿大学 艺术与科学学院,波士顿 02215
谢飞彪,硕士,从事概率论与数理统计研究,E-mail:2423741815@qq.com
彭叶辉,博士,教授,从事工程问题的数学方法研究,E-mail:pengyehui@hnust.edu.cn
杨伟,博士,副研究员,从事中医药观察性医疗数据的统计学习及因果推断方法研究,E-mail:yangyxq@ruc.edu.cn
收稿日期:2022-09-13,
网络出版日期:2023-01-31,
纸质出版日期:2023-07-20
移动端阅览
谢飞彪,彭叶辉,杨伟等.真实世界医院集中监测中药不良反应的类不平衡高维预测及其风险因素分类识别[J].中国实验方剂学杂志,2023,29(14):114-122.
XIE Feibiao,PENG Yehui,YANG Wei,et al.Class-imbalance Prediction and High-dimensional Risk Factor Identification of Adverse Reactions of Traditional Chinese Medicine with Centralized Monitoring in Real-world Hospitals[J].Chinese Journal of Experimental Traditional Medical Formulae,2023,29(14):114-122.
谢飞彪,彭叶辉,杨伟等.真实世界医院集中监测中药不良反应的类不平衡高维预测及其风险因素分类识别[J].中国实验方剂学杂志,2023,29(14):114-122. DOI: 10.13422/j.cnki.syfjx.20230352.
XIE Feibiao,PENG Yehui,YANG Wei,et al.Class-imbalance Prediction and High-dimensional Risk Factor Identification of Adverse Reactions of Traditional Chinese Medicine with Centralized Monitoring in Real-world Hospitals[J].Chinese Journal of Experimental Traditional Medical Formulae,2023,29(14):114-122. DOI: 10.13422/j.cnki.syfjx.20230352.
目的
2
基于真实世界医院集中监测的中药上市后安全性数据,实现中药不良反应的类不平衡高维预测并分类识别影响药品不良反应(ADR)发生的风险因素。
方法
2
采用集成聚类重采样结合正则化Group Lasso回归,对ADR类不平衡的数据进行高维平衡处理,进而集成平衡数据实现ADR预测及其风险因素分类识别。
结果
2
对中药安全性监测数据的示例研究结果显示,建立的ADR预测模型在测试集上的预测正确率、ADR发生的预测灵敏度、ADR未发生的预测特异度及受试者工作特征曲线下面积(AUC)4个指标均达到0.8以上。同时,该方法从600个高维变量中筛选出40个影响ADR发生的保护因素或危险因素,并分类加权识别各类因素对ADR发生的影响,重要风险因素类别依次为既往史、给药方案、合并用药名称、病症情况、合并用药数量、个人资料。
结论
2
在ADR罕见且存在大量临床变量的真实世界数据中,本文实现了精准ADR类不平衡高维预测,并分类识别出关键风险因素及其所属类别的临床重要性,为临床合理用药及联合用药提供风险预警,也为中药上市后安全性再评价提供科学依据。
Objective
2
To achieve high-dimensional prediction of class imbalanced of adverse drug reaction(ADR) of traditional Chinese medicine(TCM) and to classify and identify risk factors affecting the occurrence of ADR based on the post-marketing safety data of TCM monitored centrally in real world hospitals.
Method
2
The ensemble clustering resampling combined with regularized Group Lasso regression was used to perform high-dimensional balancing of ADR class-imbalanced data, and then to integrate the balanced datasets to achieve ADR prediction and the risk factor identification by category.
Result
2
A practical example study of the proposed method on a monitoring data of TCM injection performed that the accuracy of the ADR prediction, the prediction sensitivity, the prediction specificity and the area under receiver operating characteristic curve(AUC) were all above 0.8 on the test set. Meanwhile, 40 risk factors affecting the occurrence of ADR were screened out from total 600 high-dimensional variables. And the effect of risk factors on the occurrence of ADR was identified by classification weighting. The important risk factors were classified as follows:past history, medication information, name of combined drugs, disease status, number of combined drugs and personal data.
Conclusion
2
In the real world data of rare ADR with a large amount of clinical variables, this paper realized accurate ADR prediction on high-dimensional and class imbalanced condition, and classified and identified the key risk factors and their clinical significance of categories, so as to provide risk early warning for clinical rational drug use and combined drug use, as well as scientific basis for reevaluation of safety of post-marketing TCM.
ALANAZI H O , ABDULLAH A H , QURESHI K N . A critical review for developing accurate and dynamic predictive models using machine learning methods in medicine and health care [J]. J Med Syst , 2017 , 41 ( 4 ): 69 .
王嘉麟 , 周莉 , 王忠 , 等 . 3004例乌灵胶囊上市后安全性医院集中监测研究 [J]. 医药导报 , 2022 , 41 ( 7 ): 990 - 996 .
张庆丽 , 王忠 , 荆志伟 , 等 . 清开灵注射液上市后安全性医院集中监测5800例 [J]. 中国药物警戒 , 2015 , 12 ( 7 ): 417 - 419,423 .
谢雁鸣 , 廖星 , 赵玉斌 , 等 . 中药上市后安全性医院集中监测技术规范(征求意见稿) [J]. 中国中药杂志 , 2013 , 38 ( 18 ): 2919 - 2924 .
吴东苑 , 杨伟 , 唐进法 , 等 . 不平衡数据处理方法对中药不良反应预测的应用研究 [J]. 世界科学技术—中医药现代化 , 2017 , 19 ( 9 ): 1455 - 1461 .
张天翼 . 非平衡数据集过采样算法研究 [D]. 武汉 : 武汉大学 , 2020 .
戴珂 . 不平衡分类的数据采样问题实证研究 [D]. 武汉 : 华中师范大学 , 2020 .
管维正 . 基于不平衡数据分类算法研究及其应用 [D]. 南京 : 南京邮电大学 , 2021 .
吴娅丽 , 吴东苑 , 杨伟 , 等 . 基于不平衡数据处理方法的丹红注射液上市后安全性监测和再评价研究 [J]. 中国医院用药评价与分析 , 2022 , 22 ( 10 ): 1233 - 1236,1243 .
YAO Q , CHANG B T , CHEN R , et al . Research advances in pharmacology,safety,and clinical applications of Yunnan Baiyao,a traditional Chinese medicine formula [J]. Front Pharmacol , 2021 , 12 : 773185 .
唐进法 , 徐涛 , 孟菲 , 等 . 合并用药对丹红注射液安全性的影响 [J]. 中国实验方剂学杂志 , 2013 , 19 ( 13 ): 294 - 297 .
吉萌萌 , 吴嘉瑞 , 武红莉 , 等 . 清开灵注射液不良反应影响因素的分析 [J]. 中成药 , 2021 , 43 ( 1 ): 277 - 284 .
王春慧 . 甘草锌颗粒联合红蓝光治疗青春期痤疮的临床效果 [J]. 中国当代医药 , 2022 , 29 ( 16 ): 73 - 75 .
刘欣欣 , 冯亚楠 , 王芳 . 清开灵注射液致过敏样反应风险因素的Logistics回归分析 [J]. 中国药物评价 , 2022 , 39 ( 1 ): 72 - 74 .
金贵诗 , 许彤 , 于葆墀 , 等 . 某院近6年中成药不良反应事件临床分析 [J]. 中医药临床杂志 , 2022 , 34 ( 5 ): 924 - 927 .
余萍 . 丹红注射液治疗ACS的系统评价及其ADR预测模型的验证研究 [D]. 成都 : 电子科技大学 , 2021 .
张宸玥 . 基于机器学习的某中药注射剂安全性和有效性统计分析 [D]. 天津 : 南开大学 , 2021 .
朱桂菊 . 基于惩罚高斯混合模型的高维数据聚类分析 [D]. 兰州 : 兰州大学 , 2016 .
NG A Y , JORDAN M I , WEISS Y . On spectral clustering:Analysis and an algorithm [C]// Association for Computing Machinery . Proceedings of the 14th international conference on neural information processing systems : Natural and synthetic.Cambridge:MIT Press , 2001 : 849 - 856 .
王丙参 , 魏艳华 , 张贝贝 . 基于多元数据的谱聚类算法改进与聚类个数确定 [J]. 统计与决策 , 2022 , 38 ( 12 ): 5 - 11 .
YUAN M , LIN Y . Model selection and estimation in regression with grouped variables [J]. J R Statist Soc B , 2006 , 68 : 49 - 67 .
兰济乐 , 阮叶萍 , 邱璐琦 . 基于BAS-GA-BP神经网络结合熵权法多指标优化风引汤提取工艺 [J]. 中国中药杂志 , 2020 , 45 ( 23 ): 5686 - 5693 .
李春晓 , 凌霄 , 李学林 , 等 . 中成药上市后安全性综合评价研究探讨 [J]. 中医杂志 , 2020 , 61 ( 12 ): 1049 - 1053 .
LI X L , TANG J F , LI W X , et al . Postmarketing safety surveillance and reevaluation of Danhong injection:Clinical study of 30888 cases [J]. Evid Based Complement Alternat Med , 2015 , 2015 : 610846 .
徐文彬 , 夏翃 , 郑卫英 , 等 . 多重支持向量机递归特征消除模型在癌症特征基因筛选中的应用 [J]. 国际生物医学工程杂志 , 2019 , 42 ( 1 ): 33 - 38 .
DARST B F , MALECKI K C , ENGELMAN C D . Using recursive feature elimination in random forest to account for correlated variables in high dimensional data [J]. BMC Genet , 2018 , 19 ( Suppl 1 ): 65 .
NEJATIAN S , PARVIN H , FARAJI E . Using sub-sampling and ensemble clustering techniques to improve performance of imbalanced classification [J]. Neurocomputing , 2018 , 276 : 55 - 66 .
郭玉萱 , 阮春阳 , 王晔 , 等 . 基于不平衡数据分类的中药肝毒性检测 [J]. 计算机应用与软件 , 2018 , 35 ( 8 ): 226 - 230 .
0
浏览量
37
下载量
3
CSCD
关联资源
相关文章
相关作者
相关机构