Gemeinsame Beziehungsextraktion von Fallberichten bekannter Ärzte basierend auf dem CasRel-Modell unter Verwendung von Datenaugmentation und Entitätsabbildung

LI Yuxin ,  

XIANG Xinghua ,  

YANG Hang ,  

LIU Dasheng ,  

WANG Jiaheng ,  

ZHAO Zhiwei ,  

HAN Jiaxu ,  

WU Mengjie ,  

CHE Qianzi ,  

YANG Wei ,  

摘要

Ziel ist es, das Problem der unstrukturierten klassischen chinesischen Darstellung von Fallberichten bekannter Ärzte der traditionellen chinesischen Medizin, der verschachtelten Entitätsbeziehungen und des Mangels annotierter Daten zu lösen, indem ein gemeinsamer Extraktionsrahmen für Beziehungen entwickelt wird, der Datenaugmentation und Entitätsabbildung kombiniert, um technische Unterstützung für den Aufbau eines Wissensgraphs der chinesischen Medizin und die Entdeckung klinischer Muster zu bieten. Die Methode umfasst den Aufbau einer annotierten Struktur für Entitäten und deren Beziehungen in den Texten der Fallberichte bekannter Ärzte, die Verwendung von Datenaugmentationsstrategien, die Integration mehrerer klassischer Werke zur Erweiterung des Datensatzes für Beziehungsextraktion, die Entwicklung eines an die Semantik der chinesischen Medizin angepassten gemeinsamen Extraktionsmodells auf Basis von kaskadierten binären Markierungen (CasRel), die Einführung einer vortrainierten bidirektionalen Kodierungsschicht (BERT) für klassische Texte zur Verbesserung der semantischen Darstellung des Altchinesischen sowie die Verwendung eines Kopf-Entität - Beziehung - Schwanz-Entität-Mapping-Mechanismus, um das Problem verschachtelter Entitäten und überlappender Beziehungen gleichzeitig zu lösen. Die Ergebnisse zeigen, dass das gemeinsame CasRel-Modell mit Datenaugmentation und Entitätsabbildung signifikante Leistungsverbesserungen gegenüber dem auf Bert-Radical-Lexicon basierenden Pipeline-Modell BRL-BiLSTM-Attention aufweist, mit einer kombinierten Präzision, einem Rückruf und einem F1-Wert von 65,73 %, 64,03 % bzw. 64,87 % für insgesamt 12 Beziehungsklassen wie Symptombeziehungen, Zungendiagnosebeziehungen, Ursachenbeziehungen und Rezeptbeziehungen, was gegenüber dem Pipeline-Modell BRL-BiLSTM-Attention eine Steigerung von 14,26 %, 7,98 % bzw. 11,21 % darstellt. Die Verbesserung war bei den Zungendiagnosebeziehungen besonders ausgeprägt (F1-Wert von 69,32 %, Steigerung um 22,68 %), während die Rezeptbeziehungen die beste Leistung zeigten (F1-Wert von 70,10 %, Steigerung um 9,93 %). Fazit: Die Studie verbessert durch Datenaugmentation und gemeinsames Dekodieren erheblich die semantischen Implikationen und komplexen Abhängigkeiten zwischen Entitäten in Texten der chinesischen Medizin und bietet einen wiederverwendbaren technischen Rahmen für die strukturierte Analyse von TCM-Fallberichten. Der erstellte Wissensgraph unterstützt die klinische Diagnostik, Rezeptauswahl und Arzneimittelkompatibilitätsoptimierung und bietet zudem eine methodologische Referenz für Forschung im Bereich der künstlichen Intelligenz in der chinesischen Medizin.

关键词

Datenaugmentation;Fallberichte bekannter Ärzte;Beziehungsextraktion;gemeinsame Methode;gemeinsames Beziehungsextraktionsmodell basierend auf kaskadierten binären Markierungen (CasRel);Wissensgraph

阅读全文