Erkennung berühmter medizinischer Fälle basierend auf dem BRL-Neuronalen Netzwerkmodell

YANG Hang ,  

PENG Yehui ,  

YANG Wei ,  

WANG Jiaheng ,  

ZHAO Zhiwei ,  

XU Wenyuan ,  

LI Yuxin ,  

ZHU Yan ,  

LIU Lihong ,  

摘要

Ziel ist die Verbesserung der Erkennungsgenauigkeit benannter Entitäten in medizinischen Falltexten, um eine effektive Gewinnung und Nutzung medizinischen Wissens zu ermöglichen. Basierend auf den Besonderheiten der medizinischen Falltexte wurde ein Bert-Radical-Lexicon (BRL) neuronales Netzwerkmodell zur Erkennung medizinischer Fall-Entitäten entwickelt. Aus der "Vollständigen Datenbank historischer chinesischer berühmter Ärzte-Fälle" wurden 408 Fälle im Zusammenhang mit Bluthochdruck ausgewählt und durch manuelle Annotation ein Datensatz von 1.672 Fällen erstellt. Anschließend wurden diese Daten zufällig in drei Teilmengen aufgeteilt: Trainingsdatensatz (1.004 Fälle), Testdatensatz (334 Fälle) und Validierungsdatensatz (334 Fälle). Aufbauend darauf wurde ein BRL-Modell entwickelt, das verschiedene Merkmale medizinischer Texte integriert, sowie seine Varianten BRL-B, BRL-L, BRL-R und ein Basismodell Base. Während der Modelltrainingsphase wurden die Modelle mit dem Trainingsdatensatz trainiert, um das Überanpassungsrisiko zu minimieren, wurde die Leistung der Modelle auf dem Validierungsdatensatz kontinuierlich überwacht und das leistungsstärkste Modell gespeichert. Schließlich wurde die Leistung dieser Modelle auf dem Testdatensatz bewertet. Im Vergleich zu anderen Modellen erzielte das BRL-Modell die beste Leistung bei der Erkennung benannter Entitäten in medizinischen Falltexten mit einer Gesamtgenauigkeit von 90,09 %, einer Abrufrate von 90,61 % und einer harmonischen Mittelung (F1) von 90,35 % für acht Entitätstypen: Krankheit, Symptome, Zungenbild, Pulsbild, Syndrome, Behandlungsmethoden, Rezepturen und chinesische Arzneimittel. Im Vergleich zum Basismodell Base verbesserte das BRL-Modell die Gesamt-F1 der Entitätserkennung um 5,22 %, wobei der größte Zuwachs bei der Pulsbild-Entität mit 6,92 % lag. Fazit: Durch die Integration mehrerer medizinischer Textmerkmale auf der Embedding-Ebene verfügt das BRL-Netzwerkmodell über eine stärkere Fähigkeit zur Erkennung benannter Entitäten, wodurch genauere und zuverlässigere klinische Informationen der traditionellen chinesischen Medizin extrahiert werden können.

关键词

benannte Entitätserkennung;vortrainiertes Modell;Radikal-Embedding;Assoziationswort-Embedding;berühmte medizinische Fälle

阅读全文