Целью является повышение точности распознавания именованных сущностей в медицинских текстах, обеспечение эффективного извлечения и использования медицинских знаний. С учетом особенностей текстов медицинских записей построена нейронная сеть Bert-Radical-Lexicon (BRL) для распознавания сущностей медицинских записей. Были выбраны 408 медицинских записей, связанных с гипертонией, из "Полной библиотеки медицинских записей знаменитых китайских врачей разных эпох" и создан набор данных из 1 672 записей методом ручной разметки. Затем данные случайным образом разделили на три подмножества: тренировочный (1 004 записи), тестовый (334 записи) и валидационный (334 записи). На этой основе построена модель BRL, объединяющая несколько особенностей медицинских текстов, а также ее вариации BRL-B, BRL-L, BRL-R и базовая модель Base. На этапе тренировки моделей использовали тренировочный набор, для снижения риска переобучения проводился постоянный мониторинг производительности моделей на валидационном наборе и сохранялась модель с лучшим результатом. В итоге производительность моделей оценивалась на тестовом наборе. По сравнению с другими моделями, BRL показала наилучшие результаты в задаче распознавания именованных сущностей медицинских записей: общая точность распознавания восьми категорий сущностей — заболеваний, симптомов, признаков языка, признаков пульса, синдромов, методов лечения, рецептов и китайских лекарств — составила 90,09%, полнота — 90,61%, F1-мера — 90,35%. По сравнению с базовой моделью Base, BRL улучшила общую F1 на 5,22%, при этом F1 по сущностям признаков пульса выросла на 6,92% — наибольшее повышение. Заключение: благодаря интеграции различных текстовых признаков медицинских записей на уровне эмбеддингов, нейронная сеть BRL обладает более высокой способностью распознавать именованные сущности, что позволяет точнее и надежнее извлекать клиническую информацию традиционной китайской медицины.
关键词
распознавание именованных сущностей;предварительно обученная модель;внедрение радикалов;внедрение связанных слов;медицинские записи знаменитых врачей