上一篇
|
下一篇
データ拡張と実体マッピングCasRelモデルを組み合わせた名家医案の共同関係抽出
LI Yuxin
,
XIANG Xinghua
,
YANG Hang
,
LIU Dasheng
,
WANG Jiaheng
,
ZHAO Zhiwei
,
HAN Jiaxu
,
WU Mengjie
,
CHE Qianzi
,
YANG Wei
,
DOI:
10.13422/j.cnki.syfjx.20251866
摘要
目的は、中医学の名家医案における非構造化された文言表現、実体関係の入れ子構造およびアノテーションデータの不足という問題に対し、データ拡張と実体マッピングを組み合わせた共同関係抽出のフレームワークを構築し、中医学の診療知識グラフの構築および臨床規則の掘り起こしに技術的支援を提供することである。方法は、名家医案テキストの実体およびその関係の注釈構造を構築し、データ拡張戦略を採用して複数の古典文献を統合し医案関係抽出データセットを拡充し、中医語義に適応したカスケード二値ラベリングに基づく関係共同抽出モデル(CasRel)を設計し、中医学の古典テキストに事前学習された双方向エンコーダ表現法(BERT)エンコーディング層を導入して古漢語の意味表現を強化し、頭実体-関係-尾実体のマッピング機構を採用して実体の入れ子および関係の重複問題を同期的に解決した。結果は、流水線に基づくBert-Radical-Lexicon(BRL)-双方向長短期記憶ネットワーク-注意機構(BiLSTM-Attention)モデルと比較して、データ拡張と実体マッピングを組み合わせた関係共同抽出CasRelモデルは、病症関係、舌診関係、因証関係、方証関係など計12種類の関係において総合的な精度65.73%、再現率64.03%、F1値64.87%を示し、流水線のBRL-BiLSTM-Attentionモデルの総合精度、再現率、F1値をそれぞれ14.26%、7.98%、11.21%向上させた。特に舌診関係(F1値69.32%、22.68%向上)が顕著に改善され、方証関係が最良の性能(F1値70.10%、9.93%向上)を示した。結論として、本研究はデータ拡張と共同デコーディングを通じて中医学テキストの意味潜在性および実体間の複雑な依存関係の問題を著しく改善し、中医学医案の構造化発掘のための再利用可能な技術フレームワークを提供し、構築された知識グラフは臨床の弁証論治および処方・用薬の最適化を支援し、中医人工知能研究に方法論的な参考を提供する。
关键词
データ拡張;名家医案;関係抽出;共同方法;カスケード二値ラベリングに基づく関係共同抽出(CasRel)モデル;知識グラフ
阅读全文