Chain Thinking-driven Large Language Model for Traditional Chinese Medicine Syndrome Element Differentiation of Coronary Heart Disease

WANG Jie ,  

SONG Yijie ,  

HUI Xiaoshan ,  

ZHANG Zhenpeng ,  

ZHANG Xianchao ,  

摘要

El objetivo de este estudio es construir un modelo de lenguaje liviano para la detección de elementos de síndrome de la enfermedad coronaria basado en el pensamiento de diagnóstico en función de los elementos de síndrome de la enfermedad coronaria. Para resolver los problemas alta dependencia de datos, la falta de interpretabilidad y la adaptabilidad de base de los métodos de diagnóstico tradicionales, desarrollamos el gran modelo de lenguaje de la enfermedad coronaria en medicina china (CHD-SEDD LLM) con interpretación clínica y precisión de predicción. Utilizamos el modelo DeepSeek-r1: 32b para el modelo de lenguaje de diagnóstico utilizando los criterios de diagnóstico de los elementos del dolor torácico de la enfermedad coronaria para diseñar un marco de razonamiento en cadena de tres niveles, análisis de síntomas-evaluación de elementos de síndrome-combinación de elementos de síndrome, y codificamos las reglas de diagnóstico como modelos estructurados Prompt. Seleccionamos 6 541 casos de casos reales de enfermedades coronarias para verificar y evaluar la eficacia del CHD-SEDD LLM, en comparación con el modelo sin Prompt, utilizando la clasificación de síndromes Macro-F1, la precisión de los elementos de síndrome y el tiempo de razonamiento por caso como indicadores de evaluación. El CHD-SEDD LLM muestra una capacidad clara de razonamiento jerárquico en la verificación de casos típicos, extrayendo con precisión elementos de síndrome principales como deficiencia de Qi y estasis sanguínea, y combinándolos en síndrome de deficiencia de Qi y estasis sanguínea, síndrome de frío y entumecimiento del Yang, etc., el proceso de razonamiento es conforme a la lógica de diagnóstico en medicina china. El experimento de control muestra que el valor Macro-F1 de la clasificación de síndromes del modelo alcanza el 85,0%, que es un aumento del 23,8% en comparación con la línea de base sin Prompt; la precisión de la identificación de los elementos de síndrome es del 84,8%, significativamente superior a la línea de base (68,7%); la tasa de conflicto lógico pasó del 37% al 4%, y el tiempo de razonamiento por caso es solo de 4,1 s, sin retraso notable debido a la introducción de la cadena de razonamiento. En conclusión, el CHD-SEDD LLM, basado en un marco de razonamiento en cadena impulsado por el pensamiento y los criterios de diagnóstico en síndrome, logra una alta precisión e interpretabilidad en la detección de la enfermedad coronaria en caso de dolor torácico en un entorno con recursos limitados. También confirmó la viabilidad del paradigma gran modelo universal + cadena de reflexión de dominio, que es ampliamente aplicable a la diferenciación de síndromes de varias enfermedades y promueve la estandarización inteligente del diagnóstico y el tratamiento en medicina china.

关键词

coronary heart disease;syndrome element;large language model;chain thinking;intelligent syndrome differentiation

阅读全文