Precisión diagnóstica de un
modelo de redes bayesianas en los
síndromes coronarios agudos
John Sprockel1,2, Juan Jose Diaztagle2,3
1. Pontificia Universidad Javerian. Bogotá DC, Colombia
2. Fundación Universitaria de Ciencias de la Salud — Hospital de San José.
3. Universidad Nacional de Colombia, Bogotá DC
Correspondencia: Jhon Sprockel. Dirección: Calle 10 18-75 Hospital San Jose. Email: jjsprockel@hotmail.com. Teléfono: 3184009973
Recibido: Mayo 13 de 2014 Aprobado: Enero 26 de 2015
Forma de citar: Sprockel J, Diaztagle JJ. Precisión diagnostica de un modelo de redes Bayesianas en los síndromes coronarios agudos. Rev Univ Ind Santander Salud. 2015; 47(2):179-185.
RESUMEN
Introducción: La caracterización diagnóstica del dolor torácico, con énfasis en los síndromes coronarios agudos (SCA) es un requerimiento primordial para los médicos del área de urgencias. Objetivos: En el presente estudio se busca diseñar y evaluar el desempeño de las redes bayesianas en el apoyo al diagnóstico de los SCA. Metodología: Se trata de un estudio de pruebas diagnósticas en el cual se diseñaron dos modelos de redes bayesianas entrenadas en el framework OpenMarkov, a partir de las variables de la escala de probabilidad de Braunwald de angina en un grupo de 159 pacientes que luego se validó en una cohorte de 108 pacientes adultos hospitalizados con sospecha de un SCA en un hospital de tercer nivel de atención. Resultados: Se obtuvo una sensibilidad baja aunque con especificidad y valor predictivo positivo adecuados (62, 86 y 87% respectivamente). El rendimiento fue mejor en los casos que tuvieron electrocardiograma y biomarcadores negativos. Conclusiones: Un modelo de redes Bayesianas entrenado a partir de las variables de la escala de probabilidad de angina inestable de Braunwald, presenta un rendimiento aceptable para el diagnóstico de los SCA.
Palabras clave: Dolor Torácico, Síndromes Coronarios Agudos, Clasificación/Diagnóstico, Redes Bayesianas.
Diagnostic accuracy of a bayesian network
model in acute coronary syndromes
ABSTRACT
Introduction: The characterization and diagnosis of chest pain, with emphasis on acute coronary syndromes (ACS), is a fundamental requirement for the doctors at the emergency service. Objective: The aim of the present study is to design and evaluate the performance of Bayesian networks to back up the diagnosis of ACS. Methodology: A diagnostic tests study in which two models of Bayesian networks were designed and trained in the framework OpenMarkov, using the variables of the Braunwald angina probability scale in a group of 159 patients, which was validated afterwards in a cohort of 108 adult patients hospitalized with suspicion of ACS in a third level hospital. Results: Low sensitivity was obtained, with adequate specificity and positive predictive values, though (62, 86, and 87% respectively). Performance was better in the cases that had electrocardiogram and negative biomarkers. Conclusion: A model of Bayesian networks trained from the variables of the Braunwald unstable angina probability scale, exhibits an acceptable performance for the diagnosis of ACS.
Keywords: Chest Pain, Acute Coronary Syndromes, Classification/Diagnosis, Bayesian Networks.
INTRODUCCIÓN
La adecuada clasificación diagnóstica del dolor torácico representa una de las competencias primordiales que los médicos de urgencias deben desarrollar y afinar para su trabajo diario. Aunque en su mayoría es causado por entidades benignas, el rápido reconocimiento de las situaciones que ponen en riesgo la vida influye en el éxito de su tratamiento1. Dentro de éstas últimas causas se encuentran los síndromes coronarios agudos (SCA) que son reconocidos como la principal causa de muerte a nivel mundial. Su adecuada caracterización requiere de la combinación de una historia clínica completa, hallazgos electrocardiográficos y biomarcadores miocárdicos junto a alguna estrategia de estratificación coronaria invasiva o no invasiva2-4.
En pacientes sin cambios significativos del electrocardiograma (ECG), los factores de riesgo para enfermedad coronaria han demostrado ser pobres predictores diagnósticos del infarto o SCA. El ECG inicial tiene una sensibilidad de solo el 20% al 60% para infarto y un set simple de biomarcadores cardiacos tienen una pobre sensibilidad5. Cuando el estudio electrocardiográfico seriado no es conclusivo y los biomarcadores son negativos se estima que la probabilidad de muerte o infarto es inferior al 2% 6,7, aunque existen reportes donde se ubica en el 3% a 30 días8 y de 4,8% a 6 meses9. Por otro lado se ha reportado que los costos derivados del exceso de triage rondan los 8 billones de dólares en Estados Unidos5.
Se han hecho esfuerzos reiterados por lograr desarrollar estrategias que apoyen el diagnóstico a la cabecera del paciente, dentro de ellas los sistemas de apoyo a la decisión clínica son sistemas electrónicos diseñados para ayudar directamente en la toma de decisiones clínicas, que cuando se utiliza con eficacia, pueden reducir la carga de trabajo y mejorar tanto la calidad de los resultados de la atención de salud como la eficiencia de la prestación de asistencia10. Las herramientas automáticas para el reconocimiento estadístico de patrones representan una de las estrategias que pueden estar tras dichos sistemas de soporte de decisiones. Las redes bayesianas son un modelo probabilístico que relaciona un conjunto de variables aleatorias mediante un grafo dirigido; o en otras palabras, son una representación gráfica de dependencias para razonamiento probabilístico basado en el concepto de probabilidad condicionada evaluado mediante el teorema de Bayes11. El modelo matemático se puede exponer para una red provisional descrita como donde G es un grafo acíclico dirigido, X = {x1, x2, ..., xN}, es un conjunto de variables aleatorias y P es la distribución de probabilidad conjunta de variables en X, factorizada como sigue:
Donde πG (x) denota los padres de x en G (12).
En nuestro medio contamos con muy escasos estudios que evalúen el aporte al diagnóstico que puedan brindar sistemas de apoyo a la decisión clínica en el caso de los SCA. Es por esto que el objetivo del presente estudio es evaluar el desempeño de las redes bayesianas entrenadas para el diagnóstico de los SCA en pacientes que consultan a urgencias con dolor torácico y sospecha de SCA.
METODOLOGÍA
Se realizó un estudio de pruebas diagnósticas. La cohorte de entrenamiento estuvo constituida por 159 pacientes mayores de 18 años que consultaron por dolor torácico como motivo de consulta principal al servicio de urgencias, en el período comprendido entre el 20 febrero y el 30 de octubre de 2012; esta cohorte fue derivada de un estudio institucional en el cual se evaluó la implementación de una ruta crítica en los SCA que recibió financiación de la convocatoria interna de la universidad. La cohorte de validación estuvo constituida por 108 pacientes, recogidos de manera prospectiva, mayores de 18 años hospitalizados con sospecha clínica de SCA entre 25 de julio de 2013 y el 15 de enero de 2014, los pacientes recolectados en ella hacen parte de un estudio encaminado al desarrollo y prueba de una herramienta de sistemas multiagentes, de la cual algunos de los agentes racionales que la constituyen podrían ser estas redes bayesianas, si su desempeño lo permite.
Se diseñaron dos arquitecturas de redes bayesianas a partir de la cohorte de entrenamiento (Figura 1), teniendo en cuenta 18 de las características de probabilidad intermedia y alta de la escala de clasificación de la probabilidad de Braunwald para la angina inestable (Tabla 1)13 en el framework OpenMarkov14, un proyecto del Departamento de Inteligencia artificial de la Universidad Nacional de Educación a Distancia (UNED) en Madrid, en desarrollo desde el 2003.
El reporte de la probabilidad condicionada para los SCA obtenido tras incluir los datos de cada uno de los casos de la cohorte de validación en el modulo de inferencia de OpenMarkov (Figura 2), se definió como resultado positivo o negativo para SCA en el caso respectivo que dicha probabilidad fuera mayor o menor o igual a 0.5. A partir de ello se construyeron las tablas de contingencia (o de 2x2) calculando a partir de estos resultados la sensibilidad, especificidad, valores predictivos y precisión.
Las bases de datos que alimentaron la cohorte de entrenamiento y validación se obtuvieron de dos estudios, uno completado y el otro en curso, que fueron aprobados por el comité de ética en investigación para humanos. No se requirió la obtención de un consentimiento informado.
RESULTADOS
La cohorte de entrenamiento estuvo constituida por 159 pacientes, de los cuales en 81 se descartó el SCA; 41 (25.8%) fueron anginas y 37 (23.3%) fueron infartos. 72 (45.3%) casos fueron mujeres y el promedio de edad fue de 61.4 años. Para el diagnóstico se contó con pruebas de estratificación coronaria no invasiva en 50 casos y cateterismo cardíaco en 50 casos.
La cohorte de validación estuvo constituida por 108 pacientes, 47 cursaban con un SCA de los cuales 40 (37.0%) fueron anginas y 27 (25.0%) fueron infartos. 43 (39.8%) casos fueron mujeres y el promedio de edad fue de 66.5 años. A 69 casos se les evaluó mediante cateterismo cardíaco.
Hubo una variación en el reporte de ambas redes en sólo un paciente, la sensibilidad de las dos redes fueron 62.1 y 60.7% respectivamente. Sus especificidades fueron 85.7% en ambos casos con un valor predictivo positivo de 87.2 y 86.9% (Tabla 2). Al hacer un análisis en los casos en que el ECG y la troponina fueron normales, la sensibilidad aumentó al 74.0 y 70.4% respectivamente, con una disminución ligera de la especificidad, hasta el 84.4% en ambas redes (Tabla 3).
DISCUSIÓN
El diagnóstico de los SCA es un proceso dinámico y complejo. En los últimos años se ha documentado evidencia de que los patrones clínicos que aprendimos durante nuestra formación, no son los más frecuentes y una proporción importante de los casos se encuentra por fuera de los comportamientos descritos5,15,16, lo que hace que el análisis exclusivo de la clínica, al ignorar estas variaciones sea insuficiente para su adecuada caracterización. Se llega por ello a un estado de dependencia en la realización de los estudios complementarios, en la mayoría de los casos con el requerimiento de alguna estrategia de estratificación coronaria, generando así un consumo importante de recursos.
Las estrategias estadísticas se presentan como una opción para lograr un diagnóstico de una manera analítica. Las redes bayesianas constan de dos elementos, un conjunto de variables (los nodos de la red) y un conjunto de vínculos dirigidos que conectan un par de nodos. Las redes cumplen con las siguientes condiciones: cada nodo Xi está asociada con una función de probabilidad condicionada P(Xi | Padres (Xi)) que toma como entrada un conjunto particular de valores de los nodos padres y da la probabilidad de la variable representada por el nodo Xi, es un grafo dirigido que no es cíclico17. En el presente caso, los nodos son 18 variables procedentes de la escala de probabilidad de angina de Braunwald y la salida es la probabilidad que se trate de un SCA.
Las dos arquitecturas de redes bayesianas diseñadas tuvieron pocas variaciones en sus resultados, con un solo caso interpretado como falso negativo por la segunda red. Aunque la sensibilidad fue baja, la especificidad y el valor predictivo positivo fueron superiores al 85% (Tabla 2). Los datos clínicos de historia, dolor similar a un evento previo y de enfermedad coronaria fueron los que mejor se correlacionaron con el diagnóstico final. En los casos en que la troponina fue positiva o que habían cambios electrocardiográficos, se encontraron un alto número de falsos negativos. Debido a estas condiciones ambas redes tuvieron un mejor desempeño en los casos en los que la troponina y el ECG fueron negativos, con un aumento de la sensibilidad hasta el 74% (Tabla 3).
Los resultados obtenidos tienen un comportamiento similar a lo reportado en la literatura. La Tabla 4 resume los resultados de cuatro estudios en los que se utilizan clasificadores bayesianos, en ella se observa que a excepción del clasificador robusto, presentan un desempeño ligeramente inferior a sus comparadores. Los problemas en los que se evaluó incluyen en la mayor parte los adquiridos a partir de los datos clínicos, pero también los casos de análisis automático de los electrocardiogramas. Aunque su capacidad para clasificar el diagnóstico pueda parecer baja, es significativo el hecho que se tengan en cuenta los casos de angina inestable, en los que el logro de un diagnóstico se torna más complejo.
Como limitaciones se encuentra un posible sesgo de selección, ya que en la cohorte de entrenamiento se incluyeron solo los pacientes que contaran con los datos completos procedentes del diligenciamiento de una ruta crítica para los eventos coronarios, que no fue recogida de manera secuencial21. Por otro lado, si bien es cierto, se siguieron las recomendaciones de las guías institucionales para el enfoque diagnóstico de estos pacientes, pueden existir falsos negativos cuando se descarta un SCA, lo que puede generar en potencia un sesgo de clasificación.
Sin embargo se considera que esta es una limitación propia de la complejidad de la clasificación del SCA y en todos los casos hubo consenso entre varios especialistas en que se trataba o no de un SCA. La colocación arbitraria del punto de corte de 0.5 para el diagnóstico debe ser puesto a consideración, un abordaje que incluya casos de probabilidad intermedia (por ejemplo entre 0.3 y 0.7) podría mejorar la posibilidad de clasificación diagnóstica a costa de complicar el proceso de toma de decisión limitando su aplicación práctica. Otro punto a considerar es que no se tuvieron en cuenta otras variables que pudieran aportar al proceso de diagnóstico, o el explorar herramientas diferentes para el desarrollo de redes bayesianas, como los toolbox BNT, PMTK3 o PRT de MatLab®, o bien BNJ en java.
Consideramos que se tiene la fortaleza de contar con una base de datos de entrenamiento y validación representativa de los casos en los que se sospecha un SCA, sin descartar los casos de angina inestable abarcando así todos los extremos de la enfermedad. Las redes bayesianas entrenadas podrían llegar a hacer parte de un sistema de apoyo al diagnóstico que funcionando junto a otras herramientas (por ejemplo de sistemas inteligentes o de inferencia estadística), trabajando en paralelo o secuencialmente, ayude en la confirmación de los SCA, tomando provecho de su alta especificidad. En la elaboración del presente artículo se siguieron los lineamientos generales de la iniciativa STARD para el reporte de los estudios de precisión diagnóstica22.
CONCLUSIONES
Un modelo de redes de creencias Bayesianas entrenado a partir de las variables de la escala de probabilidad de angina inestable de Braunwald, presenta un rendimiento aceptable para el diagnóstico de los SCA, en especial en los casos en que tanto el ECG como los biomarcadores cardíacos son negativos.
REFERENCIAS
1. Erhardt L, Herlitz J, Bossaert L, Halinen M, Keltai M, Koster R, et al. European Society of Cardiology: Task force on the management of chest pain. Europ Heart J. 2002; 23(15): 1153-1176.
2. Thygesen K, Alpert JS, White HD, Joint ESC/ ACCF/AHA/WHF Task force for the redefinition of myocardial infarction, Jaffe AS, Apple FS, et al. Universal definition of myocardial infarction. Circulation. 2007; 116(22): 2634-2653.
3. Mendoza F, Isaza D, Beltrán R, Jaramillo C. Guías Colombianas de Cardiología - Síndrome coronario agudo sin elevación del ST. Rev Col Cardiol. 2008; 15(Supl. 3): 143-232.
4. Mendoza F, Isaza D, Beltrán R, Jaramillo C. Guías Colombianas de Cardiología - Síndrome Coronario Agudo con Elevación del ST. Rev Col Cardiol. 2010; 17(Supl. 3): 121-275.
5. Swap CJ, Nagurney JT. Value and limitations of chest pain history in the evaluation of patients with suspected acute coronary syndromes. JAMA. 2005; 294(20): 2623-2629.
6. Hamm WC, Braunwald E. A classification of unstable angina revisited. Circulation. 2000; 102: 118-122.
7. Lee TH, Goldman L. Evaluation of the patient with acute chest pain. N Engl J Med. 2000; 342: 1187-1195.
8. Newby LK, Storrow AB, Gibler WB, Garvey JL, Tucker JF, Kaplan AL, et al. Bedside multimarker testing of risk stratification in chest pain units. The chest pain evaluation by creatine kinase-MB, myoglobin and troponin I (CHECKMATE) study. Circulation. 2001; 103: 1832-1837.
9. Sanchis J, Bodí V, Llácer A, Núñez J, Consuegra L, Bosch MJ, et al. Risk stratification of patients with acute chest pain and normal troponin concentrations. Heart. 2005; 91(8): 1013-1018.
10. Lobach D, Sanders GD, Bright TJ, Wong A, Dhurjati R, Bristow E, et al. Enabling health care decision making through clinical decision support and knowledge management. Agency for Healthcare Research and Quality (US); 2012; (Evidence report/Technology assessments No. 203.)
11. Heckerman D, Geiger D, Chickering DM. Learning Bayesian Networks: The Combination of Knowledge and Statistical Data. Machine Learning. 1995; 20(3): 197-243.
12. Exarchos KP, Exarchos TP, Bourantas CV, Papafaklis MI, Naka KK, Michalis LK, et al. Prediction of coronary atherosclerosis progression using dynamic Bayesian networks. Conf Proc Osaka, Japan: IEEE Eng Med Biol Soc. 2013; 2013: 3889-3892.
13. Braunwald E, Jones RH, Mark DB, Brown J, Brown L, Cheitlin MD, et al. Diagnosing and managing unstable angina. Agency for Health Care Policy and Research. Circulation. 1994; 90(1): 613-622.
14. Arias M, Díez FJ, Palacios-Alonso MA, Yebra M, Fernández J. POMDPs in OpenMarkov and ProbModelXML, presented at the Seventh Annual Workshop on Multiagent Sequential Decision-Making Under Uncertainty, Valencia, Spain, 2012, pp. 1-8.
15. Goodacre S, Locker T, Morris F, Campbell S. How useful are clinical features in the diagnosis of acute, undifferentiated chest pain? Acad Emerg Med. 2002; 9(3): 203-208.
16. Body R, Carley S, Wibberley C, McDowell G, Ferguson J, Mackway-Jones K. The value of symptoms and signs in the emergent diagnosis of acute coronary syndromes. Resuscitation. 2010; 81(3): 281-286.
17. Vila-Francés J, Sanchís J, Soria-Olivas E, Serrano AJ, Martínez-Sober M, Bonanad C, et al. Expert system for predicting unstable angina based on Bayesian networks. Expert Syst Appl. 2013; 40(12): 5004-5010.
18. Kukar M, Groselj C, Kononenko I, Fettich JJ. An application of machine learning in the diagnosis of ischaemic heart disease. IEEE Symposium on Computer-Based Medical Systems; 1997.
19. Bigi R, Gregori D, Cortigiani L, Desideri A, Chiarotto FA, Toffolo GM. Artificial neural networks and robust Bayesian classifiers for risk stratification following uncomplicated myocardial infarction. Int J Cardiol. 2005; 101(3): 481-487.
20. Chiang Y-Y, Hsu W-H. Integrating dynamic Bayesian networks and constraint-based fuzzy models for myocardial infarction classification with 12-lead ECGS. Conference on Precision Electromagnetic Measurements (CPEM). 2010. p. 310-311.
21. Sprockel JJ, Diaztagle JJ, Chaves WG, Simon CJ, Hernandez JI. Estructuración e implementación de un critical pathway para el manejo de pacientes con síndrome coronario agudo en el servicio de urgencias del Hospital San José de Bogotá. Rev Col Cardiol. 2013; 20(5): 262-274.
22. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD Initiative. Ann Intern Med. 2003; 138(1): 40-44.