XX International Symposium of Electrical Engineering "SIE 2023"

XX International Symposium of Electrical Engineering

SIE 2023

Comparison of Machine Learning algorithms in PROCDEC database

The estimation of cardiovascular risk through risk models for the occurrence of an event is of great importance in medicine. It allows us to analyze the mechanisms of the appearance of the disease and predict, under a certain probability said phenomenon. The most frequent difficulties associated with the problem of Arterial Hypertension are making important decisions for its diagnosis, performing a quick and effective analysis and accessing useful and valuable information hidden in the data. The fundamental objective of this work is the comparison of 5 Machine Learning algorithms using the Weka software, version 3.8.6, based on real cases of school children in the city of Santa Clara. The case base is made up of 1,140 individuals with 42 attributes or risk factors contemplated by the PROCDEC Project. The main results obtained are a function of the classification quality of each selected algorithm, taking into account the average Area Under the Curve (ROC), where Random Forest obtained a value of 0.892, J48 a value of 0.837, SMO a value of 0.752, Bagging a value of 0.888 and Bayes Networks a value of 0.872. Likewise, the fundamental relationships of some factors are shown and their implication on the classification of each individual, where HBP, obesity and hyperreactivity are determining factors in the classification of cardiovascular risk.

La estimación del riesgo cardiovascular mediante modelos de riesgo de aparición de un suceso es de gran importancia en la medicina. Permite analizar los mecanismos de aparición de la enfermedad y predecir bajo cierta probabilidad dicho fenómeno. Las dificultades más frecuentes asociadas a la problemática de la Hipertensión Arterial son la toma de decisiones importantes para su diagnóstico, la realización de un análisis rápido y efectivo y el acceso a información útil y valiosa oculta en los datos. Este trabajo tiene como objetivo fundamental la comparación de 5 algoritmos de Machine Learning utilizando el software Weka, versión 3.8.6, sobre la base de casos reales de niños escolares de la ciudad de Santa Clara. La base de casos se compone de 1140 individuos con 42 atributos o factores de riesgos que contempla el Proyecto PROCDEC. Los principales resultados obtenidos están en función de la calidad de clasificación de cada algoritmo seleccionado, teniendo en cuenta el Área Bajo la Curva (ROC) promedio, donde Random Forest obtuvo un valor de 0,892, el J48 un valor de 0,837, el SMO un valor de 0,752, el Bagging un valor de 0,888 y las Redes de Bayes un valor de 0,872. De igual forma se muestran las relaciones fundamentales de algunos factores y su implicación sobre la clasificación de cada individuo, donde la HTA, la obesidad y la hiperreactividad son factores determinantes en la clasificación del riesgo cardiovascular.

About The Speaker

Rafael Alejandro Olivera Solís

Rafael Alejandro Olivera Solís

UCLV Flag of Cuba

Vicedecano de Extensión, Comunicación e Informatización de la facultad de Ingeniería Eléctrica. Profesor del Departamento de Electrónica y Telecomunicaciones

Discussion

Practical Info
Spanish / Español
November 15, 2023 9:10 AM
10 minutes
Salón Principal SIE 2023
Authors
Rafael Alejandro Olivera Solís
Emilio Francisco González Rodríguez
Keywords
atributos
attributes
clasificadores
classifiers
m-health.
ml; crf
ml; frcv
salud móvil.
Documents