Resum
Introducción: El colesterol de lipoproteínas de baja densidad (c-LDL) es un factor de riesgo cardiovascular significativo, siendo su medición directa costosa y no disponible en la mayoría de los laboratorios clínicos. La fórmula de Friedewald (FD), a pesar de su uso generalizado desde 1972, presenta limitaciones particularmente en niveles altos de triglicéridos y concentraciones bajas de c-LDL. Las técnicas de aprendizaje automático (ML) ofrecen alternativas prometedoras para la estimación precisa del c-LDL, superando potencialmente las limitaciones de las fórmulas tradicionales mediante el reconocimiento de patrones complejos en los datos del perfil lipídico.
Material y métodos: Este estudio retrospectivo analizó 34.678 perfiles lipídicos de pacientes mayores de 18 años que acudieron al Hospital Universitario Virgen Macarena, Sevilla (enero 2021-diciembre 2022). Se obtuvo la aprobación del estudio por el Comité de Ética (CEI HVM-VR_03/2024). Todos los parámetros lipídicos (colesterol total, triglicéridos, c-HDL, c-LDL) se midieron utilizando el analizador Cobas 6000. Se desarrollaron 22 modelos de aprendizaje automático utilizando la librería PyCaret de Python con división 80/20 entrenamiento-prueba. Los modelos incluyeron Regresión Lineal, Random Forest, XGBoost, LightGBM y Gradient Boosting, entre otros. El rendimiento se evaluó utilizando el coeficiente de determinación (R2), error absoluto medio (MAE) y error cuadrático medio (RMSE). Se analizaron cuatro subgrupos de triglicéridos: <150, 150-250, 250-400 y >400 mg/dL.
Resultados: El conjunto de datos comprendió 34.678 individuos con valores medios: colesterol total 204,6 ± 73,36 mg/dL, triglicéridos 203,95 ± 143,94 mg/dL, c-HDL 51,83 ± 18,45 mg/dL y c-LDL 120,38 ± 62,29 mg/dL. LightGBM alcanzó el mayor rendimiento (R2 = 0,965, RMSE = 11,35, MAE = 7,99), seguido por Gradient Boosting (R2 = 0,962, RMSE = 11,89, MAE = 7,87) y XGBoost (R2 = 0,958, RMSE = 12,49, MAE = 8,3). Las fórmulas tradicionales mostraron rendimiento inferior: Martin-Hopkins (R2 = 0,951, RMSE = 13,82, MAE = 9,3) y Friedewald (R2 = 0,926, RMSE = 16,92, MAE = 11,97). Las diferencias de rendimiento se hicieron más evidentes en niveles de triglicéridos ≥ 250 mg/dL, con los modelos de ML manteniendo R2 > 0,92 mientras que las fórmulas clásicas se deterioraron significativamente, particularmente Friedewald (R2 = 0,34) con triglicéridos > 400 mg/dL.
Conclusiones: Los modelos de aprendizaje automático, particularmente los algoritmos de boosting (LightGBM, Gradient Boosting, XGBoost), superaron significativamente a las fórmulas tradicionales de cálculo del c-LDL en todos los rangos de triglicéridos. Estos enfoques basados en IA demostraron precisión y robustez superiores, especialmente en escenarios clínicos desafiantes con triglicéridos elevados donde las fórmulas convencionales fallan. La implementación de modelos de ML en laboratorios clínicos podría proporcionar estimaciones más confiables del c-LDL, contribuyendo a una mejor estratificación del riesgo cardiovascular y manejo de pacientes. Este avance tecnológico representa una transformación prometedora en la metodología de la medicina de laboratorio.
Material y métodos: Este estudio retrospectivo analizó 34.678 perfiles lipídicos de pacientes mayores de 18 años que acudieron al Hospital Universitario Virgen Macarena, Sevilla (enero 2021-diciembre 2022). Se obtuvo la aprobación del estudio por el Comité de Ética (CEI HVM-VR_03/2024). Todos los parámetros lipídicos (colesterol total, triglicéridos, c-HDL, c-LDL) se midieron utilizando el analizador Cobas 6000. Se desarrollaron 22 modelos de aprendizaje automático utilizando la librería PyCaret de Python con división 80/20 entrenamiento-prueba. Los modelos incluyeron Regresión Lineal, Random Forest, XGBoost, LightGBM y Gradient Boosting, entre otros. El rendimiento se evaluó utilizando el coeficiente de determinación (R2), error absoluto medio (MAE) y error cuadrático medio (RMSE). Se analizaron cuatro subgrupos de triglicéridos: <150, 150-250, 250-400 y >400 mg/dL.
Resultados: El conjunto de datos comprendió 34.678 individuos con valores medios: colesterol total 204,6 ± 73,36 mg/dL, triglicéridos 203,95 ± 143,94 mg/dL, c-HDL 51,83 ± 18,45 mg/dL y c-LDL 120,38 ± 62,29 mg/dL. LightGBM alcanzó el mayor rendimiento (R2 = 0,965, RMSE = 11,35, MAE = 7,99), seguido por Gradient Boosting (R2 = 0,962, RMSE = 11,89, MAE = 7,87) y XGBoost (R2 = 0,958, RMSE = 12,49, MAE = 8,3). Las fórmulas tradicionales mostraron rendimiento inferior: Martin-Hopkins (R2 = 0,951, RMSE = 13,82, MAE = 9,3) y Friedewald (R2 = 0,926, RMSE = 16,92, MAE = 11,97). Las diferencias de rendimiento se hicieron más evidentes en niveles de triglicéridos ≥ 250 mg/dL, con los modelos de ML manteniendo R2 > 0,92 mientras que las fórmulas clásicas se deterioraron significativamente, particularmente Friedewald (R2 = 0,34) con triglicéridos > 400 mg/dL.
Conclusiones: Los modelos de aprendizaje automático, particularmente los algoritmos de boosting (LightGBM, Gradient Boosting, XGBoost), superaron significativamente a las fórmulas tradicionales de cálculo del c-LDL en todos los rangos de triglicéridos. Estos enfoques basados en IA demostraron precisión y robustez superiores, especialmente en escenarios clínicos desafiantes con triglicéridos elevados donde las fórmulas convencionales fallan. La implementación de modelos de ML en laboratorios clínicos podría proporcionar estimaciones más confiables del c-LDL, contribuyendo a una mejor estratificación del riesgo cardiovascular y manejo de pacientes. Este avance tecnológico representa una transformación prometedora en la metodología de la medicina de laboratorio.
| Títol traduït de la contribució | Rendimiento comparativo del aprendizaje automático frente a las fórmulas clásicas para el cálculo del colesterol LDL |
|---|---|
| Idioma original | Anglès |
| Número d’article | 500887 |
| Revista | Clinica e Investigacion en Arteriosclerosis |
| DOIs | |
| Estat de la publicació | Publicada - 8 de des. 2025 |
Fingerprint
Navegar pels temes de recerca de 'Comparative performance of machine learning vs classical formulas for LDL-cholesterol calculation.'. Junts formen un fingerprint únic.Com citar-ho
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver