a hybrid cost-sensitive ensemble for imbalanced breast thermogram classification
objetivos: el reconocimiento temprano del cáncer de mama, la forma de cáncer más comúnmente diagnosticada en las mujeres, es de crucial importancia, ya que conduce a una mejora significativa de las posibilidades de supervivencia., La termografía médica, que utiliza una cámara infrarroja para imágenes térmicas, se ha demostrado como una técnica particularmente útil para el diagnóstico precoz, ya que detecta tumores más pequeños que la modalidad estándar de la mamografía.
métodos y material: en este trabajo, analizamos termogramas mamarios extrayendo características que describen simetrías bilaterales entre las dos áreas mamarias, y presentamos un sistema de clasificación para la toma de decisiones. Claramente, los costos asociados con la ausencia de un caso de cáncer son mucho más altos que los de etiquetar erróneamente un caso benigno., Al mismo tiempo, los conjuntos de datos contienen significativamente menos casos malignos que benignos. Los enfoques de clasificación estándar no tienen en cuenta ninguno de estos aspectos. En este documento, presentamos un conjunto de clasificadores híbridos sensibles a los costos para abordar este desafiante problema. Nuestro enfoque implica un conjunto de árboles de decisión sensibles a los costos que asignan un mayor costo de clasificación errónea a la clase maligna, aumentando así su tasa de reconocimiento. Se emplea un algoritmo genético para la selección simultánea de características y la fusión del clasificador., Como criterio de optimización, utilizamos una combinación de costo de clasificación errónea y diversidad para lograr una alta sensibilidad y un conjunto heterogéneo. Además, podamos nuestro conjunto descartando clasificadores que contribuyen mínimamente a la toma de decisiones.
resultados: para un conjunto de datos desafiante de aproximadamente 150 termogramas, nuestro enfoque logra una excelente sensibilidad del 83.10%, mientras mantiene una alta especificidad del 89.44%., Esto no solo significa un mejor reconocimiento de los casos malignos, sino que también supera estadísticamente a otros algoritmos de última generación diseñados para la clasificación desequilibrada, y por lo tanto proporciona un enfoque eficaz para analizar los termogramas de mama.
conclusiones: nuestro conjunto híbrido sensible a los costos propuesto puede facilitar un diagnóstico temprano altamente preciso del cáncer de mama basado en las características del termograma. Supera las dificultades que plantea la distribución desequilibrada de los pacientes en los dos grupos analizados.