un ensemble hybride sensible aux coûts pour la classification du thermogramme mammaire déséquilibré
objectifs: la reconnaissance précoce du cancer du sein, la forme de cancer la plus souvent diagnostiquée chez les femmes, est d’une importance cruciale, car elle conduit à une amélioration significative, La thermographie médicale, qui utilise une caméra infrarouge pour l’imagerie thermique, a été démontrée comme une technique particulièrement utile pour le diagnostic précoce, car elle détecte des tumeurs plus petites que la modalité standard de la mammographie.
méthodes et matériel: dans cet article, nous analysons les thermogrammes mammaires en extrayant des caractéristiques décrivant les symétries bilatérales entre les deux zones mammaires, et présentons un système de classification pour la prise de décision. Clairement, les coûts associés à manquer un cas de cancer sont beaucoup plus élevés que ceux d’une erreur d’étiquetage bénigne cas., Dans le même temps, les ensembles de données contiennent beaucoup moins de cas malins que de cas bénins. Les approches de classification Standard ne tiennent pas compte de l’un ou l’autre de ces aspects. Dans cet article, nous présentons un ensemble de classificateurs hybrides sensibles aux coûts pour résoudre ce problème difficile. Notre approche implique un pool d’arbres de décision sensibles aux coûts qui attribuent un coût de classification erroné plus élevé à la classe maligne, augmentant ainsi son taux de reconnaissance. Un algorithme génétique est utilisé pour la sélection simultanée de caractéristiques et la fusion de classificateurs., En tant que critère d’optimisation, nous utilisons une combinaison de coûts de classification erronés et de diversité pour obtenir à la fois une sensibilité élevée et un ensemble hétérogène. De plus, nous élaguons notre ensemble en écartant les classificateurs qui contribuent le moins possible à la prise de décision.
résultats: pour un ensemble de données difficile d’environ 150 thermogrammes, notre approche atteint une excellente sensibilité de 83,10%, tout en maintenant une spécificité élevée de 89,44%., Cela signifie non seulement une meilleure reconnaissance des cas malins, il surpasse également statistiquement d’autres algorithmes de pointe conçus pour une classification déséquilibrée, et fournit donc une approche efficace pour analyser les thermogrammes mammaires.
Conclusions: notre ensemble hybride sensible aux coûts proposé peut faciliter un diagnostic précoce très précis du cancer du sein basé sur les caractéristiques du thermogramme. Il permet de surmonter les difficultés posées par la répartition déséquilibrée des patients dans les deux groupes analysés.