Análisis comparativo de clasificadores para la detección de subtipos de cáncer
Resumen
En la actualidad el cáncer es una de las primeras causas de muerte a nivel mundial,
en la ingeniería el aprendizaje automático se está utilizando para analizar datos y
aprender de ellos, consecuentemente son capaces de predecir o sugerir, y está
teniendo un alto impacto en los avances tecnológicos médicos. El objetivo de este
trabajo es realizar un análisis comparativo para la detección de los subtipos de un
cáncer, la investigación inicia con la selección del tipo de cáncer, el cual se
seleccionó el cáncer de mama, posteriormente se caracterizó los subtipos del
cáncer obteniendo 4 subtipos los cuales son, Luminal A, Luminal B, Basal o triple
negativo y el tipo de cáncer enriquecido con Her2. Posteriormente se realizó la
clasificación siendo los clasificadores Support Vector Machines, K-Nearest
Neighbor y Naive Bayes los seleccionados, además se utilizaron los datos
obtenidos del bioproyecto GSE10886 que contiene 200 muestras de tejido
tumorosos generados en GEO2R (Herramienta que analiza datos genómicos). Los
resultados obtenidos de los indicadores precisión, error, sensibilidad y
especificidad de los clasificadores son SVM (97%, 3%, 95%, 99%) , siendo el que
obtuvo mejor performance en comparación al clasificador KNN(88%, 12%, 89%,
96%) y del clasificador NB (90%, 10%, 89% y 98%) respectivamente, demás se
obtuvo el tiempo de respuesta de la ejecución de los clasificadores siendo del
clasificador SVM 0.36 segundos, 2.79 segundos del clasificador KNN y 0.33
segundos del clasificador Naive Bayes. Finalmente se concluyó que el clasificador
que obtuvo mejor performance en los resultados evaluados es el clasificador SVM
con un 97% de precisión, 3% de error , 95% de sensibilidad y un 99% de
especificidad y por último el clasificador con menos tiempo de respuesta fue el
clasificador Naive Bayes con 0.33 segundos.
Materias
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: