Modelo de machine learning en la detección de sitios web phishing
Resumen
En la actualidad se evidencia el crecimiento de ataques informáticos y de forma
específica los ataques phishing, la presente investigación tiene como problema
fundamental el rendimiento en la detección de sitios web phishing. Las causas
encontradas sugieren profundizar el proceso de la ciberseguridad y la detección
de phishing, por lo que se plantea como objetivo: Aplicar un sistema de detección
de phishing, sustentada en un modelo de machine learning, para el rendimiento
en la detección de sitios web falsos.
Se propone un modelo de machine learning en la detección de sitios web
phishing, construida en seis dimensiones: Sitio web, inteligencia de amenazas,
preparación de datos, algoritmos de machine learning, entrenamiento y
detección; visto holísticamente que permite la integración de todas las
dimensiones; este modelo propuesto se materializa mediante un sistema de
detección de phishing que se desarrolla en seis fases: recolección de datos,
preparación de datos, selección de algoritmos, entrenamiento del sistema,
detección de sitios phishing y evaluación del rendimiento.
Finalmente, se implementó el sistema de detección de phishing, utilizando datos
de 11055 sitios web que son clasificados como sitios web legítimos y sitios web
phishing, de los cuales 2211 sitios web se utilizaron para la evaluación del
rendimiento del sistema y se obtiene un accuracy de 97.42% en la detección
correcta de forma global de los sitios web, que es mayor en comparación con los
resultados de estudios previos.
Materias
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: