Análisis comparativo de algoritmos de aprendizaje automático para identificar ataques de inyección SQL a base de datos en aplicaciones web
Resumen
Un alto porcentaje de las organizaciones públicas como privadas actualmente han
migrado sus actividades del mundo del papel hacia lo digital, implicando que la
información se encuentre disponible en la red. Personas con propósitos mal
intencionados con intereses de conocer o apoderarse de la información, se
aprovechan de las vulnerabilidades de las aplicaciones implementadas por las
organizaciones, para lograr su objetivo aplican diversos tipos de técnicas y métodos
para lograr acceder a la información contenida en base de datos aprovechando las
deficiencias de las aplicaciones web, apoyados de inyección de código SQL desde
los elementos de un formulario o a través de la URL.
Por lo tanto, en esta investigación se plantea un análisis comparativo de los
algoritmos de aprendizaje automático para la mitigación de los ataques de inyección
SQL, comprende las etapas de clasificación de los algoritmos según su rendimiento
en cuanto a precisión, luego la clasificación de los ataques de inyección SQL,
extracción de los datos para su procesamiento y aplicación de los algoritmos de
aprendizaje automático seleccionados para el análisis de los datos clasificados. La
clasificación de los ataques de inyección SQL a base de datos, se construyó una
tabla de clasificación por tipo de ataque y el nivel de riesgo que significan las firmas,
para la implementación de los algoritmos de aprendizaje automático se realizó en
el entorno de trabajo de Phyton, se utilizó librerías para la implementación de los
algoritmos de aprendizaje automático AdaBoost, SVM y Decision Tree, Phyton en
el entorno de trabajo Jupiter Notebook y scikit-learn demostraron ser un buen
entorno para la implementación de los algoritmos por la existencia de múltiples
librerías.
Se evaluó la precisión de tres algoritmos de aprendizaje automático poniendo a
prueba con la data extraída después de recogerlo de los ataques realizados en un
entorno de un sitio web, se encontró que el algoritmo Decision Tree demostró una
mejor precisión obteniendo el 100% al momento de realizar el análisis.
Materias
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: