Comparación de técnicas de minería de datos para descubrir información relevante de ventas de una Mype comercial
Resumen
Perú aplicó Inteligencia Artificial (IA) en empresas de envergadura, constituyó
apalancamiento para la productividad y se estimó que impulsaría un crecimiento de
hasta 6% en PBI al 2028. Muchos emprendimientos no fueron sostenibles ante la
falta de herramientas tecnológicas como minería de datos. Se han realizado
soluciones de negocio en tecnología de información e inteligencia artificial, para
superar incidencias en fraude electrónico, toma de decisiones, soluciones para
ventas y otros que no han sido suficiente por alto costo que representan, para las
Medianas y Pequeñas Empresas MYPE´s acceder a tales herramientas
tecnológicas, para fortalecimiento de capacidades. En ese sentido se desarrolló un
método que permita conocer que técnicas de minería de datos existentes,
proporcionan mejor desempeño, para descubrir información relevante de ventas
que permita apuntalar sus objetivos de negocio y proporcione confiabilidad y
eficiencia. Este método comprendió elegir una MYPE comercial en virtud al área de
influencia de la Universidad señor de Sipán que proporcionó los datos y se
construyó un data set al cual se le aplicó normalización de variables de entrada
haciendo uso de la técnica de escalado de variables de Min y Max, procesándose
5,522 registros y a éstos se les aplicó las técnicas de minería seleccionadas por su
eficiencia y rendimiento concorde a la investigación de las bases de datos
Ieeexplore, Scopus y Science Direct. Posteriormente haciendo uso de librerías
contenidas en la suite Anaconda Navigator, junto a Python como herramienta de
programación y Jupyter como editor, se logró resultados que evidencian que
regresión logística es la técnica eficiente en tanto que las demás no ofrecen óptimos
resultados en indicadores tiempo de respuesta y precisión; concluyendo que la
técnica de clasificación en lo concerniente a regresión logística es la más eficiente
con un promedio de tiempo de respuesta de 0.0620 segundos, nivel de precisión
(P) de 99.93%, consumo de CPU 4.6 Gb; consumo de memoria de 6.13; error
cuadrático medio (ECM) de 0.00090 y desviación absoluta media (MAD) 0.000898.
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: