Modelo de clasificación con algortimo TabNet para abandono de clientes en servicios de telecomunicaciones del Instituto Costarricense de Electricidad entre agosto y octubre de 2022

 

Guardado en:
Detalles Bibliográficos
Autor: Santamaría Guzmán, Patrick José
Formato: tesis de maestría
Fecha de Publicación:2024
Descripción:Dos de los principales objetivos de los proveedores de servicios de telecomunicación son maximizar las ganancias por el servicio brindado y mantenerse vivos en el mercado. Para lograr esto, las estrategias de retención de clientes juegan un papel fundamental, ya que el precio de retener clientes en un servicio de telecomunicación, es mucho menor que el de buscar nuevos clientes. Dada la necesidad de retención de clientes, los algoritmos de aprendizaje de máquinas suelen utilizarse en gran medida con el fin de poder aplicar estrategias de retención de clientes antes de que estos decidan abandonar el servicio de telecomunicación. Debido a esto, el principal objetivo de esta investigación, es determinar si el algoritmo TabNet, una variación de redes neuronales que promete tener un mejor desempeño en la predicción de datos tabulares que las redes neuronales convencionales, presenta mejoras respecto a algoritmos ampliamente utilizados en la predicción de datos en formato tabular, como XGBoost y LightGBM, para lo cual se utilizó un conjunto de datos proporcionado por el Instituto Costarricense de Electricidad de abandono de clientes sobre el uso del servicio prepago de sus clientes, en un periodo de estudio que va de agosto a octubre de 2022. Para comparar el desempeño de los algoritmos se utilizan dos criterios, el primero es por métricas de desempeño, donde se compara la exactitud, sensibilidad, especificidad y ROC AUC de las predicciones realizadas por los algoritmos, y el segundo criterio es el tiempo de ejecución en minutos que tardan los algoritmos en ejecutarse. El algoritmo TabNet logra una mejor métrica de desempeño solo cuando se compara la sensibilidad respecto a los otros dos algoritmos, logrando predecir correctamente hasta un 74,4% de los casos de abandonos de clientes, frente a XGBoost y LightGBM que lograron porcentajes de 73.2% y 72.9% respectivamente; si se compara por las demás métricas, LightGBM y XGBoost tienen mejores resultados. Por otro lado, TabNet tarda hasta 5.6 minutos más en ejecutarse que XGBoost y hasta 8.4 minutos más que LightGBM, esto cuando se comparan los algoritmos con las 3 mejores combinaciones de hiperparámetros obtenidas en la métrica de sensibilidad; si se compara por otras métricas de desempeño, estos tiempos pueden llegar a aumentarse hasta en 87 minutos si se compara contra XGBoost. En general el algoritmo TabNet, debido a sus altos tiempos de ejecución y a la similitud de las métricas obtenidas respecto a LightGBM y XGBoost, se recomendaría solo en caso de que se busque maximizar la métrica de sensibilidad, aunque LightGBM, en general, logra métricas similares con tiempos de ejecución para el ajuste de los modelos mucho menores.
País:Kérwá
Institución:Universidad de Costa Rica
Repositorio:Kérwá
Lenguaje:Español
OAI Identifier:oai:kerwa.ucr.ac.cr:10669/91781
Acceso en línea:https://hdl.handle.net/10669/91781
Palabra clave:TabNet
XGBoost
LightGBM
Telecomunicaciones
Redes
Neuronales