Efecto del balanceo de clases al evaluar el F-Score para un clasificador de texto en análisis de sentimiento

 

Kaydedildi:
Detaylı Bibliyografya
Yazar: Solís Fonseca, Carlos Francisco
Materyal Türü: tesis de maestría
Yayın Tarihi:2020
Diğer Bilgiler:En los últimos años los métodos de aprendizaje de máquina han sido incluidos en muchas áreas de investigación para dar soporte al análisis de datos. Los modelos de clasificación, los cuales corresponden a métodos de aprendizaje no supervisado, se han convertido en un instrumento muy importante para el análisis de texto y el análisis de sentimiento no es la excepción. Por esta razón es importante tener en consideración las características de los datos ya que, dependiendo de su naturaleza, pueden afectar la calidad del clasificador entrenado. Este trabajo se centra sobre el problema en las clases desbalanceadas. Mediante dos métodos de balanceo, submuestreo y sobremuestreo, se lleva a cabo un experimento estadístico para determinar si balancear un conjunto de datos con clases desbalanceadas mejora o no la calidad de un clasificador usando máquinas de soporte vectorial. Usando dos diferentes modelos para vectorizar palabras, TF-IDF y Word2Vec, se evalúa mediante un análisis de varianza el F-Score del clasificador de texto obteniendo como resultado un F-Score mayor cuando se usa sobremuestreo para balancear clases en comparación al F-Score obtenido del clasificador usando los datos con las clases desbalanceadas.
Ülke:Kérwá
Kurum:Universidad de Costa Rica
Repositorio:Kérwá
OAI Identifier:oai:kerwa.ucr.ac.cr:10669/82700
Online Erişim:https://hdl.handle.net/10669/82700
Access Level:acceso abierto
Anahtar Kelime:Balanceo de clases
Análisis de sentimiento
Aprendizaje de máquina
Clasificación de texto
Aprendizaje no supervisado
representación vectorial de palabras