Efecto del balanceo de clases al evaluar el F-Score para un clasificador de texto en análisis de sentimiento

 

Tallennettuna:
Bibliografiset tiedot
Tekijä: Solís Fonseca, Carlos Francisco
Aineistotyyppi: tesis de maestría
Julkaisupäivä:2020
Kuvaus:En los últimos años los métodos de aprendizaje de máquina han sido incluidos en muchas áreas de investigación para dar soporte al análisis de datos. Los modelos de clasificación, los cuales corresponden a métodos de aprendizaje no supervisado, se han convertido en un instrumento muy importante para el análisis de texto y el análisis de sentimiento no es la excepción. Por esta razón es importante tener en consideración las características de los datos ya que, dependiendo de su naturaleza, pueden afectar la calidad del clasificador entrenado. Este trabajo se centra sobre el problema en las clases desbalanceadas. Mediante dos métodos de balanceo, submuestreo y sobremuestreo, se lleva a cabo un experimento estadístico para determinar si balancear un conjunto de datos con clases desbalanceadas mejora o no la calidad de un clasificador usando máquinas de soporte vectorial. Usando dos diferentes modelos para vectorizar palabras, TF-IDF y Word2Vec, se evalúa mediante un análisis de varianza el F-Score del clasificador de texto obteniendo como resultado un F-Score mayor cuando se usa sobremuestreo para balancear clases en comparación al F-Score obtenido del clasificador usando los datos con las clases desbalanceadas.
Maa:Kérwá
Organisaatio:Universidad de Costa Rica
Repositorio:Kérwá
OAI Identifier:oai:kerwa.ucr.ac.cr:10669/82700
Linkit:https://hdl.handle.net/10669/82700
Access Level:acceso abierto
Sanahaku:Balanceo de clases
Análisis de sentimiento
Aprendizaje de máquina
Clasificación de texto
Aprendizaje no supervisado
representación vectorial de palabras