Minería de texto: comparación léxico-semántica del corpus lingüístico de las obras literarias latinoamericanas recomendadas en el tercer ciclo y educación diversificada en el sistema educativo costarricense con el corpus lingüístico de ítems de práctica para la Prueba de Aptitud Académica (PAA) de la Universidad de Costa Rica, 2018 -2020

 

Salvato in:
Dettagli Bibliografici
Autore: Valverde Hernández, Melissa Edith
Natura: tesis de maestría
Data di pubblicazione:2025
Descrizione:La comprensión lectora y el conocimiento del léxico son parte fundamental en el entendimiento de los textos. En este estudio se explora si el corpus lingüístico de diversas obras literarias latinoamericanas, recomendadas a nivel de secundaria en el sistema educativo costarricense, se asocian con el corpus lingüístico de ítems de práctica para la Prueba de Aptitud Académica (PAA) de la Universidad de Costa Rica. En este caso se realiza un análisis bajo el enfoque cuantitativo utilizando métricas y técnicas de minería de textos. En total se analizan 68 obras literarias y se toma en cuenta 150 ítems de práctica de la PAA. Al final, se obtiene un corpus general con más de 73 000 palabras. Según los resultados de asociación de los corpus lingüísticos, se muestra magnitudes de las asociaciones de la similitud de coseno y el índice de Jaccard superiores a 0.9, lo cual indica asociación entre los documentos y los corpus. Además, los modelos de clasificación obtienen precisiones mayores a 0.9 y precisiones equilibradas mayores a 0.5. Los modelos con asignación latente de Direchlet (ALD) presentan las mejores precisiones equilibradas. El modelo de bosques aleatorios clasifica con precisión mayor a 0.93 y precisiones equilibradas mayores a 0.6. Se concluye que existe una notable similitud en el vocabulario utilizado en las obras literarias recomendadas y los ítems de práctica de la PAA. El modelo de bosques aleatorios demostró ser el más eficaz para la clasificación léxica en este contexto. Estos hallazgos sugieren que la familiarización con el léxico de las obras literarias requeridas podría ser beneficiosa para las personas estudiantes al enfrentar la PAA. Sin embargo, se reconoce que la adquisición de vocabulario y la comprensión lectora dependen también de factores individuales (hábitos, actitudes, vivencias) y del enfoque pedagógico empleado en el aula por la persona docente.
Stato:Kérwá
Istituzione:Universidad de Costa Rica
Repositorio:Kérwá
Lingua:Español
OAI Identifier:oai:kerwa.ucr.ac.cr:10669/103777
Accesso online:https://hdl.handle.net/10669/103777
Keyword:Corpus lingüístico
comprensión lectora
obras literarias
prueba de aptitud
minería de texto
Linguistic corpus
reading comprehension
literary works
aptitude test
text mining.