Minería de texto: comparación léxico-semántica del corpus lingüístico de las obras literarias latinoamericanas recomendadas en el tercer ciclo y educación diversificada en el sistema educativo costarricense con el corpus lingüístico de ítems de práctica para la Prueba de Aptitud Académica (PAA) de la Universidad de Costa Rica, 2018 -2020
Salvato in:
| Autore: | |
|---|---|
| Natura: | tesis de maestría |
| Data di pubblicazione: | 2025 |
| Descrizione: | La comprensión lectora y el conocimiento del léxico son parte fundamental en el entendimiento de los textos. En este estudio se explora si el corpus lingüístico de diversas obras literarias latinoamericanas, recomendadas a nivel de secundaria en el sistema educativo costarricense, se asocian con el corpus lingüístico de ítems de práctica para la Prueba de Aptitud Académica (PAA) de la Universidad de Costa Rica. En este caso se realiza un análisis bajo el enfoque cuantitativo utilizando métricas y técnicas de minería de textos. En total se analizan 68 obras literarias y se toma en cuenta 150 ítems de práctica de la PAA. Al final, se obtiene un corpus general con más de 73 000 palabras. Según los resultados de asociación de los corpus lingüísticos, se muestra magnitudes de las asociaciones de la similitud de coseno y el índice de Jaccard superiores a 0.9, lo cual indica asociación entre los documentos y los corpus. Además, los modelos de clasificación obtienen precisiones mayores a 0.9 y precisiones equilibradas mayores a 0.5. Los modelos con asignación latente de Direchlet (ALD) presentan las mejores precisiones equilibradas. El modelo de bosques aleatorios clasifica con precisión mayor a 0.93 y precisiones equilibradas mayores a 0.6. Se concluye que existe una notable similitud en el vocabulario utilizado en las obras literarias recomendadas y los ítems de práctica de la PAA. El modelo de bosques aleatorios demostró ser el más eficaz para la clasificación léxica en este contexto. Estos hallazgos sugieren que la familiarización con el léxico de las obras literarias requeridas podría ser beneficiosa para las personas estudiantes al enfrentar la PAA. Sin embargo, se reconoce que la adquisición de vocabulario y la comprensión lectora dependen también de factores individuales (hábitos, actitudes, vivencias) y del enfoque pedagógico empleado en el aula por la persona docente. |
| Stato: | Kérwá |
| Istituzione: | Universidad de Costa Rica |
| Repositorio: | Kérwá |
| Lingua: | Español |
| OAI Identifier: | oai:kerwa.ucr.ac.cr:10669/103777 |
| Accesso online: | https://hdl.handle.net/10669/103777 |
| Keyword: | Corpus lingüístico comprensión lectora obras literarias prueba de aptitud minería de texto Linguistic corpus reading comprehension literary works aptitude test text mining. |