Extracción de temas emergentes en microblogs utilizando modelos de temas y discriminación de bitérminos
Guardado en:
Autores: | , , |
---|---|
Formato: | artículo original |
Estado: | Versión publicada |
Fecha de Publicación: | 2017 |
Descripción: | La minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuer- zos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad. Concretamente, el contenido de los textos publicados regularmente, en los sitios de microblogs (por ejemplo, en Twitter.com) puede ser utilizado para analizar tendencias. Estas últimas son marcadas por temas emergen- tes que se distinguen de los demás por un súbito y acelerado aumento de popularidad en periodos relativamen- te cortos, de un día o de unas cuantas horas. De este modo, el problema es extraer los temas sobre los cuáles se escribe e identificar cuáles de ellos son emergentes. Una solución reciente, conocida como Bursty Biterm Topic Model (BBTM) es un algoritmo que utiliza coocurrencias de palabras (bitérminos) para la identificación de temas emergentes y cuenta con un buen nivel de resultados en Twitter. Sin embargo, toma en cuenta todas las palabras, aún aquellas que no representan temas emergentes y por lo tanto, son menos útiles para identificar- los. De ahí, que esta investigación busca hacer una exploración inicial de la aplicación de una discriminación de los bitérminos utilizados por BBTM para modelar los temas emergentes. |
País: | Portal de Revistas UCR |
Institución: | Universidad de Costa Rica |
Repositorio: | Portal de Revistas UCR |
Lenguaje: | Español |
OAI Identifier: | oai:portal.ucr.ac.cr:article/30224 |
Acceso en línea: | https://revistas.ucr.ac.cr/index.php/kanina/article/view/30224 |
Palabra clave: | Temas emergentes modelos de temas detección de tendencias redes sociales procesamiento de leguaje temporal |