Resumen:
Base de datos y los scripts usados para hacer un EDA sobre el término Presirvienta y su aparición en X del 1 al 8 de octubre.
- Bases de datos
- Njson de la búsqueda inicial creado usando Zeeschuimer (raw_presirvienta)
- csv después de pasar por 4Cat (raw_presirvienta)
- csv resultado del análisis de sentimientos en Orange Data Mining (1er_proc_presirvienta)
- csv unido raw_presirvienta con 1er_proc_presirvienta (tidy_presirvienta)
- Scripts
- Analisis de sentimientos.- script que se uso en Orange Data Mining para el análisis de emociones y sentimientos
- EDA_presirvienta.- Quarto Script en R, de las visualizaciones de la base de datos "tidy_presirvienta"
- Exploracio_texto.- Quarto Script en R, primeros pasos en el procesamiento del texto, nubes de palabras y conteo de ocurrencias
- Topic_modeling_presirvienta.- Quiarto Script en R, el modelado de topicos sin supervisión y los resultados.
- Busqueda en "X", término presirvienta entre los días 1 de octubre de 2024 al 8 de octubre de 2024.
- Captura de los resultados usando Zeeschuimer
- Convertir a CSV empleando 4Cat.
- Se hace un análisis de emociones en Orange Data Mining
- Se limpia la base de datos y se unen los resultados hasta este momento, usando el lenguaje R.
- En la exploración y análisis se crean algunas visualizaciones para lograr entender todos los datos y sus relaciones.
- Posteriormente se trabaja en los textos concretamente en la columna body, para entender las publicaciones y sus contenidos.
- Por último se hace un modelado de tópicos para entender mejor el contenido del dataset.