Análisis Exploratorio de Datos sobre el término Presirvienta

Resumen:

Base de datos y los scripts usados para hacer un EDA sobre el término Presirvienta y su aparición en X del 1 al 8 de octubre.

1. Contenidos

Bases de datos
1. Njson de la búsqueda inicial creado usando Zeeschuimer (raw_presirvienta)
2. csv después de pasar por 4Cat (raw_presirvienta)
3. csv resultado del análisis de sentimientos en Orange Data Mining (1er_proc_presirvienta)
4. csv unido raw_presirvienta con 1er_proc_presirvienta (tidy_presirvienta)
Scripts
1. Analisis de sentimientos.- script que se uso en Orange Data Mining para el análisis de emociones y sentimientos
2. EDA_presirvienta.- Quarto Script en R, de las visualizaciones de la base de datos "tidy_presirvienta"
3. Exploracio_texto.- Quarto Script en R, primeros pasos en el procesamiento del texto, nubes de palabras y conteo de ocurrencias
4. Topic_modeling_presirvienta.- Quiarto Script en R, el modelado de topicos sin supervisión y los resultados.

Busqueda en "X", término presirvienta entre los días 1 de octubre de 2024 al 8 de octubre de 2024.
Captura de los resultados usando Zeeschuimer
Convertir a CSV empleando 4Cat.
Se hace un análisis de emociones en Orange Data Mining
Se limpia la base de datos y se unen los resultados hasta este momento, usando el lenguaje R.
En la exploración y análisis se crean algunas visualizaciones para lograr entender todos los datos y sus relaciones.
Posteriormente se trabaja en los textos concretamente en la columna body, para entender las publicaciones y sus contenidos.
Por último se hace un modelado de tópicos para entender mejor el contenido del dataset.