"Probar una hipótesis de producto analizando datos de usuario para incrementar la fidelizacion de clientes en un servicio de streaming musical." En este proyecto se pone a prueba el manejo de dataframes, la limpieza de datos y la capacidad de relacionar dafaframes distintos.
En el contexto de este proyecto, probarás una hipótesis relacionada con las preferencias musicales de dos ciudades. Esto se hará mediante el análisis de datos reales de transmisión de música online para probar la hipótesis a continuación y comparar el comportamiento de los usuarios y las usuarias de estas dos ciudades.
Esto implicará analizar los datos reales de transmisión de música online para comparar el comportamiento de los usuarios y las usuarias en Springfield y Shelbyville. El proyecto se divide en tres etapas, cada una con objetivos específicos.
En la etapa 1, proporcionarás una descripción general de los datos y anotarás tus observaciones. En la etapa 2, preprocesarás los datos al limpiarlos. Finalmente, en la etapa 3, pondrás a prueba la hipótesis siguiendo los pasos de programación necesarios para probar cada declaración y comentando tus resultados en los bloques apropiados.
Al completar estas etapas, podrás extraer información valiosa de los datos y tomar decisiones basadas en datos.
Para este proyecto, recopilamos los requisitos y desarrollamos una hipótesis que debe ser confirmada o negada.
Al probar hipótesis, es importante tener en cuenta que pueden aceptarse por completo, aceptarse parcialmente, rechazarse parcialmente o rechazarse por completo.
Cuando una hipótesis se acepta por completo, significa que los resultados de la prueba respaldan sin ambigüedades la declaración hecha sobre la población.
Si se acepta solo parcialmente, significa que los resultados respaldan la declaración en cierta medida, pero no lo suficiente como para aceptarla por completo.
Por el contrario, si una hipótesis se rechaza por completo, significa que los resultados de la prueba no respaldan la declaración hecha sobre la población.
Por último, una hipótesis también puede ser rechazada parcialmente si los datos indican que es falsa, pero no puedes rechazarla por completo. Cuando se interpretan los resultados de una prueba de hipótesis, es importante tener en cuenta estas diferentes posibilidades.
Aquí está nuestra hipótesis para aceptar o rechazar:
La actividad de los usuarios y las usuarias difiere según el día de la semana y dependiendo de la ciudad. Diccionario de datos Los datos se almacenan en el archivo /datasets/music_project_en.csv. También puedes descargarlo aquí.
userID
: identifica de forma exclusiva a cada usuario o usuaria;Track
: título de la canción;artist
: nombre del artista;genre
: género musical;City
: ciudad del usuario o la usuaria;time
: hora del día en la que se reprodujo la pista (HH:MM:SS);Day
: día de la semana.
Se te proporciona una plantilla del cuaderno, donde puedes escribir tu código y proporcionar descripciones de tu análisis. Para completar el proyecto, rellena cada celda de código en la plantilla y edita las celdas Markdown donde la plantilla te pide que expliques tus resultados.
Siempre es una buena práctica incluir una introducción que describa brevemente tus objetivos y una conclusión que resuma tus resultados en forma de celdas Markdown.
Antes de comenzar, repasemos las tres etapas del proyecto una vez más:
Descripción de los datos. El cuaderno tiene celdas preparadas con instrucciones sobre qué tipo de código escribir, así como bloques de texto donde puedes anotar tus observaciones.
En esta etapa, limpiarás los datos examinando los nombres de las columnas y abordando los valores duplicados y ausentes. Sigue la estructura proporcionada en el cuaderno y asegúrate de anotar tus observaciones al final de esta sección.
Es el núcleo de tu proyecto. Sigue los pasos de programación necesarios para probar cada declaración y comenta tus resultados en los bloques apropiados. Finalmente, resume los resultados de todo el proyecto en la sección "Conclusiones".