Frecuencia, Distribución,Resultados y Variables¶ Imitando el juego de dados
#comparar los resultados de diferentes números de ensayos
Podemos ver que con más intentos, el resultado se ve cada vez más estable, y esto es muy parecido a una distribución de probabilidad. Intente aumentar aún más el número de "pruebas" (pero Jupyter Notebook puede tardar un tiempo en generar el resultado)
supongamos que tenemos dados justos, lo que significa que todas las caras se mostrarán con la misma probabilidad
X_distri = pd.DataFrame(index=[2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]) X_distri['Prob'] = [1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1] X_distri['Prob'] = X_distri['Prob']/36 X_distri
mean = pd.Series(X_distri.index * X_distri['Prob']).sum() var = pd.Series(((X_distri.index - mean)**2)*X_distri['Prob']).sum()
mean=6.999999999999998 var=5.833333333333333
si calculamos la media y la varianza de los resultados (con un número suficientemente alto de ensayos, por ejemplo, 20000)...
ensayo = 20000 resultado = [die.sample(2, replace=True).sum().loc[0] for i in range(ensayo)]
#imprime la media y la varianza de los 20000 ensayos
resultado = pd.Series(resultado) print("la media es", resultado.mean(), "la varianza es", resultado.var())
la media es 6.9879 la varianza es 5.849246052304745