Holap,
quería implementar y trastear un poco con el algoritmo Monte Carlo (repetir x mil veces y coger la opción que nos haya dado más veces la solución deseada) pero recomiendan usar el algoritmo UCB1 para que se repitan con más probabilidad las opciones que mejores resultados seguramente den.
Sin embargo, buscando por internet solo he encontrado esta explicación :
http://lane.compbio.cmu.edu/courses/slides_ucb.pdf
No acabo de ver cómo ni cuando poder aplicarla... ¿alguien podría echarme una mano?
¡gracias!
quería implementar y trastear un poco con el algoritmo Monte Carlo (repetir x mil veces y coger la opción que nos haya dado más veces la solución deseada) pero recomiendan usar el algoritmo UCB1 para que se repitan con más probabilidad las opciones que mejores resultados seguramente den.
Sin embargo, buscando por internet solo he encontrado esta explicación :
http://lane.compbio.cmu.edu/courses/slides_ucb.pdf
No acabo de ver cómo ni cuando poder aplicarla... ¿alguien podría echarme una mano?
¡gracias!