Holap,
quería implementar y trastear un poco con el algoritmo Monte Carlo (repetir x mil veces y coger la opción que nos haya dado más veces la solución deseada) pero recomiendan usar el algoritmo UCB1 para que se repitan con más probabilidad las opciones que mejores resultados seguramente den.
Sin embargo, buscando por internet solo he encontrado esta explicación :
http://lane.compbio.cmu.edu/courses/slides_ucb.pdf
No acabo de ver cómo ni cuando poder aplicarla... ¿alguien podría echarme una mano?
¡gracias!
Uh... más que Montecarlo lo que estás proponiendo es una búsqueda aleatoria pura y dura, ¿no? ¿Qué problema intentas solucionar?
Bueno, lo que quiero es buscar la mejor solución a un problema tonto por pura y dura repetición... y encontré (no recuerdo dónde porque no hay mucha información al respecto) que se recomendaba utilizar el algoritmo UCB1 para que se repitan más veces los casos más probables.