Abstract:
1.- Integración de un módulo con el algoritmo Q-Learning a la plataforma SOBA (simulación de agentes en edficios) para su posterior aplicación a diversas utilidades como eficiencia energética del edificio. En concreto, este TFG se centra en la evacuación del edificio en una situación de emergencia como puede ser un incendio, una inundación o eventos similares. Por esta razón la segunda parte del código se implementará dentro de SEBA (simulación de agentes en edificios ante situación de emergencia), que es una plataforma que hereda de SOBA.
Ambas plataformas están construidas sobre el paquete MESA (simulación de agentes).
2.- El proceso de "explotación y exploración" del algoritmo Q-Learning se estudiará con las dos técnicas más extendidas: E-Greedy y Boltzmann.
3.- El objetivo final es comparar la eficacia del reinforcement learning por recompensa frente al actual método de algoritmo en estrella (distancia matemática óptima) implantado en SEBA, a la hora de evacuar el edificio exitosamente.
4.- El lenguaje de programación utilizado será el mismo que utilizan las tres plataformas: Python en su versión > 3.0.