Pasar al contenido principal

Primera Defensa de tesis de Maestría en Ciencia de Datos Aplicada

El 15 de agosto a las 17:30 hs en el salón 701 (7mo. piso) defiende su tesis el estudiante de Maestría en Ciencia de Datos Aplicada Bruno Olivera.

Título de la tesis: "Despacho Hidrotérmico Óptimo conTécnicas de Aprendizaje por Refuerzo"

Director Académico: Dr. Pablo Rodríguez Bocca

Directores de Tesis: Dr. Claudio Risso y Dr. Pablo Rodríguez Bocca

El tribunal está integrado por:

- Dr. Ignacio Ramírez (revisor)
- MSc. Alfredo Piria
- Dr. Alberto Pardo

Resumen:

Toda empresa de energía eléctrica, que cuente con generadores térmicos y
ge-neradores hidroeléctricos, se enfrenta al problema del Despacho
Hidrotérmico Óp-timo. El mismo consiste en determinar una política de
operación óptima de sus ge-neradores de forma que se minimicen los
costos a la hora de satisfacer la demandaenergética en un determinado
período de tiempo.

Históricamente se suele usar técnicas derivadas de formulaciones
analíticas pararesolver este problema, como por ejemplo la Programación
Dinámica o Programa-ción Dinámica Estocástica (debido a la naturaleza
estocástica del problema) entreotras. Estas técnicas suelen enfrentarse
a la denominada “maldición de la dimen-sionalidad”, donde el espacio de
estados sobre el que se trabaja tiende a crecerdemasiado rápido,
volviendo al problema intratable en términos computacionales.Para
superar esa contrariedad y aplicar estas técnicas, por lo general, se
opta pormodificar o simplificar el problema original.

Este trabajo investiga la viabilidad de resolver el problema de Despacho
Hi-drotérmico Óptimo utilizando técnicas deReinforcement Learning, una
rama deMachine Learningque ha mostrado sobreponerse al problema de la
“Maldición dela Dimensionalidad” en otros tipos de problemas.

El trabajo está estructurado en dos iteraciones, en cada iteración se
detalla unainstancia del problema (con alguna complejidad extra sobre la
iteración anterior), yluego se procede a resolverlo por técnicas
tradicionales, y porReinforcement Lear-ning, para luego analizar y
comparar los resultados.Reinforcement Learningpareceser una alternativa
prometedora para resolver el problema de Despacho Hidrotérmi-co Óptimo,
ya que en muchos de los experimentos realizados se obtienen
resultadossimilares, o hasta mejores, que las técnicas tradicionales, y
ejecutándose de formamuy rápida.