Full list
You will be redirected to the institution’s website in order to read these documents.
-
1990 — Computationally efficient adpative control algorithms for Markov chainsAbstract
Nous proposons ici des procédures itératives pour le calcul des politiques optimales de contrôle dans les chaines de Markov. Nous considérons des chaines de Markov dont les probabilités de transition sont inconnues et dépendent d'un paramètre. L'objectif étant de minimiser les couts moyens de la chaine de Markov en état stationnaire, ces procédures doivent à la fois estimer le paramètre inconnu et déterminer la meilleure politique de contrôle. À chaque itération un estimateur "fortement consistent" du paramètre inconnu est calculé et subséquemment utilise pour bonifier la politique de contrôle. L'apport principal de cette thèse est le calcul en temps réel … Read more