× Zamknij

Serwis Infona wykorzystuje pliki cookies (ciasteczka). Są to wartości tekstowe, zapamiętywane przez przeglądarkę na urządzeniu użytkownika. Nasz serwis ma dostęp do tych wartości oraz wykorzystuje je do zapamiętania danych dotyczących użytkownika, takich jak np. ustawienia (typu widok ekranu, wybór języka interfejsu), zapamiętanie zalogowania. Korzystanie z serwisu Infona oznacza zgodę na zapis informacji i ich wykorzystanie dla celów korzytania z serwisu. Więcej informacji można znaleźć w Polityce prywatności oraz Regulaminie serwisu. Zamknięcie tego okienka potwierdza zapoznanie się z informacją o plikach cookies, akceptację polityki prywatności i regulaminu oraz sposobu wykorzystywania plików cookies w serwisie. Możesz zmienić ustawienia obsługi cookies w swojej przeglądarce.

Journal of Optimization Theory and Applications

Pozycje od 1 do 1 spośród 1 wyników

artykuł

An Online Actor–Critic Algorithm with Function Approximation for Constrained Markov Decision Processes

Shalabh Bhatnagar, K. Lakshmanan

Journal of Optimization Theory and Applications > 2012 > 153 > 3 > 688-708

We develop an online actor–critic reinforcement learning algorithm with function approximation for a problem of control under inequality constraints. We consider the long-run average cost Markov decision process (MDP) framework in which both the objective and the constraint functions are suitable policy-dependent long-run averages of certain sample path functions. The Lagrange multiplier method is...

Opcje filtrowania

Wolumin:
153
Rok:
2012
Słowa kluczowe:
FUNCTION APPROXIMATION

Data publikacji

Ustaw własny zakres dat

Numer

3 (1)

Sfinansowano przez Narodowe Centrum Badań i Rozwoju (NCBiR), nr umowy SP/I/1/77065/10 w ramach programu strategicznego: SYNAT - „Interdyscyplinarny system interaktywnej informacji naukowej i naukowo-technicznej”.

INFONA - portal komunikacji naukowej

Journal of Optimization Theory and Applications

An Online Actor–Critic Algorithm with Function Approximation for Constrained Markov Decision Processes

Dodaj adresata

Anulowanie wysłania wiadomości

Czy na pewno chcesz anulować wysłanie wiadomości?

Wyślij wiadomość

Opcje filtrowania

Data publikacji

Ustawianie zakresu dat

Podaj zakres dat dla filtrowania wyświetlonych wyników. Możesz podać datę początkową, końcową lub obie daty. Daty możesz wpisać ręcznie lub wybrać za pomocą kalendarza.

Numer

Zgłaszanie błędu / nadużycia

Nieudane wysłanie zgłoszenia

Ułatwienia dostępu