× Zamknij

Serwis Infona wykorzystuje pliki cookies (ciasteczka). Są to wartości tekstowe, zapamiętywane przez przeglądarkę na urządzeniu użytkownika. Nasz serwis ma dostęp do tych wartości oraz wykorzystuje je do zapamiętania danych dotyczących użytkownika, takich jak np. ustawienia (typu widok ekranu, wybór języka interfejsu), zapamiętanie zalogowania. Korzystanie z serwisu Infona oznacza zgodę na zapis informacji i ich wykorzystanie dla celów korzytania z serwisu. Więcej informacji można znaleźć w Polityce prywatności oraz Regulaminie serwisu. Zamknięcie tego okienka potwierdza zapoznanie się z informacją o plikach cookies, akceptację polityki prywatności i regulaminu oraz sposobu wykorzystywania plików cookies w serwisie. Możesz zmienić ustawienia obsługi cookies w swojej przeglądarce.

Annals of Operations Research

Pozycje od 1 do 1 spośród 1 wyników

artykuł

Q-learning and policy iteration algorithms for stochastic shortest path problems

Huizhen Yu, Dimitri P. Bertsekas

Annals of Operations Research > 2013 > 208 > 1 > 95-132

We consider the stochastic shortest path problem, a classical finite-state Markovian decision problem with a termination state, and we propose new convergent Q-learning algorithms that combine elements of policy iteration and classical Q-learning/value iteration. These algorithms are related to the ones introduced by the authors for discounted problems in Bertsekas and Yu (Math. Oper. Res. 37(1):66-94,...

Opcje filtrowania

Rok:
2013
Słowa kluczowe:
APPROXIMATE DYNAMIC PROGRAMMING

Data publikacji

Ustaw własny zakres dat

Wolumin

208 (1)

Sfinansowano przez Narodowe Centrum Badań i Rozwoju (NCBiR), nr umowy SP/I/1/77065/10 w ramach programu strategicznego: SYNAT - „Interdyscyplinarny system interaktywnej informacji naukowej i naukowo-technicznej”.

INFONA - portal komunikacji naukowej

Annals of Operations Research

Q-learning and policy iteration algorithms for stochastic shortest path problems

Dodaj adresata

Anulowanie wysłania wiadomości

Czy na pewno chcesz anulować wysłanie wiadomości?

Wyślij wiadomość

Opcje filtrowania

Data publikacji

Ustawianie zakresu dat

Podaj zakres dat dla filtrowania wyświetlonych wyników. Możesz podać datę początkową, końcową lub obie daty. Daty możesz wpisać ręcznie lub wybrać za pomocą kalendarza.

Wolumin

Zgłaszanie błędu / nadużycia

Nieudane wysłanie zgłoszenia

Ułatwienia dostępu