× Zamknij

Serwis Infona wykorzystuje pliki cookies (ciasteczka). Są to wartości tekstowe, zapamiętywane przez przeglądarkę na urządzeniu użytkownika. Nasz serwis ma dostęp do tych wartości oraz wykorzystuje je do zapamiętania danych dotyczących użytkownika, takich jak np. ustawienia (typu widok ekranu, wybór języka interfejsu), zapamiętanie zalogowania. Korzystanie z serwisu Infona oznacza zgodę na zapis informacji i ich wykorzystanie dla celów korzytania z serwisu. Więcej informacji można znaleźć w Polityce prywatności oraz Regulaminie serwisu. Zamknięcie tego okienka potwierdza zapoznanie się z informacją o plikach cookies, akceptację polityki prywatności i regulaminu oraz sposobu wykorzystywania plików cookies w serwisie. Możesz zmienić ustawienia obsługi cookies w swojej przeglądarce.

Wyniki wyszukiwania dla: Haibo He

Pozycje od 1 do 1 spośród 1 wyników

rozdział

Two-time-scale online actor-critic paradigm driven by POMDP

Bo Liu, Haibo He, Daniel W Repperger

2010 International Conference on Networking, Sensing and Control (ICNSC) > 243 - 248

2010 International Conference on Networking, Sensing and Control (ICNSC 2010)

In this paper, we analyze a class of actor-critic algorithms under partially observable Markov decision process (POMDP) environment. Specifically, in this work we focus on the two-time-scale framework in which the critic uses a temporal difference with neural network (NN) as nonlinear function approximator, and the actor is updated using greedy algorithm with the stochastic gradient approach. Instead...

Opcje filtrowania

Słowa kluczowe:
ADAPTIVE DYNAMIC PROGRAMMING
APPROXIMATION METHODS

Data publikacji

Ustaw własny zakres dat

Sfinansowano przez Narodowe Centrum Badań i Rozwoju (NCBiR), nr umowy SP/I/1/77065/10 w ramach programu strategicznego: SYNAT - „Interdyscyplinarny system interaktywnej informacji naukowej i naukowo-technicznej”.

INFONA - portal komunikacji naukowej

Wyniki wyszukiwania dla: Haibo He

Two-time-scale online actor-critic paradigm driven by POMDP

Dodaj adresata

Anulowanie wysłania wiadomości

Czy na pewno chcesz anulować wysłanie wiadomości?

Wyślij wiadomość

Opcje filtrowania

Data publikacji

Ustawianie zakresu dat

Podaj zakres dat dla filtrowania wyświetlonych wyników. Możesz podać datę początkową, końcową lub obie daty. Daty możesz wpisać ręcznie lub wybrać za pomocą kalendarza.

Zgłaszanie błędu / nadużycia

Nieudane wysłanie zgłoszenia

Ułatwienia dostępu