Wyniki wyszukiwania dla: Yanjie Li

Pozycje od 1 do 2 spośród 2 wyników

rozdział

An improvement of policy gradient estimation algorithms

Yanjie Li, Fang Cao, Xi-Ren Cao

2008 9th International Workshop on Discrete Event Systems > 168 - 172

2008 9th International Workshop on Discrete Event Systems - WODES

In this paper, we discuss the problem of the sample-path-based (on-line) performance gradient estimation for Markov systems. The existing on-line performance gradient estimation algorithms generally require a standard importance sampling assumption. When the assumption does not hold, these algorithms may lead to poor estimates for the gradients. We show that this assumption can be relaxed. We propose...

artykuł

Partially Observable Markov Decision Processes and Performance Sensitivity Analysis

Yanjie Li, Baoqun Yin, Hongsheng Xi

IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics) > 2008 > 38 > 6 > 1645 - 1651

The sensitivity-based optimization of Markov systems has become an increasingly important area. From the perspective of performance sensitivity analysis, policy-iteration algorithms and gradient estimation methods can be directly obtained for Markov decision processes (MDPs). In this correspondence, the sensitivity-based optimization is extended to average reward partially observable MDPs (POMDPs)...

Opcje filtrowania

Słowa kluczowe:
MARKOV SYSTEMS

Data publikacji

Ustaw własny zakres dat

Typ publikacji

artykuł (1)
książka (1)

Słowa kluczowe

APPROXIMATION ALGORITHMS (1)
APPROXIMATION METHODS (1)
AUTOMATIC CONTROL (1)
COMPUTATIONAL COMPLEXITY (1)
CONFERENCES (1)
COST FUNCTION (1)
DISCRETE EVENT DYNAMIC SYSTEM (1)
DISCRETE EVENT SYSTEMS (1)
ESTIMATION THEORY (1)
FINITE-STATE CONTROLLER (FSC) (1)
GRADIENT ESTIMATION (1)
GRADIENT ESTIMATION METHODS (1)
HISTORY (1)
MARKOV CHAIN (1)
MDP (1)
ON-LINE ESTIMATION (1)
OPTIMAL FINITE-STATE-CONTROLLER POLICY (1)
OPTIMISATION (1)
PARTIALLY OBSERVABLE MARKOV DECISION PROCESSES (1)
PARTIALLY OBSERVABLE MARKOV DECISION PROCESSES (POMDPS) (1)
PERFORMANCE POTENTIALS (1)
PERFORMANCE SENSITIVITY ANALYSIS (1)
PERFORMANCE-DERIVATIVE FORMULA (1)
PERFORMANCE-DIFFERENCE FORMULA (1)
PERTURBATION ANALYSIS (1)
POLICY GRADIENT (1)
POLICY GRADIENT ESTIMATION ALGORITHMS (1)
POLICY ITERATION (1)
POLICY-ITERATION ALGORITHMS (1)
POMDP (1)
POWER CAPACITORS (1)
SAMPLE-PATH-BASED PERFORMANCE GRADIENT ESTIMATION (1)
SCALABILITY (1)
SENSITIVITY ANALYSIS (1)
SENSITIVITY-BASED OPTIMIZATION (1)
STOCHASTIC PROCESSES (1)
więcej

INFONA - portal komunikacji naukowej

Wyniki wyszukiwania dla: Yanjie Li

An improvement of policy gradient estimation algorithms

Partially Observable Markov Decision Processes and Performance Sensitivity Analysis

Dodaj adresata

Anulowanie wysłania wiadomości

Czy na pewno chcesz anulować wysłanie wiadomości?

Wyślij wiadomość

Opcje filtrowania

Data publikacji

Ustawianie zakresu dat

Podaj zakres dat dla filtrowania wyświetlonych wyników. Możesz podać datę początkową, końcową lub obie daty. Daty możesz wpisać ręcznie lub wybrać za pomocą kalendarza.

Typ publikacji

Słowa kluczowe

Zgłaszanie błędu / nadużycia

Nieudane wysłanie zgłoszenia

Ułatwienia dostępu