Abstrakt
Planning in large state spaces inevitably needs to balance the depth and breadth of the search. It has a crucial impact on the performance of a planner and most manage this interplay implicitly. We present a novel method \textit{Shoot Tree Search (STS)}, which makes it possible to control this trade-off more explicitly. Our algorithm can be understood as an interpolation between two celebrated search mechanisms: MCTS and random shooting. It also lets the user control the bias-variance trade-off, akin to TD(n), but in the tree search context. In experiments on challenging domains, we show that STS can get the best of both worlds consistently achieving higher scores.
Cytowania
-
0
CrossRef
-
0
Web of Science
-
1
Scopus
Autorzy (5)
Cytuj jako
Pełna treść
pełna treść publikacji nie jest dostępna w portalu
Słowa kluczowe
Informacje szczegółowe
- Kategoria:
- Aktywność konferencyjna
- Typ:
- materiały konferencyjne indeksowane w Web of Science
- Język:
- angielski
- Rok wydania:
- 2021
- Opis bibliograficzny:
- Czechowski K., Januszewski P., Kozakowski P., Kuciński Ł., Miłoś P..: Structure and Randomness in Planning and Reinforcement Learning, W: , 2021, ,.
- DOI:
- Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1109/ijcnn52387.2021.9533317
- Źródła finansowania:
-
- Polish National Science Center grant UMO-2017/26/E/ST6/00622
- Weryfikacja:
- Politechnika Gdańska
wyświetlono 95 razy
Publikacje, które mogą cię zainteresować
Autonomous port management based AGV path planning and optimization via an ensemble reinforcement learning framework
- X. Chen,
- S. Liu,
- J. Zhao
- + 3 autorów