Structure and Randomness in Planning and Reinforcement Learning - Publikacja - MOST Wiedzy

Wyszukiwarka

Structure and Randomness in Planning and Reinforcement Learning

Abstrakt

Planning in large state spaces inevitably needs to balance the depth and breadth of the search. It has a crucial impact on the performance of a planner and most manage this interplay implicitly. We present a novel method \textit{Shoot Tree Search (STS)}, which makes it possible to control this trade-off more explicitly. Our algorithm can be understood as an interpolation between two celebrated search mechanisms: MCTS and random shooting. It also lets the user control the bias-variance trade-off, akin to TD(n), but in the tree search context. In experiments on challenging domains, we show that STS can get the best of both worlds consistently achieving higher scores.

Cytowania

  • 0

    CrossRef

  • 0

    Web of Science

  • 1

    Scopus

Autorzy (5)

  • Zdjęcie użytkownika magister Konrad Czechowski

    Konrad Czechowski magister

    • Faculty of Mathematics, Informatics and Mechanics, University of Warsaw
  • Zdjęcie użytkownika magister Piotr Kozakowski

    Piotr Kozakowski magister

    • Faculty of Mathematics, Informatics and Mechanics, University of Warsaw
  • Zdjęcie użytkownika doktor Łukasz Kuciński

    Łukasz Kuciński doktor

    • Institute of Mathematics, Polish Academy of Science
  • Zdjęcie użytkownika doktor habilitowany Piotr Miłoś

    Piotr Miłoś doktor habilitowany

    • Institute of Mathematics, Polish Academy of Science

Cytuj jako

Pełna treść

pełna treść publikacji nie jest dostępna w portalu

Słowa kluczowe

Informacje szczegółowe

Kategoria:
Aktywność konferencyjna
Typ:
materiały konferencyjne indeksowane w Web of Science
Język:
angielski
Rok wydania:
2021
Opis bibliograficzny:
Czechowski K., Januszewski P., Kozakowski P., Kuciński Ł., Miłoś P..: Structure and Randomness in Planning and Reinforcement Learning, W: , 2021, ,.
DOI:
Cyfrowy identyfikator dokumentu elektronicznego (otwiera się w nowej karcie) 10.1109/ijcnn52387.2021.9533317
Źródła finansowania:
  • Polish National Science Center grant UMO-2017/26/E/ST6/00622
Weryfikacja:
Politechnika Gdańska

wyświetlono 97 razy

Publikacje, które mogą cię zainteresować

Meta Tagi