From 0b0c517bf4212aa7d12c8acbc3aacaa0fe1d5994 Mon Sep 17 00:00:00 2001
From: Kaiyu Zheng <kzheng@theaiinstitute.com>
Date: Tue, 12 Mar 2024 19:22:24 -0400
Subject: [PATCH] docs

---
 docs/_sphinx_src/api/modules.rst              |   1 +
 .../api/pomdp_py.problems.lasertag.rst        |  10 -
 .../api/pomdp_py.problems.light_dark.rst      |   2 +
 .../api/pomdp_py.problems.load_unload.rst     |   2 +
 .../api/pomdp_py.problems.maze.rst            |   2 +
 .../pomdp_py.problems.multi_object_search.rst |   2 +
 .../api/pomdp_py.problems.rocksample.rst      |   2 +
 .../api/pomdp_py.problems.tiger.rst           |   2 +
 docs/_sphinx_src/building_docs.rst            |   6 +-
 docs/_sphinx_src/index.rst                    |   2 -
 docs/_sphinx_src/simple_rl_integration.rst    |   6 -
 docs/html/_modules/index.html                 |  16 +-
 .../pomdp_py/algorithms/bsp/blqr.html         |  22 +-
 .../pomdp_py/problems/light_dark/env/env.html |  10 +-
 .../problems/light_dark/env/plotting.html     | 261 ++++++
 .../problems/load_unload/load_unload.html     | 535 ++++++++++++
 .../problems/maze/domain/observation.html     |  10 +-
 .../pomdp_py/problems/maze/domain/state.html  |  10 +-
 .../pomdp_py/problems/maze/env/env.html       |  10 +-
 .../multi_object_search/agent/agent.html      |  10 +-
 .../multi_object_search/agent/belief.html     |  10 +-
 .../multi_object_search/domain/action.html    |  14 +-
 .../domain/observation.html                   |  10 +-
 .../multi_object_search/domain/state.html     |  10 +-
 .../problems/multi_object_search/env/env.html |  10 +-
 .../multi_object_search/env/visual.html       | 532 ++++++++++++
 .../multi_object_search/example_worlds.html   |  10 +-
 .../models/components/grid_map.html           |  10 +-
 .../models/components/sensor.html             |  10 +-
 .../models/observation_model.html             |  10 +-
 .../models/policy_model.html                  |  18 +-
 .../models/reward_model.html                  |  10 +-
 .../models/transition_model.html              |  10 +-
 .../problems/multi_object_search/problem.html | 510 +++++++++++
 .../rocksample/rocksample_problem.html        |  89 +-
 .../pomdp_py/problems/tag/agent/agent.html    |  10 +-
 .../pomdp_py/problems/tag/domain/action.html  |  10 +-
 .../problems/tag/domain/observation.html      |  10 +-
 .../pomdp_py/problems/tag/domain/state.html   |  10 +-
 .../pomdp_py/problems/tag/env/env.html        | 193 +++++
 .../pomdp_py/problems/tag/env/visual.html     | 438 ++++++++++
 .../pomdp_py/problems/tag/experiment.html     | 187 ++++
 .../tag/models/components/grid_map.html       |  10 +-
 .../tag/models/components/motion_policy.html  |  10 +-
 .../tag/models/observation_model.html         |  10 +-
 .../problems/tag/models/policy_model.html     |  10 +-
 .../problems/tag/models/reward_model.html     |  10 +-
 .../problems/tag/models/transition_model.html |  10 +-
 .../pomdp_py/problems/tag/problem.html        | 319 +++++++
 .../problems/tiger/tiger_problem.html         |  10 +-
 .../representations/belief/histogram.html     |  10 +-
 docs/html/_modules/pomdp_py/utils/colors.html |  10 +-
 .../_modules/pomdp_py/utils/debugging.html    |  50 +-
 .../pomdp_py/utils/interfaces/conversion.html |  10 +-
 .../pomdp_py/utils/interfaces/solvers.html    |  10 +-
 docs/html/_modules/pomdp_py/utils/math.html   |  10 +-
 docs/html/_modules/pomdp_py/utils/misc.html   |  10 +-
 .../_modules/pomdp_py/utils/templates.html    |  10 +-
 docs/html/_modules/pomdp_py/utils/typ.html    |  10 +-
 .../problems/load_unload/load_unload.html     | 535 ++++++++++++
 .../problems/maze/domain/observation.html     | 171 ++++
 .../_modules/problems/maze/domain/state.html  | 179 ++++
 docs/html/_modules/problems/maze/env/env.html | 149 ++++
 .../multi_object_search/agent/agent.html      | 214 +++++
 .../multi_object_search/agent/belief.html     | 352 ++++++++
 .../multi_object_search/domain/action.html    | 327 +++++++
 .../domain/observation.html                   | 248 ++++++
 .../multi_object_search/domain/state.html     | 255 ++++++
 .../problems/multi_object_search/env/env.html | 412 +++++++++
 .../multi_object_search/env/visual.html       | 532 ++++++++++++
 .../multi_object_search/example_worlds.html   | 263 ++++++
 .../models/components/grid_map.html           | 206 +++++
 .../models/components/sensor.html             | 420 +++++++++
 .../models/observation_model.html             | 442 ++++++++++
 .../models/policy_model.html                  | 208 +++++
 .../models/reward_model.html                  | 231 +++++
 .../models/transition_model.html              | 386 +++++++++
 .../problems/multi_object_search/problem.html | 510 +++++++++++
 .../rocksample/rocksample_problem.html        | 810 ++++++++++++++++++
 .../_modules/problems/tag/agent/agent.html    | 281 ++++++
 .../_modules/problems/tag/domain/action.html  | 166 ++++
 .../problems/tag/domain/observation.html      | 168 ++++
 .../_modules/problems/tag/domain/state.html   | 186 ++++
 docs/html/_modules/problems/tag/env/env.html  | 193 +++++
 .../_modules/problems/tag/env/visual.html     | 438 ++++++++++
 .../_modules/problems/tag/experiment.html     | 187 ++++
 .../tag/models/components/grid_map.html       | 207 +++++
 .../tag/models/components/motion_policy.html  | 249 ++++++
 .../tag/models/observation_model.html         | 186 ++++
 .../problems/tag/models/policy_model.html     | 176 ++++
 .../problems/tag/models/reward_model.html     | 180 ++++
 .../problems/tag/models/transition_model.html | 245 ++++++
 docs/html/_modules/problems/tag/problem.html  | 319 +++++++
 .../problems/tiger/tiger_problem.html         | 589 +++++++++++++
 docs/html/_sources/api/modules.rst.txt        |   1 +
 .../api/pomdp_py.problems.light_dark.rst.txt  |   2 +
 .../api/pomdp_py.problems.load_unload.rst.txt |   2 +
 .../api/pomdp_py.problems.maze.rst.txt        |   2 +
 ...dp_py.problems.multi_object_search.rst.txt |   2 +
 .../api/pomdp_py.problems.rocksample.rst.txt  |   2 +
 .../api/pomdp_py.problems.tiger.rst.txt       |   2 +
 docs/html/_sources/building_docs.rst.txt      |   6 +-
 docs/html/_sources/changelog.rst.txt          |  26 +
 docs/html/_sources/index.rst.txt              |   2 -
 docs/html/_sources/problems/modules.rst.txt   |   7 +
 .../problems/problems.lasertag.rst.txt        |  10 +
 .../problems.light_dark.agent.rst.txt         |  21 +
 .../problems.light_dark.domain.rst.txt        |  37 +
 .../problems/problems.light_dark.env.rst.txt  |  37 +
 .../problems.light_dark.models.rst.txt        |  29 +
 .../problems/problems.light_dark.rst.txt      |  40 +
 .../problems/problems.load_unload.rst.txt     |  21 +
 .../problems/problems.maze.domain.rst.txt     |  37 +
 .../problems/problems.maze.env.rst.txt        |  21 +
 .../problems.maze.models.components.rst.txt   |  21 +
 .../problems/problems.maze.models.rst.txt     |  18 +
 .../_sources/problems/problems.maze.rst.txt   |  20 +
 ...problems.multi_object_search.agent.rst.txt |  29 +
 ...roblems.multi_object_search.domain.rst.txt |  37 +
 .../problems.multi_object_search.env.rst.txt  |  29 +
 ...ti_object_search.models.components.rst.txt |  29 +
 ...roblems.multi_object_search.models.rst.txt |  53 ++
 .../problems.multi_object_search.rst.txt      |  40 +
 .../problems.rocksample.cythonize.rst.txt     |  37 +
 .../problems/problems.rocksample.rst.txt      |  29 +
 docs/html/_sources/problems/problems.rst.txt  |  25 +
 .../problems/problems.tag.agent.rst.txt       |  21 +
 .../problems/problems.tag.domain.rst.txt      |  37 +
 .../problems/problems.tag.env.rst.txt         |  29 +
 .../problems.tag.models.components.rst.txt    |  29 +
 .../problems/problems.tag.models.rst.txt      |  53 ++
 .../_sources/problems/problems.tag.rst.txt    |  56 ++
 .../problems/problems.tiger.cythonize.rst.txt |  37 +
 .../_sources/problems/problems.tiger.rst.txt  |  29 +
 docs/html/_static/documentation_options.js    |   2 +-
 docs/html/_static/pygments.css                |   1 -
 docs/html/api/modules.html                    |  79 +-
 docs/html/api/pomdp_py.algorithms.bsp.html    |  10 +-
 docs/html/api/pomdp_py.algorithms.html        |  47 +-
 docs/html/api/pomdp_py.algorithms.visual.html |   8 +-
 docs/html/api/pomdp_py.framework.html         |  53 +-
 docs/html/api/pomdp_py.html                   |  23 +-
 docs/html/api/pomdp_py.problems.html          | 117 ++-
 docs/html/api/pomdp_py.problems.lasertag.html |  10 +-
 .../pomdp_py.problems.light_dark.agent.html   |  30 +-
 .../pomdp_py.problems.light_dark.domain.html  |  30 +-
 .../api/pomdp_py.problems.light_dark.env.html |  68 +-
 .../api/pomdp_py.problems.light_dark.html     |  55 +-
 .../pomdp_py.problems.light_dark.models.html  |  30 +-
 .../api/pomdp_py.problems.load_unload.html    | 375 +++++++-
 .../api/pomdp_py.problems.maze.domain.html    |  10 +-
 docs/html/api/pomdp_py.problems.maze.env.html |  10 +-
 docs/html/api/pomdp_py.problems.maze.html     |  57 +-
 ...dp_py.problems.maze.models.components.html |  32 +-
 .../api/pomdp_py.problems.maze.models.html    |  30 +-
 ...py.problems.multi_object_search.agent.html |  10 +-
 ...y.problems.multi_object_search.domain.html |  10 +-
 ...p_py.problems.multi_object_search.env.html | 135 ++-
 ...pomdp_py.problems.multi_object_search.html | 121 ++-
 ...multi_object_search.models.components.html |  10 +-
 ...y.problems.multi_object_search.models.html |  10 +-
 ...omdp_py.problems.rocksample.cythonize.html |  30 +-
 .../api/pomdp_py.problems.rocksample.html     |  62 +-
 .../html/api/pomdp_py.problems.tag.agent.html |  10 +-
 .../api/pomdp_py.problems.tag.domain.html     |  10 +-
 docs/html/api/pomdp_py.problems.tag.env.html  | 162 +++-
 docs/html/api/pomdp_py.problems.tag.html      |  90 +-
 ...mdp_py.problems.tag.models.components.html |  10 +-
 .../api/pomdp_py.problems.tag.models.html     |  10 +-
 .../pomdp_py.problems.tiger.cythonize.html    |  36 +-
 docs/html/api/pomdp_py.problems.tiger.html    |  39 +-
 .../api/pomdp_py.representations.belief.html  |  10 +-
 ...pomdp_py.representations.distribution.html |  20 +-
 docs/html/api/pomdp_py.representations.html   |  11 +-
 docs/html/api/pomdp_py.utils.debugging.html   |  10 +-
 docs/html/api/pomdp_py.utils.html             |  11 +-
 docs/html/api/pomdp_py.utils.interfaces.html  |  11 +-
 docs/html/api/pomdp_py.visual.html            |   8 +-
 docs/html/building_docs.html                  |  17 +-
 docs/html/changelog.html                      |  37 +-
 docs/html/design_principles.html              |  10 +-
 docs/html/examples.action_prior.html          |  16 +-
 docs/html/examples.external_solvers.html      |  10 +-
 docs/html/examples.html                       |  10 +-
 docs/html/examples.mos.html                   |  14 +-
 docs/html/examples.tiger.html                 |  10 +-
 docs/html/existing_domains.html               |  21 +-
 docs/html/existing_solvers.html               |  16 +-
 docs/html/extensions.html                     |  10 +-
 docs/html/genindex.html                       | 351 +++++++-
 docs/html/index.html                          |  16 +-
 docs/html/installation.html                   |  10 +-
 docs/html/modules.html                        |  10 +-
 docs/html/objects.inv                         | Bin 6481 -> 7092 bytes
 docs/html/other_libraries.html                |  10 +-
 docs/html/problems/modules.html               | 217 +++++
 docs/html/problems/problems.html              | 526 ++++++++++++
 docs/html/problems/problems.lasertag.html     | 172 ++++
 .../problems/problems.light_dark.agent.html   | 182 ++++
 .../problems/problems.light_dark.domain.html  | 190 ++++
 .../problems/problems.light_dark.env.html     | 190 ++++
 docs/html/problems/problems.light_dark.html   | 221 +++++
 .../problems/problems.light_dark.models.html  | 186 ++++
 docs/html/problems/problems.load_unload.html  | 500 +++++++++++
 docs/html/problems/problems.maze.domain.html  | 211 +++++
 docs/html/problems/problems.maze.env.html     | 191 +++++
 docs/html/problems/problems.maze.html         | 234 +++++
 .../problems.maze.models.components.html      | 184 ++++
 docs/html/problems/problems.maze.models.html  | 188 ++++
 .../problems.multi_object_search.agent.html   | 265 ++++++
 .../problems.multi_object_search.domain.html  | 485 +++++++++++
 .../problems.multi_object_search.env.html     | 460 ++++++++++
 .../problems.multi_object_search.html         | 450 ++++++++++
 ...multi_object_search.models.components.html | 349 ++++++++
 .../problems.multi_object_search.models.html  | 621 ++++++++++++++
 .../problems.rocksample.cythonize.html        | 249 ++++++
 docs/html/problems/problems.rocksample.html   | 657 ++++++++++++++
 docs/html/problems/problems.tag.agent.html    | 238 +++++
 docs/html/problems/problems.tag.domain.html   | 229 +++++
 docs/html/problems/problems.tag.env.html      | 327 +++++++
 docs/html/problems/problems.tag.html          | 355 ++++++++
 .../problems.tag.models.components.html       | 253 ++++++
 docs/html/problems/problems.tag.models.html   | 454 ++++++++++
 .../problems/problems.tiger.cythonize.html    | 248 ++++++
 docs/html/problems/problems.tiger.html        | 512 +++++++++++
 docs/html/py-modindex.html                    |  49 +-
 docs/html/search.html                         |   8 +-
 docs/html/searchindex.js                      |   2 +-
 228 files changed, 26569 insertions(+), 661 deletions(-)
 delete mode 100644 docs/_sphinx_src/api/pomdp_py.problems.lasertag.rst
 delete mode 100644 docs/_sphinx_src/simple_rl_integration.rst
 create mode 100644 docs/html/_modules/pomdp_py/problems/light_dark/env/plotting.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/load_unload/load_unload.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/multi_object_search/env/visual.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/multi_object_search/problem.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/tag/env/env.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/tag/env/visual.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/tag/experiment.html
 create mode 100644 docs/html/_modules/pomdp_py/problems/tag/problem.html
 create mode 100644 docs/html/_modules/problems/load_unload/load_unload.html
 create mode 100644 docs/html/_modules/problems/maze/domain/observation.html
 create mode 100644 docs/html/_modules/problems/maze/domain/state.html
 create mode 100644 docs/html/_modules/problems/maze/env/env.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/agent/agent.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/agent/belief.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/domain/action.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/domain/observation.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/domain/state.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/env/env.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/env/visual.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/example_worlds.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/models/components/grid_map.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/models/components/sensor.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/models/observation_model.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/models/policy_model.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/models/reward_model.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/models/transition_model.html
 create mode 100644 docs/html/_modules/problems/multi_object_search/problem.html
 create mode 100644 docs/html/_modules/problems/rocksample/rocksample_problem.html
 create mode 100644 docs/html/_modules/problems/tag/agent/agent.html
 create mode 100644 docs/html/_modules/problems/tag/domain/action.html
 create mode 100644 docs/html/_modules/problems/tag/domain/observation.html
 create mode 100644 docs/html/_modules/problems/tag/domain/state.html
 create mode 100644 docs/html/_modules/problems/tag/env/env.html
 create mode 100644 docs/html/_modules/problems/tag/env/visual.html
 create mode 100644 docs/html/_modules/problems/tag/experiment.html
 create mode 100644 docs/html/_modules/problems/tag/models/components/grid_map.html
 create mode 100644 docs/html/_modules/problems/tag/models/components/motion_policy.html
 create mode 100644 docs/html/_modules/problems/tag/models/observation_model.html
 create mode 100644 docs/html/_modules/problems/tag/models/policy_model.html
 create mode 100644 docs/html/_modules/problems/tag/models/reward_model.html
 create mode 100644 docs/html/_modules/problems/tag/models/transition_model.html
 create mode 100644 docs/html/_modules/problems/tag/problem.html
 create mode 100644 docs/html/_modules/problems/tiger/tiger_problem.html
 create mode 100644 docs/html/_sources/problems/modules.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.lasertag.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.light_dark.agent.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.light_dark.domain.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.light_dark.env.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.light_dark.models.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.light_dark.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.load_unload.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.maze.domain.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.maze.env.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.maze.models.components.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.maze.models.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.maze.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.multi_object_search.agent.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.multi_object_search.domain.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.multi_object_search.env.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.multi_object_search.models.components.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.multi_object_search.models.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.multi_object_search.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.rocksample.cythonize.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.rocksample.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tag.agent.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tag.domain.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tag.env.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tag.models.components.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tag.models.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tag.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tiger.cythonize.rst.txt
 create mode 100644 docs/html/_sources/problems/problems.tiger.rst.txt
 create mode 100644 docs/html/problems/modules.html
 create mode 100644 docs/html/problems/problems.html
 create mode 100644 docs/html/problems/problems.lasertag.html
 create mode 100644 docs/html/problems/problems.light_dark.agent.html
 create mode 100644 docs/html/problems/problems.light_dark.domain.html
 create mode 100644 docs/html/problems/problems.light_dark.env.html
 create mode 100644 docs/html/problems/problems.light_dark.html
 create mode 100644 docs/html/problems/problems.light_dark.models.html
 create mode 100644 docs/html/problems/problems.load_unload.html
 create mode 100644 docs/html/problems/problems.maze.domain.html
 create mode 100644 docs/html/problems/problems.maze.env.html
 create mode 100644 docs/html/problems/problems.maze.html
 create mode 100644 docs/html/problems/problems.maze.models.components.html
 create mode 100644 docs/html/problems/problems.maze.models.html
 create mode 100644 docs/html/problems/problems.multi_object_search.agent.html
 create mode 100644 docs/html/problems/problems.multi_object_search.domain.html
 create mode 100644 docs/html/problems/problems.multi_object_search.env.html
 create mode 100644 docs/html/problems/problems.multi_object_search.html
 create mode 100644 docs/html/problems/problems.multi_object_search.models.components.html
 create mode 100644 docs/html/problems/problems.multi_object_search.models.html
 create mode 100644 docs/html/problems/problems.rocksample.cythonize.html
 create mode 100644 docs/html/problems/problems.rocksample.html
 create mode 100644 docs/html/problems/problems.tag.agent.html
 create mode 100644 docs/html/problems/problems.tag.domain.html
 create mode 100644 docs/html/problems/problems.tag.env.html
 create mode 100644 docs/html/problems/problems.tag.html
 create mode 100644 docs/html/problems/problems.tag.models.components.html
 create mode 100644 docs/html/problems/problems.tag.models.html
 create mode 100644 docs/html/problems/problems.tiger.cythonize.html
 create mode 100644 docs/html/problems/problems.tiger.html

diff --git a/docs/_sphinx_src/api/modules.rst b/docs/_sphinx_src/api/modules.rst
index a7d235a8..7d2b9ddd 100644
--- a/docs/_sphinx_src/api/modules.rst
+++ b/docs/_sphinx_src/api/modules.rst
@@ -5,3 +5,4 @@ pomdp_py
    :maxdepth: 4
 
    pomdp_py
+   pomdp_py.problems
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.lasertag.rst b/docs/_sphinx_src/api/pomdp_py.problems.lasertag.rst
deleted file mode 100644
index 1c5004c3..00000000
--- a/docs/_sphinx_src/api/pomdp_py.problems.lasertag.rst
+++ /dev/null
@@ -1,10 +0,0 @@
-pomdp\_py.problems.lasertag package
-===================================
-
-Module contents
----------------
-
-.. automodule:: pomdp_py.problems.lasertag
-   :members:
-   :undoc-members:
-   :show-inheritance:
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.light_dark.rst b/docs/_sphinx_src/api/pomdp_py.problems.light_dark.rst
index 3dc382ef..e11f5d4a 100644
--- a/docs/_sphinx_src/api/pomdp_py.problems.light_dark.rst
+++ b/docs/_sphinx_src/api/pomdp_py.problems.light_dark.rst
@@ -1,6 +1,8 @@
 pomdp\_py.problems.light\_dark package
 ======================================
 
+.. include:: ../../../pomdp_py/problems/light_dark/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.load_unload.rst b/docs/_sphinx_src/api/pomdp_py.problems.load_unload.rst
index 0c600479..bf357ffa 100644
--- a/docs/_sphinx_src/api/pomdp_py.problems.load_unload.rst
+++ b/docs/_sphinx_src/api/pomdp_py.problems.load_unload.rst
@@ -1,6 +1,8 @@
 pomdp\_py.problems.load\_unload package
 =======================================
 
+.. include:: ../../../pomdp_py/problems/load_unload/README.rst
+
 Submodules
 ----------
 
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.maze.rst b/docs/_sphinx_src/api/pomdp_py.problems.maze.rst
index b30ee522..f780b7f6 100644
--- a/docs/_sphinx_src/api/pomdp_py.problems.maze.rst
+++ b/docs/_sphinx_src/api/pomdp_py.problems.maze.rst
@@ -1,6 +1,8 @@
 pomdp\_py.problems.maze package
 ===============================
 
+.. include:: ../../../pomdp_py/problems/maze/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.multi_object_search.rst b/docs/_sphinx_src/api/pomdp_py.problems.multi_object_search.rst
index 229f9e56..2d03418d 100644
--- a/docs/_sphinx_src/api/pomdp_py.problems.multi_object_search.rst
+++ b/docs/_sphinx_src/api/pomdp_py.problems.multi_object_search.rst
@@ -1,6 +1,8 @@
 pomdp\_py.problems.multi\_object\_search package
 ================================================
 
+.. include:: ../../../pomdp_py/problems/multi_object_search/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.rocksample.rst b/docs/_sphinx_src/api/pomdp_py.problems.rocksample.rst
index 81374a6d..00764146 100644
--- a/docs/_sphinx_src/api/pomdp_py.problems.rocksample.rst
+++ b/docs/_sphinx_src/api/pomdp_py.problems.rocksample.rst
@@ -1,6 +1,8 @@
 pomdp\_py.problems.rocksample package
 =====================================
 
+.. include:: ../../../pomdp_py/problems/rocksample/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/_sphinx_src/api/pomdp_py.problems.tiger.rst b/docs/_sphinx_src/api/pomdp_py.problems.tiger.rst
index ada2838a..c2e06ded 100644
--- a/docs/_sphinx_src/api/pomdp_py.problems.tiger.rst
+++ b/docs/_sphinx_src/api/pomdp_py.problems.tiger.rst
@@ -1,6 +1,8 @@
 pomdp\_py.problems.tiger package
 ================================
 
+.. include:: ../../../pomdp_py/problems/tiger/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/_sphinx_src/building_docs.rst b/docs/_sphinx_src/building_docs.rst
index 9367fd1c..5efe5c8e 100644
--- a/docs/_sphinx_src/building_docs.rst
+++ b/docs/_sphinx_src/building_docs.rst
@@ -44,7 +44,7 @@ Building docs for `pomdp_py.problems`
 
 2. Building docs for `pomdp_py`. Run :code:`sphinx-apidoc`::
 
-    sphinx-apidoc -o problems/ ../../pomdp_py.problems
+    sphinx-apidoc -o problems/ ../../pomdp_py/problems
 
 3. Generate web pages::
 
@@ -54,13 +54,13 @@ Building docs for `pomdp_py.problems`
 
 Note that when creating the documentation for a problem under :code:`pomdp_py.problems`,
 you may want to re-use the README file on github for the documentation. To do that,
-first create a read-me file at :code:`pomdp_py.problems/<problem>/README.rst` with desirable
+first create a read-me file at :code:`pomdp_py/problems/<problem>/README.rst` with desirable
 content that describes the problem. Then, include this read-me file at the top of the
 generated :code:`pomdp_py.problems.<problem>.rst`, like so:
 
 .. code-block::
 
-   .. include:: ../../../pomdp_py.problems/<problem>/README.rst
+   .. include:: ../../../pomdp_py/problems/<problem>/README.rst
 
 
 Note on Changelog
diff --git a/docs/_sphinx_src/index.rst b/docs/_sphinx_src/index.rst
index 8601b6b1..b2979662 100644
--- a/docs/_sphinx_src/index.rst
+++ b/docs/_sphinx_src/index.rst
@@ -40,7 +40,6 @@ Further
 * :doc:`extensions`
 * :doc:`other_libraries`
 * :doc:`building_docs`
-* :doc:`simple_rl_integration`
 
 .. toctree::
    :maxdepth: 2
@@ -76,7 +75,6 @@ API References
    :caption: API References
 
    api/modules
-   problems/modules
 
 Tools
 -----
diff --git a/docs/_sphinx_src/simple_rl_integration.rst b/docs/_sphinx_src/simple_rl_integration.rst
deleted file mode 100644
index c505ce89..00000000
--- a/docs/_sphinx_src/simple_rl_integration.rst
+++ /dev/null
@@ -1,6 +0,0 @@
-Integration with `simple_rl`
-============================
-
-.. include:: api/pomdp_py.utils.interfaces.rst
-
-
diff --git a/docs/html/_modules/index.html b/docs/html/_modules/index.html
index 9d9cb1c2..7858432c 100644
--- a/docs/html/_modules/index.html
+++ b/docs/html/_modules/index.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>Overview: module code &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>Overview: module code &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -122,6 +122,8 @@ <h1>All modules for which code is available</h1>
 <li><a href="pomdp_py/framework/oopomdp.html">pomdp_py.framework.oopomdp</a></li>
 <li><a href="pomdp_py/framework/planner.html">pomdp_py.framework.planner</a></li>
 <li><a href="pomdp_py/problems/light_dark/env/env.html">pomdp_py.problems.light_dark.env.env</a></li>
+<li><a href="pomdp_py/problems/light_dark/env/plotting.html">pomdp_py.problems.light_dark.env.plotting</a></li>
+<li><a href="pomdp_py/problems/load_unload/load_unload.html">pomdp_py.problems.load_unload.load_unload</a></li>
 <li><a href="pomdp_py/problems/maze/domain/observation.html">pomdp_py.problems.maze.domain.observation</a></li>
 <li><a href="pomdp_py/problems/maze/domain/state.html">pomdp_py.problems.maze.domain.state</a></li>
 <li><a href="pomdp_py/problems/maze/env/env.html">pomdp_py.problems.maze.env.env</a></li>
@@ -131,6 +133,7 @@ <h1>All modules for which code is available</h1>
 <li><a href="pomdp_py/problems/multi_object_search/domain/observation.html">pomdp_py.problems.multi_object_search.domain.observation</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/domain/state.html">pomdp_py.problems.multi_object_search.domain.state</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/env/env.html">pomdp_py.problems.multi_object_search.env.env</a></li>
+<li><a href="pomdp_py/problems/multi_object_search/env/visual.html">pomdp_py.problems.multi_object_search.env.visual</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/example_worlds.html">pomdp_py.problems.multi_object_search.example_worlds</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/models/components/grid_map.html">pomdp_py.problems.multi_object_search.models.components.grid_map</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/models/components/sensor.html">pomdp_py.problems.multi_object_search.models.components.sensor</a></li>
@@ -138,18 +141,23 @@ <h1>All modules for which code is available</h1>
 <li><a href="pomdp_py/problems/multi_object_search/models/policy_model.html">pomdp_py.problems.multi_object_search.models.policy_model</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/models/reward_model.html">pomdp_py.problems.multi_object_search.models.reward_model</a></li>
 <li><a href="pomdp_py/problems/multi_object_search/models/transition_model.html">pomdp_py.problems.multi_object_search.models.transition_model</a></li>
+<li><a href="pomdp_py/problems/multi_object_search/problem.html">pomdp_py.problems.multi_object_search.problem</a></li>
 <li><a href="pomdp_py/problems/rocksample/cythonize/rocksample_problem.html">pomdp_py.problems.rocksample.cythonize.rocksample_problem</a></li>
 <li><a href="pomdp_py/problems/rocksample/rocksample_problem.html">pomdp_py.problems.rocksample.rocksample_problem</a></li>
 <li><a href="pomdp_py/problems/tag/agent/agent.html">pomdp_py.problems.tag.agent.agent</a></li>
 <li><a href="pomdp_py/problems/tag/domain/action.html">pomdp_py.problems.tag.domain.action</a></li>
 <li><a href="pomdp_py/problems/tag/domain/observation.html">pomdp_py.problems.tag.domain.observation</a></li>
 <li><a href="pomdp_py/problems/tag/domain/state.html">pomdp_py.problems.tag.domain.state</a></li>
+<li><a href="pomdp_py/problems/tag/env/env.html">pomdp_py.problems.tag.env.env</a></li>
+<li><a href="pomdp_py/problems/tag/env/visual.html">pomdp_py.problems.tag.env.visual</a></li>
+<li><a href="pomdp_py/problems/tag/experiment.html">pomdp_py.problems.tag.experiment</a></li>
 <li><a href="pomdp_py/problems/tag/models/components/grid_map.html">pomdp_py.problems.tag.models.components.grid_map</a></li>
 <li><a href="pomdp_py/problems/tag/models/components/motion_policy.html">pomdp_py.problems.tag.models.components.motion_policy</a></li>
 <li><a href="pomdp_py/problems/tag/models/observation_model.html">pomdp_py.problems.tag.models.observation_model</a></li>
 <li><a href="pomdp_py/problems/tag/models/policy_model.html">pomdp_py.problems.tag.models.policy_model</a></li>
 <li><a href="pomdp_py/problems/tag/models/reward_model.html">pomdp_py.problems.tag.models.reward_model</a></li>
 <li><a href="pomdp_py/problems/tag/models/transition_model.html">pomdp_py.problems.tag.models.transition_model</a></li>
+<li><a href="pomdp_py/problems/tag/problem.html">pomdp_py.problems.tag.problem</a></li>
 <li><a href="pomdp_py/problems/tiger/cythonize/tiger_problem.html">pomdp_py.problems.tiger.cythonize.tiger_problem</a></li>
 <li><a href="pomdp_py/problems/tiger/tiger_problem.html">pomdp_py.problems.tiger.tiger_problem</a></li>
 <li><a href="pomdp_py/representations/belief/histogram.html">pomdp_py.representations.belief.histogram</a></li>
diff --git a/docs/html/_modules/pomdp_py/algorithms/bsp/blqr.html b/docs/html/_modules/pomdp_py/algorithms/bsp/blqr.html
index 8b3c7a63..750af4e2 100644
--- a/docs/html/_modules/pomdp_py/algorithms/bsp/blqr.html
+++ b/docs/html/_modules/pomdp_py/algorithms/bsp/blqr.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.algorithms.bsp.blqr &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.algorithms.bsp.blqr &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -124,7 +126,7 @@ <h1>Source code for pomdp_py.algorithms.bsp.blqr</h1><div class="highlight"><pre
 
 
 <div class="viewcode-block" id="BLQR">
-<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR">[docs]</a>
+<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR">[docs]</a>
 <span class="k">class</span> <span class="nc">BLQR</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Planner</span><span class="p">):</span>
     <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
         <span class="bp">self</span><span class="p">,</span>
@@ -187,7 +189,7 @@ <h1>Source code for pomdp_py.algorithms.bsp.blqr</h1><div class="highlight"><pre
         <span class="bp">self</span><span class="o">.</span><span class="n">_dim_control</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_R</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
 
 <div class="viewcode-block" id="BLQR.ekf_update_mlo">
-<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.ekf_update_mlo">[docs]</a>
+<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.ekf_update_mlo">[docs]</a>
     <span class="k">def</span> <span class="nf">ekf_update_mlo</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bt</span><span class="p">,</span> <span class="n">ut</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">        Performs the ekf belief update assuming maximum likelihood observation.</span>
@@ -261,7 +263,7 @@ <h1>Source code for pomdp_py.algorithms.bsp.blqr</h1><div class="highlight"><pre
         <span class="k">return</span> <span class="n">b_i_vec</span> <span class="o">-</span> <span class="n">b_ip1_vec</span>
 
 <div class="viewcode-block" id="BLQR.integrate_belief_segment">
-<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.integrate_belief_segment">[docs]</a>
+<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.integrate_belief_segment">[docs]</a>
     <span class="k">def</span> <span class="nf">integrate_belief_segment</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">b_i</span><span class="p">,</span> <span class="n">u_i</span><span class="p">,</span> <span class="n">num_segments</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;This is to represent equation 18.</span>
 
@@ -300,7 +302,7 @@ <h1>Source code for pomdp_py.algorithms.bsp.blqr</h1><div class="highlight"><pre
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">segmented_cost_function</span><span class="p">(</span><span class="n">bu_traj</span><span class="p">,</span> <span class="n">b_des</span><span class="p">,</span> <span class="n">u_des</span><span class="p">,</span> <span class="n">num_segments</span><span class="p">)</span>
 
 <div class="viewcode-block" id="BLQR.segmented_cost_function">
-<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.segmented_cost_function">[docs]</a>
+<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.segmented_cost_function">[docs]</a>
     <span class="k">def</span> <span class="nf">segmented_cost_function</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">bu_traj</span><span class="p">,</span> <span class="n">b_des</span><span class="p">,</span> <span class="n">u_des</span><span class="p">,</span> <span class="n">num_segments</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;The cost function in eq 17.</span>
 
@@ -339,7 +341,7 @@ <h1>Source code for pomdp_py.algorithms.bsp.blqr</h1><div class="highlight"><pre
 
 
 <div class="viewcode-block" id="BLQR.create_plan">
-<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.create_plan">[docs]</a>
+<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.create_plan">[docs]</a>
     <span class="k">def</span> <span class="nf">create_plan</span><span class="p">(</span>
         <span class="bp">self</span><span class="p">,</span>
         <span class="n">b_0</span><span class="p">,</span>
@@ -422,7 +424,7 @@ <h1>Source code for pomdp_py.algorithms.bsp.blqr</h1><div class="highlight"><pre
 
 
 <div class="viewcode-block" id="BLQR.interpret_sqp_plan">
-<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.interpret_sqp_plan">[docs]</a>
+<a class="viewcode-back" href="../../../../api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.interpret_sqp_plan">[docs]</a>
     <span class="k">def</span> <span class="nf">interpret_sqp_plan</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">opt_res</span><span class="p">,</span> <span class="n">num_segments</span><span class="p">):</span>
         <span class="n">x_res</span> <span class="o">=</span> <span class="n">opt_res</span><span class="o">.</span><span class="n">x</span>
         <span class="n">plan</span> <span class="o">=</span> <span class="p">[]</span>
diff --git a/docs/html/_modules/pomdp_py/problems/light_dark/env/env.html b/docs/html/_modules/pomdp_py/problems/light_dark/env/env.html
index 563f8e94..81cbe0d1 100644
--- a/docs/html/_modules/pomdp_py/problems/light_dark/env/env.html
+++ b/docs/html/_modules/pomdp_py/problems/light_dark/env/env.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.light_dark.env.env &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.light_dark.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/light_dark/env/plotting.html b/docs/html/_modules/pomdp_py/problems/light_dark/env/plotting.html
new file mode 100644
index 00000000..52445873
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/light_dark/env/plotting.html
@@ -0,0 +1,261 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.light_dark.env.plotting &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.light_dark.env.plotting</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Plotting utilties&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
+
+
+<div class="viewcode-block" id="plot_points">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_points">[docs]</a>
+<span class="k">def</span> <span class="nf">plot_points</span><span class="p">(</span>
+    <span class="n">xvals</span><span class="p">,</span>
+    <span class="n">yvals</span><span class="p">,</span>
+    <span class="n">color</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="n">size</span><span class="o">=</span><span class="mf">1.5</span><span class="p">,</span>
+    <span class="n">label</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="n">connected</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">style</span><span class="o">=</span><span class="s2">&quot;--&quot;</span><span class="p">,</span>
+    <span class="n">linewidth</span><span class="o">=</span><span class="mf">1.5</span><span class="p">,</span>
+    <span class="n">xlabel</span><span class="o">=</span><span class="s2">&quot;x&quot;</span><span class="p">,</span>
+    <span class="n">ylabel</span><span class="o">=</span><span class="s2">&quot;f(x)&quot;</span><span class="p">,</span>
+    <span class="n">loc</span><span class="o">=</span><span class="s2">&quot;lower right&quot;</span><span class="p">,</span>
+<span class="p">):</span>
+    <span class="k">if</span> <span class="ow">not</span> <span class="n">connected</span><span class="p">:</span>
+        <span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">xvals</span><span class="p">,</span> <span class="n">yvals</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="n">size</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="n">color</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="n">label</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">xvals</span><span class="p">,</span> <span class="n">yvals</span><span class="p">,</span> <span class="n">style</span><span class="p">,</span> <span class="n">linewidth</span><span class="o">=</span><span class="n">linewidth</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="n">label</span><span class="p">)</span>
+    <span class="c1"># plt.axhline(y=0, color=&#39;k&#39;)</span>
+    <span class="c1"># plt.axvline(x=0, color=&#39;k&#39;)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="n">xlabel</span><span class="p">)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="n">loc</span><span class="p">)</span></div>
+
+
+
+<span class="c1"># Plot polygons with colors</span>
+<div class="viewcode-block" id="plot_polygons">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_polygons">[docs]</a>
+<span class="k">def</span> <span class="nf">plot_polygons</span><span class="p">(</span><span class="n">verts</span><span class="p">,</span> <span class="n">colors</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">edgecolor</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    `verts` is a sequence of ( verts0, verts1, ...) where verts_i is a sequence of</span>
+<span class="sd">    xy tuples of vertices, or an equivalent numpy array of shape (nv, 2).</span>
+
+<span class="sd">    `c` is a sequence of (color0, color1, ...) where color_i is a color,</span>
+<span class="sd">    represented by a hex string (7 characters #xxxxxx).</span>
+
+<span class="sd">    Creates a PolygonCollection object in the axis `ax`.&quot;&quot;&quot;</span>
+    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+        <span class="n">fig</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gcf</span><span class="p">()</span>
+        <span class="n">ax</span> <span class="o">=</span> <span class="n">fig</span><span class="o">.</span><span class="n">add_subplot</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+    <span class="n">pc</span> <span class="o">=</span> <span class="n">PolyCollection</span><span class="p">(</span><span class="n">verts</span><span class="p">)</span>
+    <span class="n">pc</span><span class="o">.</span><span class="n">set_edgecolor</span><span class="p">(</span><span class="n">edgecolor</span><span class="p">)</span>
+    <span class="n">pc</span><span class="o">.</span><span class="n">set_facecolor</span><span class="p">(</span><span class="n">colors</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">add_collection</span><span class="p">(</span><span class="n">pc</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;X axis&quot;</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s2">&quot;Y axis&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="plot_line">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_line">[docs]</a>
+<span class="k">def</span> <span class="nf">plot_line</span><span class="p">(</span>
+    <span class="n">ax</span><span class="p">,</span> <span class="n">p1</span><span class="p">,</span> <span class="n">p2</span><span class="p">,</span> <span class="n">linewidth</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">,</span> <span class="n">zorder</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span> <span class="n">linestyle</span><span class="o">=</span><span class="s2">&quot;-&quot;</span>
+<span class="p">):</span>
+    <span class="n">p1x</span><span class="p">,</span> <span class="n">p1y</span> <span class="o">=</span> <span class="n">p1</span>
+    <span class="n">p2x</span><span class="p">,</span> <span class="n">p2y</span> <span class="o">=</span> <span class="n">p2</span>
+    <span class="n">line</span> <span class="o">=</span> <span class="n">lines</span><span class="o">.</span><span class="n">Line2D</span><span class="p">(</span>
+        <span class="p">[</span><span class="n">p1x</span><span class="p">,</span> <span class="n">p2x</span><span class="p">],</span>
+        <span class="p">[</span><span class="n">p1y</span><span class="p">,</span> <span class="n">p2y</span><span class="p">],</span>
+        <span class="n">linewidth</span><span class="o">=</span><span class="n">linewidth</span><span class="p">,</span>
+        <span class="n">color</span><span class="o">=</span><span class="n">color</span><span class="p">,</span>
+        <span class="n">zorder</span><span class="o">=</span><span class="n">zorder</span><span class="p">,</span>
+        <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">,</span>
+        <span class="n">linestyle</span><span class="o">=</span><span class="n">linestyle</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">add_line</span><span class="p">(</span><span class="n">line</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="plot_circle">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_circle">[docs]</a>
+<span class="k">def</span> <span class="nf">plot_circle</span><span class="p">(</span>
+    <span class="n">ax</span><span class="p">,</span>
+    <span class="n">center</span><span class="p">,</span>
+    <span class="n">radius</span><span class="p">,</span>
+    <span class="n">color</span><span class="o">=</span><span class="s2">&quot;blue&quot;</span><span class="p">,</span>
+    <span class="n">fill</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="n">zorder</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+    <span class="n">linewidth</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+    <span class="n">edgecolor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="n">label_text</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="n">alpha</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+    <span class="n">text_color</span><span class="o">=</span><span class="s2">&quot;white&quot;</span><span class="p">,</span>
+<span class="p">):</span>
+    <span class="n">px</span><span class="p">,</span> <span class="n">py</span> <span class="o">=</span> <span class="n">center</span>
+    <span class="n">circ</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">Circle</span><span class="p">(</span>
+        <span class="p">(</span><span class="n">px</span><span class="p">,</span> <span class="n">py</span><span class="p">),</span>
+        <span class="n">radius</span><span class="p">,</span>
+        <span class="n">facecolor</span><span class="o">=</span><span class="n">color</span><span class="p">,</span>
+        <span class="n">fill</span><span class="o">=</span><span class="n">fill</span><span class="p">,</span>
+        <span class="n">zorder</span><span class="o">=</span><span class="n">zorder</span><span class="p">,</span>
+        <span class="n">linewidth</span><span class="o">=</span><span class="n">linewidth</span><span class="p">,</span>
+        <span class="n">edgecolor</span><span class="o">=</span><span class="n">edgecolor</span><span class="p">,</span>
+        <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">add_artist</span><span class="p">(</span><span class="n">circ</span><span class="p">)</span>
+    <span class="k">if</span> <span class="n">label_text</span><span class="p">:</span>
+        <span class="n">text</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span>
+            <span class="n">px</span><span class="p">,</span>
+            <span class="n">py</span><span class="p">,</span>
+            <span class="n">label_text</span><span class="p">,</span>
+            <span class="n">color</span><span class="o">=</span><span class="n">text_color</span><span class="p">,</span>
+            <span class="n">ha</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span>
+            <span class="n">va</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span>
+            <span class="n">size</span><span class="o">=</span><span class="mi">7</span><span class="p">,</span>
+            <span class="n">weight</span><span class="o">=</span><span class="s2">&quot;bold&quot;</span><span class="p">,</span>
+        <span class="p">)</span>
+        <span class="n">text</span><span class="o">.</span><span class="n">set_path_effects</span><span class="p">(</span>
+            <span class="p">[</span>
+                <span class="n">path_effects</span><span class="o">.</span><span class="n">Stroke</span><span class="p">(</span><span class="n">linewidth</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">foreground</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">),</span>
+                <span class="n">path_effects</span><span class="o">.</span><span class="n">Normal</span><span class="p">(),</span>
+            <span class="p">]</span>
+        <span class="p">)</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/load_unload/load_unload.html b/docs/html/_modules/pomdp_py/problems/load_unload/load_unload.html
new file mode 100644
index 00000000..8cf92a95
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/load_unload/load_unload.html
@@ -0,0 +1,535 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.load_unload.load_unload &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.load_unload.load_unload</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The load unload problem. An agent is placed on a one dimensional grid world</span>
+<span class="sd">and is tasked with loading itself up on the right side of the world and</span>
+<span class="sd">unloading on the left. The agent can observe whether or not it is in the load or</span>
+<span class="sd">unload block but can not tell its exact location of whether it is loaded or</span>
+<span class="sd">unloaded. Therefore the agent must maintain belief about it&#39;s location and load</span>
+<span class="sd">status.</span>
+
+<span class="sd">States are defined by the location of the agent and whether or not it is loaded</span>
+<span class="sd">Actions: &quot;move-left&quot;, &quot;move-right&quot;</span>
+<span class="sd">Rewards:</span>
+<span class="sd">    +100 for moving into the unload block while loaded</span>
+<span class="sd">    -1 otherwise</span>
+
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">sys</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
+<span class="kn">from</span> <span class="nn">matplotlib.animation</span> <span class="kn">import</span> <span class="n">FuncAnimation</span>
+
+
+<span class="n">EPSILON</span> <span class="o">=</span> <span class="mf">1e-3</span>
+<span class="n">LOAD_LOCATION</span> <span class="o">=</span> <span class="mi">10</span>
+
+
+<div class="viewcode-block" id="LUState">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUState">[docs]</a>
+<span class="k">class</span> <span class="nc">LUState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">State</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">loaded</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">int</span> <span class="ow">or</span> <span class="n">x</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Invalid state: </span><span class="si">{}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">x</span><span class="p">,</span> <span class="n">loaded</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;x must be an integer &gt; 0&quot;</span>
+            <span class="p">)</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">loaded</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">bool</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Invalid state: </span><span class="si">{}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">x</span><span class="p">,</span> <span class="n">loaded</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;loaded must be a boolean&quot;</span>
+            <span class="p">)</span>
+        <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">loaded</span> <span class="o">==</span> <span class="kc">True</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Agent can not be loaded in the 0th position&quot;</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span> <span class="ow">and</span> <span class="n">loaded</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Agent can not be unloaded in the last position&quot;</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">x</span> <span class="o">=</span> <span class="n">x</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span> <span class="o">=</span> <span class="n">loaded</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">LUState</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">x</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">tuple</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">other</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span> <span class="o">==</span> <span class="n">other</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;State(</span><span class="si">{}</span><span class="s2">)&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="LUAction">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUAction">[docs]</a>
+<span class="k">class</span> <span class="nc">LUAction</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">name</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="s2">&quot;move-left&quot;</span><span class="p">,</span> <span class="s2">&quot;move-right&quot;</span><span class="p">]:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">name</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">LUAction</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Action(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span></div>
+
+
+
+<div class="viewcode-block" id="LUObservation">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservation">[docs]</a>
+<span class="k">class</span> <span class="nc">LUObservation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">obs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">obs</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="s2">&quot;load&quot;</span><span class="p">,</span> <span class="s2">&quot;unload&quot;</span><span class="p">,</span> <span class="s2">&quot;middle&quot;</span><span class="p">]:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Invalid observation: </span><span class="si">{}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">name</span><span class="p">)</span>
+                <span class="o">+</span> <span class="s2">&quot;Observation must be an integer &gt; 0&quot;</span>
+            <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">obs</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">LUObservation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Observation(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">x</span><span class="p">)</span></div>
+
+
+
+<span class="c1"># Observation model</span>
+<div class="viewcode-block" id="LUObservationModel">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LUObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObservationModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This problem is small enough for the probabilities to be directly given</span>
+<span class="sd">    externally&quot;&quot;&quot;</span>
+
+<div class="viewcode-block" id="LUObservationModel.probability">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">observation</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="c1"># return EPSILON to avoid degradation of particles</span>
+            <span class="k">return</span> <span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="LUObservationModel.sample">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">LUObservation</span><span class="p">(</span><span class="s2">&quot;unload&quot;</span><span class="p">)</span>
+        <span class="k">elif</span> <span class="n">next_state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">LUObservation</span><span class="p">(</span><span class="s2">&quot;load&quot;</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">LUObservation</span><span class="p">(</span><span class="s2">&quot;middle&quot;</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="LUObservationModel.argmax">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely observation&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Transition Model</span>
+<div class="viewcode-block" id="LUTransitionModel">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LUTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This problem is small enough for the probabilities to be directly given</span>
+<span class="sd">    externally&quot;&quot;&quot;</span>
+
+<div class="viewcode-block" id="LUTransitionModel.probability">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_state</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="LUTransitionModel.sample">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span> <span class="ow">and</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-right&quot;</span><span class="p">)</span> <span class="ow">or</span> <span class="p">(</span>
+            <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-left&quot;</span>
+        <span class="p">):</span>
+            <span class="c1"># trying to make invalid move, stay in the same place</span>
+            <span class="k">return</span> <span class="n">state</span>
+
+        <span class="k">if</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-right&quot;</span><span class="p">:</span>
+            <span class="c1"># make sure we&#39;re always loaded in the far right cell</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">loaded</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-left&quot;</span><span class="p">:</span>
+            <span class="c1"># make sure we&#39;re always unloaded in the first cell</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">loaded</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="LUTransitionModel.argmax">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely next state&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Reward Model</span>
+<div class="viewcode-block" id="LURewardModel">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LURewardModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RewardModel</span><span class="p">):</span>
+<div class="viewcode-block" id="LURewardModel.probability">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">reward</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span>
+    <span class="p">):</span>
+        <span class="k">if</span> <span class="n">reward</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="mf">1.0</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">0.0</span></div>
+
+
+<div class="viewcode-block" id="LURewardModel.sample">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="c1"># if we are unloaded things, give reward 100, otherwise give -1</span>
+        <span class="k">if</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-left&quot;</span> <span class="ow">and</span> <span class="n">state</span><span class="o">.</span><span class="n">loaded</span> <span class="o">==</span> <span class="kc">True</span> <span class="ow">and</span> <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">100</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="o">-</span><span class="mi">1</span></div>
+
+
+<div class="viewcode-block" id="LURewardModel.argmax">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely reward&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Policy Model</span>
+<div class="viewcode-block" id="LUPolicyModel">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LUPolicyModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RandomRollout</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This is an extremely dumb policy model; To keep consistent</span>
+<span class="sd">    with the framework.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span> <span class="o">=</span> <span class="p">{</span><span class="n">LUAction</span><span class="p">(</span><span class="s2">&quot;move-right&quot;</span><span class="p">),</span> <span class="n">LUAction</span><span class="p">(</span><span class="s2">&quot;move-left&quot;</span><span class="p">)}</span>
+
+<div class="viewcode-block" id="LUPolicyModel.probability">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span>  <span class="c1"># Never used</span></div>
+
+
+<div class="viewcode-block" id="LUPolicyModel.sample">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">()</span><span class="o">.</span><span class="n">random</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="LUPolicyModel.argmax">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely reward&quot;&quot;&quot;</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="LUPolicyModel.get_all_actions">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="LoadUnloadProblem">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem">[docs]</a>
+<span class="k">class</span> <span class="nc">LoadUnloadProblem</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMDP</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;init_belief is a Distribution.&quot;&quot;&quot;</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">(</span>
+            <span class="n">init_belief</span><span class="p">,</span>
+            <span class="n">LUPolicyModel</span><span class="p">(),</span>
+            <span class="n">LUTransitionModel</span><span class="p">(),</span>
+            <span class="n">LUObservationModel</span><span class="p">(),</span>
+            <span class="n">LURewardModel</span><span class="p">(),</span>
+        <span class="p">)</span>
+
+        <span class="n">env</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">LUTransitionModel</span><span class="p">(),</span> <span class="n">LURewardModel</span><span class="p">())</span>
+
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;LoadUnloadProblem&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="generate_random_state">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.generate_random_state">[docs]</a>
+<span class="k">def</span> <span class="nf">generate_random_state</span><span class="p">():</span>
+    <span class="c1"># Flip a coin to determine if we are loaded</span>
+    <span class="n">loaded</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">rand</span><span class="p">()</span> <span class="o">&gt;</span> <span class="mf">0.5</span>
+    <span class="n">location</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">LOAD_LOCATION</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+    <span class="k">if</span> <span class="n">location</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="n">loaded</span> <span class="o">=</span> <span class="kc">False</span>
+    <span class="k">if</span> <span class="n">location</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span><span class="p">:</span>
+        <span class="n">loaded</span> <span class="o">=</span> <span class="kc">True</span>
+    <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">location</span><span class="p">,</span> <span class="n">loaded</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="generate_init_belief">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.generate_init_belief">[docs]</a>
+<span class="k">def</span> <span class="nf">generate_init_belief</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+    <span class="n">particles</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+        <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">generate_random_state</span><span class="p">())</span>
+
+    <span class="k">return</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="test_planner">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.test_planner">[docs]</a>
+<span class="k">def</span> <span class="nf">test_planner</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="p">,</span> <span class="n">planner</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">discount</span><span class="o">=</span><span class="mf">0.95</span><span class="p">):</span>
+    <span class="n">gamma</span> <span class="o">=</span> <span class="mf">1.0</span>
+    <span class="n">total_reward</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">total_discounted_reward</span> <span class="o">=</span> <span class="mi">0</span>
+
+    <span class="n">fig</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">()</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="s2">&quot;Load/Unload problem (Red = empty, Blue = full)&quot;</span><span class="p">)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;Position&quot;</span><span class="p">)</span>
+
+    <span class="n">ax</span> <span class="o">=</span> <span class="n">fig</span><span class="o">.</span><span class="n">add_subplot</span><span class="p">(</span><span class="mi">111</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlim</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">LOAD_LOCATION</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylim</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
+    <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="p">[],</span> <span class="p">[]</span>
+    <span class="p">(</span><span class="n">scat</span><span class="p">,)</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s2">&quot;x&quot;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">ls</span><span class="o">=</span><span class="s2">&quot; &quot;</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="nf">update</span><span class="p">(</span><span class="n">t</span><span class="p">):</span>
+        <span class="k">nonlocal</span> <span class="n">gamma</span><span class="p">,</span> <span class="n">total_reward</span><span class="p">,</span> <span class="n">total_discounted_reward</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">t</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="n">action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+
+        <span class="n">env_reward</span> <span class="o">=</span> <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+        <span class="n">true_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">action</span>
+        <span class="p">)</span>
+        <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">total_reward</span> <span class="o">+=</span> <span class="n">env_reward</span>
+        <span class="n">total_discounted_reward</span> <span class="o">+=</span> <span class="n">env_reward</span> <span class="o">*</span> <span class="n">gamma</span>
+        <span class="n">gamma</span> <span class="o">*=</span> <span class="n">discount</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;True state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">true_state</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">env_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative Discounted): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">total_discounted_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Belief: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">sample_belief</span><span class="p">()))</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__plan_time__: </span><span class="si">%.5f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_planning_time</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">PORollout</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__best_reward__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_best_reward</span><span class="p">)</span>
+
+        <span class="n">new_x</span><span class="p">,</span> <span class="n">new_y</span> <span class="o">=</span> <span class="p">[</span><span class="n">true_state</span><span class="o">.</span><span class="n">x</span><span class="p">],</span> <span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+        <span class="n">scat</span><span class="o">.</span><span class="n">set_data</span><span class="p">(</span><span class="n">new_x</span><span class="p">,</span> <span class="n">new_y</span><span class="p">)</span>
+        <span class="n">scat</span><span class="o">.</span><span class="n">set_color</span><span class="p">(</span><span class="s2">&quot;b&quot;</span> <span class="k">if</span> <span class="n">true_state</span><span class="o">.</span><span class="n">loaded</span> <span class="k">else</span> <span class="s2">&quot;r&quot;</span><span class="p">)</span>
+        <span class="k">return</span> <span class="p">(</span><span class="n">scat</span><span class="p">,)</span>
+
+    <span class="n">ani</span> <span class="o">=</span> <span class="n">FuncAnimation</span><span class="p">(</span><span class="n">fig</span><span class="p">,</span> <span class="n">update</span><span class="p">,</span> <span class="n">frames</span><span class="o">=</span><span class="n">nsteps</span><span class="p">,</span> <span class="n">interval</span><span class="o">=</span><span class="mi">500</span><span class="p">)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">init_state</span> <span class="o">=</span> <span class="n">generate_random_state</span><span class="p">()</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">generate_init_belief</span><span class="p">(</span><span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span>
+    <span class="n">load_unload_problem</span> <span class="o">=</span> <span class="n">LoadUnloadProblem</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">)</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;** Testing POMCP **&quot;</span><span class="p">)</span>
+    <span class="n">pomcp</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">num_sims</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">110</span><span class="p">,</span>
+        <span class="n">rollout_policy</span><span class="o">=</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">test_planner</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="p">,</span> <span class="n">pomcp</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/maze/domain/observation.html b/docs/html/_modules/pomdp_py/problems/maze/domain/observation.html
index 55390774..1c3fd29a 100644
--- a/docs/html/_modules/pomdp_py/problems/maze/domain/observation.html
+++ b/docs/html/_modules/pomdp_py/problems/maze/domain/observation.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.maze.domain.observation &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.domain.observation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/maze/domain/state.html b/docs/html/_modules/pomdp_py/problems/maze/domain/state.html
index bac2ab30..ae64b6c6 100644
--- a/docs/html/_modules/pomdp_py/problems/maze/domain/state.html
+++ b/docs/html/_modules/pomdp_py/problems/maze/domain/state.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.maze.domain.state &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.domain.state &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/maze/env/env.html b/docs/html/_modules/pomdp_py/problems/maze/env/env.html
index 500e54fa..5900cdb4 100644
--- a/docs/html/_modules/pomdp_py/problems/maze/env/env.html
+++ b/docs/html/_modules/pomdp_py/problems/maze/env/env.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.maze.env.env &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/agent.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/agent.html
index 483da1ae..12dc9f02 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/agent.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/agent.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.agent.agent &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.agent.agent &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/belief.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/belief.html
index 0e68d18c..f26aab99 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/belief.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/agent/belief.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.agent.belief &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.agent.belief &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/action.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/action.html
index 2f28d2d6..349ec576 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/action.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/action.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.domain.action &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.domain.action &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -296,9 +298,9 @@ <h1>Source code for pomdp_py.problems.multi_object_search.domain.action</h1><div
 <span class="n">Find</span> <span class="o">=</span> <span class="n">FindAction</span><span class="p">()</span>
 
 <span class="k">if</span> <span class="n">MOTION_SCHEME</span> <span class="o">==</span> <span class="s2">&quot;xy&quot;</span><span class="p">:</span>
-    <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">{</span><span class="n">MoveEast</span><span class="p">,</span> <span class="n">MoveWest</span><span class="p">,</span> <span class="n">MoveNorth</span><span class="p">,</span> <span class="n">MoveSouth</span><span class="p">}</span>
+    <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">[</span><span class="n">MoveEast</span><span class="p">,</span> <span class="n">MoveWest</span><span class="p">,</span> <span class="n">MoveNorth</span><span class="p">,</span> <span class="n">MoveSouth</span><span class="p">]</span>
 <span class="k">elif</span> <span class="n">MOTION_SCHEME</span> <span class="o">==</span> <span class="s2">&quot;vw&quot;</span><span class="p">:</span>
-    <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">{</span><span class="n">MoveForward</span><span class="p">,</span> <span class="n">MoveBackward</span><span class="p">,</span> <span class="n">MoveLeft</span><span class="p">,</span> <span class="n">MoveRight</span><span class="p">}</span>
+    <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">[</span><span class="n">MoveForward</span><span class="p">,</span> <span class="n">MoveBackward</span><span class="p">,</span> <span class="n">MoveLeft</span><span class="p">,</span> <span class="n">MoveRight</span><span class="p">]</span>
 <span class="k">else</span><span class="p">:</span>
     <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;motion scheme &#39;</span><span class="si">%s</span><span class="s2">&#39; is invalid&quot;</span> <span class="o">%</span> <span class="n">MOTION_SCHEME</span><span class="p">)</span>
 </pre></div>
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/observation.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/observation.html
index 708e0fd4..5c528c22 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/observation.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/observation.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.domain.observation &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.domain.observation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/state.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/state.html
index dab6609f..3b5003eb 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/state.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/domain/state.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.domain.state &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.domain.state &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/env/env.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/env/env.html
index 6b3d2c9a..b62b7df9 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/env/env.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/env/env.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.env.env &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/env/visual.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/env/visual.html
new file mode 100644
index 00000000..4666176f
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/env/visual.html
@@ -0,0 +1,532 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.multi_object_search.env.visual &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.multi_object_search.env.visual</h1><div class="highlight"><pre>
+<span></span><span class="c1"># Visualization of a MOS instance using pygame</span>
+<span class="c1">#</span>
+<span class="c1"># Note to run this file, you need to run the following</span>
+<span class="c1"># in the parent directory of multi_object_search:</span>
+<span class="c1">#</span>
+<span class="c1">#   python -m multi_object_search.env.visual</span>
+<span class="c1">#</span>
+
+<span class="kn">import</span> <span class="nn">pygame</span>
+<span class="kn">import</span> <span class="nn">cv2</span>
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.utils</span> <span class="k">as</span> <span class="nn">util</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1"># Deterministic way to get object color</span>
+<div class="viewcode-block" id="object_color">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.object_color">[docs]</a>
+<span class="k">def</span> <span class="nf">object_color</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">count</span><span class="p">):</span>
+    <span class="n">color</span> <span class="o">=</span> <span class="p">[</span><span class="mi">107</span><span class="p">,</span> <span class="mi">107</span><span class="p">,</span> <span class="mi">107</span><span class="p">]</span>
+    <span class="k">if</span> <span class="n">count</span> <span class="o">%</span> <span class="mi">3</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">100</span> <span class="o">+</span> <span class="p">(</span><span class="mi">3</span> <span class="o">*</span> <span class="p">(</span><span class="n">objid</span> <span class="o">*</span> <span class="mi">5</span> <span class="o">%</span> <span class="mi">11</span><span class="p">))</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="mi">222</span><span class="p">,</span> <span class="n">color</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+    <span class="k">elif</span> <span class="n">count</span> <span class="o">%</span> <span class="mi">3</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">100</span> <span class="o">+</span> <span class="p">(</span><span class="mi">3</span> <span class="o">*</span> <span class="p">(</span><span class="n">objid</span> <span class="o">*</span> <span class="mi">5</span> <span class="o">%</span> <span class="mi">11</span><span class="p">))</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="mi">222</span><span class="p">,</span> <span class="n">color</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">100</span> <span class="o">+</span> <span class="p">(</span><span class="mi">3</span> <span class="o">*</span> <span class="p">(</span><span class="n">objid</span> <span class="o">*</span> <span class="mi">5</span> <span class="o">%</span> <span class="mi">11</span><span class="p">))</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="mi">222</span><span class="p">,</span> <span class="n">color</span><span class="p">[</span><span class="mi">2</span><span class="p">]))</span>
+    <span class="k">return</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">color</span><span class="p">)</span></div>
+
+
+
+<span class="c1">#### Visualization through pygame ####</span>
+<div class="viewcode-block" id="MosViz">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz">[docs]</a>
+<span class="k">class</span> <span class="nc">MosViz</span><span class="p">:</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">res</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">fps</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_env</span> <span class="o">=</span> <span class="n">env</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="n">res</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_img</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_make_gridworld_image</span><span class="p">(</span><span class="n">res</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to MosOOObservation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to MosOOObservation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to Action</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to OOBelief</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span> <span class="o">=</span> <span class="n">controllable</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_fps</span> <span class="o">=</span> <span class="n">fps</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">=</span> <span class="mf">0.0</span>
+
+        <span class="c1"># Generate some colors, one per target object</span>
+        <span class="n">colors</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">objid</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">):</span>
+            <span class="n">colors</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">object_color</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">i</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_target_colors</span> <span class="o">=</span> <span class="n">colors</span>
+
+    <span class="k">def</span> <span class="nf">_make_gridworld_image</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">r</span><span class="p">):</span>
+        <span class="c1"># Preparing 2d array</span>
+        <span class="n">w</span><span class="p">,</span> <span class="n">l</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span>
+        <span class="n">arr2d</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># free grids</span>
+        <span class="n">state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">:</span>
+            <span class="n">pose</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;robot&quot;</span><span class="p">:</span>
+                <span class="n">arr2d</span><span class="p">[</span><span class="n">pose</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pose</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">0</span>  <span class="c1"># free grid</span>
+            <span class="k">elif</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;obstacle&quot;</span><span class="p">:</span>
+                <span class="n">arr2d</span><span class="p">[</span><span class="n">pose</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pose</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">1</span>  <span class="c1"># obstacle</span>
+            <span class="k">elif</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;target&quot;</span><span class="p">:</span>
+                <span class="n">arr2d</span><span class="p">[</span><span class="n">pose</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pose</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">2</span>  <span class="c1"># target</span>
+
+        <span class="c1"># Creating image</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">w</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">l</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="mi">255</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">w</span><span class="p">):</span>
+            <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">l</span><span class="p">):</span>
+                <span class="k">if</span> <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>  <span class="c1"># free</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="k">elif</span> <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>  <span class="c1"># obstacle</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">40</span><span class="p">,</span> <span class="mi">31</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="k">elif</span> <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">2</span><span class="p">:</span>  <span class="c1"># target</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">165</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">8</span>
+                <span class="p">)</span>
+        <span class="k">return</span> <span class="n">img</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_width</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_height</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">last_observation</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span>
+
+<div class="viewcode-block" id="MosViz.update">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.update">[docs]</a>
+    <span class="k">def</span> <span class="nf">update</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">viz_observation</span><span class="p">,</span> <span class="n">belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Update the visualization after there is new real action and observation</span>
+<span class="sd">        and updated belief.</span>
+
+<span class="sd">        Args:</span>
+<span class="sd">            observation (MosOOObservation): Real observation</span>
+<span class="sd">            viz_observation (MosOOObservation): An observation used to visualize</span>
+<span class="sd">                                                the sensing region.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">action</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">observation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">viz_observation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">belief</span></div>
+
+
+<div class="viewcode-block" id="MosViz.draw_robot">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_robot">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_robot</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">th</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">)):</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">size</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">radius</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
+
+        <span class="n">endpoint</span> <span class="o">=</span> <span class="p">(</span>
+            <span class="n">y</span> <span class="o">+</span> <span class="n">radius</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">radius</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">th</span><span class="p">))),</span>
+            <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">radius</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">th</span><span class="p">))),</span>
+        <span class="p">)</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">line</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">endpoint</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosViz.draw_observation">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_observation">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_observation</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">z</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">255</span><span class="p">)):</span>
+        <span class="k">assert</span> <span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)</span> <span class="o">==</span> <span class="n">MosOOObservation</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> != MosOOObservation&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)))</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">z</span><span class="o">.</span><span class="n">objposes</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">z</span><span class="o">.</span><span class="n">for_obj</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">pose</span> <span class="o">!=</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">:</span>
+                <span class="n">lx</span><span class="p">,</span> <span class="n">ly</span> <span class="o">=</span> <span class="n">z</span><span class="o">.</span><span class="n">for_obj</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">pose</span>
+                <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">ly</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">lx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span>
+                <span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosViz.draw_belief">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_belief">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">target_colors</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;belief (OOBelief)&quot;&quot;&quot;</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+
+        <span class="n">circle_drawn</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from pose to number of times drawn</span>
+
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">belief</span><span class="o">.</span><span class="n">object_beliefs</span><span class="p">:</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">belief</span><span class="o">.</span><span class="n">object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">random</span><span class="p">(),</span> <span class="n">RobotState</span><span class="p">):</span>
+                <span class="k">continue</span>
+            <span class="n">hist</span> <span class="o">=</span> <span class="n">belief</span><span class="o">.</span><span class="n">object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">get_histogram</span><span class="p">()</span>
+            <span class="n">color</span> <span class="o">=</span> <span class="n">target_colors</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span>
+
+            <span class="n">last_val</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+            <span class="n">count</span> <span class="o">=</span> <span class="mi">0</span>
+            <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="nb">reversed</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">hist</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">hist</span><span class="o">.</span><span class="n">get</span><span class="p">)):</span>
+                <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;target&quot;</span><span class="p">:</span>
+                    <span class="k">if</span> <span class="n">last_val</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+                        <span class="n">color</span> <span class="o">=</span> <span class="n">util</span><span class="o">.</span><span class="n">lighter</span><span class="p">(</span><span class="n">color</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">/</span> <span class="n">last_val</span><span class="p">)</span>
+                    <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">color</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">]))</span> <span class="o">&lt;</span> <span class="mf">0.99</span><span class="p">:</span>
+                        <span class="n">tx</span><span class="p">,</span> <span class="n">ty</span> <span class="o">=</span> <span class="n">state</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+                        <span class="k">if</span> <span class="p">(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">circle_drawn</span><span class="p">:</span>
+                            <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+                        <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">+=</span> <span class="mi">1</span>
+
+                        <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                            <span class="n">img</span><span class="p">,</span>
+                            <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span>
+                            <span class="n">size</span> <span class="o">//</span> <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)],</span>
+                            <span class="n">color</span><span class="p">,</span>
+                            <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
+                        <span class="p">)</span>
+                        <span class="n">last_val</span> <span class="o">=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+
+                        <span class="n">count</span> <span class="o">+=</span> <span class="mi">1</span>
+                        <span class="k">if</span> <span class="n">last_val</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">:</span>
+                            <span class="k">break</span></div>
+
+
+    <span class="c1"># PyGame interface functions</span>
+<div class="viewcode-block" id="MosViz.on_init">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_init">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_init</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;pygame init&quot;&quot;&quot;</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">init</span><span class="p">()</span>  <span class="c1"># calls pygame.font.init()</span>
+        <span class="c1"># init main screen and background</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_mode</span><span class="p">(</span>
+            <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">),</span> <span class="n">pygame</span><span class="o">.</span><span class="n">HWSURFACE</span>
+        <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_background</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">Surface</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="o">.</span><span class="n">get_size</span><span class="p">())</span><span class="o">.</span><span class="n">convert</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">time</span><span class="o">.</span><span class="n">Clock</span><span class="p">()</span>
+
+        <span class="c1"># Font</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_myfont</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">font</span><span class="o">.</span><span class="n">SysFont</span><span class="p">(</span><span class="s2">&quot;Comic Sans MS&quot;</span><span class="p">,</span> <span class="mi">30</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">True</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_event">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_event">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_event</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">event</span><span class="p">):</span>
+        <span class="c1"># TODO: Keyboard control multiple robots</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">robot_ids</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Just pick the first one.</span>
+
+        <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">QUIT</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">KEYDOWN</span><span class="p">:</span>
+            <span class="n">u</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control signal according to motion model</span>
+            <span class="n">action</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control input by user</span>
+
+            <span class="c1"># odometry model</span>
+            <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_LEFT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveLeft</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_RIGHT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveRight</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_UP</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveForward</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_DOWN</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveBackward</span>
+            <span class="c1"># euclidean axis model</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_a</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveWest</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_d</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveEast</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_s</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveSouth</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_w</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveNorth</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_SPACE</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">Look</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_RETURN</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">Find</span>
+
+            <span class="k">if</span> <span class="n">action</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span>
+
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span><span class="p">:</span>
+                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+                    <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span>
+                        <span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+                    <span class="p">)</span>
+                    <span class="n">z</span> <span class="o">=</span> <span class="kc">None</span>
+                <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">)</span> <span class="ow">or</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">FindAction</span><span class="p">):</span>
+                    <span class="n">robot_pose</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+                    <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">observe</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+                    <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span>
+                        <span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+                    <span class="p">)</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;robot state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">z</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;------------&quot;</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">action</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_loop">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_loop">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_loop</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">tick</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_fps</span><span class="p">)</span> <span class="o">/</span> <span class="mf">1000.0</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_render">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_render">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_render</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="c1"># self._display_surf.blit(self._background, (0, 0))</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">render_env</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="p">)</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">robot_ids</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Just pick the first one.</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">fps_text</span> <span class="o">=</span> <span class="s2">&quot;FPS: </span><span class="si">{0:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">get_fps</span><span class="p">())</span>
+        <span class="n">last_action</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+        <span class="n">last_action_str</span> <span class="o">=</span> <span class="s2">&quot;no_action&quot;</span> <span class="k">if</span> <span class="n">last_action</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="nb">str</span><span class="p">(</span><span class="n">last_action</span><span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_caption</span><span class="p">(</span>
+            <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> | Robot</span><span class="si">%d</span><span class="s2">(</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">) | </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">&quot;</span>
+            <span class="o">%</span> <span class="p">(</span>
+                <span class="n">last_action_str</span><span class="p">,</span>
+                <span class="n">robot_id</span><span class="p">,</span>
+                <span class="n">rx</span><span class="p">,</span>
+                <span class="n">ry</span><span class="p">,</span>
+                <span class="n">rth</span> <span class="o">*</span> <span class="mi">180</span> <span class="o">/</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">,</span>
+                <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">][</span><span class="s2">&quot;objects_found&quot;</span><span class="p">]),</span>
+                <span class="n">fps_text</span><span class="p">,</span>
+            <span class="p">)</span>
+        <span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">flip</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_cleanup">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_cleanup">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_cleanup</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">quit</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_execute">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_execute">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_execute</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+
+        <span class="k">while</span> <span class="bp">self</span><span class="o">.</span><span class="n">_running</span><span class="p">:</span>
+            <span class="k">for</span> <span class="n">event</span> <span class="ow">in</span> <span class="n">pygame</span><span class="o">.</span><span class="n">event</span><span class="o">.</span><span class="n">get</span><span class="p">():</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">on_event</span><span class="p">(</span><span class="n">event</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">on_cleanup</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="MosViz.render_env">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.render_env">[docs]</a>
+    <span class="k">def</span> <span class="nf">render_env</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">display_surf</span><span class="p">):</span>
+        <span class="c1"># draw robot, a circle and a vector</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">robot_id</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">robot_ids</span><span class="p">):</span>
+            <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+            <span class="n">r</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span>  <span class="c1"># Not radius!</span>
+            <span class="n">last_observation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="n">last_viz_observation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="n">last_belief</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">last_belief</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">last_belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">3</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_target_colors</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">last_viz_observation</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_observation</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span>
+                    <span class="n">last_viz_observation</span><span class="p">,</span>
+                    <span class="n">rx</span><span class="p">,</span>
+                    <span class="n">ry</span><span class="p">,</span>
+                    <span class="n">rth</span><span class="p">,</span>
+                    <span class="n">r</span><span class="p">,</span>
+                    <span class="n">r</span> <span class="o">//</span> <span class="mi">4</span><span class="p">,</span>
+                    <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">200</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="mi">12</span><span class="p">),</span>
+                <span class="p">)</span>
+            <span class="k">if</span> <span class="n">last_observation</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_observation</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="n">last_observation</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">8</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span> <span class="mi">20</span><span class="p">,</span> <span class="mi">180</span><span class="p">)</span>
+                <span class="p">)</span>
+
+            <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_robot</span><span class="p">(</span>
+                <span class="n">img</span><span class="p">,</span> <span class="n">rx</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">ry</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="mi">255</span> <span class="o">*</span> <span class="p">(</span><span class="mf">0.8</span> <span class="o">*</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)),</span> <span class="mi">12</span><span class="p">)</span>
+            <span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">surfarray</span><span class="o">.</span><span class="n">blit_array</span><span class="p">(</span><span class="n">display_surf</span><span class="p">,</span> <span class="n">img</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="c1"># If you don&#39;t want occlusion, use this:</span>
+    <span class="n">laserstr</span> <span class="o">=</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">90</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="c1"># If you want occlusion, use this</span>
+    <span class="c1"># (the difference is mainly in angle_increment; this</span>
+    <span class="c1">#  is due to the discretization - discretization may</span>
+    <span class="c1">#  cause &quot;strange&quot; behavior when checking occlusion</span>
+    <span class="c1">#  but the model is actually doing the right thing.)</span>
+    <span class="n">laserstr_occ</span> <span class="o">=</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">360</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+    <span class="c1"># Proximity sensor</span>
+    <span class="n">proxstr</span> <span class="o">=</span> <span class="n">make_proximity_sensor</span><span class="p">(</span><span class="mf">1.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">proxstr_occ</span> <span class="o">=</span> <span class="n">make_proximity_sensor</span><span class="p">(</span><span class="mf">1.5</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+
+    <span class="n">worldmap</span><span class="p">,</span> <span class="n">robot</span> <span class="o">=</span> <span class="n">world1</span>
+    <span class="n">worldstr</span> <span class="o">=</span> <span class="n">equip_sensors</span><span class="p">(</span><span class="n">worldmap</span><span class="p">,</span> <span class="p">{</span><span class="n">robot</span><span class="p">:</span> <span class="n">laserstr</span><span class="p">})</span>
+
+    <span class="n">dim</span><span class="p">,</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">sensors</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">init_state</span> <span class="o">=</span> <span class="n">MosOOState</span><span class="p">({</span><span class="o">**</span><span class="n">objects</span><span class="p">,</span> <span class="o">**</span><span class="n">robots</span><span class="p">})</span>
+    <span class="n">env</span> <span class="o">=</span> <span class="n">MosEnvironment</span><span class="p">(</span><span class="n">dim</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="n">obstacles</span><span class="o">=</span><span class="n">obstacles</span><span class="p">)</span>
+    <span class="n">viz</span> <span class="o">=</span> <span class="n">MosViz</span><span class="p">(</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+    <span class="n">viz</span><span class="o">.</span><span class="n">on_execute</span><span class="p">()</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/example_worlds.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/example_worlds.html
index 5d4427c5..b657b700 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/example_worlds.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/example_worlds.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.example_worlds &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.example_worlds &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/grid_map.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/grid_map.html
index 0f09fb73..11bccbda 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/grid_map.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/grid_map.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.models.components.grid_map &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.components.grid_map &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/sensor.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/sensor.html
index e6ba1c20..5e25b2bb 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/sensor.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/components/sensor.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.models.components.sensor &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.components.sensor &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/observation_model.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/observation_model.html
index e5ce7ced..e093d1e2 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/observation_model.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/observation_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.models.observation_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.observation_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/policy_model.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/policy_model.html
index 71ff962e..b492a6a7 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/policy_model.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/policy_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.models.policy_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.policy_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -163,17 +165,17 @@ <h1>Source code for pomdp_py.problems.multi_object_search.models.policy_model</h
             <span class="n">last_action</span> <span class="o">=</span> <span class="n">history</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span>
             <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">last_action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
                 <span class="n">can_find</span> <span class="o">=</span> <span class="kc">True</span>
-        <span class="n">find_action</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({</span><span class="n">Find</span><span class="p">})</span> <span class="k">if</span> <span class="n">can_find</span> <span class="k">else</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="n">find_action</span> <span class="o">=</span> <span class="p">[</span><span class="n">Find</span><span class="p">]</span> <span class="k">if</span> <span class="n">can_find</span> <span class="k">else</span> <span class="p">[]</span>
         <span class="k">if</span> <span class="n">state</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="k">return</span> <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">|</span> <span class="p">{</span><span class="n">Look</span><span class="p">}</span> <span class="o">|</span> <span class="n">find_action</span>
+            <span class="k">return</span> <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">+</span> <span class="p">[</span><span class="n">Look</span><span class="p">]</span> <span class="o">+</span> <span class="n">find_action</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
                 <span class="n">valid_motions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span>
                     <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">),</span> <span class="n">ALL_MOTION_ACTIONS</span>
                 <span class="p">)</span>
-                <span class="k">return</span> <span class="n">valid_motions</span> <span class="o">|</span> <span class="p">{</span><span class="n">Look</span><span class="p">}</span> <span class="o">|</span> <span class="n">find_action</span>
+                <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">valid_motions</span><span class="p">)</span> <span class="o">+</span> <span class="p">[</span><span class="n">Look</span><span class="p">]</span> <span class="o">+</span> <span class="n">find_action</span>
             <span class="k">else</span><span class="p">:</span>
-                <span class="k">return</span> <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">|</span> <span class="p">{</span><span class="n">Look</span><span class="p">}</span> <span class="o">|</span> <span class="n">find_action</span></div>
+                <span class="k">return</span> <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">+</span> <span class="p">[</span><span class="n">Look</span><span class="p">]</span> <span class="o">+</span> <span class="n">find_action</span></div>
 
 
 <div class="viewcode-block" id="PolicyModel.rollout">
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/reward_model.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/reward_model.html
index 132c2e88..d95b0c14 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/reward_model.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/reward_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.models.reward_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.reward_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/transition_model.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/transition_model.html
index 3de8f347..9cccfb03 100644
--- a/docs/html/_modules/pomdp_py/problems/multi_object_search/models/transition_model.html
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/models/transition_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.multi_object_search.models.transition_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.transition_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/multi_object_search/problem.html b/docs/html/_modules/pomdp_py/problems/multi_object_search/problem.html
new file mode 100644
index 00000000..8efa2143
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/multi_object_search/problem.html
@@ -0,0 +1,510 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.multi_object_search.problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.multi_object_search.problem</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;2D Multi-Object Search (MOS) Task.</span>
+<span class="sd">Uses the domain, models, and agent/environment</span>
+<span class="sd">to actually define the POMDP problem for multi-object search.</span>
+<span class="sd">Then, solve it using POUCT or POMCP.&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.visual</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.agent.agent</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.models.components.grid_map</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">argparse</span>
+<span class="kn">import</span> <span class="nn">time</span>
+<span class="kn">import</span> <span class="nn">random</span>
+
+
+<div class="viewcode-block" id="MosOOPOMDP">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.MosOOPOMDP">[docs]</a>
+<span class="k">class</span> <span class="nc">MosOOPOMDP</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOPOMDP</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    A MosOOPOMDP is instantiated given a string description</span>
+<span class="sd">    of the search world, sensor descriptions for robots,</span>
+<span class="sd">    and the necessary parameters for the agent&#39;s models.</span>
+
+<span class="sd">    Note: This is of course a simulation, where you can</span>
+<span class="sd">    generate a world and know where the target objects are</span>
+<span class="sd">    and then construct the Environment object. But in the</span>
+<span class="sd">    real robot scenario, you don&#39;t know where the objects</span>
+<span class="sd">    are. In that case, as I have done it in the past, you</span>
+<span class="sd">    could construct an Environment object and give None to</span>
+<span class="sd">    the object poses.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">robot_id</span><span class="p">,</span>
+        <span class="n">env</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">grid_map</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">sensors</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span>
+        <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">belief_rep</span><span class="o">=</span><span class="s2">&quot;histogram&quot;</span><span class="p">,</span>
+        <span class="n">prior</span><span class="o">=</span><span class="p">{},</span>
+        <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+        <span class="n">agent_has_map</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Args:</span>
+<span class="sd">            robot_id (int or str): the id of the agent that will solve this MosOOPOMDP.</span>
+<span class="sd">                If it is a `str`, it will be interpreted as an integer using `interpret_robot_id`</span>
+<span class="sd">                in env/env.py.</span>
+<span class="sd">            env (MosEnvironment): the environment.</span>
+<span class="sd">            grid_map (str): Search space description. See env/env.py:interpret. An example:</span>
+<span class="sd">                rx...</span>
+<span class="sd">                .x.xT</span>
+<span class="sd">                .....</span>
+<span class="sd">                Ignored if env is not None</span>
+<span class="sd">            sensors (dict): map from robot character to sensor string.</span>
+<span class="sd">                For example: {&#39;r&#39;: &#39;laser fov=90 min_range=1 max_range=5</span>
+<span class="sd">                                    angle_increment=5&#39;}</span>
+<span class="sd">                Ignored if env is not None</span>
+<span class="sd">            agent_has_map (bool): If True, we assume the agent is given the occupancy</span>
+<span class="sd">                                  grid map of the world. Then, the agent can use this</span>
+<span class="sd">                                  map to avoid planning invalid actions (bumping into things).</span>
+<span class="sd">                                  But this map does not help the agent&#39;s prior belief directly.</span>
+
+<span class="sd">            sigma, epsilon: observation model paramters</span>
+<span class="sd">            belief_rep (str): belief representation. Either histogram or particles.</span>
+<span class="sd">            prior (dict or str): either a dictionary as defined in agent/belief.py</span>
+<span class="sd">                or a string, either &quot;uniform&quot; or &quot;informed&quot;. For &quot;uniform&quot;, a uniform</span>
+<span class="sd">                prior will be given. For &quot;informed&quot;, a perfect prior will be given.</span>
+<span class="sd">            num_particles (int): setting for the particle belief representation</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="n">env</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">assert</span> <span class="n">grid_map</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">sensors</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">,</span> <span class="p">(</span>
+                <span class="s2">&quot;Since env is not provided, you must provide string descriptions&quot;</span>
+                <span class="s2">&quot;of the world and sensors.&quot;</span>
+            <span class="p">)</span>
+            <span class="n">worldstr</span> <span class="o">=</span> <span class="n">equip_sensors</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">sensors</span><span class="p">)</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">sensors</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+            <span class="n">init_state</span> <span class="o">=</span> <span class="n">MosOOState</span><span class="p">({</span><span class="o">**</span><span class="n">objects</span><span class="p">,</span> <span class="o">**</span><span class="n">robots</span><span class="p">})</span>
+            <span class="n">env</span> <span class="o">=</span> <span class="n">MosEnvironment</span><span class="p">(</span><span class="n">dim</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="n">obstacles</span><span class="o">=</span><span class="n">obstacles</span><span class="p">)</span>
+
+        <span class="c1"># construct prior</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">prior</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;uniform&quot;</span><span class="p">:</span>
+                <span class="n">prior</span> <span class="o">=</span> <span class="p">{}</span>
+            <span class="k">elif</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;informed&quot;</span><span class="p">:</span>
+                <span class="n">prior</span> <span class="o">=</span> <span class="p">{}</span>
+                <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">:</span>
+                    <span class="n">groundtruth_pose</span> <span class="o">=</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+                    <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span><span class="n">groundtruth_pose</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">}</span>
+
+        <span class="c1"># Potential extension: a multi-agent POMDP. For now, the environment</span>
+        <span class="c1"># can keep track of the states of multiple agents, but a POMDP is still</span>
+        <span class="c1"># only defined over a single agent. Perhaps, MultiAgent is just a kind</span>
+        <span class="c1"># of Agent, which will make the implementation of multi-agent POMDP cleaner.</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span> <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span> <span class="o">==</span> <span class="nb">int</span> <span class="k">else</span> <span class="n">interpret_robot_id</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">grid_map</span> <span class="o">=</span> <span class="p">(</span>
+            <span class="n">GridMap</span><span class="p">(</span>
+                <span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span>
+                <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">,</span>
+                <span class="p">{</span><span class="n">objid</span><span class="p">:</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span> <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">env</span><span class="o">.</span><span class="n">obstacles</span><span class="p">},</span>
+            <span class="p">)</span>
+            <span class="k">if</span> <span class="n">agent_has_map</span>
+            <span class="k">else</span> <span class="kc">None</span>
+        <span class="p">)</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">MosAgent</span><span class="p">(</span>
+            <span class="n">robot_id</span><span class="p">,</span>
+            <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span>
+            <span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">,</span>
+            <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span>
+            <span class="n">env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span>
+            <span class="n">sigma</span><span class="o">=</span><span class="n">sigma</span><span class="p">,</span>
+            <span class="n">epsilon</span><span class="o">=</span><span class="n">epsilon</span><span class="p">,</span>
+            <span class="n">belief_rep</span><span class="o">=</span><span class="n">belief_rep</span><span class="p">,</span>
+            <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">,</span>
+            <span class="n">num_particles</span><span class="o">=</span><span class="n">num_particles</span><span class="p">,</span>
+            <span class="n">grid_map</span><span class="o">=</span><span class="n">grid_map</span><span class="p">,</span>
+        <span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+            <span class="n">agent</span><span class="p">,</span>
+            <span class="n">env</span><span class="p">,</span>
+            <span class="n">name</span><span class="o">=</span><span class="s2">&quot;MOS(</span><span class="si">%d</span><span class="s2">,</span><span class="si">%d</span><span class="s2">,</span><span class="si">%d</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">)),</span>
+        <span class="p">)</span></div>
+
+
+
+<span class="c1">### Belief Update ###</span>
+<div class="viewcode-block" id="belief_update">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.belief_update">[docs]</a>
+<span class="k">def</span> <span class="nf">belief_update</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">,</span> <span class="n">next_robot_state</span><span class="p">,</span> <span class="n">planner</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Updates the agent&#39;s belief; The belief update may happen</span>
+<span class="sd">    through planner update (e.g. when planner is POMCP).&quot;&quot;&quot;</span>
+    <span class="c1"># Updates the planner; In case of POMCP, agent&#39;s belief is also updated.</span>
+    <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+
+    <span class="c1"># Update agent&#39;s belief, when planner is not POMCP</span>
+    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">):</span>
+        <span class="c1"># Update belief for every object</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">object_beliefs</span><span class="p">:</span>
+            <span class="n">belief_obj</span> <span class="o">=</span> <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">belief_obj</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">):</span>
+                <span class="k">if</span> <span class="n">objid</span> <span class="o">==</span> <span class="n">agent</span><span class="o">.</span><span class="n">robot_id</span><span class="p">:</span>
+                    <span class="c1"># Assuming the agent can observe its own state:</span>
+                    <span class="n">new_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">({</span><span class="n">next_robot_state</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">})</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="c1"># This is doing</span>
+                    <span class="c1">#    B(si&#39;) = normalizer * O(oi|si&#39;,sr&#39;,a) * sum_s T(si&#39;|s,a)*B(si)</span>
+                    <span class="c1">#</span>
+                    <span class="c1"># Notes: First, objects are static; Second,</span>
+                    <span class="c1"># O(oi|s&#39;,a) ~= O(oi|si&#39;,sr&#39;,a) according to the definition</span>
+                    <span class="c1"># of the observation model in models/observation.py.  Note</span>
+                    <span class="c1"># that the exact belief update rule for this OOPOMDP needs to use</span>
+                    <span class="c1"># a model like O(oi|si&#39;,sr&#39;,a) because it&#39;s intractable to</span>
+                    <span class="c1"># consider s&#39; (that means all combinations of all object</span>
+                    <span class="c1"># states must be iterated).  Of course, there could be work</span>
+                    <span class="c1"># around (out of scope) - Consider a volumetric observaiton,</span>
+                    <span class="c1"># instead of the object-pose observation. That means oi is a</span>
+                    <span class="c1"># set of pixels (2D) or voxels (3D). Note the real</span>
+                    <span class="c1"># observation, oi, is most likely sampled from O(oi|s&#39;,a)</span>
+                    <span class="c1"># because real world considers the occlusion between objects</span>
+                    <span class="c1"># (due to full state s&#39;). The problem is how to compute the</span>
+                    <span class="c1"># probability of this oi given s&#39; and a, where it&#39;s</span>
+                    <span class="c1"># intractable to obtain s&#39;. To this end, we can make a</span>
+                    <span class="c1"># simplifying assumption that an object is contained within</span>
+                    <span class="c1"># one pixel (or voxel); The pixel (or voxel) is labeled to</span>
+                    <span class="c1"># indicate free space or object. The label of each pixel or</span>
+                    <span class="c1"># voxel is certainly a result of considering the full state</span>
+                    <span class="c1"># s. The occlusion can be handled nicely with the volumetric</span>
+                    <span class="c1"># observation definition. Then that assumption can reduce the</span>
+                    <span class="c1"># observation model from O(oi|s&#39;,a) to O(label_i|s&#39;,a) and</span>
+                    <span class="c1"># it becomes easy to define O(label_i=i|s&#39;,a) and O(label_i=FREE|s&#39;,a).</span>
+                    <span class="c1"># These ideas are used in my recent 3D object search work.</span>
+                    <span class="n">new_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">update_histogram_belief</span><span class="p">(</span>
+                        <span class="n">belief_obj</span><span class="p">,</span>
+                        <span class="n">real_action</span><span class="p">,</span>
+                        <span class="n">real_observation</span><span class="o">.</span><span class="n">for_obj</span><span class="p">(</span><span class="n">objid</span><span class="p">),</span>
+                        <span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">[</span><span class="n">objid</span><span class="p">],</span>
+                        <span class="n">agent</span><span class="o">.</span><span class="n">transition_model</span><span class="p">[</span><span class="n">objid</span><span class="p">],</span>
+                        <span class="c1"># The agent knows the objects are static.</span>
+                        <span class="n">static_transition</span><span class="o">=</span><span class="n">objid</span> <span class="o">!=</span> <span class="n">agent</span><span class="o">.</span><span class="n">robot_id</span><span class="p">,</span>
+                        <span class="n">oargs</span><span class="o">=</span><span class="p">{</span><span class="s2">&quot;next_robot_state&quot;</span><span class="p">:</span> <span class="n">next_robot_state</span><span class="p">},</span>
+                    <span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                    <span class="s2">&quot;Unexpected program state.&quot;</span>
+                    <span class="s2">&quot;Are you using the appropriate belief representation?&quot;</span>
+                <span class="p">)</span>
+
+            <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">set_object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">new_belief</span><span class="p">)</span></div>
+
+
+
+<span class="c1">### Solve the problem with POUCT/POMCP planner ###</span>
+<span class="c1">### This is the main online POMDP solver logic ###</span>
+<div class="viewcode-block" id="solve">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.solve">[docs]</a>
+<span class="k">def</span> <span class="nf">solve</span><span class="p">(</span>
+    <span class="n">problem</span><span class="p">,</span>
+    <span class="n">max_depth</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>  <span class="c1"># planning horizon</span>
+    <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
+    <span class="n">planning_time</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>  <span class="c1"># amount of time (s) to plan each step</span>
+    <span class="n">exploration_const</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>  <span class="c1"># exploration constant</span>
+    <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>  <span class="c1"># maximum amount of time allowed to solve the problem</span>
+    <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+<span class="p">):</span>  <span class="c1"># maximum number of planning steps the agent can take.</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    This function terminates when:</span>
+<span class="sd">    - maximum time (max_time) reached; This time includes planning and updates</span>
+<span class="sd">    - agent has planned `max_steps` number of steps</span>
+<span class="sd">    - agent has taken n FindAction(s) where n = number of target objects.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        visualize (bool) if True, show the pygame visualization.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="n">random_objid</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">random_object_belief</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">belief</span><span class="o">.</span><span class="n">object_beliefs</span><span class="p">[</span><span class="n">random_objid</span><span class="p">]</span>
+    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">random_object_belief</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">):</span>
+        <span class="c1"># Use POUCT</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>  <span class="c1"># Random by default</span>
+    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">random_object_belief</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">):</span>
+        <span class="c1"># Use POMCP</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>  <span class="c1"># Random by default</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+            <span class="s2">&quot;Unsupported object belief type </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">random_object_belief</span><span class="p">))</span>
+        <span class="p">)</span>
+
+    <span class="n">robot_id</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">robot_id</span>
+    <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+        <span class="n">viz</span> <span class="o">=</span> <span class="n">MosViz</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span>
+        <span class="p">)</span>  <span class="c1"># controllable=False means no keyboard control.</span>
+        <span class="k">if</span> <span class="n">viz</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s2">&quot;Environment failed to initialize&quot;</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+    <span class="n">_time_used</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_find_actions_count</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_total_reward</span> <span class="o">=</span> <span class="mi">0</span>  <span class="c1"># total, undiscounted reward</span>
+    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">max_steps</span><span class="p">):</span>
+        <span class="c1"># Plan action</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="k">break</span>  <span class="c1"># no more time to update.</span>
+
+        <span class="c1"># Execute action</span>
+        <span class="n">reward</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span>
+            <span class="n">real_action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Receive observation</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">real_action</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Updates</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">clear_history</span><span class="p">()</span>  <span class="c1"># truncate history</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">belief_update</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span>
+            <span class="n">real_action</span><span class="p">,</span>
+            <span class="n">real_observation</span><span class="p">,</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span>
+            <span class="n">planner</span><span class="p">,</span>
+        <span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+
+        <span class="c1"># Info and render</span>
+        <span class="n">_total_reward</span> <span class="o">+=</span> <span class="n">reward</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">FindAction</span><span class="p">):</span>
+            <span class="n">_find_actions_count</span> <span class="o">+=</span> <span class="mi">1</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">_total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Find Actions Count: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">_find_actions_count</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+            <span class="c1"># This is used to show the sensing range; Not sampled</span>
+            <span class="c1"># according to observation model.</span>
+            <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">pose</span>
+            <span class="n">viz_observation</span> <span class="o">=</span> <span class="n">MosOOObservation</span><span class="p">({})</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">)</span> <span class="ow">or</span> <span class="nb">isinstance</span><span class="p">(</span>
+                <span class="n">real_action</span><span class="p">,</span> <span class="n">FindAction</span>
+            <span class="p">):</span>
+                <span class="n">viz_observation</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">observe</span><span class="p">(</span>
+                    <span class="n">robot_pose</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span>
+                <span class="p">)</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+                <span class="n">robot_id</span><span class="p">,</span>
+                <span class="n">real_action</span><span class="p">,</span>
+                <span class="n">real_observation</span><span class="p">,</span>
+                <span class="n">viz_observation</span><span class="p">,</span>
+                <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">,</span>
+            <span class="p">)</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+        <span class="c1"># Termination check</span>
+        <span class="k">if</span> <span class="p">(</span>
+            <span class="nb">set</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">objects_found</span><span class="p">)</span>
+            <span class="o">==</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span>
+        <span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Done!&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_find_actions_count</span> <span class="o">&gt;=</span> <span class="nb">len</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;FindAction limit reached.&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Maximum time reached.&quot;</span><span class="p">)</span>
+            <span class="k">break</span></div>
+
+
+
+<span class="c1"># Test</span>
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="c1"># random world</span>
+    <span class="n">grid_map</span><span class="p">,</span> <span class="n">robot_char</span> <span class="o">=</span> <span class="n">random_world</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span>
+    <span class="n">laserstr</span> <span class="o">=</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">90</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">4</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">proxstr</span> <span class="o">=</span> <span class="n">make_proximity_sensor</span><span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">problem</span> <span class="o">=</span> <span class="n">MosOOPOMDP</span><span class="p">(</span>
+        <span class="n">robot_char</span><span class="p">,</span>  <span class="c1"># r is the robot character</span>
+        <span class="n">sigma</span><span class="o">=</span><span class="mf">0.05</span><span class="p">,</span>  <span class="c1"># observation model parameter</span>
+        <span class="n">epsilon</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>  <span class="c1"># observation model parameter</span>
+        <span class="n">grid_map</span><span class="o">=</span><span class="n">grid_map</span><span class="p">,</span>
+        <span class="n">sensors</span><span class="o">=</span><span class="p">{</span><span class="n">robot_char</span><span class="p">:</span> <span class="n">proxstr</span><span class="p">},</span>
+        <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">,</span>
+        <span class="n">agent_has_map</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">solve</span><span class="p">(</span>
+        <span class="n">problem</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
+        <span class="n">planning_time</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>
+        <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>
+        <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+    <span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/rocksample/rocksample_problem.html b/docs/html/_modules/pomdp_py/problems/rocksample/rocksample_problem.html
index 9e5333f9..ebcc7857 100644
--- a/docs/html/_modules/pomdp_py/problems/rocksample/rocksample_problem.html
+++ b/docs/html/_modules/pomdp_py/problems/rocksample/rocksample_problem.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.rocksample.rocksample_problem &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.rocksample.rocksample_problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -114,8 +116,7 @@ <h3 class="donation">Donate/support</h3>
           <div class="body" role="main">
             
   <h1>Source code for pomdp_py.problems.rocksample.rocksample_problem</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">RockSample(n,k) problem</span>
+<span></span><span class="sd">&quot;&quot;&quot;RockSample(n,k) problem</span>
 
 <span class="sd">Origin: Heuristic Search Value Iteration for POMDPs (UAI 2004)</span>
 
@@ -140,12 +141,16 @@ <h1>Source code for pomdp_py.problems.rocksample.rocksample_problem</h1><div cla
 <span class="sd">    Check_i: receives a noisy observation about RockType_i</span>
 <span class="sd">    (noise determined by eta (:math:`\eta`). eta=1 -&gt; perfect sensor; eta=0 -&gt; uniform)</span>
 
-<span class="sd">Observation: observes the property of rock i when taking Check_i.</span>
+<span class="sd">Observation: observes the property of rock i when taking Check_i.  The</span>
+<span class="sd">     observation may be noisy, depending on an efficiency parameter which</span>
+<span class="sd">     decreases exponentially as the distance increases between the rover and</span>
+<span class="sd">     rock i. &#39;half_efficiency_dist&#39; influences this parameter (larger, more robust)</span>
 
 <span class="sd">Reward: +10 for Sample a good rock. -10 for Sampling a bad rock.</span>
 <span class="sd">        Move to exit area +10. Other actions have no cost or reward.</span>
 
 <span class="sd">Initial belief: every rock has equal probability of being Good or Bad.</span>
+
 <span class="sd">&quot;&quot;&quot;</span>
 
 <span class="kn">import</span> <span class="nn">pomdp_py</span>
@@ -540,7 +545,7 @@ <h1>Source code for pomdp_py.problems.rocksample.rocksample_problem</h1><div cla
     <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
         <span class="n">state</span> <span class="o">=</span> <span class="n">kwargs</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;state&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
         <span class="k">if</span> <span class="n">state</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span>
+            <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span><span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">motions</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span><span class="p">)</span>
             <span class="n">rover_x</span><span class="p">,</span> <span class="n">rover_y</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">position</span>
@@ -550,7 +555,7 @@ <h1>Source code for pomdp_py.problems.rocksample.rocksample_problem</h1><div cla
                 <span class="n">motions</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">MoveNorth</span><span class="p">)</span>
             <span class="k">if</span> <span class="n">rover_y</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
                 <span class="n">motions</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">MoveSouth</span><span class="p">)</span>
-            <span class="k">return</span> <span class="n">motions</span> <span class="o">|</span> <span class="bp">self</span><span class="o">.</span><span class="n">_other_actions</span></div>
+            <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">motions</span> <span class="o">|</span> <span class="bp">self</span><span class="o">.</span><span class="n">_other_actions</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="RSPolicyModel.rollout">
@@ -641,13 +646,15 @@ <h1>Source code for pomdp_py.problems.rocksample.rocksample_problem</h1><div cla
         <span class="nb">print</span><span class="p">(</span><span class="n">string</span><span class="p">)</span></div>
 
 
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="n">half_efficiency_dist</span><span class="o">=</span><span class="mi">20</span>
+    <span class="p">):</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_n</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_k</span> <span class="o">=</span> <span class="n">n</span><span class="p">,</span> <span class="n">k</span>
         <span class="n">agent</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">(</span>
             <span class="n">init_belief</span><span class="p">,</span>
             <span class="n">RSPolicyModel</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">),</span>
             <span class="n">RSTransitionModel</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">),</span>
-            <span class="n">RSObservationModel</span><span class="p">(</span><span class="n">rock_locs</span><span class="p">),</span>
+            <span class="n">RSObservationModel</span><span class="p">(</span><span class="n">rock_locs</span><span class="p">,</span> <span class="n">half_efficiency_dist</span><span class="o">=</span><span class="n">half_efficiency_dist</span><span class="p">),</span>
             <span class="n">RSRewardModel</span><span class="p">(</span><span class="n">rock_locs</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">),</span>
         <span class="p">)</span>
         <span class="n">env</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">(</span>
@@ -723,49 +730,57 @@ <h1>Source code for pomdp_py.problems.rocksample.rocksample_problem</h1><div cla
 
 
 
-<div class="viewcode-block" id="main">
-<a class="viewcode-back" href="../../../../api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.main">[docs]</a>
-<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
-    <span class="n">n</span><span class="p">,</span> <span class="n">k</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">5</span>
-    <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="o">.</span><span class="n">generate_instance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">)</span>
-    <span class="c1"># # For debugging purpose</span>
-    <span class="c1"># n, k = 2,2</span>
-    <span class="c1"># rover_position = (0, 0)</span>
-    <span class="c1"># rock_locs = {}  # map from rock location to rock id</span>
-    <span class="c1"># rock_locs[(0,1)] = 0</span>
-    <span class="c1"># rock_locs[(1,1)] = 1</span>
-    <span class="c1"># rocktypes = (&#39;good&#39;, &#39;good&#39;)</span>
+<div class="viewcode-block" id="minimal_instance">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.minimal_instance">[docs]</a>
+<span class="k">def</span> <span class="nf">minimal_instance</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+    <span class="c1"># A particular instance for debugging purpose</span>
+    <span class="n">n</span><span class="p">,</span> <span class="n">k</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">2</span>
+    <span class="n">rover_position</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+    <span class="n">rock_locs</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from rock location to rock id</span>
+    <span class="n">rock_locs</span><span class="p">[(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">rock_locs</span><span class="p">[(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">1</span>
+    <span class="n">rocktypes</span> <span class="o">=</span> <span class="p">(</span><span class="s2">&quot;good&quot;</span><span class="p">,</span> <span class="s2">&quot;good&quot;</span><span class="p">)</span>
     <span class="c1"># Ground truth state</span>
-    <span class="c1"># init_state = State(rover_position, rocktypes, False)</span>
-    <span class="c1"># belief = &quot;uniform&quot;</span>
-
+    <span class="n">init_state</span> <span class="o">=</span> <span class="n">State</span><span class="p">(</span><span class="n">rover_position</span><span class="p">,</span> <span class="n">rocktypes</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
     <span class="n">belief</span> <span class="o">=</span> <span class="s2">&quot;uniform&quot;</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">init_particles_belief</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="n">belief</span><span class="p">)</span>
+    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">rocksample</span></div>
+
+
 
-    <span class="n">init_state_copy</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">init_state</span><span class="p">)</span>
+<div class="viewcode-block" id="create_instance">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.create_instance">[docs]</a>
+<span class="k">def</span> <span class="nf">create_instance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+    <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="o">.</span><span class="n">generate_instance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">)</span>
+
+    <span class="n">belief</span> <span class="o">=</span> <span class="s2">&quot;uniform&quot;</span>
 
     <span class="c1"># init belief (uniform), represented in particles;</span>
     <span class="c1"># We don&#39;t factor the state here; We are also not doing any action prior.</span>
     <span class="n">init_belief</span> <span class="o">=</span> <span class="n">init_particles_belief</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="n">belief</span><span class="p">)</span>
 
-    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">)</span>
+    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">rocksample</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">debug_instance</span><span class="p">()</span>  <span class="c1"># create_instance(7, 8)</span>
     <span class="n">rocksample</span><span class="o">.</span><span class="n">print_state</span><span class="p">()</span>
 
     <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;*** Testing POMCP ***&quot;</span><span class="p">)</span>
     <span class="n">pomcp</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
-        <span class="n">max_depth</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span>
         <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
         <span class="n">num_sims</span><span class="o">=</span><span class="mi">10000</span><span class="p">,</span>
-        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span>
         <span class="n">rollout_policy</span><span class="o">=</span><span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
         <span class="n">num_visits_init</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
     <span class="p">)</span>
-    <span class="n">tt</span><span class="p">,</span> <span class="n">ttd</span> <span class="o">=</span> <span class="n">test_planner</span><span class="p">(</span><span class="n">rocksample</span><span class="p">,</span> <span class="n">pomcp</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">discount</span><span class="o">=</span><span class="mf">0.95</span><span class="p">)</span>
-
-    <span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">position</span> <span class="o">=</span> <span class="n">init_state_copy</span><span class="o">.</span><span class="n">position</span>
-    <span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">rocktypes</span> <span class="o">=</span> <span class="n">init_state_copy</span><span class="o">.</span><span class="n">rocktypes</span>
-    <span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">terminal</span> <span class="o">=</span> <span class="kc">False</span>
-    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">init_particles_belief</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="n">belief</span><span class="p">)</span>
-    <span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">set_belief</span><span class="p">(</span><span class="n">init_belief</span><span class="p">)</span></div>
+    <span class="n">tt</span><span class="p">,</span> <span class="n">ttd</span> <span class="o">=</span> <span class="n">test_planner</span><span class="p">(</span><span class="n">rocksample</span><span class="p">,</span> <span class="n">pomcp</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">discount</span><span class="o">=</span><span class="mf">0.95</span><span class="p">)</span></div>
 
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/agent/agent.html b/docs/html/_modules/pomdp_py/problems/tag/agent/agent.html
index e7156a09..9ba5c553 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/agent/agent.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/agent/agent.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.agent.agent &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.agent.agent &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/domain/action.html b/docs/html/_modules/pomdp_py/problems/tag/domain/action.html
index 77905a83..a3f0806d 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/domain/action.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/domain/action.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.domain.action &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.domain.action &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/domain/observation.html b/docs/html/_modules/pomdp_py/problems/tag/domain/observation.html
index ad81a5da..bf132c7d 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/domain/observation.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/domain/observation.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.domain.observation &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.domain.observation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/domain/state.html b/docs/html/_modules/pomdp_py/problems/tag/domain/state.html
index 32a4d0c8..b82f527d 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/domain/state.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/domain/state.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.domain.state &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.domain.state &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/env/env.html b/docs/html/_modules/pomdp_py/problems/tag/env/env.html
new file mode 100644
index 00000000..44fa7806
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/tag/env/env.html
@@ -0,0 +1,193 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.tag.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.tag.env.env</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.transition_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.reward_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.components.motion_policy</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.components.grid_map</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="n">interpret</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.visual</span> <span class="kn">import</span> <span class="n">MosViz</span>
+
+
+<div class="viewcode-block" id="TagEnvironment">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment">[docs]</a>
+<span class="k">class</span> <span class="nc">TagEnvironment</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+        <span class="n">target_motion_policy</span> <span class="o">=</span> <span class="n">TagTargetMotionPolicy</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="p">)</span>
+        <span class="n">transition_model</span> <span class="o">=</span> <span class="n">TagTransitionModel</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">target_motion_policy</span><span class="p">)</span>
+        <span class="n">reward_model</span> <span class="o">=</span> <span class="n">TagRewardModel</span><span class="p">(</span><span class="n">small</span><span class="o">=</span><span class="n">small</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="n">big</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">transition_model</span><span class="p">,</span> <span class="n">reward_model</span><span class="p">)</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">width</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">width</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">length</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">length</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">grid_map</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span>
+
+<div class="viewcode-block" id="TagEnvironment.from_str">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.from_str">[docs]</a>
+    <span class="nd">@classmethod</span>
+    <span class="k">def</span> <span class="nf">from_str</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">worldstr</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="n">dim</span><span class="p">,</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">robots</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">,</span> <span class="s2">&quot;Does not support multiple robots.&quot;</span>
+        <span class="n">robot_position</span> <span class="o">=</span> <span class="n">robots</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">robots</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">pose</span><span class="p">[:</span><span class="mi">2</span><span class="p">]</span>
+        <span class="n">targets</span> <span class="o">=</span> <span class="p">[]</span>
+        <span class="n">obstacle_poses</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">objects</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">objid</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">obstacles</span><span class="p">:</span>
+                <span class="n">targets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">obstacle_poses</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">objects</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">pose</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">targets</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">,</span> <span class="s2">&quot;Does not support multiple objects.&quot;</span>
+        <span class="n">target_position</span> <span class="o">=</span> <span class="n">objects</span><span class="p">[</span><span class="n">targets</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">pose</span>
+        <span class="n">init_state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+        <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="p">(</span><span class="n">dim</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">dim</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">obstacle_poses</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">TagEnvironment</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/tag/env/visual.html b/docs/html/_modules/pomdp_py/problems/tag/env/visual.html
new file mode 100644
index 00000000..4ec4f395
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/tag/env/visual.html
@@ -0,0 +1,438 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.tag.env.visual &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.tag.env.visual</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Largely based on MosViz, except this is not an OO-POMDP&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pygame</span>
+<span class="kn">import</span> <span class="nn">cv2</span>
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.utils</span> <span class="k">as</span> <span class="nn">util</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.observation_model</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1">#### Visualization through pygame ####</span>
+<div class="viewcode-block" id="TagViz">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz">[docs]</a>
+<span class="k">class</span> <span class="nc">TagViz</span><span class="p">:</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">res</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">fps</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">observation_model</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_env</span> <span class="o">=</span> <span class="n">env</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="n">res</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_img</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_make_gridworld_image</span><span class="p">(</span><span class="n">res</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_observation_model</span> <span class="o">=</span> <span class="n">observation_model</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span> <span class="o">=</span> <span class="n">controllable</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_fps</span> <span class="o">=</span> <span class="n">fps</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">=</span> <span class="mf">0.0</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_target_color</span> <span class="o">=</span> <span class="p">(</span><span class="mi">200</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">50</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="nf">_make_gridworld_image</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">r</span><span class="p">):</span>
+        <span class="c1"># Preparing 2d array</span>
+        <span class="n">w</span><span class="p">,</span> <span class="n">l</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span>
+        <span class="n">arr2d</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># free grids</span>
+        <span class="c1"># Creating image</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">w</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">l</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="mi">255</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">w</span><span class="p">):</span>
+            <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">l</span><span class="p">):</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">grid_map</span><span class="o">.</span><span class="n">obstacle_poses</span><span class="p">:</span>
+                    <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span>  <span class="c1"># free</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">1</span>  <span class="c1"># obstacle</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">40</span><span class="p">,</span> <span class="mi">31</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">8</span>
+                <span class="p">)</span>
+        <span class="k">return</span> <span class="n">img</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_width</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_height</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">last_observation</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span>
+
+<div class="viewcode-block" id="TagViz.update">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.update">[docs]</a>
+    <span class="k">def</span> <span class="nf">update</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Update the visualization after there is new real action and observation</span>
+<span class="sd">        and updated belief.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span> <span class="o">=</span> <span class="n">action</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="n">observation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="o">=</span> <span class="n">belief</span></div>
+
+
+<div class="viewcode-block" id="TagViz.draw_robot">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_robot">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_robot</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">th</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">)):</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">size</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">radius</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=</span><span class="mi">6</span><span class="p">)</span></div>
+
+        <span class="c1"># endpoint = (y+radius + int(round(radius*math.sin(th))),</span>
+        <span class="c1">#             x+radius + int(round(radius*math.cos(th))))</span>
+        <span class="c1"># cv2.line(img, (y+radius,x+radius), endpoint, color, 2)</span>
+
+<div class="viewcode-block" id="TagViz.draw_observation">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_observation">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_observation</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">z</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">255</span><span class="p">)):</span>
+        <span class="k">assert</span> <span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)</span> <span class="o">==</span> <span class="n">TagObservation</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> != TagObservation&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)))</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="k">if</span> <span class="n">z</span><span class="o">.</span><span class="n">target_position</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">lx</span><span class="p">,</span> <span class="n">ly</span> <span class="o">=</span> <span class="n">z</span><span class="o">.</span><span class="n">target_position</span>
+            <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">ly</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">lx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span>
+            <span class="p">)</span></div>
+
+
+    <span class="c1"># TODO! Deprecated.</span>
+<div class="viewcode-block" id="TagViz.draw_belief">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_belief">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">target_color</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;belief (OOBelief)&quot;&quot;&quot;</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+
+        <span class="n">circle_drawn</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from pose to number of times drawn</span>
+
+        <span class="n">hist</span> <span class="o">=</span> <span class="n">belief</span><span class="o">.</span><span class="n">get_histogram</span><span class="p">()</span>
+        <span class="n">color</span> <span class="o">=</span> <span class="n">target_color</span>
+
+        <span class="n">last_val</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+        <span class="n">count</span> <span class="o">=</span> <span class="mi">0</span>
+        <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="nb">reversed</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">hist</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">hist</span><span class="o">.</span><span class="n">get</span><span class="p">)):</span>
+            <span class="k">if</span> <span class="n">last_val</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+                <span class="n">color</span> <span class="o">=</span> <span class="n">util</span><span class="o">.</span><span class="n">lighter</span><span class="p">(</span><span class="n">color</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">/</span> <span class="n">last_val</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">color</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">]))</span> <span class="o">&lt;</span> <span class="mf">0.999</span><span class="p">:</span>
+                <span class="n">tx</span><span class="p">,</span> <span class="n">ty</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">target_position</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">circle_drawn</span><span class="p">:</span>
+                    <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+                <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">+=</span> <span class="mi">1</span>
+
+                <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span>
+                    <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span>
+                    <span class="n">size</span> <span class="o">//</span> <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)],</span>
+                    <span class="n">color</span><span class="p">,</span>
+                    <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
+                <span class="p">)</span>
+                <span class="n">last_val</span> <span class="o">=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+
+                <span class="n">count</span> <span class="o">+=</span> <span class="mi">1</span>
+                <span class="k">if</span> <span class="n">last_val</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">:</span>
+                    <span class="k">break</span></div>
+
+
+    <span class="c1"># PyGame interface functions</span>
+<div class="viewcode-block" id="TagViz.on_init">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_init">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_init</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;pygame init&quot;&quot;&quot;</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">init</span><span class="p">()</span>  <span class="c1"># calls pygame.font.init()</span>
+        <span class="c1"># init main screen and background</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_mode</span><span class="p">(</span>
+            <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">),</span> <span class="n">pygame</span><span class="o">.</span><span class="n">HWSURFACE</span>
+        <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_background</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">Surface</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="o">.</span><span class="n">get_size</span><span class="p">())</span><span class="o">.</span><span class="n">convert</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">time</span><span class="o">.</span><span class="n">Clock</span><span class="p">()</span>
+
+        <span class="c1"># Font</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_myfont</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">font</span><span class="o">.</span><span class="n">SysFont</span><span class="p">(</span><span class="s2">&quot;Comic Sans MS&quot;</span><span class="p">,</span> <span class="mi">30</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">True</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_event">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_event">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_event</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">event</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">QUIT</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="c1"># TODO! DEPRECATED!</span>
+        <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">KEYDOWN</span><span class="p">:</span>
+            <span class="n">u</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control signal according to motion model</span>
+            <span class="n">action</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control input by user</span>
+
+            <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_LEFT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveWest2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_RIGHT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveEast2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_DOWN</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveSouth2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_UP</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveNorth2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_SPACE</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">TagAction</span><span class="p">()</span>
+
+            <span class="k">if</span> <span class="n">action</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span>
+
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span><span class="p">:</span>
+                <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+                <span class="n">robot_pose</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span>
+                <span class="n">z</span> <span class="o">=</span> <span class="kc">None</span>
+                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_observation_model</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                    <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_observation_model</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="n">z</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;      state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">z</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span>
+                    <span class="s2">&quot; valid motions: </span><span class="si">%s</span><span class="s2">&quot;</span>
+                    <span class="o">%</span> <span class="nb">str</span><span class="p">(</span>
+                        <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">)</span>
+                    <span class="p">)</span>
+                <span class="p">)</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;------------&quot;</span><span class="p">)</span>
+                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+            <span class="k">return</span> <span class="n">action</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_loop">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_loop">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_loop</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">tick</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_fps</span><span class="p">)</span> <span class="o">/</span> <span class="mf">1000.0</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_render">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_render">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_render</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="c1"># self._display_surf.blit(self._background, (0, 0))</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">render_env</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="p">)</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span>
+        <span class="n">fps_text</span> <span class="o">=</span> <span class="s2">&quot;FPS: </span><span class="si">{0:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">get_fps</span><span class="p">())</span>
+        <span class="n">last_action</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span>
+        <span class="n">last_action_str</span> <span class="o">=</span> <span class="s2">&quot;no_action&quot;</span> <span class="k">if</span> <span class="n">last_action</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="nb">str</span><span class="p">(</span><span class="n">last_action</span><span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_caption</span><span class="p">(</span>
+            <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> | Robot(</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">) | </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">&quot;</span>
+            <span class="o">%</span> <span class="p">(</span><span class="n">last_action_str</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">),</span> <span class="n">fps_text</span><span class="p">)</span>
+        <span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">flip</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_cleanup">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_cleanup">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_cleanup</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">quit</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_execute">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_execute">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_execute</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+
+        <span class="k">while</span> <span class="bp">self</span><span class="o">.</span><span class="n">_running</span><span class="p">:</span>
+            <span class="k">for</span> <span class="n">event</span> <span class="ow">in</span> <span class="n">pygame</span><span class="o">.</span><span class="n">event</span><span class="o">.</span><span class="n">get</span><span class="p">():</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">on_event</span><span class="p">(</span><span class="n">event</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">on_cleanup</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="TagViz.render_env">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.render_env">[docs]</a>
+    <span class="k">def</span> <span class="nf">render_env</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">display_surf</span><span class="p">):</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="p">)</span>
+        <span class="n">r</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span>  <span class="c1"># Not radius! It&#39;s resolution.</span>
+
+        <span class="c1"># draw target</span>
+        <span class="n">tx</span><span class="p">,</span> <span class="n">ty</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_position</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+            <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">165</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+        <span class="p">)</span>
+
+        <span class="c1"># draw robot</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span>
+        <span class="n">r</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span>  <span class="c1"># Not radius!</span>
+        <span class="c1"># last_observation = self._last_observation.get(robot_id, None)</span>
+        <span class="c1"># last_viz_observation = self._last_viz_observation.get(robot_id, None)</span>
+        <span class="c1"># last_belief = self._last_belief.get(robot_id, None)</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">TagViz</span><span class="o">.</span><span class="n">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">3</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_target_color</span><span class="p">)</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">TagViz</span><span class="o">.</span><span class="n">draw_observation</span><span class="p">(</span>
+                <span class="n">img</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">8</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span> <span class="mi">20</span><span class="p">,</span> <span class="mi">180</span><span class="p">)</span>
+            <span class="p">)</span>
+
+        <span class="n">TagViz</span><span class="o">.</span><span class="n">draw_robot</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">rx</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">ry</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">200</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">150</span><span class="p">))</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">surfarray</span><span class="o">.</span><span class="n">blit_array</span><span class="p">(</span><span class="n">display_surf</span><span class="p">,</span> <span class="n">img</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># TODO! DEPRECATED!</span>
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../../../api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="n">worldmap</span><span class="p">,</span> <span class="n">robot</span> <span class="o">=</span> <span class="n">world0</span>
+    <span class="n">env</span> <span class="o">=</span> <span class="n">TagEnvironment</span><span class="o">.</span><span class="n">from_str</span><span class="p">(</span><span class="n">worldmap</span><span class="p">)</span>
+    <span class="n">observation_model</span> <span class="o">=</span> <span class="n">TagObservationModel</span><span class="p">()</span>
+    <span class="n">viz</span> <span class="o">=</span> <span class="n">TagViz</span><span class="p">(</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">observation_model</span><span class="o">=</span><span class="n">observation_model</span><span class="p">)</span>
+    <span class="n">viz</span><span class="o">.</span><span class="n">on_execute</span><span class="p">()</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/tag/experiment.html b/docs/html/_modules/pomdp_py/problems/tag/experiment.html
new file mode 100644
index 00000000..621f6338
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/tag/experiment.html
@@ -0,0 +1,187 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.tag.experiment &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.tag.experiment</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Simple experiment to get mean&quot;&quot;&quot;</span>
+
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.problem</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+
+
+<div class="viewcode-block" id="trial">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.experiment.trial">[docs]</a>
+<span class="k">def</span> <span class="nf">trial</span><span class="p">(</span><span class="n">worldstr</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+    <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="o">.</span><span class="n">from_str</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">free_cells</span> <span class="o">=</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">free_cells</span><span class="p">()</span>
+    <span class="n">init_robot_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">init_target_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="n">problem</span> <span class="o">=</span> <span class="n">TagProblem</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">init_target_position</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+    <span class="n">discounted_reward</span> <span class="o">=</span> <span class="n">solve</span><span class="p">(</span>
+        <span class="n">problem</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">15</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">planning_time</span><span class="o">=</span><span class="mf">0.7</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>
+        <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="k">return</span> <span class="n">discounted_reward</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.experiment.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">all_rewards</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">try</span><span class="p">:</span>
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">100</span><span class="p">):</span>
+            <span class="n">dr</span> <span class="o">=</span> <span class="n">trial</span><span class="p">(</span><span class="n">world0</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">)</span>
+            <span class="n">all_rewards</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dr</span><span class="p">)</span>
+    <span class="k">finally</span><span class="p">:</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;All done!&quot;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;---------&quot;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Average discounted reward: </span><span class="si">%.3f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">all_rewards</span><span class="p">)))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Std.dev discounted reward: </span><span class="si">%.3f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">all_rewards</span><span class="p">)))</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/tag/models/components/grid_map.html b/docs/html/_modules/pomdp_py/problems/tag/models/components/grid_map.html
index 648da001..ae287fba 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/models/components/grid_map.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/models/components/grid_map.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.models.components.grid_map &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.components.grid_map &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/models/components/motion_policy.html b/docs/html/_modules/pomdp_py/problems/tag/models/components/motion_policy.html
index 9c9e4cac..ee939c75 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/models/components/motion_policy.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/models/components/motion_policy.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.models.components.motion_policy &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.components.motion_policy &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/models/observation_model.html b/docs/html/_modules/pomdp_py/problems/tag/models/observation_model.html
index c588bf78..27cdb7b5 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/models/observation_model.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/models/observation_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.models.observation_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.observation_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/models/policy_model.html b/docs/html/_modules/pomdp_py/problems/tag/models/policy_model.html
index 13dd8bdd..cc1aee82 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/models/policy_model.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/models/policy_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.models.policy_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.policy_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/models/reward_model.html b/docs/html/_modules/pomdp_py/problems/tag/models/reward_model.html
index 61920c26..890a6543 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/models/reward_model.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/models/reward_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.models.reward_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.reward_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/models/transition_model.html b/docs/html/_modules/pomdp_py/problems/tag/models/transition_model.html
index 9a89b011..4a592c99 100644
--- a/docs/html/_modules/pomdp_py/problems/tag/models/transition_model.html
+++ b/docs/html/_modules/pomdp_py/problems/tag/models/transition_model.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tag.models.transition_model &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.transition_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/problems/tag/problem.html b/docs/html/_modules/pomdp_py/problems/tag/problem.html
new file mode 100644
index 00000000..cddd483e
--- /dev/null
+++ b/docs/html/_modules/pomdp_py/problems/tag/problem.html
@@ -0,0 +1,319 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>pomdp_py.problems.tag.problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for pomdp_py.problems.tag.problem</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.env.visual</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.agent.agent</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">time</span>
+
+
+<div class="viewcode-block" id="TagProblem">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.TagProblem">[docs]</a>
+<span class="k">class</span> <span class="nc">TagProblem</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMDP</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">init_robot_position</span><span class="p">,</span>
+        <span class="n">init_target_position</span><span class="p">,</span>
+        <span class="n">grid_map</span><span class="p">,</span>
+        <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span>
+        <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">,</span>
+        <span class="n">belief_type</span><span class="o">=</span><span class="s2">&quot;hist&quot;</span><span class="p">,</span>
+        <span class="n">num_particles</span><span class="o">=</span><span class="mi">6</span><span class="p">,</span>
+    <span class="p">):</span>
+        <span class="n">init_state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">init_target_position</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+        <span class="n">env</span> <span class="o">=</span> <span class="n">TagEnvironment</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="n">pr_stay</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;uniform&quot;</span><span class="p">:</span>
+            <span class="n">prior</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">elif</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;informed&quot;</span><span class="p">:</span>
+            <span class="n">prior</span> <span class="o">=</span> <span class="p">{</span><span class="n">init_target_position</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">}</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Unrecognized prior type: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">prior</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">belief_type</span> <span class="o">==</span> <span class="s2">&quot;particles&quot;</span><span class="p">:</span>
+            <span class="n">init_belief</span> <span class="o">=</span> <span class="n">initialize_particles_belief</span><span class="p">(</span>
+                <span class="n">grid_map</span><span class="p">,</span> <span class="n">init_robot_position</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">,</span> <span class="n">num_particles</span><span class="o">=</span><span class="n">num_particles</span>
+            <span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">init_belief</span> <span class="o">=</span> <span class="n">initialize_belief</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">init_robot_position</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">)</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">TagAgent</span><span class="p">(</span><span class="n">init_belief</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="n">pr_stay</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;TagProblem&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="solve">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.solve">[docs]</a>
+<span class="k">def</span> <span class="nf">solve</span><span class="p">(</span>
+    <span class="n">problem</span><span class="p">,</span>
+    <span class="n">planner_type</span><span class="o">=</span><span class="s2">&quot;pouct&quot;</span><span class="p">,</span>
+    <span class="n">max_depth</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>  <span class="c1"># planning horizon</span>
+    <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
+    <span class="n">planning_time</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>  <span class="c1"># amount of time (s) to plan each step</span>
+    <span class="n">exploration_const</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>  <span class="c1"># exploration constant</span>
+    <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>  <span class="c1"># maximum amount of time allowed to solve the problem</span>
+    <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+<span class="p">):</span>  <span class="c1"># maximum number of planning steps the agent can take.</span>
+    <span class="k">if</span> <span class="n">planner_type</span> <span class="o">==</span> <span class="s2">&quot;pouct&quot;</span><span class="p">:</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>
+    <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+        <span class="n">viz</span> <span class="o">=</span> <span class="n">TagViz</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">viz</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s2">&quot;Environment failed to initialize&quot;</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+    <span class="n">_discount</span> <span class="o">=</span> <span class="mf">1.0</span>
+    <span class="n">_time_used</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_find_actions_count</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_total_reward</span> <span class="o">=</span> <span class="mi">0</span>  <span class="c1"># total, undiscounted reward</span>
+    <span class="n">_total_discounted_reward</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">max_steps</span><span class="p">):</span>
+        <span class="c1"># Plan action</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="k">break</span>  <span class="c1"># no more time to update.</span>
+
+        <span class="c1"># Execute action</span>
+        <span class="n">reward</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+
+        <span class="c1"># Receive observation</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">real_action</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Updates</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">clear_history</span><span class="p">()</span>  <span class="c1"># truncate history</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">planner_type</span> <span class="o">==</span> <span class="s2">&quot;pouct&quot;</span><span class="p">:</span>
+            <span class="n">belief_update</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+
+        <span class="c1"># Info and render</span>
+        <span class="n">_total_reward</span> <span class="o">+=</span> <span class="n">reward</span>
+        <span class="n">_total_discounted_reward</span> <span class="o">+=</span> <span class="n">reward</span> <span class="o">*</span> <span class="n">_discount</span>
+        <span class="n">_discount</span> <span class="o">=</span> <span class="n">_discount</span> <span class="o">*</span> <span class="n">discount_factor</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">_total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Discounted): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">_total_discounted_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Find Actions Count: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">_find_actions_count</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">)</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+        <span class="c1"># Termination check</span>
+        <span class="k">if</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Done!&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Maximum time reached.&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_discount</span> <span class="o">*</span> <span class="mi">10</span> <span class="o">&lt;</span> <span class="mf">1e-4</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Discount factor already too small&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+
+    <span class="k">return</span> <span class="n">_total_discounted_reward</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../../api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">worldstr</span><span class="p">,</span> <span class="n">robotstr</span> <span class="o">=</span> <span class="n">world0</span>
+    <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="o">.</span><span class="n">from_str</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">free_cells</span> <span class="o">=</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">free_cells</span><span class="p">()</span>
+    <span class="n">init_robot_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">init_target_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="n">problem</span> <span class="o">=</span> <span class="n">TagProblem</span><span class="p">(</span>
+        <span class="n">init_robot_position</span><span class="p">,</span>
+        <span class="n">init_target_position</span><span class="p">,</span>
+        <span class="n">grid_map</span><span class="p">,</span>
+        <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span>
+        <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">,</span>
+        <span class="n">belief_type</span><span class="o">=</span><span class="s2">&quot;histogram&quot;</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">solve</span><span class="p">(</span>
+        <span class="n">problem</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">15</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">planning_time</span><span class="o">=</span><span class="mf">0.8</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
+        <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">max_time</span><span class="o">=</span><span class="mi">360</span><span class="p">,</span>
+        <span class="n">max_steps</span><span class="o">=</span><span class="mi">251</span><span class="p">,</span>
+        <span class="n">planner_type</span><span class="o">=</span><span class="s2">&quot;pouct&quot;</span><span class="p">,</span>
+    <span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/pomdp_py/problems/tiger/tiger_problem.html b/docs/html/_modules/pomdp_py/problems/tiger/tiger_problem.html
index 97a0b2d2..4ad05dbd 100644
--- a/docs/html/_modules/pomdp_py/problems/tiger/tiger_problem.html
+++ b/docs/html/_modules/pomdp_py/problems/tiger/tiger_problem.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.problems.tiger.tiger_problem &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tiger.tiger_problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/representations/belief/histogram.html b/docs/html/_modules/pomdp_py/representations/belief/histogram.html
index b4d9661e..86f372fc 100644
--- a/docs/html/_modules/pomdp_py/representations/belief/histogram.html
+++ b/docs/html/_modules/pomdp_py/representations/belief/histogram.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.representations.belief.histogram &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.representations.belief.histogram &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/colors.html b/docs/html/_modules/pomdp_py/utils/colors.html
index 57f5f40c..123febd6 100644
--- a/docs/html/_modules/pomdp_py/utils/colors.html
+++ b/docs/html/_modules/pomdp_py/utils/colors.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.colors &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.colors &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/debugging.html b/docs/html/_modules/pomdp_py/utils/debugging.html
index b9d33576..b76f7766 100644
--- a/docs/html/_modules/pomdp_py/utils/debugging.html
+++ b/docs/html/_modules/pomdp_py/utils/debugging.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.debugging &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.debugging &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -439,7 +441,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="TreeDebugger">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger">[docs]</a>
 <span class="k">class</span> <span class="nc">TreeDebugger</span><span class="p">:</span>
 <span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">    Helps you debug the search tree; A search tree is a tree</span>
@@ -491,7 +493,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="k">return</span> <span class="n">stats</span>
 
 <div class="viewcode-block" id="TreeDebugger.num_nodes">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.num_nodes">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.num_nodes">[docs]</a>
     <span class="k">def</span> <span class="nf">num_nodes</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">kind</span><span class="o">=</span><span class="s2">&quot;all&quot;</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">        Returns the total number of nodes in the tree rooted at &quot;current&quot;</span>
@@ -551,14 +553,14 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">num_nodes</span><span class="p">(</span><span class="n">kind</span><span class="o">=</span><span class="s2">&quot;v&quot;</span><span class="p">)</span>
 
 <div class="viewcode-block" id="TreeDebugger.l">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.l">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.l">[docs]</a>
     <span class="k">def</span> <span class="nf">l</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">as_debuggers</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;alias for layer&quot;&quot;&quot;</span>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">layer</span><span class="p">(</span><span class="n">depth</span><span class="p">,</span> <span class="n">as_debuggers</span><span class="o">=</span><span class="n">as_debuggers</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="TreeDebugger.layer">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.layer">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.layer">[docs]</a>
     <span class="k">def</span> <span class="nf">layer</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">as_debuggers</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">        Returns a list of nodes at the given depth. Will only return VNodes.</span>
@@ -612,7 +614,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="k">return</span> <span class="n">leafs</span>
 
 <div class="viewcode-block" id="TreeDebugger.step">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.step">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.step">[docs]</a>
     <span class="k">def</span> <span class="nf">step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">key</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Updates current interaction node to follow the</span>
 <span class="sd">        edge along key&quot;&quot;&quot;</span>
@@ -622,14 +624,14 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="TreeDebugger.s">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.s">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.s">[docs]</a>
     <span class="k">def</span> <span class="nf">s</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">key</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;alias for step&quot;&quot;&quot;</span>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">step</span><span class="p">(</span><span class="n">key</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="TreeDebugger.back">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.back">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.back">[docs]</a>
     <span class="k">def</span> <span class="nf">back</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;move current node of interaction back to parent&quot;&quot;&quot;</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">current</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">current</span><span class="o">.</span><span class="n">parent</span></div>
@@ -656,7 +658,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">current</span>
 
 <div class="viewcode-block" id="TreeDebugger.p">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.p">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.p">[docs]</a>
     <span class="k">def</span> <span class="nf">p</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;print tree&quot;&quot;&quot;</span>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">current</span><span class="o">.</span><span class="n">p</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
@@ -680,7 +682,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="o">.</span><span class="n">p</span><span class="p">(</span><span class="s2">&quot;marked-only&quot;</span><span class="p">)</span>
 
 <div class="viewcode-block" id="TreeDebugger.mark_sequence">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.mark_sequence">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.mark_sequence">[docs]</a>
     <span class="k">def</span> <span class="nf">mark_sequence</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seq</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="n">DEFAULT_MARK_COLOR</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">        Given a list of keys (understandable by __getitem__ in _NodePP),</span>
@@ -696,21 +698,21 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="TreeDebugger.mark">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.mark">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.mark">[docs]</a>
     <span class="k">def</span> <span class="nf">mark</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">seq</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;alias for mark_sequence&quot;&quot;&quot;</span>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">mark_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="TreeDebugger.mark_path">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.mark_path">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.mark_path">[docs]</a>
     <span class="k">def</span> <span class="nf">mark_path</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dest</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;paths the path to dest node&quot;&quot;&quot;</span>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">mark</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">path_to</span><span class="p">(</span><span class="n">dest</span><span class="p">),</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="TreeDebugger.markp">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.markp">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.markp">[docs]</a>
     <span class="k">def</span> <span class="nf">markp</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dest</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;alias to mark_path&quot;&quot;&quot;</span>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">mark_path</span><span class="p">(</span><span class="n">dest</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
@@ -733,7 +735,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">preferred_actions</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">current</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
 
 <div class="viewcode-block" id="TreeDebugger.bestseqd">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.bestseqd">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.bestseqd">[docs]</a>
     <span class="k">def</span> <span class="nf">bestseqd</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_depth</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
 <span class="sd">        alias for bestseq except with</span>
@@ -742,7 +744,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="TreeDebugger.single_node_str">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.single_node_str">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.single_node_str">[docs]</a>
     <span class="nd">@staticmethod</span>
     <span class="k">def</span> <span class="nf">single_node_str</span><span class="p">(</span><span class="n">node</span><span class="p">,</span> <span class="n">parent_edge</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">indent</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">include_children</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
@@ -783,7 +785,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="TreeDebugger.preferred_actions">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.preferred_actions">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.preferred_actions">[docs]</a>
     <span class="nd">@staticmethod</span>
     <span class="k">def</span> <span class="nf">preferred_actions</span><span class="p">(</span><span class="n">root</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
@@ -827,7 +829,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
             <span class="p">)</span>
 
 <div class="viewcode-block" id="TreeDebugger.path">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.path">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.path">[docs]</a>
     <span class="k">def</span> <span class="nf">path</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dest</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;alias for path_to;</span>
 <span class="sd">        Example usage:</span>
@@ -840,7 +842,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="TreeDebugger.path_to">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.path_to">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.path_to">[docs]</a>
     <span class="k">def</span> <span class="nf">path_to</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dest</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns a list of keys (actions / observations) that represents the path from</span>
 <span class="sd">        self.current to the given node `dest`. Returns None if the path does not</span>
@@ -875,7 +877,7 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
         <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="nb">reversed</span><span class="p">(</span><span class="n">path</span><span class="p">))</span>
 
 <div class="viewcode-block" id="TreeDebugger.tree_stats">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.tree_stats">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.tree_stats">[docs]</a>
     <span class="nd">@staticmethod</span>
     <span class="k">def</span> <span class="nf">tree_stats</span><span class="p">(</span><span class="n">root</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Gether statistics about the tree&quot;&quot;&quot;</span>
@@ -925,14 +927,14 @@ <h1>Source code for pomdp_py.utils.debugging</h1><div class="highlight"><pre>
 
 
 <div class="viewcode-block" id="sorted_by_str">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.sorted_by_str">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.sorted_by_str">[docs]</a>
 <span class="k">def</span> <span class="nf">sorted_by_str</span><span class="p">(</span><span class="n">enumerable</span><span class="p">):</span>
     <span class="k">return</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">enumerable</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">n</span><span class="p">:</span> <span class="nb">str</span><span class="p">(</span><span class="n">n</span><span class="p">))</span></div>
 
 
 
 <div class="viewcode-block" id="interpret_color">
-<a class="viewcode-back" href="../../../api/pomdp_py.utils.html#pomdp_py.utils.debugging.interpret_color">[docs]</a>
+<a class="viewcode-back" href="../../../api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.interpret_color">[docs]</a>
 <span class="k">def</span> <span class="nf">interpret_color</span><span class="p">(</span><span class="n">colorstr</span><span class="p">):</span>
     <span class="k">if</span> <span class="n">colorstr</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span> <span class="ow">in</span> <span class="n">typ</span><span class="o">.</span><span class="n">colors</span><span class="p">:</span>
         <span class="k">return</span> <span class="nb">eval</span><span class="p">(</span><span class="s2">&quot;typ.</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">colorstr</span><span class="p">))</span>
diff --git a/docs/html/_modules/pomdp_py/utils/interfaces/conversion.html b/docs/html/_modules/pomdp_py/utils/interfaces/conversion.html
index c4076fd6..0b0938e5 100644
--- a/docs/html/_modules/pomdp_py/utils/interfaces/conversion.html
+++ b/docs/html/_modules/pomdp_py/utils/interfaces/conversion.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.interfaces.conversion &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.interfaces.conversion &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/interfaces/solvers.html b/docs/html/_modules/pomdp_py/utils/interfaces/solvers.html
index a75429be..d4a8fa83 100644
--- a/docs/html/_modules/pomdp_py/utils/interfaces/solvers.html
+++ b/docs/html/_modules/pomdp_py/utils/interfaces/solvers.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.interfaces.solvers &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.interfaces.solvers &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/math.html b/docs/html/_modules/pomdp_py/utils/math.html
index 52b470c9..3431f42a 100644
--- a/docs/html/_modules/pomdp_py/utils/math.html
+++ b/docs/html/_modules/pomdp_py/utils/math.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.math &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.math &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/misc.html b/docs/html/_modules/pomdp_py/utils/misc.html
index 65b0dd3f..ffd3c2b9 100644
--- a/docs/html/_modules/pomdp_py/utils/misc.html
+++ b/docs/html/_modules/pomdp_py/utils/misc.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.misc &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.misc &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/templates.html b/docs/html/_modules/pomdp_py/utils/templates.html
index 672fb1fa..0d130962 100644
--- a/docs/html/_modules/pomdp_py/utils/templates.html
+++ b/docs/html/_modules/pomdp_py/utils/templates.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.templates &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.templates &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/pomdp_py/utils/typ.html b/docs/html/_modules/pomdp_py/utils/typ.html
index c26554d5..1bea9c94 100644
--- a/docs/html/_modules/pomdp_py/utils/typ.html
+++ b/docs/html/_modules/pomdp_py/utils/typ.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>pomdp_py.utils.typ &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.typ &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
-    <script src="../../../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
     <script src="../../../_static/doctools.js?v=888ff710"></script>
     <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../../../_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,10 +55,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/_modules/problems/load_unload/load_unload.html b/docs/html/_modules/problems/load_unload/load_unload.html
new file mode 100644
index 00000000..c112a8bd
--- /dev/null
+++ b/docs/html/_modules/problems/load_unload/load_unload.html
@@ -0,0 +1,535 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.load_unload.load_unload &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.load_unload.load_unload</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The load unload problem. An agent is placed on a one dimensional grid world</span>
+<span class="sd">and is tasked with loading itself up on the right side of the world and</span>
+<span class="sd">unloading on the left. The agent can observe whether or not it is in the load or</span>
+<span class="sd">unload block but can not tell its exact location of whether it is loaded or</span>
+<span class="sd">unloaded. Therefore the agent must maintain belief about it&#39;s location and load</span>
+<span class="sd">status.</span>
+
+<span class="sd">States are defined by the location of the agent and whether or not it is loaded</span>
+<span class="sd">Actions: &quot;move-left&quot;, &quot;move-right&quot;</span>
+<span class="sd">Rewards:</span>
+<span class="sd">    +100 for moving into the unload block while loaded</span>
+<span class="sd">    -1 otherwise</span>
+
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">sys</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
+<span class="kn">from</span> <span class="nn">matplotlib.animation</span> <span class="kn">import</span> <span class="n">FuncAnimation</span>
+
+
+<span class="n">EPSILON</span> <span class="o">=</span> <span class="mf">1e-3</span>
+<span class="n">LOAD_LOCATION</span> <span class="o">=</span> <span class="mi">10</span>
+
+
+<div class="viewcode-block" id="LUState">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUState">[docs]</a>
+<span class="k">class</span> <span class="nc">LUState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">State</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">loaded</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">x</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">int</span> <span class="ow">or</span> <span class="n">x</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Invalid state: </span><span class="si">{}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">x</span><span class="p">,</span> <span class="n">loaded</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;x must be an integer &gt; 0&quot;</span>
+            <span class="p">)</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">loaded</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">bool</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Invalid state: </span><span class="si">{}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">((</span><span class="n">x</span><span class="p">,</span> <span class="n">loaded</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;loaded must be a boolean&quot;</span>
+            <span class="p">)</span>
+        <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">loaded</span> <span class="o">==</span> <span class="kc">True</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Agent can not be loaded in the 0th position&quot;</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span> <span class="ow">and</span> <span class="n">loaded</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Agent can not be unloaded in the last position&quot;</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">x</span> <span class="o">=</span> <span class="n">x</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span> <span class="o">=</span> <span class="n">loaded</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">LUState</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">x</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">tuple</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">other</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span> <span class="o">==</span> <span class="n">other</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">x</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">loaded</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;State(</span><span class="si">{}</span><span class="s2">)&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="LUAction">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUAction">[docs]</a>
+<span class="k">class</span> <span class="nc">LUAction</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">name</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="s2">&quot;move-left&quot;</span><span class="p">,</span> <span class="s2">&quot;move-right&quot;</span><span class="p">]:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">name</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">LUAction</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Action(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span></div>
+
+
+
+<div class="viewcode-block" id="LUObservation">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUObservation">[docs]</a>
+<span class="k">class</span> <span class="nc">LUObservation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">obs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">obs</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">[</span><span class="s2">&quot;load&quot;</span><span class="p">,</span> <span class="s2">&quot;unload&quot;</span><span class="p">,</span> <span class="s2">&quot;middle&quot;</span><span class="p">]:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Invalid observation: </span><span class="si">{}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">name</span><span class="p">)</span>
+                <span class="o">+</span> <span class="s2">&quot;Observation must be an integer &gt; 0&quot;</span>
+            <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">obs</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">LUObservation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Observation(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">x</span><span class="p">)</span></div>
+
+
+
+<span class="c1"># Observation model</span>
+<div class="viewcode-block" id="LUObservationModel">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LUObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObservationModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This problem is small enough for the probabilities to be directly given</span>
+<span class="sd">    externally&quot;&quot;&quot;</span>
+
+<div class="viewcode-block" id="LUObservationModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">observation</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="c1"># return EPSILON to avoid degradation of particles</span>
+            <span class="k">return</span> <span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="LUObservationModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">LUObservation</span><span class="p">(</span><span class="s2">&quot;unload&quot;</span><span class="p">)</span>
+        <span class="k">elif</span> <span class="n">next_state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">LUObservation</span><span class="p">(</span><span class="s2">&quot;load&quot;</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">LUObservation</span><span class="p">(</span><span class="s2">&quot;middle&quot;</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="LUObservationModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely observation&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Transition Model</span>
+<div class="viewcode-block" id="LUTransitionModel">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LUTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This problem is small enough for the probabilities to be directly given</span>
+<span class="sd">    externally&quot;&quot;&quot;</span>
+
+<div class="viewcode-block" id="LUTransitionModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_state</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="LUTransitionModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span> <span class="ow">and</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-right&quot;</span><span class="p">)</span> <span class="ow">or</span> <span class="p">(</span>
+            <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-left&quot;</span>
+        <span class="p">):</span>
+            <span class="c1"># trying to make invalid move, stay in the same place</span>
+            <span class="k">return</span> <span class="n">state</span>
+
+        <span class="k">if</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-right&quot;</span><span class="p">:</span>
+            <span class="c1"># make sure we&#39;re always loaded in the far right cell</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">loaded</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-left&quot;</span><span class="p">:</span>
+            <span class="c1"># make sure we&#39;re always unloaded in the first cell</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">-</span> <span class="mi">1</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">loaded</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="LUTransitionModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely next state&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Reward Model</span>
+<div class="viewcode-block" id="LURewardModel">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LURewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LURewardModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RewardModel</span><span class="p">):</span>
+<div class="viewcode-block" id="LURewardModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LURewardModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">reward</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span>
+    <span class="p">):</span>
+        <span class="k">if</span> <span class="n">reward</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="mf">1.0</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">0.0</span></div>
+
+
+<div class="viewcode-block" id="LURewardModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LURewardModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="c1"># if we are unloaded things, give reward 100, otherwise give -1</span>
+        <span class="k">if</span> <span class="n">action</span> <span class="o">==</span> <span class="s2">&quot;move-left&quot;</span> <span class="ow">and</span> <span class="n">state</span><span class="o">.</span><span class="n">loaded</span> <span class="o">==</span> <span class="kc">True</span> <span class="ow">and</span> <span class="n">state</span><span class="o">.</span><span class="n">x</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">100</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="o">-</span><span class="mi">1</span></div>
+
+
+<div class="viewcode-block" id="LURewardModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LURewardModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely reward&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Policy Model</span>
+<div class="viewcode-block" id="LUPolicyModel">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel">[docs]</a>
+<span class="k">class</span> <span class="nc">LUPolicyModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RandomRollout</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This is an extremely dumb policy model; To keep consistent</span>
+<span class="sd">    with the framework.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span> <span class="o">=</span> <span class="p">{</span><span class="n">LUAction</span><span class="p">(</span><span class="s2">&quot;move-right&quot;</span><span class="p">),</span> <span class="n">LUAction</span><span class="p">(</span><span class="s2">&quot;move-left&quot;</span><span class="p">)}</span>
+
+<div class="viewcode-block" id="LUPolicyModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span>  <span class="c1"># Never used</span></div>
+
+
+<div class="viewcode-block" id="LUPolicyModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">()</span><span class="o">.</span><span class="n">random</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="LUPolicyModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely reward&quot;&quot;&quot;</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="LUPolicyModel.get_all_actions">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.get_all_actions">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="LoadUnloadProblem">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.LoadUnloadProblem">[docs]</a>
+<span class="k">class</span> <span class="nc">LoadUnloadProblem</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMDP</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;init_belief is a Distribution.&quot;&quot;&quot;</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">(</span>
+            <span class="n">init_belief</span><span class="p">,</span>
+            <span class="n">LUPolicyModel</span><span class="p">(),</span>
+            <span class="n">LUTransitionModel</span><span class="p">(),</span>
+            <span class="n">LUObservationModel</span><span class="p">(),</span>
+            <span class="n">LURewardModel</span><span class="p">(),</span>
+        <span class="p">)</span>
+
+        <span class="n">env</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">LUTransitionModel</span><span class="p">(),</span> <span class="n">LURewardModel</span><span class="p">())</span>
+
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;LoadUnloadProblem&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="generate_random_state">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.generate_random_state">[docs]</a>
+<span class="k">def</span> <span class="nf">generate_random_state</span><span class="p">():</span>
+    <span class="c1"># Flip a coin to determine if we are loaded</span>
+    <span class="n">loaded</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">rand</span><span class="p">()</span> <span class="o">&gt;</span> <span class="mf">0.5</span>
+    <span class="n">location</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">LOAD_LOCATION</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+    <span class="k">if</span> <span class="n">location</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="n">loaded</span> <span class="o">=</span> <span class="kc">False</span>
+    <span class="k">if</span> <span class="n">location</span> <span class="o">==</span> <span class="n">LOAD_LOCATION</span><span class="p">:</span>
+        <span class="n">loaded</span> <span class="o">=</span> <span class="kc">True</span>
+    <span class="k">return</span> <span class="n">LUState</span><span class="p">(</span><span class="n">location</span><span class="p">,</span> <span class="n">loaded</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="generate_init_belief">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.generate_init_belief">[docs]</a>
+<span class="k">def</span> <span class="nf">generate_init_belief</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+    <span class="n">particles</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+        <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">generate_random_state</span><span class="p">())</span>
+
+    <span class="k">return</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="test_planner">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.test_planner">[docs]</a>
+<span class="k">def</span> <span class="nf">test_planner</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="p">,</span> <span class="n">planner</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">discount</span><span class="o">=</span><span class="mf">0.95</span><span class="p">):</span>
+    <span class="n">gamma</span> <span class="o">=</span> <span class="mf">1.0</span>
+    <span class="n">total_reward</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">total_discounted_reward</span> <span class="o">=</span> <span class="mi">0</span>
+
+    <span class="n">fig</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">()</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="s2">&quot;Load/Unload problem (Red = empty, Blue = full)&quot;</span><span class="p">)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;Position&quot;</span><span class="p">)</span>
+
+    <span class="n">ax</span> <span class="o">=</span> <span class="n">fig</span><span class="o">.</span><span class="n">add_subplot</span><span class="p">(</span><span class="mi">111</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlim</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">LOAD_LOCATION</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylim</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
+    <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="p">[],</span> <span class="p">[]</span>
+    <span class="p">(</span><span class="n">scat</span><span class="p">,)</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s2">&quot;x&quot;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">ls</span><span class="o">=</span><span class="s2">&quot; &quot;</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s2">&quot;black&quot;</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="nf">update</span><span class="p">(</span><span class="n">t</span><span class="p">):</span>
+        <span class="k">nonlocal</span> <span class="n">gamma</span><span class="p">,</span> <span class="n">total_reward</span><span class="p">,</span> <span class="n">total_discounted_reward</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">t</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="n">action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+
+        <span class="n">env_reward</span> <span class="o">=</span> <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+        <span class="n">true_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">action</span>
+        <span class="p">)</span>
+        <span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">total_reward</span> <span class="o">+=</span> <span class="n">env_reward</span>
+        <span class="n">total_discounted_reward</span> <span class="o">+=</span> <span class="n">env_reward</span> <span class="o">*</span> <span class="n">gamma</span>
+        <span class="n">gamma</span> <span class="o">*=</span> <span class="n">discount</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;True state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">true_state</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">env_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative Discounted): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">total_discounted_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Belief: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">sample_belief</span><span class="p">()))</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__plan_time__: </span><span class="si">%.5f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_planning_time</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">PORollout</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__best_reward__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_best_reward</span><span class="p">)</span>
+
+        <span class="n">new_x</span><span class="p">,</span> <span class="n">new_y</span> <span class="o">=</span> <span class="p">[</span><span class="n">true_state</span><span class="o">.</span><span class="n">x</span><span class="p">],</span> <span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+        <span class="n">scat</span><span class="o">.</span><span class="n">set_data</span><span class="p">(</span><span class="n">new_x</span><span class="p">,</span> <span class="n">new_y</span><span class="p">)</span>
+        <span class="n">scat</span><span class="o">.</span><span class="n">set_color</span><span class="p">(</span><span class="s2">&quot;b&quot;</span> <span class="k">if</span> <span class="n">true_state</span><span class="o">.</span><span class="n">loaded</span> <span class="k">else</span> <span class="s2">&quot;r&quot;</span><span class="p">)</span>
+        <span class="k">return</span> <span class="p">(</span><span class="n">scat</span><span class="p">,)</span>
+
+    <span class="n">ani</span> <span class="o">=</span> <span class="n">FuncAnimation</span><span class="p">(</span><span class="n">fig</span><span class="p">,</span> <span class="n">update</span><span class="p">,</span> <span class="n">frames</span><span class="o">=</span><span class="n">nsteps</span><span class="p">,</span> <span class="n">interval</span><span class="o">=</span><span class="mi">500</span><span class="p">)</span>
+    <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../problems/problems.load_unload.html#problems.load_unload.load_unload.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">init_state</span> <span class="o">=</span> <span class="n">generate_random_state</span><span class="p">()</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">generate_init_belief</span><span class="p">(</span><span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span>
+    <span class="n">load_unload_problem</span> <span class="o">=</span> <span class="n">LoadUnloadProblem</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">)</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;** Testing POMCP **&quot;</span><span class="p">)</span>
+    <span class="n">pomcp</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">num_sims</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">110</span><span class="p">,</span>
+        <span class="n">rollout_policy</span><span class="o">=</span><span class="n">load_unload_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">test_planner</span><span class="p">(</span><span class="n">load_unload_problem</span><span class="p">,</span> <span class="n">pomcp</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/maze/domain/observation.html b/docs/html/_modules/problems/maze/domain/observation.html
new file mode 100644
index 00000000..64067b8d
--- /dev/null
+++ b/docs/html/_modules/problems/maze/domain/observation.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.maze.domain.observation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.maze.domain.observation</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+
+
+<span class="c1"># we index the walls around a grid cell in</span>
+<span class="c1"># clockwise fashion: top wall (0), right wall (1),</span>
+<span class="c1"># bottom wall (2), left wall (3).</span>
+<span class="n">WALL</span> <span class="o">=</span> <span class="p">{</span><span class="mi">0</span><span class="p">:</span> <span class="s2">&quot;top&quot;</span><span class="p">,</span> <span class="mi">1</span><span class="p">:</span> <span class="s2">&quot;right&quot;</span><span class="p">,</span> <span class="mi">2</span><span class="p">:</span> <span class="s2">&quot;bottom&quot;</span><span class="p">,</span> <span class="mi">3</span><span class="p">:</span> <span class="s2">&quot;left&quot;</span><span class="p">}</span>
+
+
+<div class="viewcode-block" id="Observation">
+<a class="viewcode-back" href="../../../../problems/problems.maze.domain.html#problems.maze.domain.observation.Observation">[docs]</a>
+<span class="k">class</span> <span class="nc">Observation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">walls</span><span class="p">,</span> <span class="n">orientation</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Args:</span>
+<span class="sd">            walls (tuple) is a tuple of integers, that indicate the walls</span>
+<span class="sd">            around a grid cell that are present.</span>
+<span class="sd">            orientation (float) is the orientation of the robot.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">walls</span> <span class="o">=</span> <span class="n">walls</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">orientation</span> <span class="o">=</span> <span class="n">orientation</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">wall_case</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">orientation</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">Observation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">walls</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">walls</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">orientation</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">orientation</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/maze/domain/state.html b/docs/html/_modules/problems/maze/domain/state.html
new file mode 100644
index 00000000..ab02857e
--- /dev/null
+++ b/docs/html/_modules/problems/maze/domain/state.html
@@ -0,0 +1,179 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.maze.domain.state &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.maze.domain.state</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Defines the State for the maze domain, which is the position of the robot and its orientation.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+
+
+<div class="viewcode-block" id="State">
+<a class="viewcode-back" href="../../../../problems/problems.maze.domain.html#problems.maze.domain.state.State">[docs]</a>
+<span class="k">class</span> <span class="nc">State</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">State</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;The state of the problem is just the robot position&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">positition</span><span class="p">,</span> <span class="n">orientation</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Initializes a state in light dark domain.</span>
+
+<span class="sd">        Args:</span>
+<span class="sd">            position (tuple): position of the robot.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">position</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;State position must be a vector of length 2&quot;</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">position</span> <span class="o">=</span> <span class="n">positition</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">orientation</span> <span class="o">=</span> <span class="n">orientation</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">position</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">orientation</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">State</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">position</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">position</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="kc">False</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="fm">__repr__</span><span class="p">()</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;State(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">position</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">orientation</span><span class="p">))</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/maze/env/env.html b/docs/html/_modules/problems/maze/env/env.html
new file mode 100644
index 00000000..429e025a
--- /dev/null
+++ b/docs/html/_modules/problems/maze/env/env.html
@@ -0,0 +1,149 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.maze.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.maze.env.env</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+
+
+<div class="viewcode-block" id="MazeEnvironment">
+<a class="viewcode-back" href="../../../../problems/problems.maze.env.html#problems.maze.env.env.MazeEnvironment">[docs]</a>
+<span class="k">class</span> <span class="nc">MazeEnvironment</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">init_state</span><span class="p">):</span>
+        <span class="k">pass</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/agent/agent.html b/docs/html/_modules/problems/multi_object_search/agent/agent.html
new file mode 100644
index 00000000..98259a66
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/agent/agent.html
@@ -0,0 +1,214 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.agent.agent &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.agent.agent</h1><div class="highlight"><pre>
+<span></span><span class="c1"># Defines the agent. There&#39;s nothing special</span>
+<span class="c1"># about the MOS agent in fact, except that</span>
+<span class="c1"># it uses models defined in ..models, and</span>
+<span class="c1"># makes use of the belief initialization</span>
+<span class="c1"># functions in belief.py</span>
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">.belief</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">..models.transition_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">..models.observation_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">..models.reward_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">..models.policy_model</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="MosAgent">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.agent.html#problems.multi_object_search.agent.agent.MosAgent">[docs]</a>
+<span class="k">class</span> <span class="nc">MosAgent</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;One agent is one robot.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">robot_id</span><span class="p">,</span>
+        <span class="n">init_robot_state</span><span class="p">,</span>  <span class="c1"># initial robot state (assuming robot state is observable perfectly)</span>
+        <span class="n">object_ids</span><span class="p">,</span>  <span class="c1"># target object ids</span>
+        <span class="n">dim</span><span class="p">,</span>  <span class="c1"># tuple (w,l) of the width (w) and length (l) of the gridworld search space.</span>
+        <span class="n">sensor</span><span class="p">,</span>  <span class="c1"># Sensor equipped on the robot</span>
+        <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span>  <span class="c1"># parameter for observation model</span>
+        <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>  <span class="c1"># parameter for observation model</span>
+        <span class="n">belief_rep</span><span class="o">=</span><span class="s2">&quot;histogram&quot;</span><span class="p">,</span>  <span class="c1"># belief representation, either &quot;histogram&quot; or &quot;particles&quot;.</span>
+        <span class="n">prior</span><span class="o">=</span><span class="p">{},</span>  <span class="c1"># prior belief, as defined in belief.py:initialize_belief</span>
+        <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>  <span class="c1"># used if the belief representation is particles</span>
+        <span class="n">grid_map</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+    <span class="p">):</span>  <span class="c1"># GridMap used to avoid collision with obstacles (None if not provided)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_object_ids</span> <span class="o">=</span> <span class="n">object_ids</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">sensor</span> <span class="o">=</span> <span class="n">sensor</span>
+
+        <span class="c1"># since the robot observes its own pose perfectly, it will have 100% prior</span>
+        <span class="c1"># on this pose.</span>
+        <span class="n">prior</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span><span class="n">init_robot_state</span><span class="o">.</span><span class="n">pose</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">}</span>
+        <span class="n">rth</span> <span class="o">=</span> <span class="n">init_robot_state</span><span class="o">.</span><span class="n">pose</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span>
+
+        <span class="c1"># initialize belief</span>
+        <span class="n">init_belief</span> <span class="o">=</span> <span class="n">initialize_belief</span><span class="p">(</span>
+            <span class="n">dim</span><span class="p">,</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">,</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_object_ids</span><span class="p">,</span>
+            <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">,</span>
+            <span class="n">representation</span><span class="o">=</span><span class="n">belief_rep</span><span class="p">,</span>
+            <span class="n">robot_orientations</span><span class="o">=</span><span class="p">{</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">:</span> <span class="n">rth</span><span class="p">},</span>
+            <span class="n">num_particles</span><span class="o">=</span><span class="n">num_particles</span><span class="p">,</span>
+        <span class="p">)</span>
+        <span class="n">transition_model</span> <span class="o">=</span> <span class="n">MosTransitionModel</span><span class="p">(</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="p">{</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sensor</span><span class="p">},</span> <span class="bp">self</span><span class="o">.</span><span class="n">_object_ids</span>
+        <span class="p">)</span>
+        <span class="n">observation_model</span> <span class="o">=</span> <span class="n">MosObservationModel</span><span class="p">(</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sensor</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_object_ids</span><span class="p">,</span> <span class="n">sigma</span><span class="o">=</span><span class="n">sigma</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="n">epsilon</span>
+        <span class="p">)</span>
+        <span class="n">reward_model</span> <span class="o">=</span> <span class="n">GoalRewardModel</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_object_ids</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">policy_model</span> <span class="o">=</span> <span class="n">PolicyModel</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">grid_map</span><span class="o">=</span><span class="n">grid_map</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+            <span class="n">init_belief</span><span class="p">,</span>
+            <span class="n">policy_model</span><span class="p">,</span>
+            <span class="n">transition_model</span><span class="o">=</span><span class="n">transition_model</span><span class="p">,</span>
+            <span class="n">observation_model</span><span class="o">=</span><span class="n">observation_model</span><span class="p">,</span>
+            <span class="n">reward_model</span><span class="o">=</span><span class="n">reward_model</span><span class="p">,</span>
+        <span class="p">)</span>
+
+<div class="viewcode-block" id="MosAgent.clear_history">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.agent.html#problems.multi_object_search.agent.agent.MosAgent.clear_history">[docs]</a>
+    <span class="k">def</span> <span class="nf">clear_history</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Custum function; clear history&quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_history</span> <span class="o">=</span> <span class="kc">None</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/agent/belief.html b/docs/html/_modules/problems/multi_object_search/agent/belief.html
new file mode 100644
index 00000000..82f126ea
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/agent/belief.html
@@ -0,0 +1,352 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.agent.belief &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.agent.belief</h1><div class="highlight"><pre>
+<span></span><span class="c1"># Defines the belief distribution and update for the 2D Multi-Object Search domain;</span>
+<span class="c1">#</span>
+<span class="c1"># The belief distribution is represented as a Histogram (or Tabular representation).</span>
+<span class="c1"># Since the observation only contains mapping from object id to their location,</span>
+<span class="c1"># the belief update has no leverage on the shape of the sensing region; this is</span>
+<span class="c1"># makes the belief update algorithm more general to any sensing region but then</span>
+<span class="c1"># requires updating the belief by iterating over the state space in a nested</span>
+<span class="c1"># loop. The alternative is to use particle representation but also object-oriented.</span>
+<span class="c1"># We try both here.</span>
+<span class="c1">#</span>
+<span class="c1"># We can directly make use of the Histogram and Particle classes in pomdp_py.</span>
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">from</span> <span class="nn">..domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="MosOOBelief">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.MosOOBelief">[docs]</a>
+<span class="k">class</span> <span class="nc">MosOOBelief</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOBelief</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This is needed to make sure the belief is sampling the right</span>
+<span class="sd">    type of State for this problem.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">object_beliefs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        robot_id (int): The id of the robot that has this belief.</span>
+<span class="sd">        object_beliefs (objid -&gt; GenerativeDistribution)</span>
+<span class="sd">            (includes robot)</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">object_beliefs</span><span class="p">)</span>
+
+<div class="viewcode-block" id="MosOOBelief.mpe">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.MosOOBelief.mpe">[docs]</a>
+    <span class="k">def</span> <span class="nf">mpe</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">MosOOState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOBelief</span><span class="o">.</span><span class="n">mpe</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span><span class="o">.</span><span class="n">object_states</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosOOBelief.random">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.MosOOBelief.random">[docs]</a>
+    <span class="k">def</span> <span class="nf">random</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">MosOOState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOBelief</span><span class="o">.</span><span class="n">random</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span><span class="o">.</span><span class="n">object_states</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="initialize_belief">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.initialize_belief">[docs]</a>
+<span class="k">def</span> <span class="nf">initialize_belief</span><span class="p">(</span>
+    <span class="n">dim</span><span class="p">,</span>
+    <span class="n">robot_id</span><span class="p">,</span>
+    <span class="n">object_ids</span><span class="p">,</span>
+    <span class="n">prior</span><span class="o">=</span><span class="p">{},</span>
+    <span class="n">representation</span><span class="o">=</span><span class="s2">&quot;histogram&quot;</span><span class="p">,</span>
+    <span class="n">robot_orientations</span><span class="o">=</span><span class="p">{},</span>
+    <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+<span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Returns a GenerativeDistribution that is the belief representation for</span>
+<span class="sd">    the multi-object search problem.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        dim (tuple): a tuple (width, length) of the search space gridworld.</span>
+<span class="sd">        robot_id (int): robot id that this belief is initialized for.</span>
+<span class="sd">        object_ids (dict): a set of object ids that we want to model the belief distribution</span>
+<span class="sd">                          over; They are `assumed` to be the target objects, not obstacles,</span>
+<span class="sd">                          because the robot doesn&#39;t really care about obstacle locations and</span>
+<span class="sd">                          modeling them just adds computation cost.</span>
+<span class="sd">        prior (dict): A mapping {(objid|robot_id) -&gt; {(x,y) -&gt; [0,1]}}. If used, then</span>
+<span class="sd">                      all locations not included in the prior will be treated to have 0 probability.</span>
+<span class="sd">                      If unspecified for an object, then the belief over that object is assumed</span>
+<span class="sd">                      to be a uniform distribution.</span>
+<span class="sd">        robot_orientations (dict): Mapping from robot id to their initial orientation (radian).</span>
+<span class="sd">                                   Assumed to be 0 if robot id not in this dictionary.</span>
+<span class="sd">        num_particles (int): Maximum number of particles used to represent the belief</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">        GenerativeDistribution: the initial belief representation.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="k">if</span> <span class="n">representation</span> <span class="o">==</span> <span class="s2">&quot;histogram&quot;</span><span class="p">:</span>
+        <span class="k">return</span> <span class="n">_initialize_histogram_belief</span><span class="p">(</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">object_ids</span><span class="p">,</span> <span class="n">prior</span><span class="p">,</span> <span class="n">robot_orientations</span>
+        <span class="p">)</span>
+    <span class="k">elif</span> <span class="n">representation</span> <span class="o">==</span> <span class="s2">&quot;particles&quot;</span><span class="p">:</span>
+        <span class="k">return</span> <span class="n">_initialize_particles_belief</span><span class="p">(</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">object_ids</span><span class="p">,</span> <span class="n">robot_orientations</span><span class="p">,</span> <span class="n">num_particles</span><span class="o">=</span><span class="n">num_particles</span>
+        <span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Unsupported belief representation </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">representation</span><span class="p">)</span></div>
+
+
+
+<span class="k">def</span> <span class="nf">_initialize_histogram_belief</span><span class="p">(</span><span class="n">dim</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">object_ids</span><span class="p">,</span> <span class="n">prior</span><span class="p">,</span> <span class="n">robot_orientations</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Returns the belief distribution represented as a histogram</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">oo_hists</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># objid -&gt; Histogram</span>
+    <span class="n">width</span><span class="p">,</span> <span class="n">length</span> <span class="o">=</span> <span class="n">dim</span>
+    <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">object_ids</span><span class="p">:</span>
+        <span class="n">hist</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># pose -&gt; prob</span>
+        <span class="n">total_prob</span> <span class="o">=</span> <span class="mi">0</span>
+        <span class="k">if</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">:</span>
+            <span class="c1"># prior knowledge provided. Just use the prior knowledge</span>
+            <span class="k">for</span> <span class="n">pose</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">]:</span>
+                <span class="n">state</span> <span class="o">=</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;target&quot;</span><span class="p">,</span> <span class="n">pose</span><span class="p">)</span>
+                <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">=</span> <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="n">pose</span><span class="p">]</span>
+                <span class="n">total_prob</span> <span class="o">+=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># no prior knowledge. So uniform.</span>
+            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">width</span><span class="p">):</span>
+                <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">length</span><span class="p">):</span>
+                    <span class="n">state</span> <span class="o">=</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;target&quot;</span><span class="p">,</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">))</span>
+                    <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">=</span> <span class="mf">1.0</span>
+                    <span class="n">total_prob</span> <span class="o">+=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+
+        <span class="c1"># Normalize</span>
+        <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="n">hist</span><span class="p">:</span>
+            <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">/=</span> <span class="n">total_prob</span>
+
+        <span class="n">hist_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">(</span><span class="n">hist</span><span class="p">)</span>
+        <span class="n">oo_hists</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">hist_belief</span>
+
+    <span class="c1"># For the robot, we assume it can observe its own state;</span>
+    <span class="c1"># Its pose must have been provided in the `prior`.</span>
+    <span class="k">assert</span> <span class="n">robot_id</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">,</span> <span class="s2">&quot;Missing initial robot pose in prior.&quot;</span>
+    <span class="n">init_robot_pose</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">prior</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">oo_hists</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">(</span>
+        <span class="p">{</span><span class="n">RobotState</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">init_robot_pose</span><span class="p">,</span> <span class="p">(),</span> <span class="kc">None</span><span class="p">):</span> <span class="mf">1.0</span><span class="p">}</span>
+    <span class="p">)</span>
+
+    <span class="k">return</span> <span class="n">MosOOBelief</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">oo_hists</span><span class="p">)</span>
+
+
+<span class="k">def</span> <span class="nf">_initialize_particles_belief</span><span class="p">(</span>
+    <span class="n">dim</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">object_ids</span><span class="p">,</span> <span class="n">prior</span><span class="p">,</span> <span class="n">robot_orientations</span><span class="p">,</span> <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span>
+<span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This returns a single set of particles that represent the distribution over a</span>
+<span class="sd">    joint state space of all objects.</span>
+
+<span class="sd">    Since it is very difficult to provide a prior knowledge over the joint state</span>
+<span class="sd">    space when the number of objects scales, the prior (which is</span>
+<span class="sd">    object-oriented), is used to create particles separately for each object to</span>
+<span class="sd">    satisfy the prior; That is, particles beliefs are generated for each object</span>
+<span class="sd">    as if object_oriented=True. Then, `num_particles` number of particles with</span>
+<span class="sd">    joint state is sampled randomly from these particle beliefs.</span>
+
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="c1"># For the robot, we assume it can observe its own state;</span>
+    <span class="c1"># Its pose must have been provided in the `prior`.</span>
+    <span class="k">assert</span> <span class="n">robot_id</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">,</span> <span class="s2">&quot;Missing initial robot pose in prior.&quot;</span>
+    <span class="n">init_robot_pose</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">prior</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="n">oo_particles</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># objid -&gt; Particageles</span>
+    <span class="n">width</span><span class="p">,</span> <span class="n">length</span> <span class="o">=</span> <span class="n">dim</span>
+    <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">object_ids</span><span class="p">:</span>
+        <span class="n">particles</span> <span class="o">=</span> <span class="p">[</span>
+            <span class="n">RobotState</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">init_robot_pose</span><span class="p">,</span> <span class="p">(),</span> <span class="kc">None</span><span class="p">)</span>
+        <span class="p">]</span>  <span class="c1"># list of states; Starting the observable robot state.</span>
+        <span class="k">if</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">:</span>
+            <span class="c1"># prior knowledge provided. Just use the prior knowledge</span>
+            <span class="n">prior_sum</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="n">pose</span><span class="p">]</span> <span class="k">for</span> <span class="n">pose</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">])</span>
+            <span class="k">for</span> <span class="n">pose</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">]:</span>
+                <span class="n">state</span> <span class="o">=</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;target&quot;</span><span class="p">,</span> <span class="n">pose</span><span class="p">)</span>
+                <span class="n">amount_to_add</span> <span class="o">=</span> <span class="p">(</span><span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="n">pose</span><span class="p">]</span> <span class="o">/</span> <span class="n">prior_sum</span><span class="p">)</span> <span class="o">*</span> <span class="n">num_particles</span>
+                <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">amount_to_add</span><span class="p">):</span>
+                    <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># no prior knowledge. So uniformly sample `num_particles` number of states.</span>
+            <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+                <span class="n">x</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">width</span><span class="p">)</span>
+                <span class="n">y</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">length</span><span class="p">)</span>
+                <span class="n">state</span> <span class="o">=</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;target&quot;</span><span class="p">,</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">))</span>
+                <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+
+        <span class="n">particles_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span>
+        <span class="n">oo_particles</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">particles_belief</span>
+
+    <span class="c1"># Return Particles distribution which contains particles</span>
+    <span class="c1"># that represent joint object states</span>
+    <span class="n">particles</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+        <span class="n">object_states</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">oo_particles</span><span class="p">:</span>
+            <span class="n">random_particle</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">oo_particles</span><span class="p">[</span><span class="n">objid</span><span class="p">],</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+            <span class="n">object_states</span><span class="p">[</span><span class="n">_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">random_particle</span><span class="p">)</span>
+        <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">MosOOState</span><span class="p">(</span><span class="n">object_states</span><span class="p">))</span>
+    <span class="k">return</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span>
+
+
+<span class="sd">&quot;&quot;&quot;If `object oriented` is True, then just like histograms, there will be</span>
+<span class="sd">one set of particles per object; Otherwise, there is a single set</span>
+<span class="sd">of particles that represent the distribution over a joint state space</span>
+<span class="sd">of all &lt;objects.</span>
+
+<span class="sd">When updating the particle belief, Monte Carlo simulation is used instead of</span>
+<span class="sd">computing the probabilities using T/O models. This means one must sample</span>
+<span class="sd">(s&#39;,o,r) from G(s,a). If this belief representation if object oriented, then</span>
+<span class="sd">you have N particle sets for N objects. Thanks to the fact that in this</span>
+<span class="sd">particular domain, objects are static, you could have si&#39; = si if i is an</span>
+<span class="sd">object. However, if robot state sr&#39; needs to consider collision with other</span>
+<span class="sd">objects, then it can&#39;t be obtained just from sr. This means eventually you</span>
+<span class="sd">would have to build an s by sampling randomly from the particle set for each</span>
+<span class="sd">object.</span>
+
+<span class="sd">More details on the non-object-oriented case: Since it is extremely</span>
+<span class="sd">difficult to provide a prior knowledge over the joint state space when</span>
+<span class="sd">the number of objects scales, the prior (which is object-oriented),</span>
+<span class="sd">is used to create particles separately for each object to satisfy</span>
+<span class="sd">the prior; That is, particles beliefs are generated for each object</span>
+<span class="sd">as if object_oriented=True. Then, `num_particles` number of particles</span>
+<span class="sd">with joint state is sampled randomly from these particle beliefs.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/domain/action.html b/docs/html/_modules/problems/multi_object_search/domain/action.html
new file mode 100644
index 00000000..c3a9457c
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/domain/action.html
@@ -0,0 +1,327 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.domain.action &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.domain.action</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">Defines the Action for the 2D Multi-Object Search domain;</span>
+
+<span class="sd">Action space:</span>
+
+<span class="sd">    Motion :math:`\cup` Look :math:`\cup` Find</span>
+
+<span class="sd">* Motion Actions scheme 1: South, East, West, North.</span>
+<span class="sd">* Motion Actions scheme 2: Left 45deg, Right 45deg, Forward</span>
+<span class="sd">* Look: Interprets sensor input as observation</span>
+<span class="sd">* Find: Marks objects observed in the last Look action as</span>
+<span class="sd">  (differs from original paper; reduces action space)</span>
+
+<span class="sd">It is possible to force &quot;Look&quot; after every N/S/E/W action;</span>
+<span class="sd">then the Look action could be dropped. This is optional behavior.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">math</span>
+
+
+<span class="c1">###### Actions ######</span>
+<div class="viewcode-block" id="Action">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.Action">[docs]</a>
+<span class="k">class</span> <span class="nc">Action</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Action</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Mos action; Simple named action.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">Action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Action(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span></div>
+
+
+
+<span class="n">MOTION_SCHEME</span> <span class="o">=</span> <span class="s2">&quot;xy&quot;</span>  <span class="c1"># can be either xy or vw</span>
+<span class="n">STEP_SIZE</span> <span class="o">=</span> <span class="mi">1</span>
+
+
+<div class="viewcode-block" id="MotionAction">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction">[docs]</a>
+<span class="k">class</span> <span class="nc">MotionAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="c1"># scheme 1 (vx,vy,th)</span>
+    <span class="n">SCHEME_XYTH</span> <span class="o">=</span> <span class="s2">&quot;xyth&quot;</span>
+    <span class="n">EAST</span> <span class="o">=</span> <span class="p">(</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># x is horizontal; x+ is right. y is vertical; y+ is down.</span>
+    <span class="n">WEST</span> <span class="o">=</span> <span class="p">(</span><span class="o">-</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span>
+    <span class="n">NORTH</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="o">-</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">3</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)</span>
+    <span class="n">SOUTH</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">STEP_SIZE</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)</span>
+
+    <span class="c1"># scheme 2 (vt, vw) translational, rotational velocities.</span>
+    <span class="n">SCHEME_VW</span> <span class="o">=</span> <span class="s2">&quot;vw&quot;</span>
+    <span class="n">FORWARD</span> <span class="o">=</span> <span class="p">(</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+    <span class="n">BACKWARD</span> <span class="o">=</span> <span class="p">(</span><span class="o">-</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+    <span class="n">LEFT</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="o">-</span><span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">/</span> <span class="mi">4</span><span class="p">)</span>  <span class="c1"># left 45 deg</span>
+    <span class="n">RIGHT</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">/</span> <span class="mi">4</span><span class="p">)</span>  <span class="c1"># right 45 deg</span>
+
+    <span class="c1"># scheme 3 (vx,vy)</span>
+    <span class="n">SCHEME_XY</span> <span class="o">=</span> <span class="s2">&quot;xy&quot;</span>
+    <span class="n">EAST2D</span> <span class="o">=</span> <span class="p">(</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># x is horizontal; x+ is right. y is vertical; y+ is down.</span>
+    <span class="n">WEST2D</span> <span class="o">=</span> <span class="p">(</span><span class="o">-</span><span class="n">STEP_SIZE</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+    <span class="n">NORTH2D</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="o">-</span><span class="n">STEP_SIZE</span><span class="p">)</span>
+    <span class="n">SOUTH2D</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">STEP_SIZE</span><span class="p">)</span>
+
+    <span class="n">SCHEMES</span> <span class="o">=</span> <span class="p">{</span><span class="s2">&quot;xyth&quot;</span><span class="p">,</span> <span class="s2">&quot;xy&quot;</span><span class="p">,</span> <span class="s2">&quot;vw&quot;</span><span class="p">}</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">motion</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MOTION_SCHEME</span><span class="p">,</span> <span class="n">distance_cost</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        motion (tuple): a tuple of floats that describes the motion;</span>
+<span class="sd">        scheme (str): description of the motion scheme; Either</span>
+<span class="sd">                      &quot;xy&quot; or &quot;vw&quot;</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="n">scheme</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEMES</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid motion scheme </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">scheme</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">scheme</span> <span class="o">==</span> <span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XYTH</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">motion</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">{</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">EAST</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">WEST</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">NORTH</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">SOUTH</span><span class="p">,</span>
+            <span class="p">}:</span>
+                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid move motion </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">motion</span><span class="p">))</span>
+        <span class="k">elif</span> <span class="n">scheme</span> <span class="o">==</span> <span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_VW</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">motion</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">{</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">FORWARD</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">BACKWARD</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">LEFT</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">RIGHT</span><span class="p">,</span>
+            <span class="p">}:</span>
+                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid move motion </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">motion</span><span class="p">))</span>
+        <span class="k">elif</span> <span class="n">scheme</span> <span class="o">==</span> <span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XY</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">motion</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">{</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">EAST2D</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">WEST2D</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">NORTH2D</span><span class="p">,</span>
+                <span class="n">MotionAction</span><span class="o">.</span><span class="n">SOUTH2D</span><span class="p">,</span>
+            <span class="p">}:</span>
+                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid move motion </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">motion</span><span class="p">))</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">motion</span> <span class="o">=</span> <span class="n">motion</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">scheme</span> <span class="o">=</span> <span class="n">scheme</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">distance_cost</span> <span class="o">=</span> <span class="n">distance_cost</span>
+        <span class="k">if</span> <span class="n">motion_name</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">motion_name</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">motion</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;move-</span><span class="si">%s</span><span class="s2">-</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">scheme</span><span class="p">,</span> <span class="n">motion_name</span><span class="p">))</span></div>
+
+
+
+<span class="c1"># Define some constant actions</span>
+<span class="n">MoveEast</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">EAST</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XYTH</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;East&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveWest</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">WEST</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XYTH</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;West&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveNorth</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">NORTH</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XYTH</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;North&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveSouth</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">SOUTH</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XYTH</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;South&quot;</span>
+<span class="p">)</span>
+
+<span class="n">MoveForward</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">FORWARD</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_VW</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;Forward&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveBackward</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">BACKWARD</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_VW</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;Backward&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveLeft</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">LEFT</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_VW</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;TurnLeft&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveRight</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">RIGHT</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_VW</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;TurnRight&quot;</span>
+<span class="p">)</span>
+
+<span class="n">MoveEast2D</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">EAST2D</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XY</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;East2D&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveWest2D</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">WEST2D</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XY</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;West2D&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveNorth2D</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">NORTH2D</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XY</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;North2D&quot;</span>
+<span class="p">)</span>
+<span class="n">MoveSouth2D</span> <span class="o">=</span> <span class="n">MotionAction</span><span class="p">(</span>
+    <span class="n">MotionAction</span><span class="o">.</span><span class="n">SOUTH2D</span><span class="p">,</span> <span class="n">scheme</span><span class="o">=</span><span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XY</span><span class="p">,</span> <span class="n">motion_name</span><span class="o">=</span><span class="s2">&quot;South2D&quot;</span>
+<span class="p">)</span>
+
+
+<div class="viewcode-block" id="LookAction">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.LookAction">[docs]</a>
+<span class="k">class</span> <span class="nc">LookAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="c1"># For simplicity, this LookAction is not parameterized by direction</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;look&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="FindAction">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.FindAction">[docs]</a>
+<span class="k">class</span> <span class="nc">FindAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;find&quot;</span><span class="p">)</span></div>
+
+
+
+<span class="n">Look</span> <span class="o">=</span> <span class="n">LookAction</span><span class="p">()</span>
+<span class="n">Find</span> <span class="o">=</span> <span class="n">FindAction</span><span class="p">()</span>
+
+<span class="k">if</span> <span class="n">MOTION_SCHEME</span> <span class="o">==</span> <span class="s2">&quot;xy&quot;</span><span class="p">:</span>
+    <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">[</span><span class="n">MoveEast</span><span class="p">,</span> <span class="n">MoveWest</span><span class="p">,</span> <span class="n">MoveNorth</span><span class="p">,</span> <span class="n">MoveSouth</span><span class="p">]</span>
+<span class="k">elif</span> <span class="n">MOTION_SCHEME</span> <span class="o">==</span> <span class="s2">&quot;vw&quot;</span><span class="p">:</span>
+    <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">[</span><span class="n">MoveForward</span><span class="p">,</span> <span class="n">MoveBackward</span><span class="p">,</span> <span class="n">MoveLeft</span><span class="p">,</span> <span class="n">MoveRight</span><span class="p">]</span>
+<span class="k">else</span><span class="p">:</span>
+    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;motion scheme &#39;</span><span class="si">%s</span><span class="s2">&#39; is invalid&quot;</span> <span class="o">%</span> <span class="n">MOTION_SCHEME</span><span class="p">)</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/domain/observation.html b/docs/html/_modules/problems/multi_object_search/domain/observation.html
new file mode 100644
index 00000000..7471b98c
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/domain/observation.html
@@ -0,0 +1,248 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.domain.observation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.domain.observation</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">Defines the Observation for the 2D Multi-Object Search domain;</span>
+
+<span class="sd">Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)</span>
+<span class="sd">(extensions: action space changes, different sensor model, gridworld instead of topological graph)</span>
+
+<span class="sd">Observation:</span>
+
+<span class="sd">    :code:`{objid : pose(x,y) or NULL}`.</span>
+<span class="sd">    The sensor model could vary;</span>
+<span class="sd">    it could be a fan-shaped model as the original paper, or</span>
+<span class="sd">    it could be something else. But the resulting observation</span>
+<span class="sd">    should be a map from object id to observed pose or NULL (not observed).</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+
+
+<span class="c1">###### Observation ######</span>
+<div class="viewcode-block" id="ObjectObservation">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.ObjectObservation">[docs]</a>
+<span class="k">class</span> <span class="nc">ObjectObservation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;The xy pose of the object is observed; or NULL if not observed&quot;&quot;&quot;</span>
+
+    <span class="n">NULL</span> <span class="o">=</span> <span class="kc">None</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">,</span> <span class="n">pose</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">objid</span> <span class="o">=</span> <span class="n">objid</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">pose</span><span class="p">)</span> <span class="o">==</span> <span class="nb">tuple</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">pose</span><span class="p">)</span> <span class="o">==</span> <span class="mi">2</span> <span class="ow">or</span> <span class="n">pose</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">pose</span> <span class="o">=</span> <span class="n">pose</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid observation </span><span class="si">%s</span><span class="s2"> for object&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">pose</span><span class="p">),</span> <span class="n">objid</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">objid</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">pose</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">ObjectObservation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">objid</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">objid</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">pose</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">pose</span></div>
+
+
+
+<div class="viewcode-block" id="MosOOObservation">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation">[docs]</a>
+<span class="k">class</span> <span class="nc">MosOOObservation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOObservation</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Observation for Mos that can be factored by objects;</span>
+<span class="sd">    thus this is an OOObservation.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objposes</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        objposes (dict): map from objid to 2d pose or NULL (not ObjectObservation!).</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_hashcode</span> <span class="o">=</span> <span class="nb">hash</span><span class="p">(</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">objposes</span><span class="o">.</span><span class="n">items</span><span class="p">()))</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">objposes</span> <span class="o">=</span> <span class="n">objposes</span>
+
+<div class="viewcode-block" id="MosOOObservation.for_obj">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation.for_obj">[docs]</a>
+    <span class="k">def</span> <span class="nf">for_obj</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">objid</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">objposes</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">ObjectObservation</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">objposes</span><span class="p">[</span><span class="n">objid</span><span class="p">])</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">ObjectObservation</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashcode</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">MosOOObservation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">objposes</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">objposes</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;MosOOObservation(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">objposes</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span>
+
+<div class="viewcode-block" id="MosOOObservation.factor">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation.factor">[docs]</a>
+    <span class="k">def</span> <span class="nf">factor</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="o">*</span><span class="n">params</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Factor this OO-observation by objects&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="p">{</span>
+            <span class="n">objid</span><span class="p">:</span> <span class="n">ObjectObservation</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">objposes</span><span class="p">[</span><span class="n">objid</span><span class="p">])</span>
+            <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">next_state</span><span class="o">.</span><span class="n">object_states</span>
+            <span class="k">if</span> <span class="n">objid</span> <span class="o">!=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">robot_id</span>
+        <span class="p">}</span></div>
+
+
+<div class="viewcode-block" id="MosOOObservation.merge">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation.merge">[docs]</a>
+    <span class="nd">@classmethod</span>
+    <span class="k">def</span> <span class="nf">merge</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">object_observations</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="o">*</span><span class="n">params</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Merge `object_observations` into a single OOObservation object;</span>
+
+<span class="sd">        object_observation (dict): Maps from objid to ObjectObservation&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="n">MosOOObservation</span><span class="p">(</span>
+            <span class="p">{</span>
+                <span class="n">objid</span><span class="p">:</span> <span class="n">object_observations</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">pose</span>
+                <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">object_observations</span>
+                <span class="k">if</span> <span class="n">objid</span> <span class="o">!=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">!=</span> <span class="s2">&quot;robot&quot;</span>
+            <span class="p">}</span>
+        <span class="p">)</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/domain/state.html b/docs/html/_modules/problems/multi_object_search/domain/state.html
new file mode 100644
index 00000000..285c97d2
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/domain/state.html
@@ -0,0 +1,255 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.domain.state &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.domain.state</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Defines the State for the 2D Multi-Object Search domain;</span>
+
+<span class="sd">Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)</span>
+<span class="sd">(extensions: action space changes, different sensor model, gridworld instead of</span>
+<span class="sd">topological graph)</span>
+
+<span class="sd">Description: Multi-Object Search in a 2D grid world.</span>
+
+<span class="sd">State space:</span>
+
+<span class="sd">    :math:`S_1 \\times S_2 \\times ... S_n \\times S_r`</span>
+<span class="sd">    where :math:`S_i (1\leq i\leq n)` is the object state, with attribute</span>
+<span class="sd">    &quot;pose&quot; :math:`(x,y)` and Sr is the state of the robot, with attribute</span>
+<span class="sd">    &quot;pose&quot; :math:`(x,y)` and &quot;objects_found&quot; (set).</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">math</span>
+
+
+<span class="c1">###### States ######</span>
+<div class="viewcode-block" id="ObjectState">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.ObjectState">[docs]</a>
+<span class="k">class</span> <span class="nc">ObjectState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObjectState</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">,</span> <span class="n">objclass</span><span class="p">,</span> <span class="n">pose</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">objclass</span> <span class="o">!=</span> <span class="s2">&quot;obstacle&quot;</span> <span class="ow">and</span> <span class="n">objclass</span> <span class="o">!=</span> <span class="s2">&quot;target&quot;</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Only allow object class to beeither &#39;target&#39; or &#39;obstacle&#39;.Got </span><span class="si">%s</span><span class="s2">&quot;</span>
+                <span class="o">%</span> <span class="n">objclass</span>
+            <span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">objclass</span><span class="p">,</span> <span class="p">{</span><span class="s2">&quot;pose&quot;</span><span class="p">:</span> <span class="n">pose</span><span class="p">,</span> <span class="s2">&quot;id&quot;</span><span class="p">:</span> <span class="n">objid</span><span class="p">})</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;ObjectState(</span><span class="si">%s</span><span class="s2">,</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">objclass</span><span class="p">),</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">pose</span><span class="p">))</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">pose</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">attributes</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">objid</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">attributes</span><span class="p">[</span><span class="s2">&quot;id&quot;</span><span class="p">]</span></div>
+
+
+
+<div class="viewcode-block" id="RobotState">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.RobotState">[docs]</a>
+<span class="k">class</span> <span class="nc">RobotState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObjectState</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">pose</span><span class="p">,</span> <span class="n">objects_found</span><span class="p">,</span> <span class="n">camera_direction</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Note: camera_direction is None unless the robot is looking at a direction,</span>
+<span class="sd">        in which case camera_direction is the string e.g. look+x, or &#39;look&#39;&quot;&quot;&quot;</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+            <span class="s2">&quot;robot&quot;</span><span class="p">,</span>
+            <span class="p">{</span>
+                <span class="s2">&quot;id&quot;</span><span class="p">:</span> <span class="n">robot_id</span><span class="p">,</span>
+                <span class="s2">&quot;pose&quot;</span><span class="p">:</span> <span class="n">pose</span><span class="p">,</span>  <span class="c1"># x,y,th</span>
+                <span class="s2">&quot;objects_found&quot;</span><span class="p">:</span> <span class="n">objects_found</span><span class="p">,</span>
+                <span class="s2">&quot;camera_direction&quot;</span><span class="p">:</span> <span class="n">camera_direction</span><span class="p">,</span>
+            <span class="p">},</span>
+        <span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;RobotState(</span><span class="si">%s</span><span class="s2">,</span><span class="si">%s</span><span class="s2">|</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">objclass</span><span class="p">),</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">pose</span><span class="p">),</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">objects_found</span><span class="p">),</span>
+        <span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">pose</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">attributes</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">robot_pose</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">attributes</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">objects_found</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">attributes</span><span class="p">[</span><span class="s2">&quot;objects_found&quot;</span><span class="p">]</span></div>
+
+
+
+<div class="viewcode-block" id="MosOOState">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState">[docs]</a>
+<span class="k">class</span> <span class="nc">MosOOState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOState</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">object_states</span><span class="p">):</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">object_states</span><span class="p">)</span>
+
+<div class="viewcode-block" id="MosOOState.object_pose">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState.object_pose">[docs]</a>
+    <span class="k">def</span> <span class="nf">object_pose</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span></div>
+
+
+<div class="viewcode-block" id="MosOOState.pose">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState.pose">[docs]</a>
+    <span class="k">def</span> <span class="nf">pose</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">object_pose</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span></div>
+
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">object_poses</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="p">{</span>
+            <span class="n">objid</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">object_states</span>
+        <span class="p">}</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;MosOOState</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">object_states</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/env/env.html b/docs/html/_modules/problems/multi_object_search/env/env.html
new file mode 100644
index 00000000..14dabd1c
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/env/env.html
@@ -0,0 +1,412 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.env.env</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The Environment&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.models.transition_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.models.reward_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.models.components.sensor</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="MosEnvironment">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.MosEnvironment">[docs]</a>
+<span class="k">class</span> <span class="nc">MosEnvironment</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="n">obstacles</span><span class="o">=</span><span class="nb">set</span><span class="p">({})):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Args:</span>
+<span class="sd">            sensors (dict): Map from robot_id to sensor (Sensor);</span>
+<span class="sd">                            Sensors equipped on robots; Used to determine</span>
+<span class="sd">                            which objects should be marked as found.</span>
+<span class="sd">            obstacles (set): set of object ids that are obstacles;</span>
+<span class="sd">                                The set difference of all object ids then</span>
+<span class="sd">                                yields the target object ids.&quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">length</span> <span class="o">=</span> <span class="n">dim</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">sensors</span> <span class="o">=</span> <span class="n">sensors</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">obstacles</span> <span class="o">=</span> <span class="n">obstacles</span>
+        <span class="n">transition_model</span> <span class="o">=</span> <span class="n">MosTransitionModel</span><span class="p">(</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="nb">set</span><span class="p">(</span><span class="n">init_state</span><span class="o">.</span><span class="n">object_states</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+        <span class="p">)</span>
+        <span class="c1"># Target objects, a set of ids, are not robot nor obstacles</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">target_objects</span> <span class="o">=</span> <span class="p">{</span>
+            <span class="n">objid</span>
+            <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="nb">set</span><span class="p">(</span><span class="n">init_state</span><span class="o">.</span><span class="n">object_states</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">obstacles</span>
+            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">init_state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">],</span> <span class="n">RobotState</span><span class="p">)</span>
+        <span class="p">}</span>
+        <span class="n">reward_model</span> <span class="o">=</span> <span class="n">GoalRewardModel</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">target_objects</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">transition_model</span><span class="p">,</span> <span class="n">reward_model</span><span class="p">)</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">robot_ids</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sensors</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+
+<div class="viewcode-block" id="MosEnvironment.state_transition">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.MosEnvironment.state_transition">[docs]</a>
+    <span class="k">def</span> <span class="nf">state_transition</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;state_transition(self, action, execute=True, **kwargs)</span>
+
+<span class="sd">        Overriding parent class function.</span>
+<span class="sd">        Simulates a state transition given `action`. If `execute` is set to True,</span>
+<span class="sd">        then the resulting state will be the new current state of the environment.</span>
+
+<span class="sd">        Args:</span>
+<span class="sd">            action (Action): action that triggers the state transition</span>
+<span class="sd">            execute (bool): If True, the resulting state of the transition will</span>
+<span class="sd">                            become the current state.</span>
+
+<span class="sd">        Returns:</span>
+<span class="sd">            float or tuple: reward as a result of `action` and state</span>
+<span class="sd">            transition, if `execute` is True (next_state, reward) if `execute`</span>
+<span class="sd">            is False.</span>
+
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">assert</span> <span class="p">(</span>
+            <span class="n">robot_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span>
+        <span class="p">),</span> <span class="s2">&quot;state transition should happen for a specific robot&quot;</span>
+
+        <span class="n">next_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+        <span class="n">next_state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">transition_model</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span>
+        <span class="p">)</span>
+
+        <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reward_model</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+        <span class="p">)</span>
+        <span class="k">if</span> <span class="n">execute</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">apply_transition</span><span class="p">(</span><span class="n">next_state</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">reward</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">reward</span></div>
+</div>
+
+
+
+<span class="c1">#### Interpret string as an initial world state ####</span>
+<div class="viewcode-block" id="interpret">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.interpret">[docs]</a>
+<span class="k">def</span> <span class="nf">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Interprets a problem instance description in `worldstr`</span>
+<span class="sd">    and returns the corresponding MosEnvironment.</span>
+
+<span class="sd">    For example: This string</span>
+
+<span class="sd">    .. code-block:: text</span>
+
+<span class="sd">        rx...</span>
+<span class="sd">        .x.xT</span>
+<span class="sd">        .....</span>
+<span class="sd">        ***</span>
+<span class="sd">        r: laser fov=90 min_range=1 max_range=10</span>
+
+<span class="sd">    describes a 3 by 5 world where x indicates obsticles and T indicates</span>
+<span class="sd">    the &quot;target object&quot;. T could be replaced by any upper-case letter A-Z</span>
+<span class="sd">    which will serve as the object&#39;s id. Lower-case letters a-z (except for x)</span>
+<span class="sd">    serve as id for robot(s).</span>
+
+<span class="sd">    After the world, the :code:`***` signals description of the sensor for each robot.</span>
+<span class="sd">    For example &quot;r laser 90 1 10&quot; means that robot `r` will have a Laser2Dsensor</span>
+<span class="sd">    with fov 90, min_range 1.0, and max_range of 10.0.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        worldstr (str): a string that describes the initial state of the world.</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">        MosEnvironment: the corresponding environment for the world description.</span>
+
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">worldlines</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="n">sensorlines</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="n">mode</span> <span class="o">=</span> <span class="s2">&quot;world&quot;</span>
+    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">worldstr</span><span class="o">.</span><span class="n">splitlines</span><span class="p">():</span>
+        <span class="n">line</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">line</span> <span class="o">==</span> <span class="s2">&quot;***&quot;</span><span class="p">:</span>
+                <span class="n">mode</span> <span class="o">=</span> <span class="s2">&quot;sensor&quot;</span>
+                <span class="k">continue</span>
+            <span class="k">if</span> <span class="n">mode</span> <span class="o">==</span> <span class="s2">&quot;world&quot;</span><span class="p">:</span>
+                <span class="n">worldlines</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">mode</span> <span class="o">==</span> <span class="s2">&quot;sensor&quot;</span><span class="p">:</span>
+                <span class="n">sensorlines</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">line</span><span class="p">)</span>
+
+    <span class="n">lines</span> <span class="o">=</span> <span class="p">[</span><span class="n">line</span> <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">worldlines</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">]</span>
+    <span class="n">w</span><span class="p">,</span> <span class="n">l</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">worldlines</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="nb">len</span><span class="p">(</span><span class="n">worldlines</span><span class="p">)</span>
+
+    <span class="n">objects</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># objid -&gt; object_state(pose)</span>
+    <span class="n">obstacles</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>  <span class="c1"># objid</span>
+    <span class="n">robots</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># robot_id -&gt; robot_state(pose)</span>
+    <span class="n">sensors</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># robot_id -&gt; Sensor</span>
+
+    <span class="c1"># Parse world</span>
+    <span class="k">for</span> <span class="n">y</span><span class="p">,</span> <span class="n">line</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">worldlines</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">)</span> <span class="o">!=</span> <span class="n">w</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;World size inconsistent.Expected width: </span><span class="si">%d</span><span class="s2">; Actual Width: </span><span class="si">%d</span><span class="s2">&quot;</span>
+                <span class="o">%</span> <span class="p">(</span><span class="n">w</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">line</span><span class="p">))</span>
+            <span class="p">)</span>
+        <span class="k">for</span> <span class="n">x</span><span class="p">,</span> <span class="n">c</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">line</span><span class="p">):</span>
+            <span class="k">if</span> <span class="n">c</span> <span class="o">==</span> <span class="s2">&quot;x&quot;</span><span class="p">:</span>
+                <span class="c1"># obstacle</span>
+                <span class="n">objid</span> <span class="o">=</span> <span class="mi">1000</span> <span class="o">+</span> <span class="nb">len</span><span class="p">(</span><span class="n">obstacles</span><span class="p">)</span>  <span class="c1"># obstacle id</span>
+                <span class="n">objects</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;obstacle&quot;</span><span class="p">,</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">))</span>
+                <span class="n">obstacles</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+
+            <span class="k">elif</span> <span class="n">c</span><span class="o">.</span><span class="n">isupper</span><span class="p">():</span>
+                <span class="c1"># target object</span>
+                <span class="n">objid</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">objects</span><span class="p">)</span>
+                <span class="n">objects</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;target&quot;</span><span class="p">,</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">))</span>
+
+            <span class="k">elif</span> <span class="n">c</span><span class="o">.</span><span class="n">islower</span><span class="p">():</span>
+                <span class="c1"># robot</span>
+                <span class="n">robot_id</span> <span class="o">=</span> <span class="n">interpret_robot_id</span><span class="p">(</span><span class="n">c</span><span class="p">)</span>
+                <span class="n">robots</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">RobotState</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="p">(),</span> <span class="kc">None</span><span class="p">)</span>
+
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">assert</span> <span class="n">c</span> <span class="o">==</span> <span class="s2">&quot;.&quot;</span><span class="p">,</span> <span class="s2">&quot;Unrecognized character </span><span class="si">%s</span><span class="s2"> in worldstr&quot;</span> <span class="o">%</span> <span class="n">c</span>
+    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">robots</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No initial robot pose!&quot;</span><span class="p">)</span>
+    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">objects</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No object!&quot;</span><span class="p">)</span>
+
+    <span class="c1"># Parse sensors</span>
+    <span class="k">for</span> <span class="n">line</span> <span class="ow">in</span> <span class="n">sensorlines</span><span class="p">:</span>
+        <span class="k">if</span> <span class="s2">&quot;,&quot;</span> <span class="ow">in</span> <span class="n">line</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;Wrong Fromat. SHould not have &#39;,&#39;. Separate tokens with space.&quot;</span>
+            <span class="p">)</span>
+        <span class="n">robot_name</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;:&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="n">interpret_robot_id</span><span class="p">(</span><span class="n">robot_name</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="n">robot_id</span> <span class="ow">in</span> <span class="n">robots</span><span class="p">,</span> <span class="s2">&quot;Sensor specified for unknown robot </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span>
+            <span class="n">robot_name</span>
+        <span class="p">)</span>
+
+        <span class="n">sensor_setting</span> <span class="o">=</span> <span class="n">line</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;:&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+        <span class="n">sensor_type</span> <span class="o">=</span> <span class="n">sensor_setting</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+        <span class="n">sensor_params</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">for</span> <span class="n">token</span> <span class="ow">in</span> <span class="n">sensor_setting</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot; &quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">:]:</span>
+            <span class="n">param_name</span> <span class="o">=</span> <span class="n">token</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;=&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+            <span class="n">param_value</span> <span class="o">=</span> <span class="nb">eval</span><span class="p">(</span><span class="n">token</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;=&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">())</span>
+            <span class="n">sensor_params</span><span class="p">[</span><span class="n">param_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">param_value</span>
+
+        <span class="k">if</span> <span class="n">sensor_type</span> <span class="o">==</span> <span class="s2">&quot;laser&quot;</span><span class="p">:</span>
+            <span class="n">sensor</span> <span class="o">=</span> <span class="n">Laser2DSensor</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="o">**</span><span class="n">sensor_params</span><span class="p">)</span>
+        <span class="k">elif</span> <span class="n">sensor_type</span> <span class="o">==</span> <span class="s2">&quot;proximity&quot;</span><span class="p">:</span>
+            <span class="n">sensor</span> <span class="o">=</span> <span class="n">ProximitySensor</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="o">**</span><span class="n">sensor_params</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Unknown sensor type </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">sensor_type</span><span class="p">)</span>
+        <span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">sensor</span>
+
+    <span class="k">return</span> <span class="p">(</span><span class="n">w</span><span class="p">,</span> <span class="n">l</span><span class="p">),</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">sensors</span></div>
+
+
+
+<div class="viewcode-block" id="interpret_robot_id">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.interpret_robot_id">[docs]</a>
+<span class="k">def</span> <span class="nf">interpret_robot_id</span><span class="p">(</span><span class="n">robot_name</span><span class="p">):</span>
+    <span class="k">return</span> <span class="o">-</span><span class="nb">ord</span><span class="p">(</span><span class="n">robot_name</span><span class="p">)</span></div>
+
+
+
+<span class="c1">#### Utility functions for building the worldstr ####</span>
+<div class="viewcode-block" id="equip_sensors">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.equip_sensors">[docs]</a>
+<span class="k">def</span> <span class="nf">equip_sensors</span><span class="p">(</span><span class="n">worldmap</span><span class="p">,</span> <span class="n">sensors</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Args:</span>
+<span class="sd">        worldmap (str): a string that describes the initial state of the world.</span>
+<span class="sd">        sensors (dict) a map from robot character representation (e.g. &#39;r&#39;) to a</span>
+<span class="sd">    string that describes its sensor (e.g. &#39;laser fov=90 min_range=1 max_range=5</span>
+<span class="sd">    angle_increment=5&#39;)</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">        str: A string that can be used as input to the `interpret` function</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">worldmap</span> <span class="o">+=</span> <span class="s2">&quot;</span><span class="se">\n</span><span class="s2">***</span><span class="se">\n</span><span class="s2">&quot;</span>
+    <span class="k">for</span> <span class="n">robot_char</span> <span class="ow">in</span> <span class="n">sensors</span><span class="p">:</span>
+        <span class="n">worldmap</span> <span class="o">+=</span> <span class="s2">&quot;</span><span class="si">%s</span><span class="s2">: </span><span class="si">%s</span><span class="se">\n</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">robot_char</span><span class="p">,</span> <span class="n">sensors</span><span class="p">[</span><span class="n">robot_char</span><span class="p">])</span>
+    <span class="k">return</span> <span class="n">worldmap</span></div>
+
+
+
+<div class="viewcode-block" id="make_laser_sensor">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.make_laser_sensor">[docs]</a>
+<span class="k">def</span> <span class="nf">make_laser_sensor</span><span class="p">(</span><span class="n">fov</span><span class="p">,</span> <span class="n">dist_range</span><span class="p">,</span> <span class="n">angle_increment</span><span class="p">,</span> <span class="n">occlusion</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Returns string representation of the laser scanner configuration.</span>
+<span class="sd">    For example:  &quot;laser fov=90 min_range=1 max_range=10&quot;</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        fov (int or float): angle between the start and end beams of one scan (degree).</span>
+<span class="sd">        dist_range (tuple): (min_range, max_range)</span>
+<span class="sd">        angle_increment (int or float): angular distance between measurements (rad).</span>
+<span class="sd">        occlusion (bool): True if consider occlusion</span>
+
+<span class="sd">    Returns:</span>
+<span class="sd">        str: String representation of the laser scanner configuration.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">fovstr</span> <span class="o">=</span> <span class="s2">&quot;fov=</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">fov</span><span class="p">)</span>
+    <span class="n">rangestr</span> <span class="o">=</span> <span class="s2">&quot;min_range=</span><span class="si">%s</span><span class="s2"> max_range=</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">dist_range</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="nb">str</span><span class="p">(</span><span class="n">dist_range</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
+    <span class="n">angicstr</span> <span class="o">=</span> <span class="s2">&quot;angle_increment=</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">angle_increment</span><span class="p">))</span>
+    <span class="n">occstr</span> <span class="o">=</span> <span class="s2">&quot;occlusion_enabled=</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">occlusion</span><span class="p">)</span>
+    <span class="k">return</span> <span class="s2">&quot;laser </span><span class="si">%s</span><span class="s2"> </span><span class="si">%s</span><span class="s2"> </span><span class="si">%s</span><span class="s2"> </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">fovstr</span><span class="p">,</span> <span class="n">rangestr</span><span class="p">,</span> <span class="n">angicstr</span><span class="p">,</span> <span class="n">occstr</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="make_proximity_sensor">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.make_proximity_sensor">[docs]</a>
+<span class="k">def</span> <span class="nf">make_proximity_sensor</span><span class="p">(</span><span class="n">radius</span><span class="p">,</span> <span class="n">occlusion</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Returns string representation of the proximity sensor configuration.</span>
+<span class="sd">    For example: &quot;proximity radius=5 occlusion_enabled=False&quot;</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        radius (int or float)</span>
+<span class="sd">        occlusion (bool): True if consider occlusion</span>
+<span class="sd">    Returns:</span>
+<span class="sd">        str: String representation of the proximity sensor configuration.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">radiustr</span> <span class="o">=</span> <span class="s2">&quot;radius=</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">radius</span><span class="p">)</span>
+    <span class="n">occstr</span> <span class="o">=</span> <span class="s2">&quot;occlusion_enabled=</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">occlusion</span><span class="p">)</span>
+    <span class="k">return</span> <span class="s2">&quot;proximity </span><span class="si">%s</span><span class="s2"> </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">radiustr</span><span class="p">,</span> <span class="n">occstr</span><span class="p">)</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/env/visual.html b/docs/html/_modules/problems/multi_object_search/env/visual.html
new file mode 100644
index 00000000..d4f2d484
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/env/visual.html
@@ -0,0 +1,532 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.env.visual &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.env.visual</h1><div class="highlight"><pre>
+<span></span><span class="c1"># Visualization of a MOS instance using pygame</span>
+<span class="c1">#</span>
+<span class="c1"># Note to run this file, you need to run the following</span>
+<span class="c1"># in the parent directory of multi_object_search:</span>
+<span class="c1">#</span>
+<span class="c1">#   python -m multi_object_search.env.visual</span>
+<span class="c1">#</span>
+
+<span class="kn">import</span> <span class="nn">pygame</span>
+<span class="kn">import</span> <span class="nn">cv2</span>
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.utils</span> <span class="k">as</span> <span class="nn">util</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1"># Deterministic way to get object color</span>
+<div class="viewcode-block" id="object_color">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.object_color">[docs]</a>
+<span class="k">def</span> <span class="nf">object_color</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">count</span><span class="p">):</span>
+    <span class="n">color</span> <span class="o">=</span> <span class="p">[</span><span class="mi">107</span><span class="p">,</span> <span class="mi">107</span><span class="p">,</span> <span class="mi">107</span><span class="p">]</span>
+    <span class="k">if</span> <span class="n">count</span> <span class="o">%</span> <span class="mi">3</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">100</span> <span class="o">+</span> <span class="p">(</span><span class="mi">3</span> <span class="o">*</span> <span class="p">(</span><span class="n">objid</span> <span class="o">*</span> <span class="mi">5</span> <span class="o">%</span> <span class="mi">11</span><span class="p">))</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="mi">222</span><span class="p">,</span> <span class="n">color</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
+    <span class="k">elif</span> <span class="n">count</span> <span class="o">%</span> <span class="mi">3</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">100</span> <span class="o">+</span> <span class="p">(</span><span class="mi">3</span> <span class="o">*</span> <span class="p">(</span><span class="n">objid</span> <span class="o">*</span> <span class="mi">5</span> <span class="o">%</span> <span class="mi">11</span><span class="p">))</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="mi">222</span><span class="p">,</span> <span class="n">color</span><span class="p">[</span><span class="mi">1</span><span class="p">]))</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">100</span> <span class="o">+</span> <span class="p">(</span><span class="mi">3</span> <span class="o">*</span> <span class="p">(</span><span class="n">objid</span> <span class="o">*</span> <span class="mi">5</span> <span class="o">%</span> <span class="mi">11</span><span class="p">))</span>
+        <span class="n">color</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="mi">222</span><span class="p">,</span> <span class="n">color</span><span class="p">[</span><span class="mi">2</span><span class="p">]))</span>
+    <span class="k">return</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">color</span><span class="p">)</span></div>
+
+
+
+<span class="c1">#### Visualization through pygame ####</span>
+<div class="viewcode-block" id="MosViz">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz">[docs]</a>
+<span class="k">class</span> <span class="nc">MosViz</span><span class="p">:</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">res</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">fps</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_env</span> <span class="o">=</span> <span class="n">env</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="n">res</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_img</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_make_gridworld_image</span><span class="p">(</span><span class="n">res</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to MosOOObservation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to MosOOObservation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to Action</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from robot id to OOBelief</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span> <span class="o">=</span> <span class="n">controllable</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_fps</span> <span class="o">=</span> <span class="n">fps</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">=</span> <span class="mf">0.0</span>
+
+        <span class="c1"># Generate some colors, one per target object</span>
+        <span class="n">colors</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">objid</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">):</span>
+            <span class="n">colors</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">object_color</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">i</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_target_colors</span> <span class="o">=</span> <span class="n">colors</span>
+
+    <span class="k">def</span> <span class="nf">_make_gridworld_image</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">r</span><span class="p">):</span>
+        <span class="c1"># Preparing 2d array</span>
+        <span class="n">w</span><span class="p">,</span> <span class="n">l</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span>
+        <span class="n">arr2d</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># free grids</span>
+        <span class="n">state</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">:</span>
+            <span class="n">pose</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;robot&quot;</span><span class="p">:</span>
+                <span class="n">arr2d</span><span class="p">[</span><span class="n">pose</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pose</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">0</span>  <span class="c1"># free grid</span>
+            <span class="k">elif</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;obstacle&quot;</span><span class="p">:</span>
+                <span class="n">arr2d</span><span class="p">[</span><span class="n">pose</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pose</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">1</span>  <span class="c1"># obstacle</span>
+            <span class="k">elif</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;target&quot;</span><span class="p">:</span>
+                <span class="n">arr2d</span><span class="p">[</span><span class="n">pose</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pose</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">2</span>  <span class="c1"># target</span>
+
+        <span class="c1"># Creating image</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">w</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">l</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="mi">255</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">w</span><span class="p">):</span>
+            <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">l</span><span class="p">):</span>
+                <span class="k">if</span> <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>  <span class="c1"># free</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="k">elif</span> <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>  <span class="c1"># obstacle</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">40</span><span class="p">,</span> <span class="mi">31</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="k">elif</span> <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">2</span><span class="p">:</span>  <span class="c1"># target</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">165</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">8</span>
+                <span class="p">)</span>
+        <span class="k">return</span> <span class="n">img</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_width</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_height</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">last_observation</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span>
+
+<div class="viewcode-block" id="MosViz.update">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.update">[docs]</a>
+    <span class="k">def</span> <span class="nf">update</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">viz_observation</span><span class="p">,</span> <span class="n">belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Update the visualization after there is new real action and observation</span>
+<span class="sd">        and updated belief.</span>
+
+<span class="sd">        Args:</span>
+<span class="sd">            observation (MosOOObservation): Real observation</span>
+<span class="sd">            viz_observation (MosOOObservation): An observation used to visualize</span>
+<span class="sd">                                                the sensing region.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">action</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">observation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">viz_observation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">belief</span></div>
+
+
+<div class="viewcode-block" id="MosViz.draw_robot">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.draw_robot">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_robot</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">th</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">)):</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">size</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">radius</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
+
+        <span class="n">endpoint</span> <span class="o">=</span> <span class="p">(</span>
+            <span class="n">y</span> <span class="o">+</span> <span class="n">radius</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">radius</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">th</span><span class="p">))),</span>
+            <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">radius</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">th</span><span class="p">))),</span>
+        <span class="p">)</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">line</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">endpoint</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosViz.draw_observation">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.draw_observation">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_observation</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">z</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">255</span><span class="p">)):</span>
+        <span class="k">assert</span> <span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)</span> <span class="o">==</span> <span class="n">MosOOObservation</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> != MosOOObservation&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)))</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">z</span><span class="o">.</span><span class="n">objposes</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">z</span><span class="o">.</span><span class="n">for_obj</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">pose</span> <span class="o">!=</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">:</span>
+                <span class="n">lx</span><span class="p">,</span> <span class="n">ly</span> <span class="o">=</span> <span class="n">z</span><span class="o">.</span><span class="n">for_obj</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">pose</span>
+                <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">ly</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">lx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span>
+                <span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosViz.draw_belief">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.draw_belief">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">target_colors</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;belief (OOBelief)&quot;&quot;&quot;</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+
+        <span class="n">circle_drawn</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from pose to number of times drawn</span>
+
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">belief</span><span class="o">.</span><span class="n">object_beliefs</span><span class="p">:</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">belief</span><span class="o">.</span><span class="n">object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">random</span><span class="p">(),</span> <span class="n">RobotState</span><span class="p">):</span>
+                <span class="k">continue</span>
+            <span class="n">hist</span> <span class="o">=</span> <span class="n">belief</span><span class="o">.</span><span class="n">object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span><span class="o">.</span><span class="n">get_histogram</span><span class="p">()</span>
+            <span class="n">color</span> <span class="o">=</span> <span class="n">target_colors</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span>
+
+            <span class="n">last_val</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+            <span class="n">count</span> <span class="o">=</span> <span class="mi">0</span>
+            <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="nb">reversed</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">hist</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">hist</span><span class="o">.</span><span class="n">get</span><span class="p">)):</span>
+                <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;target&quot;</span><span class="p">:</span>
+                    <span class="k">if</span> <span class="n">last_val</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+                        <span class="n">color</span> <span class="o">=</span> <span class="n">util</span><span class="o">.</span><span class="n">lighter</span><span class="p">(</span><span class="n">color</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">/</span> <span class="n">last_val</span><span class="p">)</span>
+                    <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">color</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">]))</span> <span class="o">&lt;</span> <span class="mf">0.99</span><span class="p">:</span>
+                        <span class="n">tx</span><span class="p">,</span> <span class="n">ty</span> <span class="o">=</span> <span class="n">state</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+                        <span class="k">if</span> <span class="p">(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">circle_drawn</span><span class="p">:</span>
+                            <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+                        <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">+=</span> <span class="mi">1</span>
+
+                        <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                            <span class="n">img</span><span class="p">,</span>
+                            <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span>
+                            <span class="n">size</span> <span class="o">//</span> <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)],</span>
+                            <span class="n">color</span><span class="p">,</span>
+                            <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
+                        <span class="p">)</span>
+                        <span class="n">last_val</span> <span class="o">=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+
+                        <span class="n">count</span> <span class="o">+=</span> <span class="mi">1</span>
+                        <span class="k">if</span> <span class="n">last_val</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">:</span>
+                            <span class="k">break</span></div>
+
+
+    <span class="c1"># PyGame interface functions</span>
+<div class="viewcode-block" id="MosViz.on_init">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_init">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_init</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;pygame init&quot;&quot;&quot;</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">init</span><span class="p">()</span>  <span class="c1"># calls pygame.font.init()</span>
+        <span class="c1"># init main screen and background</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_mode</span><span class="p">(</span>
+            <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">),</span> <span class="n">pygame</span><span class="o">.</span><span class="n">HWSURFACE</span>
+        <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_background</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">Surface</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="o">.</span><span class="n">get_size</span><span class="p">())</span><span class="o">.</span><span class="n">convert</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">time</span><span class="o">.</span><span class="n">Clock</span><span class="p">()</span>
+
+        <span class="c1"># Font</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_myfont</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">font</span><span class="o">.</span><span class="n">SysFont</span><span class="p">(</span><span class="s2">&quot;Comic Sans MS&quot;</span><span class="p">,</span> <span class="mi">30</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">True</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_event">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_event">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_event</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">event</span><span class="p">):</span>
+        <span class="c1"># TODO: Keyboard control multiple robots</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">robot_ids</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Just pick the first one.</span>
+
+        <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">QUIT</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">KEYDOWN</span><span class="p">:</span>
+            <span class="n">u</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control signal according to motion model</span>
+            <span class="n">action</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control input by user</span>
+
+            <span class="c1"># odometry model</span>
+            <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_LEFT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveLeft</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_RIGHT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveRight</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_UP</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveForward</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_DOWN</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveBackward</span>
+            <span class="c1"># euclidean axis model</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_a</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveWest</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_d</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveEast</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_s</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveSouth</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_w</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveNorth</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_SPACE</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">Look</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_RETURN</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">Find</span>
+
+            <span class="k">if</span> <span class="n">action</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span>
+
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span><span class="p">:</span>
+                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+                    <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span>
+                        <span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+                    <span class="p">)</span>
+                    <span class="n">z</span> <span class="o">=</span> <span class="kc">None</span>
+                <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">)</span> <span class="ow">or</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">FindAction</span><span class="p">):</span>
+                    <span class="n">robot_pose</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+                    <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">observe</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+                    <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span>
+                        <span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+                    <span class="p">)</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;robot state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">z</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;------------&quot;</span><span class="p">)</span>
+            <span class="k">return</span> <span class="n">action</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_loop">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_loop">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_loop</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">tick</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_fps</span><span class="p">)</span> <span class="o">/</span> <span class="mf">1000.0</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_render">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_render">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_render</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="c1"># self._display_surf.blit(self._background, (0, 0))</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">render_env</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="p">)</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">robot_ids</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>  <span class="c1"># Just pick the first one.</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">fps_text</span> <span class="o">=</span> <span class="s2">&quot;FPS: </span><span class="si">{0:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">get_fps</span><span class="p">())</span>
+        <span class="n">last_action</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+        <span class="n">last_action_str</span> <span class="o">=</span> <span class="s2">&quot;no_action&quot;</span> <span class="k">if</span> <span class="n">last_action</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="nb">str</span><span class="p">(</span><span class="n">last_action</span><span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_caption</span><span class="p">(</span>
+            <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> | Robot</span><span class="si">%d</span><span class="s2">(</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">) | </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">&quot;</span>
+            <span class="o">%</span> <span class="p">(</span>
+                <span class="n">last_action_str</span><span class="p">,</span>
+                <span class="n">robot_id</span><span class="p">,</span>
+                <span class="n">rx</span><span class="p">,</span>
+                <span class="n">ry</span><span class="p">,</span>
+                <span class="n">rth</span> <span class="o">*</span> <span class="mi">180</span> <span class="o">/</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">,</span>
+                <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">][</span><span class="s2">&quot;objects_found&quot;</span><span class="p">]),</span>
+                <span class="n">fps_text</span><span class="p">,</span>
+            <span class="p">)</span>
+        <span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">flip</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_cleanup">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_cleanup">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_cleanup</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">quit</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="MosViz.on_execute">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_execute">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_execute</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+
+        <span class="k">while</span> <span class="bp">self</span><span class="o">.</span><span class="n">_running</span><span class="p">:</span>
+            <span class="k">for</span> <span class="n">event</span> <span class="ow">in</span> <span class="n">pygame</span><span class="o">.</span><span class="n">event</span><span class="o">.</span><span class="n">get</span><span class="p">():</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">on_event</span><span class="p">(</span><span class="n">event</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">on_cleanup</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="MosViz.render_env">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.render_env">[docs]</a>
+    <span class="k">def</span> <span class="nf">render_env</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">display_surf</span><span class="p">):</span>
+        <span class="c1"># draw robot, a circle and a vector</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">robot_id</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">robot_ids</span><span class="p">):</span>
+            <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+            <span class="n">r</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span>  <span class="c1"># Not radius!</span>
+            <span class="n">last_observation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="n">last_viz_observation</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_viz_observation</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="n">last_belief</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">last_belief</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">last_belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">3</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_target_colors</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">last_viz_observation</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_observation</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span>
+                    <span class="n">last_viz_observation</span><span class="p">,</span>
+                    <span class="n">rx</span><span class="p">,</span>
+                    <span class="n">ry</span><span class="p">,</span>
+                    <span class="n">rth</span><span class="p">,</span>
+                    <span class="n">r</span><span class="p">,</span>
+                    <span class="n">r</span> <span class="o">//</span> <span class="mi">4</span><span class="p">,</span>
+                    <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">200</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="mi">12</span><span class="p">),</span>
+                <span class="p">)</span>
+            <span class="k">if</span> <span class="n">last_observation</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_observation</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="n">last_observation</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">8</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span> <span class="mi">20</span><span class="p">,</span> <span class="mi">180</span><span class="p">)</span>
+                <span class="p">)</span>
+
+            <span class="n">MosViz</span><span class="o">.</span><span class="n">draw_robot</span><span class="p">(</span>
+                <span class="n">img</span><span class="p">,</span> <span class="n">rx</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">ry</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="mi">255</span> <span class="o">*</span> <span class="p">(</span><span class="mf">0.8</span> <span class="o">*</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)),</span> <span class="mi">12</span><span class="p">)</span>
+            <span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">surfarray</span><span class="o">.</span><span class="n">blit_array</span><span class="p">(</span><span class="n">display_surf</span><span class="p">,</span> <span class="n">img</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.env.html#problems.multi_object_search.env.visual.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="c1"># If you don&#39;t want occlusion, use this:</span>
+    <span class="n">laserstr</span> <span class="o">=</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">90</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="c1"># If you want occlusion, use this</span>
+    <span class="c1"># (the difference is mainly in angle_increment; this</span>
+    <span class="c1">#  is due to the discretization - discretization may</span>
+    <span class="c1">#  cause &quot;strange&quot; behavior when checking occlusion</span>
+    <span class="c1">#  but the model is actually doing the right thing.)</span>
+    <span class="n">laserstr_occ</span> <span class="o">=</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">360</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">8</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+    <span class="c1"># Proximity sensor</span>
+    <span class="n">proxstr</span> <span class="o">=</span> <span class="n">make_proximity_sensor</span><span class="p">(</span><span class="mf">1.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">proxstr_occ</span> <span class="o">=</span> <span class="n">make_proximity_sensor</span><span class="p">(</span><span class="mf">1.5</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
+
+    <span class="n">worldmap</span><span class="p">,</span> <span class="n">robot</span> <span class="o">=</span> <span class="n">world1</span>
+    <span class="n">worldstr</span> <span class="o">=</span> <span class="n">equip_sensors</span><span class="p">(</span><span class="n">worldmap</span><span class="p">,</span> <span class="p">{</span><span class="n">robot</span><span class="p">:</span> <span class="n">laserstr</span><span class="p">})</span>
+
+    <span class="n">dim</span><span class="p">,</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">sensors</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">init_state</span> <span class="o">=</span> <span class="n">MosOOState</span><span class="p">({</span><span class="o">**</span><span class="n">objects</span><span class="p">,</span> <span class="o">**</span><span class="n">robots</span><span class="p">})</span>
+    <span class="n">env</span> <span class="o">=</span> <span class="n">MosEnvironment</span><span class="p">(</span><span class="n">dim</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="n">obstacles</span><span class="o">=</span><span class="n">obstacles</span><span class="p">)</span>
+    <span class="n">viz</span> <span class="o">=</span> <span class="n">MosViz</span><span class="p">(</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+    <span class="n">viz</span><span class="o">.</span><span class="n">on_execute</span><span class="p">()</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/example_worlds.html b/docs/html/_modules/problems/multi_object_search/example_worlds.html
new file mode 100644
index 00000000..d7f00703
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/example_worlds.html
@@ -0,0 +1,263 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.example_worlds &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.example_worlds</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;This file has some examples of world string.&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">random</span>
+
+<span class="c1">############# Example Worlds ###########</span>
+<span class="c1"># See env.py:interpret for definition of</span>
+<span class="c1"># the format</span>
+
+<span class="n">world0</span> <span class="o">=</span> <span class="p">(</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">rx...</span>
+<span class="sd">.x.xT</span>
+<span class="sd">.....</span>
+<span class="sd">&quot;&quot;&quot;</span><span class="p">,</span>
+    <span class="s2">&quot;r&quot;</span><span class="p">,</span>
+<span class="p">)</span>
+
+<span class="n">world1</span> <span class="o">=</span> <span class="p">(</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">rx.T...</span>
+<span class="sd">.x.....</span>
+<span class="sd">...xx..</span>
+<span class="sd">.......</span>
+<span class="sd">.xxx.T.</span>
+<span class="sd">.xxx...</span>
+<span class="sd">.......</span>
+<span class="sd">&quot;&quot;&quot;</span><span class="p">,</span>
+    <span class="s2">&quot;r&quot;</span><span class="p">,</span>
+<span class="p">)</span>
+
+<span class="c1"># Used to test the shape of the sensor</span>
+<span class="n">world2</span> <span class="o">=</span> <span class="p">(</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">.................</span>
+<span class="sd">.................</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxTxxxx..</span>
+<span class="sd">..xxxxxxrxTxxxx..</span>
+<span class="sd">..xxxxxxxxTxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">.................</span>
+<span class="sd">.................</span>
+<span class="sd">&quot;&quot;&quot;</span><span class="p">,</span>
+    <span class="s2">&quot;r&quot;</span><span class="p">,</span>
+<span class="p">)</span>
+
+<span class="c1"># Used to test sensor occlusion</span>
+<span class="n">world3</span> <span class="o">=</span> <span class="p">(</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">.................</span>
+<span class="sd">.................</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxTxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxx...xxxxxx..</span>
+<span class="sd">..xxxx..xx.xxxx..</span>
+<span class="sd">..xxxx..r.Txxxx..</span>
+<span class="sd">..xxxx..xx.xxxx..</span>
+<span class="sd">..xxxxxx..xxxxx..</span>
+<span class="sd">..xxxxTx..xxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">..xxxxxxxxxxxxx..</span>
+<span class="sd">.................</span>
+<span class="sd">.................</span>
+<span class="sd">&quot;&quot;&quot;</span><span class="p">,</span>
+    <span class="s2">&quot;r&quot;</span><span class="p">,</span>
+<span class="p">)</span>
+
+
+<div class="viewcode-block" id="random_world">
+<a class="viewcode-back" href="../../../problems/problems.multi_object_search.html#problems.multi_object_search.example_worlds.random_world">[docs]</a>
+<span class="k">def</span> <span class="nf">random_world</span><span class="p">(</span><span class="n">width</span><span class="p">,</span> <span class="n">length</span><span class="p">,</span> <span class="n">num_obj</span><span class="p">,</span> <span class="n">num_obstacles</span><span class="p">,</span> <span class="n">robot_char</span><span class="o">=</span><span class="s2">&quot;r&quot;</span><span class="p">):</span>
+    <span class="n">worldstr</span> <span class="o">=</span> <span class="p">[[</span><span class="s2">&quot;.&quot;</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">width</span><span class="p">)]</span> <span class="k">for</span> <span class="n">j</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">length</span><span class="p">)]</span>
+    <span class="c1"># First place obstacles</span>
+    <span class="n">num_obstacles_placed</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="k">while</span> <span class="n">num_obstacles_placed</span> <span class="o">&lt;</span> <span class="n">num_obstacles</span><span class="p">:</span>
+        <span class="n">x</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">width</span><span class="p">)</span>
+        <span class="n">y</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">length</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">worldstr</span><span class="p">[</span><span class="n">y</span><span class="p">][</span><span class="n">x</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;.&quot;</span><span class="p">:</span>
+            <span class="n">worldstr</span><span class="p">[</span><span class="n">y</span><span class="p">][</span><span class="n">x</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;x&quot;</span>
+            <span class="n">num_obstacles_placed</span> <span class="o">+=</span> <span class="mi">1</span>
+
+    <span class="n">num_obj_placed</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="k">while</span> <span class="n">num_obj_placed</span> <span class="o">&lt;</span> <span class="n">num_obj</span><span class="p">:</span>
+        <span class="n">x</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">width</span><span class="p">)</span>
+        <span class="n">y</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">length</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">worldstr</span><span class="p">[</span><span class="n">y</span><span class="p">][</span><span class="n">x</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;.&quot;</span><span class="p">:</span>
+            <span class="n">worldstr</span><span class="p">[</span><span class="n">y</span><span class="p">][</span><span class="n">x</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;T&quot;</span>
+            <span class="n">num_obj_placed</span> <span class="o">+=</span> <span class="mi">1</span>
+
+    <span class="c1"># Finally place the robot</span>
+    <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
+        <span class="n">x</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">width</span><span class="p">)</span>
+        <span class="n">y</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">randrange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">length</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">worldstr</span><span class="p">[</span><span class="n">y</span><span class="p">][</span><span class="n">x</span><span class="p">]</span> <span class="o">==</span> <span class="s2">&quot;.&quot;</span><span class="p">:</span>
+            <span class="n">worldstr</span><span class="p">[</span><span class="n">y</span><span class="p">][</span><span class="n">x</span><span class="p">]</span> <span class="o">=</span> <span class="n">robot_char</span>
+            <span class="k">break</span>
+
+    <span class="c1"># Create the string.</span>
+    <span class="n">finalstr</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">for</span> <span class="n">row_chars</span> <span class="ow">in</span> <span class="n">worldstr</span><span class="p">:</span>
+        <span class="n">finalstr</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="s2">&quot;&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">row_chars</span><span class="p">))</span>
+    <span class="n">finalstr</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="se">\n</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">finalstr</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">finalstr</span><span class="p">,</span> <span class="n">robot_char</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/models/components/grid_map.html b/docs/html/_modules/problems/multi_object_search/models/components/grid_map.html
new file mode 100644
index 00000000..52143814
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/models/components/grid_map.html
@@ -0,0 +1,206 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.models.components.grid_map &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.models.components.grid_map</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Optional grid map to assist collision avoidance during planning.&quot;&quot;&quot;</span>
+
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.models.transition_model</span> <span class="kn">import</span> <span class="p">(</span>
+    <span class="n">RobotTransitionModel</span><span class="p">,</span>
+<span class="p">)</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="GridMap">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.grid_map.GridMap">[docs]</a>
+<span class="k">class</span> <span class="nc">GridMap</span><span class="p">:</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This map assists the agent to avoid planning invalid</span>
+<span class="sd">    actions that will run into obstacles. Used if we assume</span>
+<span class="sd">    the agent has a map. This map does not contain information</span>
+<span class="sd">    about the object locations.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">length</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Args:</span>
+<span class="sd">            obstacles (dict): Map from objid to (x,y); The object is</span>
+<span class="sd">                                   supposed to be an obstacle.</span>
+<span class="sd">            width (int): width of the grid map</span>
+<span class="sd">            length (int): length of the grid map</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">length</span> <span class="o">=</span> <span class="n">length</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_obstacles</span> <span class="o">=</span> <span class="n">obstacles</span>
+        <span class="c1"># An MosOOState that only contains poses for obstacles;</span>
+        <span class="c1"># This is to allow calling RobotTransitionModel.if_move_by</span>
+        <span class="c1"># function.</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_obstacle_states</span> <span class="o">=</span> <span class="p">{</span>
+            <span class="n">objid</span><span class="p">:</span> <span class="n">ObjectState</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="s2">&quot;obstacle&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_obstacles</span><span class="p">[</span><span class="n">objid</span><span class="p">])</span>
+            <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_obstacles</span>
+        <span class="p">}</span>
+        <span class="c1"># set of obstacle poses</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">obstacle_poses</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({</span><span class="bp">self</span><span class="o">.</span><span class="n">_obstacles</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_obstacles</span><span class="p">})</span>
+
+<div class="viewcode-block" id="GridMap.valid_motions">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.grid_map.GridMap.valid_motions">[docs]</a>
+    <span class="k">def</span> <span class="nf">valid_motions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="n">all_motion_actions</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Returns a set of MotionAction(s) that are valid to</span>
+<span class="sd">        be executed from robot pose (i.e. they will not bump</span>
+<span class="sd">        into obstacles). The validity is determined under</span>
+<span class="sd">        the assumption that the robot dynamics is deterministic.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="n">state</span> <span class="o">=</span> <span class="n">MosOOState</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_obstacle_states</span><span class="p">)</span>
+        <span class="n">state</span><span class="o">.</span><span class="n">set_object_state</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">RobotState</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">))</span>
+
+        <span class="n">valid</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="k">for</span> <span class="n">motion_action</span> <span class="ow">in</span> <span class="n">all_motion_actions</span><span class="p">:</span>
+            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">motion_action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                    <span class="s2">&quot;This (</span><span class="si">%s</span><span class="s2">) is not a motion action&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">motion_action</span><span class="p">)</span>
+                <span class="p">)</span>
+
+            <span class="n">next_pose</span> <span class="o">=</span> <span class="n">RobotTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span>
+                <span class="n">robot_id</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">motion_action</span><span class="p">,</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">length</span><span class="p">)</span>
+            <span class="p">)</span>
+            <span class="k">if</span> <span class="n">next_pose</span> <span class="o">!=</span> <span class="n">robot_pose</span><span class="p">:</span>
+                <span class="c1"># robot moved --&gt; valid motion</span>
+                <span class="n">valid</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">motion_action</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">valid</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/models/components/sensor.html b/docs/html/_modules/problems/multi_object_search/models/components/sensor.html
new file mode 100644
index 00000000..4e89c337
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/models/components/sensor.html
@@ -0,0 +1,420 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.models.components.sensor &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.models.components.sensor</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Sensor model (for example, laser scanner)&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+
+<span class="c1"># Note that the occlusion of an object is implemented based on</span>
+<span class="c1"># whether a beam will hit an obstacle or some other object before</span>
+<span class="c1"># that object. Because the world is discretized, this leads to</span>
+<span class="c1"># some strange pattern of the field of view. But what&#39;s for sure</span>
+<span class="c1"># is that, when occlusion is enabled, the sensor will definitely</span>
+<span class="c1"># not receive observation for some regions in the field of view</span>
+<span class="c1"># making it a more challenging situation to deal with.</span>
+
+
+<span class="c1"># Utility functions</span>
+<div class="viewcode-block" id="euclidean_dist">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.euclidean_dist">[docs]</a>
+<span class="k">def</span> <span class="nf">euclidean_dist</span><span class="p">(</span><span class="n">p1</span><span class="p">,</span> <span class="n">p2</span><span class="p">):</span>
+    <span class="k">return</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="nb">sum</span><span class="p">([(</span><span class="n">a</span> <span class="o">-</span> <span class="n">b</span><span class="p">)</span> <span class="o">**</span> <span class="mi">2</span> <span class="k">for</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">p1</span><span class="p">,</span> <span class="n">p2</span><span class="p">)]))</span></div>
+
+
+
+<div class="viewcode-block" id="to_rad">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.to_rad">[docs]</a>
+<span class="k">def</span> <span class="nf">to_rad</span><span class="p">(</span><span class="n">deg</span><span class="p">):</span>
+    <span class="k">return</span> <span class="n">deg</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">/</span> <span class="mf">180.0</span></div>
+
+
+
+<div class="viewcode-block" id="in_range">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.in_range">[docs]</a>
+<span class="k">def</span> <span class="nf">in_range</span><span class="p">(</span><span class="n">val</span><span class="p">,</span> <span class="n">rang</span><span class="p">):</span>
+    <span class="c1"># Returns True if val is in range (a,b); Inclusive.</span>
+    <span class="k">return</span> <span class="n">val</span> <span class="o">&gt;=</span> <span class="n">rang</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="ow">and</span> <span class="n">val</span> <span class="o">&lt;=</span> <span class="n">rang</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span></div>
+
+
+
+<span class="c1">#### Sensors ####</span>
+<div class="viewcode-block" id="Sensor">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor">[docs]</a>
+<span class="k">class</span> <span class="nc">Sensor</span><span class="p">:</span>
+    <span class="n">LASER</span> <span class="o">=</span> <span class="s2">&quot;laser&quot;</span>
+    <span class="n">PROXIMITY</span> <span class="o">=</span> <span class="s2">&quot;proximity&quot;</span>
+
+<div class="viewcode-block" id="Sensor.observe">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.observe">[docs]</a>
+    <span class="k">def</span> <span class="nf">observe</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="n">env_state</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Returns an Observation with this sensor model.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="Sensor.within_range">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.within_range">[docs]</a>
+    <span class="k">def</span> <span class="nf">within_range</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="n">point</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns true if the point is within range of the sensor; but the point might not</span>
+<span class="sd">        actually be visible due to occlusion or &quot;gap&quot; between beams&quot;&quot;&quot;</span>
+        <span class="k">raise</span> <span class="ne">ValueError</span></div>
+
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">sensing_region_size</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sensing_region_size</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">robot_id</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="c1"># id of the robot equipped with this sensor</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span></div>
+
+
+
+<div class="viewcode-block" id="Laser2DSensor">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor">[docs]</a>
+<span class="k">class</span> <span class="nc">Laser2DSensor</span><span class="p">:</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Fan shaped 2D laser sensor&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">robot_id</span><span class="p">,</span>
+        <span class="n">fov</span><span class="o">=</span><span class="mi">90</span><span class="p">,</span>
+        <span class="n">min_range</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">max_range</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span>
+        <span class="n">angle_increment</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span>
+        <span class="n">occlusion_enabled</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        fov (float): angle between the start and end beams of one scan (degree).</span>
+<span class="sd">        min_range (int or float)</span>
+<span class="sd">        max_range (int or float)</span>
+<span class="sd">        angle_increment (float): angular distance between measurements (rad).</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">fov</span> <span class="o">=</span> <span class="n">to_rad</span><span class="p">(</span><span class="n">fov</span><span class="p">)</span>  <span class="c1"># convert to radian</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">min_range</span> <span class="o">=</span> <span class="n">min_range</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">max_range</span> <span class="o">=</span> <span class="n">max_range</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">angle_increment</span> <span class="o">=</span> <span class="n">to_rad</span><span class="p">(</span><span class="n">angle_increment</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_occlusion_enabled</span> <span class="o">=</span> <span class="n">occlusion_enabled</span>
+
+        <span class="c1"># determines the range of angles;</span>
+        <span class="c1"># For example, the fov=pi, means the range scanner scans 180 degrees</span>
+        <span class="c1"># in front of the robot. By our angle convention, 180 degrees maps to [0,90] and [270, 360].&quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_fov_left</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">fov</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_fov_right</span> <span class="o">=</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">fov</span> <span class="o">/</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span>
+
+        <span class="c1"># beams that are actually within the fov (set of angles)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_beams</span> <span class="o">=</span> <span class="p">{</span>
+            <span class="nb">round</span><span class="p">(</span><span class="n">th</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
+            <span class="k">for</span> <span class="n">th</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_fov_left</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_fov_left</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span>
+                <span class="nb">int</span><span class="p">(</span>
+                    <span class="nb">round</span><span class="p">(</span>
+                        <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_fov_left</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">_fov_left</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">angle_increment</span>
+                    <span class="p">)</span>
+                <span class="p">),</span>
+            <span class="p">)</span>
+        <span class="p">}</span> <span class="o">|</span> <span class="p">{</span>
+            <span class="nb">round</span><span class="p">(</span><span class="n">th</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
+            <span class="k">for</span> <span class="n">th</span> <span class="ow">in</span> <span class="n">np</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_fov_right</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_fov_right</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span>
+                <span class="nb">int</span><span class="p">(</span>
+                    <span class="nb">round</span><span class="p">(</span>
+                        <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_fov_right</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">_fov_right</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">angle_increment</span>
+                    <span class="p">)</span>
+                <span class="p">),</span>
+            <span class="p">)</span>
+        <span class="p">}</span>
+        <span class="c1"># The size of the sensing region here is the area covered by the fan</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_sensing_region_size</span> <span class="o">=</span> <span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">fov</span> <span class="o">/</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">*</span> <span class="p">(</span><span class="n">max_range</span> <span class="o">-</span> <span class="n">min_range</span><span class="p">)</span> <span class="o">**</span> <span class="mi">2</span>
+        <span class="p">)</span>
+
+<div class="viewcode-block" id="Laser2DSensor.in_field_of_view">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.in_field_of_view">[docs]</a>
+    <span class="k">def</span> <span class="nf">in_field_of_view</span><span class="p">(</span><span class="n">th</span><span class="p">,</span> <span class="n">view_angles</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Determines if the beame at angle `th` is in a field of view of size `view_angles`.</span>
+<span class="sd">        For example, the view_angles=180, means the range scanner scans 180 degrees</span>
+<span class="sd">        in front of the robot. By our angle convention, 180 degrees maps to [0,90] and [270, 360].</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="n">fov_right</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">view_angles</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)</span>
+        <span class="n">fov_left</span> <span class="o">=</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span> <span class="o">-</span> <span class="n">view_angles</span> <span class="o">/</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="Laser2DSensor.within_range">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.within_range">[docs]</a>
+    <span class="k">def</span> <span class="nf">within_range</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="n">point</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns true if the point is within range of the sensor; but the point might not</span>
+<span class="sd">        actually be visible due to occlusion or &quot;gap&quot; between beams&quot;&quot;&quot;</span>
+        <span class="n">dist</span><span class="p">,</span> <span class="n">bearing</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">shoot_beam</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="n">point</span><span class="p">)</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="n">in_range</span><span class="p">(</span><span class="n">dist</span><span class="p">,</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">min_range</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_range</span><span class="p">)):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">if</span> <span class="p">(</span><span class="ow">not</span> <span class="n">in_range</span><span class="p">(</span><span class="n">bearing</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_fov_left</span><span class="p">))</span> <span class="ow">and</span> <span class="p">(</span>
+            <span class="ow">not</span> <span class="n">in_range</span><span class="p">(</span><span class="n">bearing</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_fov_right</span><span class="p">)</span>
+        <span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">return</span> <span class="kc">True</span></div>
+
+
+<div class="viewcode-block" id="Laser2DSensor.shoot_beam">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.shoot_beam">[docs]</a>
+    <span class="k">def</span> <span class="nf">shoot_beam</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="n">point</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Shoots a beam from robot_pose at point. Returns the distance and bearing</span>
+<span class="sd">        of the beame (i.e. the length and orientation of the beame)&quot;&quot;&quot;</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="n">robot_pose</span>
+        <span class="n">dist</span> <span class="o">=</span> <span class="n">euclidean_dist</span><span class="p">(</span><span class="n">point</span><span class="p">,</span> <span class="p">(</span><span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">))</span>
+        <span class="n">bearing</span> <span class="o">=</span> <span class="p">(</span><span class="n">math</span><span class="o">.</span><span class="n">atan2</span><span class="p">(</span><span class="n">point</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="n">ry</span><span class="p">,</span> <span class="n">point</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">-</span> <span class="n">rx</span><span class="p">)</span> <span class="o">-</span> <span class="n">rth</span><span class="p">)</span> <span class="o">%</span> <span class="p">(</span>
+            <span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span>
+        <span class="p">)</span>  <span class="c1"># bearing (i.e. orientation)</span>
+        <span class="k">return</span> <span class="p">(</span><span class="n">dist</span><span class="p">,</span> <span class="n">bearing</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="Laser2DSensor.valid_beam">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.valid_beam">[docs]</a>
+    <span class="k">def</span> <span class="nf">valid_beam</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dist</span><span class="p">,</span> <span class="n">bearing</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns true beam length (i.e. `dist`) is within range and its angle</span>
+<span class="sd">        `bearing` is valid, that is, it is within the fov range and in</span>
+<span class="sd">        accordance with the angle increment.&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="p">(</span>
+            <span class="n">dist</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">min_range</span>
+            <span class="ow">and</span> <span class="n">dist</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_range</span>
+            <span class="ow">and</span> <span class="nb">round</span><span class="p">(</span><span class="n">bearing</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_beams</span>
+        <span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="nf">_build_beam_map</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">beam</span><span class="p">,</span> <span class="n">point</span><span class="p">,</span> <span class="n">beam_map</span><span class="o">=</span><span class="p">{}):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;beam_map (dict): Maps from bearing to (dist, point)&quot;&quot;&quot;</span>
+        <span class="n">dist</span><span class="p">,</span> <span class="n">bearing</span> <span class="o">=</span> <span class="n">beam</span>
+        <span class="n">valid</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">valid_beam</span><span class="p">(</span><span class="n">dist</span><span class="p">,</span> <span class="n">bearing</span><span class="p">)</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="n">valid</span><span class="p">:</span>
+            <span class="k">return</span>
+        <span class="n">bearing_key</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">bearing</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">bearing_key</span> <span class="ow">in</span> <span class="n">beam_map</span><span class="p">:</span>
+            <span class="c1"># There&#39;s an object covered by this beame already.</span>
+            <span class="c1"># see if this beame is closer</span>
+            <span class="k">if</span> <span class="n">dist</span> <span class="o">&lt;</span> <span class="n">beam_map</span><span class="p">[</span><span class="n">bearing_key</span><span class="p">][</span><span class="mi">0</span><span class="p">]:</span>
+                <span class="c1"># point is closer; Update beam map</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;HEY&quot;</span><span class="p">)</span>
+                <span class="n">beam_map</span><span class="p">[</span><span class="n">bearing_key</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">dist</span><span class="p">,</span> <span class="n">point</span><span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="c1"># point is farther than current hit</span>
+                <span class="k">pass</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">beam_map</span><span class="p">[</span><span class="n">bearing_key</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">dist</span><span class="p">,</span> <span class="n">point</span><span class="p">)</span>
+
+<div class="viewcode-block" id="Laser2DSensor.observe">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.observe">[docs]</a>
+    <span class="k">def</span> <span class="nf">observe</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_pose</span><span class="p">,</span> <span class="n">env_state</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Returns a MosObservation with this sensor model.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="n">robot_pose</span>
+
+        <span class="c1"># Check every object</span>
+        <span class="n">objposes</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="n">beam_map</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">env_state</span><span class="o">.</span><span class="n">object_states</span><span class="p">:</span>
+            <span class="n">objposes</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span>
+            <span class="n">object_pose</span> <span class="o">=</span> <span class="n">env_state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span>
+            <span class="n">beam</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">shoot_beam</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="n">object_pose</span><span class="p">)</span>
+
+            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_occlusion_enabled</span><span class="p">:</span>
+                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">valid_beam</span><span class="p">(</span><span class="o">*</span><span class="n">beam</span><span class="p">):</span>
+                    <span class="n">d</span><span class="p">,</span> <span class="n">bearing</span> <span class="o">=</span> <span class="n">beam</span>  <span class="c1"># distance, bearing</span>
+                    <span class="n">lx</span> <span class="o">=</span> <span class="n">rx</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">d</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">rth</span> <span class="o">+</span> <span class="n">bearing</span><span class="p">)))</span>
+                    <span class="n">ly</span> <span class="o">=</span> <span class="n">ry</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">d</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">rth</span> <span class="o">+</span> <span class="n">bearing</span><span class="p">)))</span>
+                    <span class="n">objposes</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">lx</span><span class="p">,</span> <span class="n">ly</span><span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_build_beam_map</span><span class="p">(</span><span class="n">beam</span><span class="p">,</span> <span class="n">object_pose</span><span class="p">,</span> <span class="n">beam_map</span><span class="o">=</span><span class="n">beam_map</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_occlusion_enabled</span><span class="p">:</span>
+            <span class="c1"># The observed objects are in the beam_map</span>
+            <span class="k">for</span> <span class="n">bearing_key</span> <span class="ow">in</span> <span class="n">beam_map</span><span class="p">:</span>
+                <span class="n">d</span><span class="p">,</span> <span class="n">objid</span> <span class="o">=</span> <span class="n">beam_map</span><span class="p">[</span><span class="n">bearing_key</span><span class="p">]</span>
+                <span class="n">lx</span> <span class="o">=</span> <span class="n">rx</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">d</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">rth</span> <span class="o">+</span> <span class="n">bearing_key</span><span class="p">)))</span>
+                <span class="n">ly</span> <span class="o">=</span> <span class="n">ry</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">d</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">rth</span> <span class="o">+</span> <span class="n">bearing_key</span><span class="p">)))</span>
+                <span class="n">objposes</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">lx</span><span class="p">,</span> <span class="n">ly</span><span class="p">)</span>
+
+        <span class="k">return</span> <span class="n">MosOOObservation</span><span class="p">(</span><span class="n">objposes</span><span class="p">)</span></div>
+
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">sensing_region_size</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sensing_region_size</span></div>
+
+
+
+<div class="viewcode-block" id="ProximitySensor">
+<a class="viewcode-back" href="../../../../../problems/problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.ProximitySensor">[docs]</a>
+<span class="k">class</span> <span class="nc">ProximitySensor</span><span class="p">(</span><span class="n">Laser2DSensor</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This is a simple sensor; Observes a region centered</span>
+<span class="sd">    at the robot.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">radius</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">occlusion_enabled</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        radius (int or float) radius of the sensing region.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">radius</span> <span class="o">=</span> <span class="n">radius</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_occlusion_enabled</span> <span class="o">=</span> <span class="n">occlusion_enabled</span>
+
+        <span class="c1"># This is in fact just a specific kind of Laser2DSensor</span>
+        <span class="c1"># that has a 360 field of view, min_range = 0.1 and</span>
+        <span class="c1"># max_range = radius</span>
+        <span class="k">if</span> <span class="n">occlusion_enabled</span><span class="p">:</span>
+            <span class="n">angle_increment</span> <span class="o">=</span> <span class="mi">5</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">angle_increment</span> <span class="o">=</span> <span class="mf">0.25</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+            <span class="n">robot_id</span><span class="p">,</span>
+            <span class="n">fov</span><span class="o">=</span><span class="mi">360</span><span class="p">,</span>
+            <span class="n">min_range</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span>
+            <span class="n">max_range</span><span class="o">=</span><span class="n">radius</span><span class="p">,</span>
+            <span class="n">angle_increment</span><span class="o">=</span><span class="n">angle_increment</span><span class="p">,</span>
+            <span class="n">occlusion_enabled</span><span class="o">=</span><span class="n">occlusion_enabled</span><span class="p">,</span>
+        <span class="p">)</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/models/observation_model.html b/docs/html/_modules/problems/multi_object_search/models/observation_model.html
new file mode 100644
index 00000000..9938feee
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/models/observation_model.html
@@ -0,0 +1,442 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.models.observation_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.models.observation_model</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Defines the ObservationModel for the 2D Multi-Object Search domain.</span>
+
+<span class="sd">Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)</span>
+<span class="sd">(extensions: action space changes, different sensor model, gridworld instead of</span>
+<span class="sd">topological graph)</span>
+
+<span class="sd">Observation: {objid : pose(x,y) or NULL}. The sensor model could vary;</span>
+<span class="sd">             it could be a fan-shaped model as the original paper, or</span>
+<span class="sd">             it could be something else. But the resulting observation</span>
+<span class="sd">             should be a map from object id to observed pose or NULL (not observed).</span>
+
+<span class="sd">Observation Model</span>
+
+<span class="sd">  The agent can observe its own state, as well as object poses</span>
+<span class="sd">  that are within its sensor range. We only need to model object</span>
+<span class="sd">  observation.</span>
+
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1">#### Observation Models ####</span>
+<div class="viewcode-block" id="MosObservationModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.MosObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">MosObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOObservationModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Object-oriented transition model&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="n">object_ids</span><span class="p">,</span> <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">sigma</span> <span class="o">=</span> <span class="n">sigma</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span> <span class="o">=</span> <span class="n">epsilon</span>
+        <span class="n">observation_models</span> <span class="o">=</span> <span class="p">{</span>
+            <span class="n">objid</span><span class="p">:</span> <span class="n">ObjectObservationModel</span><span class="p">(</span>
+                <span class="n">objid</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">sigma</span><span class="o">=</span><span class="n">sigma</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="n">epsilon</span>
+            <span class="p">)</span>
+            <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">object_ids</span>
+        <span class="p">}</span>
+        <span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOObservationModel</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation_models</span><span class="p">)</span>
+
+<div class="viewcode-block" id="MosObservationModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.MosObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">MosOOObservation</span><span class="p">({})</span>
+            <span class="c1"># return MosOOObservation({objid: ObjectObservationModel.NULL</span>
+            <span class="c1">#                          for objid in next_state.object_states</span>
+            <span class="c1">#                          if objid != next_state.object_states[objid].objclass != &quot;robot&quot;})</span>
+
+        <span class="n">factored_observations</span> <span class="o">=</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="n">argmax</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">MosOOObservation</span><span class="o">.</span><span class="n">merge</span><span class="p">(</span><span class="n">factored_observations</span><span class="p">,</span> <span class="n">next_state</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="ObjectObservationModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">ObjectObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObservationModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">sigma</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        sigma and epsilon are parameters of the observation model (see paper),</span>
+<span class="sd">        dim (tuple): a tuple (width, length) for the dimension of the world&quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_objid</span> <span class="o">=</span> <span class="n">objid</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span> <span class="o">=</span> <span class="n">sensor</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_dim</span> <span class="o">=</span> <span class="n">dim</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">sigma</span> <span class="o">=</span> <span class="n">sigma</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span> <span class="o">=</span> <span class="n">epsilon</span>
+
+    <span class="k">def</span> <span class="nf">_compute_params</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">object_in_sensing_region</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">object_in_sensing_region</span><span class="p">:</span>
+            <span class="c1"># Object is in the sensing region</span>
+            <span class="n">alpha</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span>
+            <span class="n">beta</span> <span class="o">=</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span><span class="p">)</span> <span class="o">/</span> <span class="mf">2.0</span>
+            <span class="n">gamma</span> <span class="o">=</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span><span class="p">)</span> <span class="o">/</span> <span class="mf">2.0</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># Object is not in the sensing region.</span>
+            <span class="n">alpha</span> <span class="o">=</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span><span class="p">)</span> <span class="o">/</span> <span class="mf">2.0</span>
+            <span class="n">beta</span> <span class="o">=</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span><span class="p">)</span> <span class="o">/</span> <span class="mf">2.0</span>
+            <span class="n">gamma</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">epsilon</span>
+        <span class="k">return</span> <span class="n">alpha</span><span class="p">,</span> <span class="n">beta</span><span class="p">,</span> <span class="n">gamma</span>
+
+<div class="viewcode-block" id="ObjectObservationModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Returns the probability of Pr (observation | next_state, action).</span>
+
+<span class="sd">        Args:</span>
+<span class="sd">            observation (ObjectObservation)</span>
+<span class="sd">            next_state (State)</span>
+<span class="sd">            action (Action)</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
+            <span class="c1"># No observation should be received</span>
+            <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">pose</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1.0</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">0.0</span>
+
+        <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">objid</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;The observation is not about the same object&quot;</span><span class="p">)</span>
+
+        <span class="c1"># The (funny) business of allowing histogram belief update using O(oi|si&#39;,sr&#39;,a).</span>
+        <span class="n">next_robot_state</span> <span class="o">=</span> <span class="n">kwargs</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;next_robot_state&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">next_robot_state</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">assert</span> <span class="p">(</span>
+                <span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;id&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">robot_id</span>
+            <span class="p">),</span> <span class="s2">&quot;Robot id of observation model mismatch with given state&quot;</span>
+            <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">next_robot_state</span><span class="o">.</span><span class="n">pose</span>
+
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">ObjectState</span><span class="p">):</span>
+                <span class="k">assert</span> <span class="p">(</span>
+                    <span class="n">next_state</span><span class="p">[</span><span class="s2">&quot;id&quot;</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_objid</span>
+                <span class="p">),</span> <span class="s2">&quot;Object id of observation model mismatch with given state&quot;</span>
+                <span class="n">object_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">pose</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">object_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">robot_id</span><span class="p">)</span>
+            <span class="n">object_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">)</span>
+
+        <span class="c1"># Compute the probability</span>
+        <span class="n">zi</span> <span class="o">=</span> <span class="n">observation</span><span class="o">.</span><span class="n">pose</span>
+        <span class="n">alpha</span><span class="p">,</span> <span class="n">beta</span><span class="p">,</span> <span class="n">gamma</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_compute_params</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="n">object_pose</span><span class="p">)</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Requires Python &gt;= 3.6</span>
+        <span class="n">prob</span> <span class="o">=</span> <span class="mf">0.0</span>
+        <span class="c1"># Event A:</span>
+        <span class="c1"># object in sensing region and observation comes from object i</span>
+        <span class="k">if</span> <span class="n">zi</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">:</span>
+            <span class="c1"># Even though event A occurred, the observation is NULL.</span>
+            <span class="c1"># This has 0.0 probability.</span>
+            <span class="n">prob</span> <span class="o">+=</span> <span class="mf">0.0</span> <span class="o">*</span> <span class="n">alpha</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">gaussian</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Gaussian</span><span class="p">(</span>
+                <span class="nb">list</span><span class="p">(</span><span class="n">object_pose</span><span class="p">),</span> <span class="p">[[</span><span class="bp">self</span><span class="o">.</span><span class="n">sigma</span><span class="o">**</span><span class="mi">2</span><span class="p">,</span> <span class="mi">0</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma</span><span class="o">**</span><span class="mi">2</span><span class="p">]]</span>
+            <span class="p">)</span>
+            <span class="n">prob</span> <span class="o">+=</span> <span class="n">gaussian</span><span class="p">[</span><span class="n">zi</span><span class="p">]</span> <span class="o">*</span> <span class="n">alpha</span>
+
+        <span class="c1"># Event B</span>
+        <span class="n">prob</span> <span class="o">+=</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">sensing_region_size</span><span class="p">)</span> <span class="o">*</span> <span class="n">beta</span>
+
+        <span class="c1"># Event C</span>
+        <span class="n">pr_c</span> <span class="o">=</span> <span class="mf">1.0</span> <span class="k">if</span> <span class="n">zi</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span> <span class="k">else</span> <span class="mf">0.0</span>  <span class="c1"># indicator zi == NULL</span>
+        <span class="n">prob</span> <span class="o">+=</span> <span class="n">pr_c</span> <span class="o">*</span> <span class="n">gamma</span>
+        <span class="k">return</span> <span class="n">prob</span></div>
+
+
+<div class="viewcode-block" id="ObjectObservationModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns observation&quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
+            <span class="c1"># Not a look action. So no observation</span>
+            <span class="k">return</span> <span class="n">ObjectObservation</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">,</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">)</span>
+
+        <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">object_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">)</span>
+
+        <span class="c1"># Obtain observation according to distribution.</span>
+        <span class="n">alpha</span><span class="p">,</span> <span class="n">beta</span><span class="p">,</span> <span class="n">gamma</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_compute_params</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="n">object_pose</span><span class="p">)</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Requires Python &gt;= 3.6</span>
+        <span class="n">event_occured</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">choices</span><span class="p">(</span>
+            <span class="p">[</span><span class="s2">&quot;A&quot;</span><span class="p">,</span> <span class="s2">&quot;B&quot;</span><span class="p">,</span> <span class="s2">&quot;C&quot;</span><span class="p">],</span> <span class="n">weights</span><span class="o">=</span><span class="p">[</span><span class="n">alpha</span><span class="p">,</span> <span class="n">beta</span><span class="p">,</span> <span class="n">gamma</span><span class="p">],</span> <span class="n">k</span><span class="o">=</span><span class="mi">1</span>
+        <span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+        <span class="n">zi</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sample_zi</span><span class="p">(</span><span class="n">event_occured</span><span class="p">,</span> <span class="n">next_state</span><span class="p">)</span>
+
+        <span class="k">return</span> <span class="n">ObjectObservation</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">,</span> <span class="n">zi</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="ObjectObservationModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="c1"># Obtain observation according to distribution.</span>
+        <span class="n">alpha</span><span class="p">,</span> <span class="n">beta</span><span class="p">,</span> <span class="n">gamma</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_compute_params</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="n">object_pose</span><span class="p">)</span>
+        <span class="p">)</span>
+
+        <span class="n">event_probs</span> <span class="o">=</span> <span class="p">{</span><span class="s2">&quot;A&quot;</span><span class="p">:</span> <span class="n">alpha</span><span class="p">,</span> <span class="s2">&quot;B&quot;</span><span class="p">:</span> <span class="n">beta</span><span class="p">,</span> <span class="s2">&quot;C&quot;</span><span class="p">:</span> <span class="n">gamma</span><span class="p">}</span>
+        <span class="n">event_occured</span> <span class="o">=</span> <span class="nb">max</span><span class="p">(</span><span class="n">event_probs</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="k">lambda</span> <span class="n">e</span><span class="p">:</span> <span class="n">event_probs</span><span class="p">[</span><span class="n">e</span><span class="p">])</span>
+        <span class="n">zi</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sample_zi</span><span class="p">(</span><span class="n">event_occured</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">ObjectObservation</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">,</span> <span class="n">zi</span><span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="nf">_sample_zi</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">event</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">event</span> <span class="o">==</span> <span class="s2">&quot;A&quot;</span><span class="p">:</span>
+            <span class="n">object_true_pose</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">object_pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">)</span>
+            <span class="n">gaussian</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Gaussian</span><span class="p">(</span>
+                <span class="nb">list</span><span class="p">(</span><span class="n">object_true_pose</span><span class="p">),</span> <span class="p">[[</span><span class="bp">self</span><span class="o">.</span><span class="n">sigma</span><span class="o">**</span><span class="mi">2</span><span class="p">,</span> <span class="mi">0</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigma</span><span class="o">**</span><span class="mi">2</span><span class="p">]]</span>
+            <span class="p">)</span>
+            <span class="k">if</span> <span class="ow">not</span> <span class="n">argmax</span><span class="p">:</span>
+                <span class="n">zi</span> <span class="o">=</span> <span class="n">gaussian</span><span class="o">.</span><span class="n">random</span><span class="p">()</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">zi</span> <span class="o">=</span> <span class="n">gaussian</span><span class="o">.</span><span class="n">mpe</span><span class="p">()</span>
+            <span class="n">zi</span> <span class="o">=</span> <span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">zi</span><span class="p">[</span><span class="mi">0</span><span class="p">])),</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">zi</span><span class="p">[</span><span class="mi">1</span><span class="p">])))</span>
+
+        <span class="k">elif</span> <span class="n">event</span> <span class="o">==</span> <span class="s2">&quot;B&quot;</span><span class="p">:</span>
+            <span class="c1"># TODO: FIX. zi should ONLY come from the field of view.</span>
+            <span class="c1"># There is currently no easy way to sample from the field of view.</span>
+            <span class="n">width</span><span class="p">,</span> <span class="n">height</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dim</span>
+            <span class="n">zi</span> <span class="o">=</span> <span class="p">(</span>
+                <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span>  <span class="c1"># x axis</span>
+                <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">height</span><span class="p">),</span>
+            <span class="p">)</span>  <span class="c1"># y axis</span>
+        <span class="k">else</span><span class="p">:</span>  <span class="c1"># event == C</span>
+            <span class="n">zi</span> <span class="o">=</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span>
+        <span class="k">return</span> <span class="n">zi</span></div>
+
+
+
+<span class="c1">### Unit test ###</span>
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="kn">from</span> <span class="nn">..env.env</span> <span class="kn">import</span> <span class="p">(</span>
+        <span class="n">make_laser_sensor</span><span class="p">,</span>
+        <span class="n">make_proximity_sensor</span><span class="p">,</span>
+        <span class="n">equip_sensors</span><span class="p">,</span>
+        <span class="n">interpret</span><span class="p">,</span>
+        <span class="n">interpret_robot_id</span><span class="p">,</span>
+    <span class="p">)</span>
+
+    <span class="c1"># Test within search region check,</span>
+    <span class="c1"># and the observation model probability and</span>
+    <span class="c1"># sampling functions.</span>
+    <span class="n">worldmap</span> <span class="o">=</span> <span class="s2">&quot;&quot;&quot;</span>
+<span class="s2">        ..........</span>
+<span class="s2">        ....T.....</span>
+<span class="s2">        ......x...</span>
+<span class="s2">        ..T.r.T...</span>
+<span class="s2">        ..x.......</span>
+<span class="s2">        ....T.....</span>
+<span class="s2">        ..........</span>
+<span class="s2">        &quot;&quot;&quot;</span>
+    <span class="c1"># 0123456789</span>
+    <span class="c1"># 10 x 8</span>
+    <span class="n">worldstr</span> <span class="o">=</span> <span class="n">equip_sensors</span><span class="p">(</span><span class="n">worldmap</span><span class="p">,</span> <span class="p">{</span><span class="s2">&quot;r&quot;</span><span class="p">:</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">90</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">5</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)})</span>
+    <span class="n">env</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">robot_id</span> <span class="o">=</span> <span class="n">interpret_robot_id</span><span class="p">(</span><span class="s2">&quot;r&quot;</span><span class="p">)</span>
+    <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+
+    <span class="c1"># within_range test</span>
+    <span class="n">sensor</span> <span class="o">=</span> <span class="n">env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="mi">3</span><span class="p">))</span> <span class="o">==</span> <span class="kc">False</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">5</span><span class="p">,</span> <span class="mi">3</span><span class="p">))</span> <span class="o">==</span> <span class="kc">True</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">6</span><span class="p">,</span> <span class="mi">3</span><span class="p">))</span> <span class="o">==</span> <span class="kc">True</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">7</span><span class="p">,</span> <span class="mi">2</span><span class="p">))</span> <span class="o">==</span> <span class="kc">True</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">7</span><span class="p">,</span> <span class="mi">3</span><span class="p">))</span> <span class="o">==</span> <span class="kc">True</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="mi">3</span><span class="p">))</span> <span class="o">==</span> <span class="kc">False</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="mi">4</span><span class="p">))</span> <span class="o">==</span> <span class="kc">False</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="mi">1</span><span class="p">))</span> <span class="o">==</span> <span class="kc">False</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="mi">5</span><span class="p">))</span> <span class="o">==</span> <span class="kc">False</span>
+    <span class="k">assert</span> <span class="n">sensor</span><span class="o">.</span><span class="n">within_range</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span> <span class="o">==</span> <span class="kc">False</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+
+    <span class="c1"># observation model test</span>
+    <span class="n">O0</span> <span class="o">=</span> <span class="n">ObjectObservationModel</span><span class="p">(</span>
+        <span class="mi">0</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span>
+    <span class="p">)</span>
+    <span class="n">O2</span> <span class="o">=</span> <span class="n">ObjectObservationModel</span><span class="p">(</span>
+        <span class="mi">2</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span>
+    <span class="p">)</span>
+    <span class="n">O3</span> <span class="o">=</span> <span class="n">ObjectObservationModel</span><span class="p">(</span>
+        <span class="mi">3</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span>
+    <span class="p">)</span>
+    <span class="n">O5</span> <span class="o">=</span> <span class="n">ObjectObservationModel</span><span class="p">(</span>
+        <span class="mi">5</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span>
+    <span class="p">)</span>
+
+    <span class="n">z0</span> <span class="o">=</span> <span class="n">O0</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span>
+    <span class="k">assert</span> <span class="n">z0</span><span class="o">.</span><span class="n">pose</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span>
+    <span class="n">z2</span> <span class="o">=</span> <span class="n">O2</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span>
+    <span class="k">assert</span> <span class="n">z2</span><span class="o">.</span><span class="n">pose</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span>
+    <span class="n">z3</span> <span class="o">=</span> <span class="n">O3</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span>
+    <span class="k">assert</span> <span class="n">z3</span><span class="o">.</span><span class="n">pose</span> <span class="o">==</span> <span class="p">(</span><span class="mi">6</span><span class="p">,</span> <span class="mi">3</span><span class="p">)</span>
+    <span class="n">z5</span> <span class="o">=</span> <span class="n">O5</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span>
+    <span class="k">assert</span> <span class="n">z5</span><span class="o">.</span><span class="n">pose</span> <span class="o">==</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span>
+
+    <span class="k">assert</span> <span class="n">O0</span><span class="o">.</span><span class="n">probability</span><span class="p">(</span><span class="n">z0</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span> <span class="o">==</span> <span class="mf">1.0</span>
+    <span class="k">assert</span> <span class="n">O2</span><span class="o">.</span><span class="n">probability</span><span class="p">(</span><span class="n">z2</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span> <span class="o">==</span> <span class="mf">1.0</span>
+    <span class="k">assert</span> <span class="n">O3</span><span class="o">.</span><span class="n">probability</span><span class="p">(</span><span class="n">z3</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="mf">1.0</span>
+    <span class="k">assert</span> <span class="p">(</span>
+        <span class="n">O3</span><span class="o">.</span><span class="n">probability</span><span class="p">(</span><span class="n">ObjectObservation</span><span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span><span class="p">),</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span>
+        <span class="o">==</span> <span class="mf">0.0</span>
+    <span class="p">)</span>
+    <span class="k">assert</span> <span class="n">O5</span><span class="o">.</span><span class="n">probability</span><span class="p">(</span><span class="n">z5</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">Look</span><span class="p">)</span> <span class="o">==</span> <span class="mf">1.0</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/models/policy_model.html b/docs/html/_modules/problems/multi_object_search/models/policy_model.html
new file mode 100644
index 00000000..f1d18c77
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/models/policy_model.html
@@ -0,0 +1,208 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.models.policy_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.models.policy_model</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Policy model for 2D Multi-Object Search domain.</span>
+<span class="sd">It is optional for the agent to be equipped with an occupancy</span>
+<span class="sd">grid map of the environment.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="PolicyModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel">[docs]</a>
+<span class="k">class</span> <span class="nc">PolicyModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RolloutPolicy</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Simple policy model. All actions are possible at any state.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">grid_map</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;FindAction can only be taken after LookAction&quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+
+<div class="viewcode-block" id="PolicyModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_all_actions</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+
+
+<div class="viewcode-block" id="PolicyModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="PolicyModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely action&quot;&quot;&quot;</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="PolicyModel.get_all_actions">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.get_all_actions">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;note: find can only happen after look.&quot;&quot;&quot;</span>
+        <span class="n">can_find</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="k">if</span> <span class="n">history</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="nb">len</span><span class="p">(</span><span class="n">history</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+            <span class="c1"># last action</span>
+            <span class="n">last_action</span> <span class="o">=</span> <span class="n">history</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">last_action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
+                <span class="n">can_find</span> <span class="o">=</span> <span class="kc">True</span>
+        <span class="n">find_action</span> <span class="o">=</span> <span class="p">[</span><span class="n">Find</span><span class="p">]</span> <span class="k">if</span> <span class="n">can_find</span> <span class="k">else</span> <span class="p">[]</span>
+        <span class="k">if</span> <span class="n">state</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">+</span> <span class="p">[</span><span class="n">Look</span><span class="p">]</span> <span class="o">+</span> <span class="n">find_action</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">valid_motions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_id</span><span class="p">),</span> <span class="n">ALL_MOTION_ACTIONS</span>
+                <span class="p">)</span>
+                <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">valid_motions</span><span class="p">)</span> <span class="o">+</span> <span class="p">[</span><span class="n">Look</span><span class="p">]</span> <span class="o">+</span> <span class="n">find_action</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">ALL_MOTION_ACTIONS</span> <span class="o">+</span> <span class="p">[</span><span class="n">Look</span><span class="p">]</span> <span class="o">+</span> <span class="n">find_action</span></div>
+
+
+<div class="viewcode-block" id="PolicyModel.rollout">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.rollout">[docs]</a>
+    <span class="k">def</span> <span class="nf">rollout</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">(</span><span class="n">state</span><span class="o">=</span><span class="n">state</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="n">history</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/models/reward_model.html b/docs/html/_modules/problems/multi_object_search/models/reward_model.html
new file mode 100644
index 00000000..ff9a727f
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/models/reward_model.html
@@ -0,0 +1,231 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.models.reward_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.models.reward_model</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Reward model for 2D Multi-object Search domain&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="MosRewardModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">MosRewardModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RewardModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">target_objects</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        robot_id (int): This model is the reward for one agent (i.e. robot),</span>
+<span class="sd">                        If None, then this model could be for the environment.</span>
+<span class="sd">        target_objects (set): a set of objids for target objects.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span> <span class="o">=</span> <span class="n">robot_id</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">big</span> <span class="o">=</span> <span class="n">big</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">small</span> <span class="o">=</span> <span class="n">small</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_target_objects</span> <span class="o">=</span> <span class="n">target_objects</span>
+
+<div class="viewcode-block" id="MosRewardModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">reward</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span>
+    <span class="p">):</span>
+        <span class="k">if</span> <span class="n">reward</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_reward_func</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="mf">1.0</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">0.0</span></div>
+
+
+<div class="viewcode-block" id="MosRewardModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="c1"># deterministic</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_reward_func</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosRewardModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely reward&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_reward_func</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="GoalRewardModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.GoalRewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">GoalRewardModel</span><span class="p">(</span><span class="n">MosRewardModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    This is a reward where the agent gets reward only for detect-related actions.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="nf">_reward_func</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">robot_id</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">assert</span> <span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span>
+            <span class="p">),</span> <span class="s2">&quot;Reward must be computed with respect to one robot.&quot;</span>
+            <span class="n">robot_id</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span>
+
+        <span class="n">reward</span> <span class="o">=</span> <span class="mi">0</span>
+
+        <span class="c1"># If the robot has detected all objects</span>
+        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">][</span><span class="s2">&quot;objects_found&quot;</span><span class="p">])</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_target_objects</span>
+        <span class="p">):</span>
+            <span class="k">return</span> <span class="mi">0</span>  <span class="c1"># no reward or penalty; the task is finished.</span>
+
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+            <span class="n">reward</span> <span class="o">=</span> <span class="n">reward</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">small</span> <span class="o">-</span> <span class="n">action</span><span class="o">.</span><span class="n">distance_cost</span>
+        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
+            <span class="n">reward</span> <span class="o">=</span> <span class="n">reward</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">small</span>
+        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">FindAction</span><span class="p">):</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">][</span><span class="s2">&quot;camera_direction&quot;</span><span class="p">]</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="c1"># The robot didn&#39;t look before detect. So nothing is in the field of view.</span>
+                <span class="n">reward</span> <span class="o">-=</span> <span class="bp">self</span><span class="o">.</span><span class="n">big</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="c1"># transition function should&#39;ve taken care of the detection.</span>
+                <span class="n">new_objects_count</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span>
+                    <span class="nb">set</span><span class="p">(</span><span class="n">next_state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">objects_found</span><span class="p">)</span>
+                    <span class="o">-</span> <span class="nb">set</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">objects_found</span><span class="p">)</span>
+                <span class="p">)</span>
+                <span class="k">if</span> <span class="n">new_objects_count</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+                    <span class="c1"># No new detection. &quot;detect&quot; is a bad action.</span>
+                    <span class="n">reward</span> <span class="o">-=</span> <span class="bp">self</span><span class="o">.</span><span class="n">big</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="c1"># Has new detection. Award.</span>
+                    <span class="n">reward</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">big</span>
+        <span class="k">return</span> <span class="n">reward</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/models/transition_model.html b/docs/html/_modules/problems/multi_object_search/models/transition_model.html
new file mode 100644
index 00000000..0df0d956
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/models/transition_model.html
@@ -0,0 +1,386 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.models.transition_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.models.transition_model</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Defines the TransitionModel for the 2D Multi-Object Search domain.</span>
+
+<span class="sd">Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)</span>
+<span class="sd">(extensions: action space changes, different sensor model, gridworld instead of</span>
+<span class="sd">topological graph)</span>
+
+<span class="sd">Description: Multi-Object Search in a 2D grid world.</span>
+
+<span class="sd">Transition: deterministic</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1">####### Transition Model #######</span>
+<div class="viewcode-block" id="MosTransitionModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.MosTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">MosTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOTransitionModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Object-oriented transition model; The transition model supports the</span>
+<span class="sd">    multi-robot case, where each robot is equipped with a sensor; The</span>
+<span class="sd">    multi-robot transition model should be used by the Environment, but</span>
+<span class="sd">    not necessarily by each robot for planning.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="n">object_ids</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-9</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        sensors (dict): robot_id -&gt; Sensor</span>
+<span class="sd">        for_env (bool): True if this is a robot transition model used by the</span>
+<span class="sd">             Environment.  see RobotTransitionModel for details.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_sensors</span> <span class="o">=</span> <span class="n">sensors</span>
+        <span class="n">transition_models</span> <span class="o">=</span> <span class="p">{</span>
+            <span class="n">objid</span><span class="p">:</span> <span class="n">StaticObjectTransitionModel</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="n">epsilon</span><span class="p">)</span>
+            <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">object_ids</span>
+            <span class="k">if</span> <span class="n">objid</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">sensors</span>
+        <span class="p">}</span>
+        <span class="k">for</span> <span class="n">robot_id</span> <span class="ow">in</span> <span class="n">sensors</span><span class="p">:</span>
+            <span class="n">transition_models</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">RobotTransitionModel</span><span class="p">(</span>
+                <span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span> <span class="n">dim</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="n">epsilon</span>
+            <span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">transition_models</span><span class="p">)</span>
+
+<div class="viewcode-block" id="MosTransitionModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.MosTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="n">oostate</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOTransitionModel</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">MosOOState</span><span class="p">(</span><span class="n">oostate</span><span class="o">.</span><span class="n">object_states</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="MosTransitionModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.MosTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="n">oostate</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOTransitionModel</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">MosOOState</span><span class="p">(</span><span class="n">oostate</span><span class="o">.</span><span class="n">object_states</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="StaticObjectTransitionModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">StaticObjectTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;This model assumes the object is static.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">objid</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-9</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_objid</span> <span class="o">=</span> <span class="n">objid</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_epsilon</span> <span class="o">=</span> <span class="n">epsilon</span>
+
+<div class="viewcode-block" id="StaticObjectTransitionModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_object_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_object_state</span> <span class="o">!=</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">next_object_state</span><span class="p">[</span><span class="s2">&quot;id&quot;</span><span class="p">]]:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_epsilon</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">_epsilon</span></div>
+
+
+<div class="viewcode-block" id="StaticObjectTransitionModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns next_object_state&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="StaticObjectTransitionModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely next object_state&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_objid</span><span class="p">])</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="RobotTransitionModel">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">RobotTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;We assume that the robot control is perfect and transitions are deterministic.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sensor</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">epsilon</span><span class="o">=</span><span class="mf">1e-9</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        dim (tuple): a tuple (width, length) for the dimension of the world</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="c1"># this is used to determine objects found for FindAction</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span> <span class="o">=</span> <span class="n">sensor</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span> <span class="o">=</span> <span class="n">sensor</span><span class="o">.</span><span class="n">robot_id</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_dim</span> <span class="o">=</span> <span class="n">dim</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_epsilon</span> <span class="o">=</span> <span class="n">epsilon</span>
+
+<div class="viewcode-block" id="RobotTransitionModel.if_move_by">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.if_move_by">[docs]</a>
+    <span class="nd">@classmethod</span>
+    <span class="k">def</span> <span class="nf">if_move_by</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">robot_id</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">check_collision</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Defines the dynamics of robot motion;</span>
+<span class="sd">        dim (tuple): the width, length of the search world.&quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Cannot move robot with </span><span class="si">%s</span><span class="s2"> action&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">action</span><span class="p">)))</span>
+
+        <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span> <span class="o">=</span> <span class="n">robot_pose</span>
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">scheme</span> <span class="o">==</span> <span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_XYTH</span><span class="p">:</span>
+            <span class="n">dx</span><span class="p">,</span> <span class="n">dy</span><span class="p">,</span> <span class="n">th</span> <span class="o">=</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span>
+            <span class="n">rx</span> <span class="o">+=</span> <span class="n">dx</span>
+            <span class="n">ry</span> <span class="o">+=</span> <span class="n">dy</span>
+            <span class="n">rth</span> <span class="o">=</span> <span class="n">th</span>
+        <span class="k">elif</span> <span class="n">action</span><span class="o">.</span><span class="n">scheme</span> <span class="o">==</span> <span class="n">MotionAction</span><span class="o">.</span><span class="n">SCHEME_VW</span><span class="p">:</span>
+            <span class="c1"># odometry motion model</span>
+            <span class="n">forward</span><span class="p">,</span> <span class="n">angle</span> <span class="o">=</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span>
+            <span class="n">rth</span> <span class="o">+=</span> <span class="n">angle</span>  <span class="c1"># angle (radian)</span>
+            <span class="n">rx</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">rx</span> <span class="o">+</span> <span class="n">forward</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">cos</span><span class="p">(</span><span class="n">rth</span><span class="p">)))</span>
+            <span class="n">ry</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">ry</span> <span class="o">+</span> <span class="n">forward</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">sin</span><span class="p">(</span><span class="n">rth</span><span class="p">)))</span>
+            <span class="n">rth</span> <span class="o">=</span> <span class="n">rth</span> <span class="o">%</span> <span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">valid_pose</span><span class="p">(</span>
+            <span class="p">(</span><span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">),</span>
+            <span class="n">dim</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+            <span class="n">dim</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span>
+            <span class="n">state</span><span class="o">=</span><span class="n">state</span><span class="p">,</span>
+            <span class="n">check_collision</span><span class="o">=</span><span class="n">check_collision</span><span class="p">,</span>
+            <span class="n">pose_objid</span><span class="o">=</span><span class="n">robot_id</span><span class="p">,</span>
+        <span class="p">):</span>
+            <span class="k">return</span> <span class="p">(</span><span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">robot_pose</span>  <span class="c1"># no change because change results in invalid pose</span></div>
+
+
+<div class="viewcode-block" id="RobotTransitionModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_robot_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_robot_state</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_epsilon</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">_epsilon</span></div>
+
+
+<div class="viewcode-block" id="RobotTransitionModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely next robot_state&quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">RobotState</span><span class="p">):</span>
+            <span class="n">robot_state</span> <span class="o">=</span> <span class="n">state</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">robot_state</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span><span class="p">]</span>
+
+        <span class="n">next_robot_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">robot_state</span><span class="p">)</span>
+        <span class="c1"># camera direction is only not None when looking</span>
+        <span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;camera_direction&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+            <span class="c1"># motion action</span>
+            <span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">RobotTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dim</span>
+            <span class="p">)</span>
+        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">):</span>
+            <span class="k">if</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="s2">&quot;motion&quot;</span><span class="p">)</span> <span class="ow">and</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="c1"># rotate the robot</span>
+                <span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;pose&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_if_move_by</span><span class="p">(</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_dim</span>
+                <span class="p">)</span>
+            <span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;camera_direction&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">FindAction</span><span class="p">):</span>
+            <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_robot_id</span><span class="p">)</span>
+            <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sensor</span><span class="o">.</span><span class="n">observe</span><span class="p">(</span><span class="n">robot_pose</span><span class="p">,</span> <span class="n">state</span><span class="p">)</span>
+            <span class="c1"># Update &quot;objects_found&quot; set for target objects</span>
+            <span class="n">observed_target_objects</span> <span class="o">=</span> <span class="p">{</span>
+                <span class="n">objid</span>
+                <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">z</span><span class="o">.</span><span class="n">objposes</span>
+                <span class="k">if</span> <span class="p">(</span>
+                    <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span> <span class="o">==</span> <span class="s2">&quot;target&quot;</span>
+                    <span class="ow">and</span> <span class="n">z</span><span class="o">.</span><span class="n">objposes</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">!=</span> <span class="n">ObjectObservation</span><span class="o">.</span><span class="n">NULL</span>
+                <span class="p">)</span>
+            <span class="p">}</span>
+            <span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;objects_found&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span>
+                <span class="nb">set</span><span class="p">(</span><span class="n">next_robot_state</span><span class="p">[</span><span class="s2">&quot;objects_found&quot;</span><span class="p">])</span> <span class="o">|</span> <span class="nb">set</span><span class="p">(</span><span class="n">observed_target_objects</span><span class="p">)</span>
+            <span class="p">)</span>
+        <span class="k">return</span> <span class="n">next_robot_state</span></div>
+
+
+<div class="viewcode-block" id="RobotTransitionModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns next_robot_state&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Utility functions</span>
+<div class="viewcode-block" id="valid_pose">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.valid_pose">[docs]</a>
+<span class="k">def</span> <span class="nf">valid_pose</span><span class="p">(</span><span class="n">pose</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">length</span><span class="p">,</span> <span class="n">state</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">check_collision</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">pose_objid</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Returns True if the given `pose` (x,y) is a valid pose;</span>
+<span class="sd">    If `check_collision` is True, then the pose is only valid</span>
+<span class="sd">    if it is not overlapping with any object pose in the environment state.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="n">pose</span><span class="p">[:</span><span class="mi">2</span><span class="p">]</span>
+
+    <span class="c1"># Check collision with obstacles</span>
+    <span class="k">if</span> <span class="n">check_collision</span> <span class="ow">and</span> <span class="n">state</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+        <span class="n">object_poses</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">object_poses</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">object_poses</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">objclass</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;obstacle&quot;</span><span class="p">):</span>
+                <span class="k">if</span> <span class="n">objid</span> <span class="o">==</span> <span class="n">pose_objid</span><span class="p">:</span>
+                    <span class="k">continue</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="o">==</span> <span class="n">object_poses</span><span class="p">[</span><span class="n">objid</span><span class="p">]:</span>
+                    <span class="k">return</span> <span class="kc">False</span>
+    <span class="k">return</span> <span class="n">in_boundary</span><span class="p">(</span><span class="n">pose</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">length</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="in_boundary">
+<a class="viewcode-back" href="../../../../problems/problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.in_boundary">[docs]</a>
+<span class="k">def</span> <span class="nf">in_boundary</span><span class="p">(</span><span class="n">pose</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">length</span><span class="p">):</span>
+    <span class="c1"># Check if in boundary</span>
+    <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="n">pose</span><span class="p">[:</span><span class="mi">2</span><span class="p">]</span>
+    <span class="k">if</span> <span class="n">x</span> <span class="o">&gt;=</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">x</span> <span class="o">&lt;</span> <span class="n">width</span><span class="p">:</span>
+        <span class="k">if</span> <span class="n">y</span> <span class="o">&gt;=</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">y</span> <span class="o">&lt;</span> <span class="n">length</span><span class="p">:</span>
+            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">pose</span><span class="p">)</span> <span class="o">==</span> <span class="mi">3</span><span class="p">:</span>
+                <span class="n">th</span> <span class="o">=</span> <span class="n">pose</span><span class="p">[</span><span class="mi">2</span><span class="p">]</span>  <span class="c1"># radian</span>
+                <span class="k">if</span> <span class="n">th</span> <span class="o">&lt;</span> <span class="mi">0</span> <span class="ow">or</span> <span class="n">th</span> <span class="o">&gt;</span> <span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="kc">False</span>
+            <span class="k">return</span> <span class="kc">True</span>
+    <span class="k">return</span> <span class="kc">False</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/multi_object_search/problem.html b/docs/html/_modules/problems/multi_object_search/problem.html
new file mode 100644
index 00000000..efc8628d
--- /dev/null
+++ b/docs/html/_modules/problems/multi_object_search/problem.html
@@ -0,0 +1,510 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.multi_object_search.problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.multi_object_search.problem</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;2D Multi-Object Search (MOS) Task.</span>
+<span class="sd">Uses the domain, models, and agent/environment</span>
+<span class="sd">to actually define the POMDP problem for multi-object search.</span>
+<span class="sd">Then, solve it using POUCT or POMCP.&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.visual</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.agent.agent</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.models.components.grid_map</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">argparse</span>
+<span class="kn">import</span> <span class="nn">time</span>
+<span class="kn">import</span> <span class="nn">random</span>
+
+
+<div class="viewcode-block" id="MosOOPOMDP">
+<a class="viewcode-back" href="../../../problems/problems.multi_object_search.html#problems.multi_object_search.problem.MosOOPOMDP">[docs]</a>
+<span class="k">class</span> <span class="nc">MosOOPOMDP</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">OOPOMDP</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    A MosOOPOMDP is instantiated given a string description</span>
+<span class="sd">    of the search world, sensor descriptions for robots,</span>
+<span class="sd">    and the necessary parameters for the agent&#39;s models.</span>
+
+<span class="sd">    Note: This is of course a simulation, where you can</span>
+<span class="sd">    generate a world and know where the target objects are</span>
+<span class="sd">    and then construct the Environment object. But in the</span>
+<span class="sd">    real robot scenario, you don&#39;t know where the objects</span>
+<span class="sd">    are. In that case, as I have done it in the past, you</span>
+<span class="sd">    could construct an Environment object and give None to</span>
+<span class="sd">    the object poses.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">robot_id</span><span class="p">,</span>
+        <span class="n">env</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">grid_map</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">sensors</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">sigma</span><span class="o">=</span><span class="mf">0.01</span><span class="p">,</span>
+        <span class="n">epsilon</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">belief_rep</span><span class="o">=</span><span class="s2">&quot;histogram&quot;</span><span class="p">,</span>
+        <span class="n">prior</span><span class="o">=</span><span class="p">{},</span>
+        <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span>
+        <span class="n">agent_has_map</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+    <span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Args:</span>
+<span class="sd">            robot_id (int or str): the id of the agent that will solve this MosOOPOMDP.</span>
+<span class="sd">                If it is a `str`, it will be interpreted as an integer using `interpret_robot_id`</span>
+<span class="sd">                in env/env.py.</span>
+<span class="sd">            env (MosEnvironment): the environment.</span>
+<span class="sd">            grid_map (str): Search space description. See env/env.py:interpret. An example:</span>
+<span class="sd">                rx...</span>
+<span class="sd">                .x.xT</span>
+<span class="sd">                .....</span>
+<span class="sd">                Ignored if env is not None</span>
+<span class="sd">            sensors (dict): map from robot character to sensor string.</span>
+<span class="sd">                For example: {&#39;r&#39;: &#39;laser fov=90 min_range=1 max_range=5</span>
+<span class="sd">                                    angle_increment=5&#39;}</span>
+<span class="sd">                Ignored if env is not None</span>
+<span class="sd">            agent_has_map (bool): If True, we assume the agent is given the occupancy</span>
+<span class="sd">                                  grid map of the world. Then, the agent can use this</span>
+<span class="sd">                                  map to avoid planning invalid actions (bumping into things).</span>
+<span class="sd">                                  But this map does not help the agent&#39;s prior belief directly.</span>
+
+<span class="sd">            sigma, epsilon: observation model paramters</span>
+<span class="sd">            belief_rep (str): belief representation. Either histogram or particles.</span>
+<span class="sd">            prior (dict or str): either a dictionary as defined in agent/belief.py</span>
+<span class="sd">                or a string, either &quot;uniform&quot; or &quot;informed&quot;. For &quot;uniform&quot;, a uniform</span>
+<span class="sd">                prior will be given. For &quot;informed&quot;, a perfect prior will be given.</span>
+<span class="sd">            num_particles (int): setting for the particle belief representation</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="n">env</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">assert</span> <span class="n">grid_map</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">sensors</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">,</span> <span class="p">(</span>
+                <span class="s2">&quot;Since env is not provided, you must provide string descriptions&quot;</span>
+                <span class="s2">&quot;of the world and sensors.&quot;</span>
+            <span class="p">)</span>
+            <span class="n">worldstr</span> <span class="o">=</span> <span class="n">equip_sensors</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">sensors</span><span class="p">)</span>
+            <span class="n">dim</span><span class="p">,</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">sensors</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+            <span class="n">init_state</span> <span class="o">=</span> <span class="n">MosOOState</span><span class="p">({</span><span class="o">**</span><span class="n">objects</span><span class="p">,</span> <span class="o">**</span><span class="n">robots</span><span class="p">})</span>
+            <span class="n">env</span> <span class="o">=</span> <span class="n">MosEnvironment</span><span class="p">(</span><span class="n">dim</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">sensors</span><span class="p">,</span> <span class="n">obstacles</span><span class="o">=</span><span class="n">obstacles</span><span class="p">)</span>
+
+        <span class="c1"># construct prior</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">prior</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;uniform&quot;</span><span class="p">:</span>
+                <span class="n">prior</span> <span class="o">=</span> <span class="p">{}</span>
+            <span class="k">elif</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;informed&quot;</span><span class="p">:</span>
+                <span class="n">prior</span> <span class="o">=</span> <span class="p">{}</span>
+                <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">:</span>
+                    <span class="n">groundtruth_pose</span> <span class="o">=</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+                    <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span> <span class="o">=</span> <span class="p">{</span><span class="n">groundtruth_pose</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">}</span>
+
+        <span class="c1"># Potential extension: a multi-agent POMDP. For now, the environment</span>
+        <span class="c1"># can keep track of the states of multiple agents, but a POMDP is still</span>
+        <span class="c1"># only defined over a single agent. Perhaps, MultiAgent is just a kind</span>
+        <span class="c1"># of Agent, which will make the implementation of multi-agent POMDP cleaner.</span>
+        <span class="n">robot_id</span> <span class="o">=</span> <span class="n">robot_id</span> <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span> <span class="o">==</span> <span class="nb">int</span> <span class="k">else</span> <span class="n">interpret_robot_id</span><span class="p">(</span><span class="n">robot_id</span><span class="p">)</span>
+        <span class="n">grid_map</span> <span class="o">=</span> <span class="p">(</span>
+            <span class="n">GridMap</span><span class="p">(</span>
+                <span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span>
+                <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">,</span>
+                <span class="p">{</span><span class="n">objid</span><span class="p">:</span> <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">pose</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span> <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">env</span><span class="o">.</span><span class="n">obstacles</span><span class="p">},</span>
+            <span class="p">)</span>
+            <span class="k">if</span> <span class="n">agent_has_map</span>
+            <span class="k">else</span> <span class="kc">None</span>
+        <span class="p">)</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">MosAgent</span><span class="p">(</span>
+            <span class="n">robot_id</span><span class="p">,</span>
+            <span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span>
+            <span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">,</span>
+            <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span>
+            <span class="n">env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span>
+            <span class="n">sigma</span><span class="o">=</span><span class="n">sigma</span><span class="p">,</span>
+            <span class="n">epsilon</span><span class="o">=</span><span class="n">epsilon</span><span class="p">,</span>
+            <span class="n">belief_rep</span><span class="o">=</span><span class="n">belief_rep</span><span class="p">,</span>
+            <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">,</span>
+            <span class="n">num_particles</span><span class="o">=</span><span class="n">num_particles</span><span class="p">,</span>
+            <span class="n">grid_map</span><span class="o">=</span><span class="n">grid_map</span><span class="p">,</span>
+        <span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+            <span class="n">agent</span><span class="p">,</span>
+            <span class="n">env</span><span class="p">,</span>
+            <span class="n">name</span><span class="o">=</span><span class="s2">&quot;MOS(</span><span class="si">%d</span><span class="s2">,</span><span class="si">%d</span><span class="s2">,</span><span class="si">%d</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="n">env</span><span class="o">.</span><span class="n">length</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">)),</span>
+        <span class="p">)</span></div>
+
+
+
+<span class="c1">### Belief Update ###</span>
+<div class="viewcode-block" id="belief_update">
+<a class="viewcode-back" href="../../../problems/problems.multi_object_search.html#problems.multi_object_search.problem.belief_update">[docs]</a>
+<span class="k">def</span> <span class="nf">belief_update</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">,</span> <span class="n">next_robot_state</span><span class="p">,</span> <span class="n">planner</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Updates the agent&#39;s belief; The belief update may happen</span>
+<span class="sd">    through planner update (e.g. when planner is POMCP).&quot;&quot;&quot;</span>
+    <span class="c1"># Updates the planner; In case of POMCP, agent&#39;s belief is also updated.</span>
+    <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+
+    <span class="c1"># Update agent&#39;s belief, when planner is not POMCP</span>
+    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">):</span>
+        <span class="c1"># Update belief for every object</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">object_beliefs</span><span class="p">:</span>
+            <span class="n">belief_obj</span> <span class="o">=</span> <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">belief_obj</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">):</span>
+                <span class="k">if</span> <span class="n">objid</span> <span class="o">==</span> <span class="n">agent</span><span class="o">.</span><span class="n">robot_id</span><span class="p">:</span>
+                    <span class="c1"># Assuming the agent can observe its own state:</span>
+                    <span class="n">new_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">({</span><span class="n">next_robot_state</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">})</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="c1"># This is doing</span>
+                    <span class="c1">#    B(si&#39;) = normalizer * O(oi|si&#39;,sr&#39;,a) * sum_s T(si&#39;|s,a)*B(si)</span>
+                    <span class="c1">#</span>
+                    <span class="c1"># Notes: First, objects are static; Second,</span>
+                    <span class="c1"># O(oi|s&#39;,a) ~= O(oi|si&#39;,sr&#39;,a) according to the definition</span>
+                    <span class="c1"># of the observation model in models/observation.py.  Note</span>
+                    <span class="c1"># that the exact belief update rule for this OOPOMDP needs to use</span>
+                    <span class="c1"># a model like O(oi|si&#39;,sr&#39;,a) because it&#39;s intractable to</span>
+                    <span class="c1"># consider s&#39; (that means all combinations of all object</span>
+                    <span class="c1"># states must be iterated).  Of course, there could be work</span>
+                    <span class="c1"># around (out of scope) - Consider a volumetric observaiton,</span>
+                    <span class="c1"># instead of the object-pose observation. That means oi is a</span>
+                    <span class="c1"># set of pixels (2D) or voxels (3D). Note the real</span>
+                    <span class="c1"># observation, oi, is most likely sampled from O(oi|s&#39;,a)</span>
+                    <span class="c1"># because real world considers the occlusion between objects</span>
+                    <span class="c1"># (due to full state s&#39;). The problem is how to compute the</span>
+                    <span class="c1"># probability of this oi given s&#39; and a, where it&#39;s</span>
+                    <span class="c1"># intractable to obtain s&#39;. To this end, we can make a</span>
+                    <span class="c1"># simplifying assumption that an object is contained within</span>
+                    <span class="c1"># one pixel (or voxel); The pixel (or voxel) is labeled to</span>
+                    <span class="c1"># indicate free space or object. The label of each pixel or</span>
+                    <span class="c1"># voxel is certainly a result of considering the full state</span>
+                    <span class="c1"># s. The occlusion can be handled nicely with the volumetric</span>
+                    <span class="c1"># observation definition. Then that assumption can reduce the</span>
+                    <span class="c1"># observation model from O(oi|s&#39;,a) to O(label_i|s&#39;,a) and</span>
+                    <span class="c1"># it becomes easy to define O(label_i=i|s&#39;,a) and O(label_i=FREE|s&#39;,a).</span>
+                    <span class="c1"># These ideas are used in my recent 3D object search work.</span>
+                    <span class="n">new_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">update_histogram_belief</span><span class="p">(</span>
+                        <span class="n">belief_obj</span><span class="p">,</span>
+                        <span class="n">real_action</span><span class="p">,</span>
+                        <span class="n">real_observation</span><span class="o">.</span><span class="n">for_obj</span><span class="p">(</span><span class="n">objid</span><span class="p">),</span>
+                        <span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">[</span><span class="n">objid</span><span class="p">],</span>
+                        <span class="n">agent</span><span class="o">.</span><span class="n">transition_model</span><span class="p">[</span><span class="n">objid</span><span class="p">],</span>
+                        <span class="c1"># The agent knows the objects are static.</span>
+                        <span class="n">static_transition</span><span class="o">=</span><span class="n">objid</span> <span class="o">!=</span> <span class="n">agent</span><span class="o">.</span><span class="n">robot_id</span><span class="p">,</span>
+                        <span class="n">oargs</span><span class="o">=</span><span class="p">{</span><span class="s2">&quot;next_robot_state&quot;</span><span class="p">:</span> <span class="n">next_robot_state</span><span class="p">},</span>
+                    <span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                    <span class="s2">&quot;Unexpected program state.&quot;</span>
+                    <span class="s2">&quot;Are you using the appropriate belief representation?&quot;</span>
+                <span class="p">)</span>
+
+            <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">set_object_belief</span><span class="p">(</span><span class="n">objid</span><span class="p">,</span> <span class="n">new_belief</span><span class="p">)</span></div>
+
+
+
+<span class="c1">### Solve the problem with POUCT/POMCP planner ###</span>
+<span class="c1">### This is the main online POMDP solver logic ###</span>
+<div class="viewcode-block" id="solve">
+<a class="viewcode-back" href="../../../problems/problems.multi_object_search.html#problems.multi_object_search.problem.solve">[docs]</a>
+<span class="k">def</span> <span class="nf">solve</span><span class="p">(</span>
+    <span class="n">problem</span><span class="p">,</span>
+    <span class="n">max_depth</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>  <span class="c1"># planning horizon</span>
+    <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
+    <span class="n">planning_time</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>  <span class="c1"># amount of time (s) to plan each step</span>
+    <span class="n">exploration_const</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>  <span class="c1"># exploration constant</span>
+    <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>  <span class="c1"># maximum amount of time allowed to solve the problem</span>
+    <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+<span class="p">):</span>  <span class="c1"># maximum number of planning steps the agent can take.</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    This function terminates when:</span>
+<span class="sd">    - maximum time (max_time) reached; This time includes planning and updates</span>
+<span class="sd">    - agent has planned `max_steps` number of steps</span>
+<span class="sd">    - agent has taken n FindAction(s) where n = number of target objects.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        visualize (bool) if True, show the pygame visualization.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="n">random_objid</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">random_object_belief</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">belief</span><span class="o">.</span><span class="n">object_beliefs</span><span class="p">[</span><span class="n">random_objid</span><span class="p">]</span>
+    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">random_object_belief</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">):</span>
+        <span class="c1"># Use POUCT</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>  <span class="c1"># Random by default</span>
+    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">random_object_belief</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">):</span>
+        <span class="c1"># Use POMCP</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>  <span class="c1"># Random by default</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+            <span class="s2">&quot;Unsupported object belief type </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">random_object_belief</span><span class="p">))</span>
+        <span class="p">)</span>
+
+    <span class="n">robot_id</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">robot_id</span>
+    <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+        <span class="n">viz</span> <span class="o">=</span> <span class="n">MosViz</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span>
+        <span class="p">)</span>  <span class="c1"># controllable=False means no keyboard control.</span>
+        <span class="k">if</span> <span class="n">viz</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s2">&quot;Environment failed to initialize&quot;</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">robot_id</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+    <span class="n">_time_used</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_find_actions_count</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_total_reward</span> <span class="o">=</span> <span class="mi">0</span>  <span class="c1"># total, undiscounted reward</span>
+    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">max_steps</span><span class="p">):</span>
+        <span class="c1"># Plan action</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="k">break</span>  <span class="c1"># no more time to update.</span>
+
+        <span class="c1"># Execute action</span>
+        <span class="n">reward</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span>
+            <span class="n">real_action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">robot_id</span><span class="o">=</span><span class="n">robot_id</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Receive observation</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">real_action</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Updates</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">clear_history</span><span class="p">()</span>  <span class="c1"># truncate history</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">belief_update</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span>
+            <span class="n">real_action</span><span class="p">,</span>
+            <span class="n">real_observation</span><span class="p">,</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">],</span>
+            <span class="n">planner</span><span class="p">,</span>
+        <span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+
+        <span class="c1"># Info and render</span>
+        <span class="n">_total_reward</span> <span class="o">+=</span> <span class="n">reward</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">FindAction</span><span class="p">):</span>
+            <span class="n">_find_actions_count</span> <span class="o">+=</span> <span class="mi">1</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">_total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Find Actions Count: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">_find_actions_count</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+            <span class="c1"># This is used to show the sensing range; Not sampled</span>
+            <span class="c1"># according to observation model.</span>
+            <span class="n">robot_pose</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">pose</span>
+            <span class="n">viz_observation</span> <span class="o">=</span> <span class="n">MosOOObservation</span><span class="p">({})</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">LookAction</span><span class="p">)</span> <span class="ow">or</span> <span class="nb">isinstance</span><span class="p">(</span>
+                <span class="n">real_action</span><span class="p">,</span> <span class="n">FindAction</span>
+            <span class="p">):</span>
+                <span class="n">viz_observation</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">sensors</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">observe</span><span class="p">(</span>
+                    <span class="n">robot_pose</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span>
+                <span class="p">)</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+                <span class="n">robot_id</span><span class="p">,</span>
+                <span class="n">real_action</span><span class="p">,</span>
+                <span class="n">real_observation</span><span class="p">,</span>
+                <span class="n">viz_observation</span><span class="p">,</span>
+                <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">,</span>
+            <span class="p">)</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+        <span class="c1"># Termination check</span>
+        <span class="k">if</span> <span class="p">(</span>
+            <span class="nb">set</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">object_states</span><span class="p">[</span><span class="n">robot_id</span><span class="p">]</span><span class="o">.</span><span class="n">objects_found</span><span class="p">)</span>
+            <span class="o">==</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span>
+        <span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Done!&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_find_actions_count</span> <span class="o">&gt;=</span> <span class="nb">len</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">target_objects</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;FindAction limit reached.&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Maximum time reached.&quot;</span><span class="p">)</span>
+            <span class="k">break</span></div>
+
+
+
+<span class="c1"># Test</span>
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../problems/problems.multi_object_search.html#problems.multi_object_search.problem.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="c1"># random world</span>
+    <span class="n">grid_map</span><span class="p">,</span> <span class="n">robot_char</span> <span class="o">=</span> <span class="n">random_world</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">10</span><span class="p">)</span>
+    <span class="n">laserstr</span> <span class="o">=</span> <span class="n">make_laser_sensor</span><span class="p">(</span><span class="mi">90</span><span class="p">,</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">4</span><span class="p">),</span> <span class="mf">0.5</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">proxstr</span> <span class="o">=</span> <span class="n">make_proximity_sensor</span><span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">problem</span> <span class="o">=</span> <span class="n">MosOOPOMDP</span><span class="p">(</span>
+        <span class="n">robot_char</span><span class="p">,</span>  <span class="c1"># r is the robot character</span>
+        <span class="n">sigma</span><span class="o">=</span><span class="mf">0.05</span><span class="p">,</span>  <span class="c1"># observation model parameter</span>
+        <span class="n">epsilon</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>  <span class="c1"># observation model parameter</span>
+        <span class="n">grid_map</span><span class="o">=</span><span class="n">grid_map</span><span class="p">,</span>
+        <span class="n">sensors</span><span class="o">=</span><span class="p">{</span><span class="n">robot_char</span><span class="p">:</span> <span class="n">proxstr</span><span class="p">},</span>
+        <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">,</span>
+        <span class="n">agent_has_map</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">solve</span><span class="p">(</span>
+        <span class="n">problem</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
+        <span class="n">planning_time</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>
+        <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>
+        <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+    <span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/rocksample/rocksample_problem.html b/docs/html/_modules/problems/rocksample/rocksample_problem.html
new file mode 100644
index 00000000..793e25ac
--- /dev/null
+++ b/docs/html/_modules/problems/rocksample/rocksample_problem.html
@@ -0,0 +1,810 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.rocksample.rocksample_problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.rocksample.rocksample_problem</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;RockSample(n,k) problem</span>
+
+<span class="sd">Origin: Heuristic Search Value Iteration for POMDPs (UAI 2004)</span>
+
+<span class="sd">Description:</span>
+
+<span class="sd">State space:</span>
+
+<span class="sd">    Position {(1,1),(1,2),...(n,n)}</span>
+<span class="sd">    :math:`\\times` RockType_1 :math:`\\times` RockType_2, ..., :math:`\\times` RockType_k</span>
+<span class="sd">    where RockType_i = {Good, Bad}</span>
+<span class="sd">    :math:`\\times` TerminalState</span>
+
+<span class="sd">    (basically, the positions of rocks are known to the robot,</span>
+<span class="sd">     but not represented explicitly in the state space. Check_i</span>
+<span class="sd">     will smartly check the rock i at its location.)</span>
+
+<span class="sd">Action space:</span>
+
+<span class="sd">    North, South, East, West, Sample, Check_1, ..., Check_k</span>
+<span class="sd">    The first four moves the agent deterministically</span>
+<span class="sd">    Sample: samples the rock at agent&#39;s current location</span>
+<span class="sd">    Check_i: receives a noisy observation about RockType_i</span>
+<span class="sd">    (noise determined by eta (:math:`\eta`). eta=1 -&gt; perfect sensor; eta=0 -&gt; uniform)</span>
+
+<span class="sd">Observation: observes the property of rock i when taking Check_i.  The</span>
+<span class="sd">     observation may be noisy, depending on an efficiency parameter which</span>
+<span class="sd">     decreases exponentially as the distance increases between the rover and</span>
+<span class="sd">     rock i. &#39;half_efficiency_dist&#39; influences this parameter (larger, more robust)</span>
+
+<span class="sd">Reward: +10 for Sample a good rock. -10 for Sampling a bad rock.</span>
+<span class="sd">        Move to exit area +10. Other actions have no cost or reward.</span>
+
+<span class="sd">Initial belief: every rock has equal probability of being Good or Bad.</span>
+
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">sys</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+
+<span class="n">EPSILON</span> <span class="o">=</span> <span class="mf">1e-9</span>
+
+
+<div class="viewcode-block" id="euclidean_dist">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.euclidean_dist">[docs]</a>
+<span class="k">def</span> <span class="nf">euclidean_dist</span><span class="p">(</span><span class="n">p1</span><span class="p">,</span> <span class="n">p2</span><span class="p">):</span>
+    <span class="k">return</span> <span class="n">math</span><span class="o">.</span><span class="n">sqrt</span><span class="p">((</span><span class="n">p1</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">-</span> <span class="n">p2</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span> <span class="o">**</span> <span class="mi">2</span> <span class="o">+</span> <span class="p">(</span><span class="n">p1</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="n">p2</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span> <span class="o">**</span> <span class="mi">2</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="RockType">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockType">[docs]</a>
+<span class="k">class</span> <span class="nc">RockType</span><span class="p">:</span>
+    <span class="n">GOOD</span> <span class="o">=</span> <span class="s2">&quot;good&quot;</span>
+    <span class="n">BAD</span> <span class="o">=</span> <span class="s2">&quot;bad&quot;</span>
+
+<div class="viewcode-block" id="RockType.invert">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockType.invert">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">invert</span><span class="p">(</span><span class="n">rocktype</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">rocktype</span> <span class="o">==</span> <span class="s2">&quot;good&quot;</span><span class="p">:</span>
+            <span class="k">return</span> <span class="s2">&quot;bad&quot;</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="s2">&quot;good&quot;</span></div>
+
+        <span class="c1"># return 1 - rocktype</span>
+
+<div class="viewcode-block" id="RockType.random">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockType.random">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">random</span><span class="p">(</span><span class="n">p</span><span class="o">=</span><span class="mf">0.5</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="n">p</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">RockType</span><span class="o">.</span><span class="n">GOOD</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">RockType</span><span class="o">.</span><span class="n">BAD</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="State">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.State">[docs]</a>
+<span class="k">class</span> <span class="nc">State</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">State</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">position</span><span class="p">,</span> <span class="n">rocktypes</span><span class="p">,</span> <span class="n">terminal</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        position (tuple): (x,y) position of the rover on the grid.</span>
+<span class="sd">        rocktypes: tuple of size k. Each is either Good or Bad.</span>
+<span class="sd">        terminal (bool): The robot is at the terminal state.</span>
+
+<span class="sd">        (It is so true that the agent&#39;s state doesn&#39;t need to involve the map!)</span>
+
+<span class="sd">        x axis is horizontal. y axis is vertical.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">position</span> <span class="o">=</span> <span class="n">position</span>
+        <span class="k">if</span> <span class="nb">type</span><span class="p">(</span><span class="n">rocktypes</span><span class="p">)</span> <span class="o">!=</span> <span class="nb">tuple</span><span class="p">:</span>
+            <span class="n">rocktypes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">rocktypes</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">rocktypes</span> <span class="o">=</span> <span class="n">rocktypes</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">terminal</span> <span class="o">=</span> <span class="n">terminal</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">position</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">terminal</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">State</span><span class="p">):</span>
+            <span class="k">return</span> <span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">position</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">position</span>
+                <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">rocktypes</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">rocktypes</span>
+                <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">terminal</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">terminal</span>
+            <span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="kc">False</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="fm">__repr__</span><span class="p">()</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;State(</span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">position</span><span class="p">),</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">),</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">terminal</span><span class="p">),</span>
+        <span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="Action">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.Action">[docs]</a>
+<span class="k">class</span> <span class="nc">Action</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">Action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Action(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span></div>
+
+
+
+<div class="viewcode-block" id="MoveAction">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.MoveAction">[docs]</a>
+<span class="k">class</span> <span class="nc">MoveAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="n">EAST</span> <span class="o">=</span> <span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># x is horizontal; x+ is right. y is vertical; y+ is up.</span>
+    <span class="n">WEST</span> <span class="o">=</span> <span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+    <span class="n">NORTH</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">)</span>
+    <span class="n">SOUTH</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">motion</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">motion</span> <span class="ow">not</span> <span class="ow">in</span> <span class="p">{</span>
+            <span class="n">MoveAction</span><span class="o">.</span><span class="n">EAST</span><span class="p">,</span>
+            <span class="n">MoveAction</span><span class="o">.</span><span class="n">WEST</span><span class="p">,</span>
+            <span class="n">MoveAction</span><span class="o">.</span><span class="n">NORTH</span><span class="p">,</span>
+            <span class="n">MoveAction</span><span class="o">.</span><span class="n">SOUTH</span><span class="p">,</span>
+        <span class="p">}:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Invalid move motion </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">motion</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">motion</span> <span class="o">=</span> <span class="n">motion</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;move-</span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">name</span><span class="p">))</span></div>
+
+
+
+<span class="n">MoveEast</span> <span class="o">=</span> <span class="n">MoveAction</span><span class="p">(</span><span class="n">MoveAction</span><span class="o">.</span><span class="n">EAST</span><span class="p">,</span> <span class="s2">&quot;EAST&quot;</span><span class="p">)</span>
+<span class="n">MoveWest</span> <span class="o">=</span> <span class="n">MoveAction</span><span class="p">(</span><span class="n">MoveAction</span><span class="o">.</span><span class="n">WEST</span><span class="p">,</span> <span class="s2">&quot;WEST&quot;</span><span class="p">)</span>
+<span class="n">MoveNorth</span> <span class="o">=</span> <span class="n">MoveAction</span><span class="p">(</span><span class="n">MoveAction</span><span class="o">.</span><span class="n">NORTH</span><span class="p">,</span> <span class="s2">&quot;NORTH&quot;</span><span class="p">)</span>
+<span class="n">MoveSouth</span> <span class="o">=</span> <span class="n">MoveAction</span><span class="p">(</span><span class="n">MoveAction</span><span class="o">.</span><span class="n">SOUTH</span><span class="p">,</span> <span class="s2">&quot;SOUTH&quot;</span><span class="p">)</span>
+
+
+<div class="viewcode-block" id="SampleAction">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.SampleAction">[docs]</a>
+<span class="k">class</span> <span class="nc">SampleAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;sample&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="CheckAction">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.CheckAction">[docs]</a>
+<span class="k">class</span> <span class="nc">CheckAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">rock_id</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">rock_id</span> <span class="o">=</span> <span class="n">rock_id</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;check-</span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">rock_id</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="Observation">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.Observation">[docs]</a>
+<span class="k">class</span> <span class="nc">Observation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">quality</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">quality</span> <span class="o">=</span> <span class="n">quality</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">quality</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">Observation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">quality</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">quality</span>
+        <span class="k">elif</span> <span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span> <span class="o">==</span> <span class="nb">str</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">quality</span> <span class="o">==</span> <span class="n">other</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">quality</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Observation(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">quality</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="RSTransitionModel">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">RSTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;The model is deterministic&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">in_exit_area</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        rock_locs: a map from (x,y) location to rock_id</span>
+<span class="sd">        in_exit_area: a function (x,y) -&gt; Bool that returns True if (x,y) is in exit area</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">=</span> <span class="n">n</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span> <span class="o">=</span> <span class="n">rock_locs</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_in_exit_area</span> <span class="o">=</span> <span class="n">in_exit_area</span>
+
+    <span class="k">def</span> <span class="nf">_move_or_exit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">position</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="n">expected</span> <span class="o">=</span> <span class="p">(</span><span class="n">position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_in_exit_area</span><span class="p">(</span><span class="n">expected</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">expected</span><span class="p">,</span> <span class="kc">True</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="p">(</span>
+                <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="n">position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)),</span>
+                <span class="nb">max</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="nb">min</span><span class="p">(</span><span class="n">position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)),</span>
+            <span class="p">),</span> <span class="kc">False</span>
+
+<div class="viewcode-block" id="RSTransitionModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_state</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="RSTransitionModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="n">next_position</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">position</span><span class="p">)</span>
+        <span class="n">rocktypes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">)</span>
+        <span class="n">next_rocktypes</span> <span class="o">=</span> <span class="n">rocktypes</span>
+        <span class="n">next_terminal</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">terminal</span>
+        <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">terminal</span><span class="p">:</span>
+            <span class="n">next_terminal</span> <span class="o">=</span> <span class="kc">True</span>  <span class="c1"># already terminated. So no state transition happens</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MoveAction</span><span class="p">):</span>
+                <span class="n">next_position</span><span class="p">,</span> <span class="n">exiting</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_move_or_exit</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">position</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span>
+                <span class="k">if</span> <span class="n">exiting</span><span class="p">:</span>
+                    <span class="n">next_terminal</span> <span class="o">=</span> <span class="kc">True</span>
+            <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">SampleAction</span><span class="p">):</span>
+                <span class="k">if</span> <span class="n">next_position</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">:</span>
+                    <span class="n">rock_id</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">[</span><span class="n">next_position</span><span class="p">]</span>
+                    <span class="n">_rocktypes</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">rocktypes</span><span class="p">)</span>
+                    <span class="n">_rocktypes</span><span class="p">[</span><span class="n">rock_id</span><span class="p">]</span> <span class="o">=</span> <span class="n">RockType</span><span class="o">.</span><span class="n">BAD</span>
+                    <span class="n">next_rocktypes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">_rocktypes</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">State</span><span class="p">(</span><span class="n">next_position</span><span class="p">,</span> <span class="n">next_rocktypes</span><span class="p">,</span> <span class="n">next_terminal</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="RSTransitionModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely next state&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="RSObservationModel">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">RSObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObservationModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">half_efficiency_dist</span><span class="o">=</span><span class="mi">20</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_half_efficiency_dist</span> <span class="o">=</span> <span class="n">half_efficiency_dist</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_rocks</span> <span class="o">=</span> <span class="p">{</span><span class="n">rock_locs</span><span class="p">[</span><span class="n">pos</span><span class="p">]:</span> <span class="n">pos</span> <span class="k">for</span> <span class="n">pos</span> <span class="ow">in</span> <span class="n">rock_locs</span><span class="p">}</span>
+
+<div class="viewcode-block" id="RSObservationModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">CheckAction</span><span class="p">):</span>
+            <span class="c1"># compute efficiency</span>
+            <span class="n">rock_pos</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rocks</span><span class="p">[</span><span class="n">action</span><span class="o">.</span><span class="n">rock_id</span><span class="p">]</span>
+            <span class="n">dist</span> <span class="o">=</span> <span class="n">euclidean_dist</span><span class="p">(</span><span class="n">rock_pos</span><span class="p">,</span> <span class="n">next_state</span><span class="o">.</span><span class="n">position</span><span class="p">)</span>
+            <span class="n">eta</span> <span class="o">=</span> <span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="nb">pow</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="n">dist</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">_half_efficiency_dist</span><span class="p">))</span> <span class="o">*</span> <span class="mf">0.5</span>
+
+            <span class="c1"># compute probability</span>
+            <span class="n">actual_rocktype</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">[</span><span class="n">action</span><span class="o">.</span><span class="n">rock_id</span><span class="p">]</span>
+            <span class="k">if</span> <span class="n">actual_rocktype</span> <span class="o">==</span> <span class="n">observation</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">eta</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">eta</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">quality</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">EPSILON</span>  <span class="c1"># expected to receive no observation</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="RSObservationModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="n">next_state</span><span class="o">.</span><span class="n">terminal</span> <span class="ow">and</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">CheckAction</span><span class="p">):</span>
+            <span class="c1"># compute efficiency</span>
+            <span class="n">rock_pos</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rocks</span><span class="p">[</span><span class="n">action</span><span class="o">.</span><span class="n">rock_id</span><span class="p">]</span>
+            <span class="n">dist</span> <span class="o">=</span> <span class="n">euclidean_dist</span><span class="p">(</span><span class="n">rock_pos</span><span class="p">,</span> <span class="n">next_state</span><span class="o">.</span><span class="n">position</span><span class="p">)</span>
+            <span class="n">eta</span> <span class="o">=</span> <span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="nb">pow</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="n">dist</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">_half_efficiency_dist</span><span class="p">))</span> <span class="o">*</span> <span class="mf">0.5</span>
+
+            <span class="k">if</span> <span class="n">argmax</span><span class="p">:</span>
+                <span class="n">keep</span> <span class="o">=</span> <span class="n">eta</span> <span class="o">&gt;</span> <span class="mf">0.5</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">keep</span> <span class="o">=</span> <span class="n">eta</span> <span class="o">&gt;</span> <span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
+
+            <span class="n">actual_rocktype</span> <span class="o">=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">[</span><span class="n">action</span><span class="o">.</span><span class="n">rock_id</span><span class="p">]</span>
+            <span class="k">if</span> <span class="ow">not</span> <span class="n">keep</span><span class="p">:</span>
+                <span class="n">observed_rocktype</span> <span class="o">=</span> <span class="n">RockType</span><span class="o">.</span><span class="n">invert</span><span class="p">(</span><span class="n">actual_rocktype</span><span class="p">)</span>
+                <span class="k">return</span> <span class="n">Observation</span><span class="p">(</span><span class="n">observed_rocktype</span><span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">Observation</span><span class="p">(</span><span class="n">actual_rocktype</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># Terminated or not a check action. So no observation.</span>
+            <span class="k">return</span> <span class="n">Observation</span><span class="p">(</span><span class="kc">None</span><span class="p">)</span>
+
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_probs</span><span class="p">[</span><span class="n">next_state</span><span class="p">][</span><span class="n">action</span><span class="p">][</span><span class="n">observation</span><span class="p">]</span></div>
+
+
+<div class="viewcode-block" id="RSObservationModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely observation&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="RSRewardModel">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">RSRewardModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RewardModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">in_exit_area</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span> <span class="o">=</span> <span class="n">rock_locs</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_in_exit_area</span> <span class="o">=</span> <span class="n">in_exit_area</span>
+
+<div class="viewcode-block" id="RSRewardModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="c1"># deterministic</span>
+        <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">terminal</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mi">0</span>  <span class="c1"># terminated. No reward</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">SampleAction</span><span class="p">):</span>
+            <span class="c1"># need to check the rocktype in `state` because it has turned bad in `next_state`</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">position</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">:</span>
+                <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">[</span><span class="n">state</span><span class="o">.</span><span class="n">position</span><span class="p">]]</span> <span class="o">==</span> <span class="n">RockType</span><span class="o">.</span><span class="n">GOOD</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="mi">10</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="c1"># No rock or bad rock</span>
+                    <span class="k">return</span> <span class="o">-</span><span class="mi">10</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mi">0</span>  <span class="c1"># problem didn&#39;t specify penalty for sampling empty space.</span>
+
+        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MoveAction</span><span class="p">):</span>
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_in_exit_area</span><span class="p">(</span><span class="n">next_state</span><span class="o">.</span><span class="n">position</span><span class="p">):</span>
+                <span class="k">return</span> <span class="mi">10</span>
+        <span class="k">return</span> <span class="mi">0</span></div>
+
+
+<div class="viewcode-block" id="RSRewardModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="RSRewardModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">reward</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span>
+    <span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="RSPolicyModel">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel">[docs]</a>
+<span class="k">class</span> <span class="nc">RSPolicyModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RolloutPolicy</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Simple policy model according to problem description.&quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">):</span>
+        <span class="n">check_actions</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({</span><span class="n">CheckAction</span><span class="p">(</span><span class="n">rock_id</span><span class="p">)</span> <span class="k">for</span> <span class="n">rock_id</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">k</span><span class="p">)})</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_move_actions</span> <span class="o">=</span> <span class="p">{</span><span class="n">MoveEast</span><span class="p">,</span> <span class="n">MoveWest</span><span class="p">,</span> <span class="n">MoveNorth</span><span class="p">,</span> <span class="n">MoveSouth</span><span class="p">}</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_other_actions</span> <span class="o">=</span> <span class="p">{</span><span class="n">SampleAction</span><span class="p">()}</span> <span class="o">|</span> <span class="n">check_actions</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_move_actions</span> <span class="o">|</span> <span class="bp">self</span><span class="o">.</span><span class="n">_other_actions</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">=</span> <span class="n">n</span>
+
+<div class="viewcode-block" id="RSPolicyModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">(</span><span class="n">state</span><span class="o">=</span><span class="n">state</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+
+
+<div class="viewcode-block" id="RSPolicyModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="RSPolicyModel.argmax">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns the most likely reward&quot;&quot;&quot;</span>
+        <span class="k">raise</span> <span class="ne">NotImplementedError</span></div>
+
+
+<div class="viewcode-block" id="RSPolicyModel.get_all_actions">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="n">state</span> <span class="o">=</span> <span class="n">kwargs</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;state&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">state</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">motions</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_all_actions</span><span class="p">)</span>
+            <span class="n">rover_x</span><span class="p">,</span> <span class="n">rover_y</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">position</span>
+            <span class="k">if</span> <span class="n">rover_x</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+                <span class="n">motions</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">MoveWest</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">rover_y</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+                <span class="n">motions</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">MoveNorth</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">rover_y</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">:</span>
+                <span class="n">motions</span><span class="o">.</span><span class="n">remove</span><span class="p">(</span><span class="n">MoveSouth</span><span class="p">)</span>
+            <span class="k">return</span> <span class="nb">list</span><span class="p">(</span><span class="n">motions</span> <span class="o">|</span> <span class="bp">self</span><span class="o">.</span><span class="n">_other_actions</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="RSPolicyModel.rollout">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.rollout">[docs]</a>
+    <span class="k">def</span> <span class="nf">rollout</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">(</span><span class="n">state</span><span class="o">=</span><span class="n">state</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="RockSampleProblem">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem">[docs]</a>
+<span class="k">class</span> <span class="nc">RockSampleProblem</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMDP</span><span class="p">):</span>
+<div class="viewcode-block" id="RockSampleProblem.random_free_location">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">random_free_location</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">not_free_locs</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;returns a random (x,y) location in nxn grid that is free.&quot;&quot;&quot;</span>
+        <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
+            <span class="n">loc</span> <span class="o">=</span> <span class="p">(</span><span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span> <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">))</span>
+            <span class="k">if</span> <span class="n">loc</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">not_free_locs</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">loc</span></div>
+
+
+<div class="viewcode-block" id="RockSampleProblem.in_exit_area">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area">[docs]</a>
+    <span class="k">def</span> <span class="nf">in_exit_area</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pos</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">pos</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span></div>
+
+
+<div class="viewcode-block" id="RockSampleProblem.generate_instance">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">generate_instance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns init_state and rock locations for an instance of RockSample(n,k)&quot;&quot;&quot;</span>
+
+        <span class="n">rover_position</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">n</span> <span class="o">-</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="n">rock_locs</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from rock location to rock id</span>
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">k</span><span class="p">):</span>
+            <span class="n">loc</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="o">.</span><span class="n">random_free_location</span><span class="p">(</span>
+                <span class="n">n</span><span class="p">,</span> <span class="nb">set</span><span class="p">(</span><span class="n">rock_locs</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span> <span class="o">|</span> <span class="nb">set</span><span class="p">({</span><span class="n">rover_position</span><span class="p">})</span>
+            <span class="p">)</span>
+            <span class="n">rock_locs</span><span class="p">[</span><span class="n">loc</span><span class="p">]</span> <span class="o">=</span> <span class="n">i</span>
+
+        <span class="c1"># random rocktypes</span>
+        <span class="n">rocktypes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">RockType</span><span class="o">.</span><span class="n">random</span><span class="p">()</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">k</span><span class="p">))</span>
+
+        <span class="c1"># Ground truth state</span>
+        <span class="n">init_state</span> <span class="o">=</span> <span class="n">State</span><span class="p">(</span><span class="n">rover_position</span><span class="p">,</span> <span class="n">rocktypes</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+
+        <span class="k">return</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span></div>
+
+
+<div class="viewcode-block" id="RockSampleProblem.print_state">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.print_state">[docs]</a>
+    <span class="k">def</span> <span class="nf">print_state</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="n">string</span> <span class="o">=</span> <span class="s2">&quot;</span><span class="se">\n</span><span class="s2">______ID______</span><span class="se">\n</span><span class="s2">&quot;</span>
+        <span class="n">rover_position</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">position</span>
+        <span class="n">rocktypes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">rocktypes</span>
+        <span class="c1"># Rock id map</span>
+        <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_n</span><span class="p">):</span>
+            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">+</span> <span class="mi">1</span><span class="p">):</span>
+                <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;.&quot;</span>
+                <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span><span class="p">:</span>
+                    <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;&gt;&quot;</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">:</span>
+                    <span class="n">char</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">[(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)])</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="o">==</span> <span class="n">rover_position</span><span class="p">:</span>
+                    <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;R&quot;</span>
+                <span class="n">string</span> <span class="o">+=</span> <span class="n">char</span>
+            <span class="n">string</span> <span class="o">+=</span> <span class="s2">&quot;</span><span class="se">\n</span><span class="s2">&quot;</span>
+        <span class="n">string</span> <span class="o">+=</span> <span class="s2">&quot;_____G/B_____</span><span class="se">\n</span><span class="s2">&quot;</span>
+        <span class="c1"># Good/bad map</span>
+        <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_n</span><span class="p">):</span>
+            <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_n</span> <span class="o">+</span> <span class="mi">1</span><span class="p">):</span>
+                <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;.&quot;</span>
+                <span class="k">if</span> <span class="n">x</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_n</span><span class="p">:</span>
+                    <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;&gt;&quot;</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">:</span>
+                    <span class="k">if</span> <span class="n">rocktypes</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span><span class="p">[(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)]]</span> <span class="o">==</span> <span class="n">RockType</span><span class="o">.</span><span class="n">GOOD</span><span class="p">:</span>
+                        <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;$&quot;</span>
+                    <span class="k">else</span><span class="p">:</span>
+                        <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;x&quot;</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="o">==</span> <span class="n">rover_position</span><span class="p">:</span>
+                    <span class="n">char</span> <span class="o">=</span> <span class="s2">&quot;R&quot;</span>
+                <span class="n">string</span> <span class="o">+=</span> <span class="n">char</span>
+            <span class="n">string</span> <span class="o">+=</span> <span class="s2">&quot;</span><span class="se">\n</span><span class="s2">&quot;</span>
+        <span class="nb">print</span><span class="p">(</span><span class="n">string</span><span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="n">half_efficiency_dist</span><span class="o">=</span><span class="mi">20</span>
+    <span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_n</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_k</span> <span class="o">=</span> <span class="n">n</span><span class="p">,</span> <span class="n">k</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">(</span>
+            <span class="n">init_belief</span><span class="p">,</span>
+            <span class="n">RSPolicyModel</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">),</span>
+            <span class="n">RSTransitionModel</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">),</span>
+            <span class="n">RSObservationModel</span><span class="p">(</span><span class="n">rock_locs</span><span class="p">,</span> <span class="n">half_efficiency_dist</span><span class="o">=</span><span class="n">half_efficiency_dist</span><span class="p">),</span>
+            <span class="n">RSRewardModel</span><span class="p">(</span><span class="n">rock_locs</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">),</span>
+        <span class="p">)</span>
+        <span class="n">env</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">(</span>
+            <span class="n">init_state</span><span class="p">,</span>
+            <span class="n">RSTransitionModel</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">),</span>
+            <span class="n">RSRewardModel</span><span class="p">(</span><span class="n">rock_locs</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">),</span>
+        <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_rock_locs</span> <span class="o">=</span> <span class="n">rock_locs</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;RockSampleProblem&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="test_planner">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.test_planner">[docs]</a>
+<span class="k">def</span> <span class="nf">test_planner</span><span class="p">(</span><span class="n">rocksample</span><span class="p">,</span> <span class="n">planner</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">discount</span><span class="o">=</span><span class="mf">0.95</span><span class="p">):</span>
+    <span class="n">gamma</span> <span class="o">=</span> <span class="mf">1.0</span>
+    <span class="n">total_reward</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">total_discounted_reward</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">nsteps</span><span class="p">):</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="n">action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+        <span class="c1"># pomdp_py.visual.visualize_pouct_search_tree(rocksample.agent.tree,</span>
+        <span class="c1">#                                             max_depth=5, anonymize=False)</span>
+
+        <span class="n">true_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+        <span class="n">env_reward</span> <span class="o">=</span> <span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+        <span class="n">true_next_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">)</span>
+
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">action</span>
+        <span class="p">)</span>
+        <span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">total_reward</span> <span class="o">+=</span> <span class="n">env_reward</span>
+        <span class="n">total_discounted_reward</span> <span class="o">+=</span> <span class="n">env_reward</span> <span class="o">*</span> <span class="n">gamma</span>
+        <span class="n">gamma</span> <span class="o">*=</span> <span class="n">discount</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;True state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">true_state</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">env_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative Discounted): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">total_discounted_reward</span><span class="p">))</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__plan_time__: </span><span class="si">%.5f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_planning_time</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">PORollout</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__best_reward__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_best_reward</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;World:&quot;</span><span class="p">)</span>
+        <span class="n">rocksample</span><span class="o">.</span><span class="n">print_state</span><span class="p">()</span>
+
+        <span class="k">if</span> <span class="n">rocksample</span><span class="o">.</span><span class="n">in_exit_area</span><span class="p">(</span><span class="n">rocksample</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">position</span><span class="p">):</span>
+            <span class="k">break</span>
+    <span class="k">return</span> <span class="n">total_reward</span><span class="p">,</span> <span class="n">total_discounted_reward</span></div>
+
+
+
+<div class="viewcode-block" id="init_particles_belief">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.init_particles_belief">[docs]</a>
+<span class="k">def</span> <span class="nf">init_particles_belief</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="n">num_particles</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">):</span>
+    <span class="n">num_particles</span> <span class="o">=</span> <span class="mi">200</span>
+    <span class="n">particles</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_particles</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">belief</span> <span class="o">==</span> <span class="s2">&quot;uniform&quot;</span><span class="p">:</span>
+            <span class="n">rocktypes</span> <span class="o">=</span> <span class="p">[]</span>
+            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">k</span><span class="p">):</span>
+                <span class="n">rocktypes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">RockType</span><span class="o">.</span><span class="n">random</span><span class="p">())</span>
+            <span class="n">rocktypes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">rocktypes</span><span class="p">)</span>
+        <span class="k">elif</span> <span class="n">belief</span> <span class="o">==</span> <span class="s2">&quot;groundtruth&quot;</span><span class="p">:</span>
+            <span class="n">rocktypes</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">init_state</span><span class="o">.</span><span class="n">rocktypes</span><span class="p">)</span>
+        <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">State</span><span class="p">(</span><span class="n">init_state</span><span class="o">.</span><span class="n">position</span><span class="p">,</span> <span class="n">rocktypes</span><span class="p">,</span> <span class="kc">False</span><span class="p">))</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">init_belief</span></div>
+
+
+
+<div class="viewcode-block" id="minimal_instance">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.minimal_instance">[docs]</a>
+<span class="k">def</span> <span class="nf">minimal_instance</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+    <span class="c1"># A particular instance for debugging purpose</span>
+    <span class="n">n</span><span class="p">,</span> <span class="n">k</span> <span class="o">=</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">2</span>
+    <span class="n">rover_position</span> <span class="o">=</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
+    <span class="n">rock_locs</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from rock location to rock id</span>
+    <span class="n">rock_locs</span><span class="p">[(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">rock_locs</span><span class="p">[(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">1</span>
+    <span class="n">rocktypes</span> <span class="o">=</span> <span class="p">(</span><span class="s2">&quot;good&quot;</span><span class="p">,</span> <span class="s2">&quot;good&quot;</span><span class="p">)</span>
+    <span class="c1"># Ground truth state</span>
+    <span class="n">init_state</span> <span class="o">=</span> <span class="n">State</span><span class="p">(</span><span class="n">rover_position</span><span class="p">,</span> <span class="n">rocktypes</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+    <span class="n">belief</span> <span class="o">=</span> <span class="s2">&quot;uniform&quot;</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">init_particles_belief</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="n">belief</span><span class="p">)</span>
+    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">rocksample</span></div>
+
+
+
+<div class="viewcode-block" id="create_instance">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.create_instance">[docs]</a>
+<span class="k">def</span> <span class="nf">create_instance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+    <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="o">.</span><span class="n">generate_instance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">)</span>
+
+    <span class="n">belief</span> <span class="o">=</span> <span class="s2">&quot;uniform&quot;</span>
+
+    <span class="c1"># init belief (uniform), represented in particles;</span>
+    <span class="c1"># We don&#39;t factor the state here; We are also not doing any action prior.</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">init_particles_belief</span><span class="p">(</span><span class="n">k</span><span class="p">,</span> <span class="mi">200</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="n">belief</span><span class="p">)</span>
+
+    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">RockSampleProblem</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="n">k</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">rock_locs</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">rocksample</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../problems/problems.rocksample.html#problems.rocksample.rocksample_problem.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">rocksample</span> <span class="o">=</span> <span class="n">debug_instance</span><span class="p">()</span>  <span class="c1"># create_instance(7, 8)</span>
+    <span class="n">rocksample</span><span class="o">.</span><span class="n">print_state</span><span class="p">()</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;*** Testing POMCP ***&quot;</span><span class="p">)</span>
+    <span class="n">pomcp</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">num_sims</span><span class="o">=</span><span class="mi">10000</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span>
+        <span class="n">rollout_policy</span><span class="o">=</span><span class="n">rocksample</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="n">num_visits_init</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">tt</span><span class="p">,</span> <span class="n">ttd</span> <span class="o">=</span> <span class="n">test_planner</span><span class="p">(</span><span class="n">rocksample</span><span class="p">,</span> <span class="n">pomcp</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">discount</span><span class="o">=</span><span class="mf">0.95</span><span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/agent/agent.html b/docs/html/_modules/problems/tag/agent/agent.html
new file mode 100644
index 00000000..036aa1d9
--- /dev/null
+++ b/docs/html/_modules/problems/tag/agent/agent.html
@@ -0,0 +1,281 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.agent.agent &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.agent.agent</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.observation_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.transition_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.reward_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.policy_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.components.motion_policy</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.components.grid_map</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1">## initialize belief</span>
+<div class="viewcode-block" id="initialize_belief">
+<a class="viewcode-back" href="../../../../problems/problems.tag.agent.html#problems.tag.agent.agent.initialize_belief">[docs]</a>
+<span class="k">def</span> <span class="nf">initialize_belief</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">init_robot_position</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="p">{}):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Initialize belief.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        grid_map (GridMap): Holds information of the map occupancy</span>
+<span class="sd">        prior (dict): A map from (x,y)-&gt;[0,1]. If empty, the belief</span>
+<span class="sd">            will be uniform.&quot;&quot;&quot;</span>
+    <span class="n">hist</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># state -&gt; prob</span>
+    <span class="n">total_prob</span> <span class="o">=</span> <span class="mf">0.0</span>
+    <span class="k">for</span> <span class="n">target_position</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">:</span>
+        <span class="n">state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+        <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">=</span> <span class="n">prior</span><span class="p">[</span><span class="n">target_position</span><span class="p">]</span>
+        <span class="n">total_prob</span> <span class="o">+=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+
+    <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">grid_map</span><span class="o">.</span><span class="n">width</span><span class="p">):</span>
+        <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">grid_map</span><span class="o">.</span><span class="n">length</span><span class="p">):</span>
+            <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">in</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">obstacle_poses</span><span class="p">:</span>
+                <span class="c1"># Skip obstacles</span>
+                <span class="k">continue</span>
+            <span class="n">state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">),</span> <span class="kc">False</span><span class="p">)</span>
+            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">prior</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">:</span>
+                    <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">=</span> <span class="mf">1e-9</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">=</span> <span class="mf">1.0</span>
+                <span class="n">total_prob</span> <span class="o">+=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+    <span class="c1"># Normalize</span>
+    <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="n">hist</span><span class="p">:</span>
+        <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">/=</span> <span class="n">total_prob</span>
+
+    <span class="n">hist_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">(</span><span class="n">hist</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">hist_belief</span></div>
+
+
+
+<div class="viewcode-block" id="initialize_particles_belief">
+<a class="viewcode-back" href="../../../../problems/problems.tag.agent.html#problems.tag.agent.agent.initialize_particles_belief">[docs]</a>
+<span class="k">def</span> <span class="nf">initialize_particles_belief</span><span class="p">(</span>
+    <span class="n">grid_map</span><span class="p">,</span> <span class="n">init_robot_position</span><span class="p">,</span> <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="p">{}</span>
+<span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Initialize belief.</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        grid_map (GridMap): Holds information of the map occupancy</span>
+<span class="sd">        prior (dict): A map from (x,y)-&gt;[0,1]. If empty, the belief</span>
+<span class="sd">            will be uniform.&quot;&quot;&quot;</span>
+    <span class="n">particles</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">prior</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+        <span class="c1"># prior knowledge provided. Just use the prior knowledge</span>
+        <span class="n">prior_sum</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">prior</span><span class="p">[</span><span class="n">pose</span><span class="p">]</span> <span class="k">for</span> <span class="n">pose</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">pose</span> <span class="ow">in</span> <span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">]:</span>
+            <span class="n">state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">pose</span><span class="p">)</span>
+            <span class="n">amount_to_add</span> <span class="o">=</span> <span class="p">(</span><span class="n">prior</span><span class="p">[</span><span class="n">objid</span><span class="p">][</span><span class="n">pose</span><span class="p">]</span> <span class="o">/</span> <span class="n">prior_sum</span><span class="p">)</span> <span class="o">*</span> <span class="n">num_particles</span>
+            <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">amount_to_add</span><span class="p">):</span>
+                <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="k">while</span> <span class="nb">len</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">num_particles</span><span class="p">:</span>
+            <span class="n">target_position</span> <span class="o">=</span> <span class="p">(</span>
+                <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">width</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span>
+                <span class="n">random</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">length</span> <span class="o">-</span> <span class="mi">1</span><span class="p">),</span>
+            <span class="p">)</span>
+            <span class="k">if</span> <span class="n">target_position</span> <span class="ow">in</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">obstacle_poses</span><span class="p">:</span>
+                <span class="c1"># Skip obstacles</span>
+                <span class="k">continue</span>
+            <span class="n">state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+            <span class="n">particles</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+    <span class="k">return</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="p">(</span><span class="n">particles</span><span class="p">)</span></div>
+
+
+
+<span class="c1">## belief update</span>
+<div class="viewcode-block" id="belief_update">
+<a class="viewcode-back" href="../../../../problems/problems.tag.agent.html#problems.tag.agent.agent.belief_update">[docs]</a>
+<span class="k">def</span> <span class="nf">belief_update</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">):</span>
+    <span class="c1"># Update agent belief</span>
+    <span class="n">current_mpe_state</span> <span class="o">=</span> <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="o">.</span><span class="n">mpe</span><span class="p">()</span>
+    <span class="n">next_robot_position</span> <span class="o">=</span> <span class="n">agent</span><span class="o">.</span><span class="n">transition_model</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span>
+        <span class="n">current_mpe_state</span><span class="p">,</span> <span class="n">real_action</span>
+    <span class="p">)</span><span class="o">.</span><span class="n">robot_position</span>
+
+    <span class="n">next_state_space</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+    <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">:</span>
+        <span class="n">next_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+        <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">=</span> <span class="n">next_robot_position</span>
+        <span class="n">next_state_space</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">next_state</span><span class="p">)</span>
+
+    <span class="n">new_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">update_histogram_belief</span><span class="p">(</span>
+        <span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">,</span>
+        <span class="n">real_action</span><span class="p">,</span>
+        <span class="n">real_observation</span><span class="p">,</span>
+        <span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span>
+        <span class="n">agent</span><span class="o">.</span><span class="n">transition_model</span><span class="p">,</span>
+        <span class="n">next_state_space</span><span class="o">=</span><span class="n">next_state_space</span><span class="p">,</span>
+    <span class="p">)</span>
+
+    <span class="n">agent</span><span class="o">.</span><span class="n">set_belief</span><span class="p">(</span><span class="n">new_belief</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="TagAgent">
+<a class="viewcode-back" href="../../../../problems/problems.tag.agent.html#problems.tag.agent.agent.TagAgent">[docs]</a>
+<span class="k">class</span> <span class="nc">TagAgent</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+        <span class="n">target_motion_policy</span> <span class="o">=</span> <span class="n">TagTargetMotionPolicy</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="p">)</span>
+        <span class="n">transition_model</span> <span class="o">=</span> <span class="n">TagTransitionModel</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">target_motion_policy</span><span class="p">)</span>
+        <span class="n">reward_model</span> <span class="o">=</span> <span class="n">TagRewardModel</span><span class="p">(</span><span class="n">small</span><span class="o">=</span><span class="n">small</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="n">big</span><span class="p">)</span>
+        <span class="n">observation_model</span> <span class="o">=</span> <span class="n">TagObservationModel</span><span class="p">()</span>
+        <span class="n">policy_model</span> <span class="o">=</span> <span class="n">TagPolicyModel</span><span class="p">(</span><span class="n">grid_map</span><span class="o">=</span><span class="n">grid_map</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+            <span class="n">init_belief</span><span class="p">,</span>
+            <span class="n">policy_model</span><span class="p">,</span>
+            <span class="n">transition_model</span><span class="o">=</span><span class="n">transition_model</span><span class="p">,</span>
+            <span class="n">observation_model</span><span class="o">=</span><span class="n">observation_model</span><span class="p">,</span>
+            <span class="n">reward_model</span><span class="o">=</span><span class="n">reward_model</span><span class="p">,</span>
+        <span class="p">)</span>
+
+<div class="viewcode-block" id="TagAgent.clear_history">
+<a class="viewcode-back" href="../../../../problems/problems.tag.agent.html#problems.tag.agent.agent.TagAgent.clear_history">[docs]</a>
+    <span class="k">def</span> <span class="nf">clear_history</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Custum function; clear history&quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_history</span> <span class="o">=</span> <span class="kc">None</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/domain/action.html b/docs/html/_modules/problems/tag/domain/action.html
new file mode 100644
index 00000000..1312dc96
--- /dev/null
+++ b/docs/html/_modules/problems/tag/domain/action.html
@@ -0,0 +1,166 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.domain.action &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.domain.action</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The Tag problem. Implemented according to the paper `Anytime Point-Based</span>
+<span class="sd">Approximations for Large POMDPs &lt;https://arxiv.org/pdf/1110.0027.pdf&gt;`_.</span>
+
+<span class="sd">Action space: The agent can take motion action and a tag action.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="c1"># Reuses the actions in the multi object search domain</span>
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.domain.action</span> <span class="kn">import</span> <span class="p">(</span>
+    <span class="n">Action</span><span class="p">,</span>
+    <span class="n">MotionAction</span><span class="p">,</span>
+    <span class="n">MoveEast2D</span><span class="p">,</span>
+    <span class="n">MoveWest2D</span><span class="p">,</span>
+    <span class="n">MoveSouth2D</span><span class="p">,</span>
+    <span class="n">MoveNorth2D</span><span class="p">,</span>
+<span class="p">)</span>
+
+<span class="n">MOTION_ACTIONS</span> <span class="o">=</span> <span class="p">{</span><span class="n">MoveEast2D</span><span class="p">,</span> <span class="n">MoveWest2D</span><span class="p">,</span> <span class="n">MoveSouth2D</span><span class="p">,</span> <span class="n">MoveNorth2D</span><span class="p">}</span>
+
+
+<div class="viewcode-block" id="TagAction">
+<a class="viewcode-back" href="../../../../problems/problems.tag.domain.html#problems.tag.domain.action.TagAction">[docs]</a>
+<span class="k">class</span> <span class="nc">TagAction</span><span class="p">(</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="s2">&quot;tag&quot;</span><span class="p">)</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/domain/observation.html b/docs/html/_modules/problems/tag/domain/observation.html
new file mode 100644
index 00000000..a3ef6a3b
--- /dev/null
+++ b/docs/html/_modules/problems/tag/domain/observation.html
@@ -0,0 +1,168 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.domain.observation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.domain.observation</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The Tag problem. Implemented according to the paper `Anytime Point-Based</span>
+<span class="sd">Approximations for Large POMDPs &lt;https://arxiv.org/pdf/1110.0027.pdf&gt;`_.</span>
+
+<span class="sd">Observation space: the agent observes the target&#39;s location when the agent and</span>
+<span class="sd">    the target are in the same cell.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+
+
+<div class="viewcode-block" id="TagObservation">
+<a class="viewcode-back" href="../../../../problems/problems.tag.domain.html#problems.tag.domain.observation.TagObservation">[docs]</a>
+<span class="k">class</span> <span class="nc">TagObservation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">target_position</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">target_position</span> <span class="o">=</span> <span class="n">target_position</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">target_position</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">TagObservation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_position</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">target_position</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;Observation(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">target_position</span><span class="p">))</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/domain/state.html b/docs/html/_modules/problems/tag/domain/state.html
new file mode 100644
index 00000000..b3a9fd8c
--- /dev/null
+++ b/docs/html/_modules/problems/tag/domain/state.html
@@ -0,0 +1,186 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.domain.state &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.domain.state</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The Tag problem. Implemented according to the paper `Anytime Point-Based</span>
+<span class="sd">Approximations for Large POMDPs &lt;https://arxiv.org/pdf/1110.0027.pdf&gt;`_.</span>
+
+<span class="sd">State space: state of the robot (x,y), state of the person (x,y), person found.</span>
+
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+
+
+<div class="viewcode-block" id="TagState">
+<a class="viewcode-back" href="../../../../problems/problems.tag.domain.html#problems.tag.domain.state.TagState">[docs]</a>
+<span class="k">class</span> <span class="nc">TagState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">State</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">target_found</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        robot_position (tuple): x,y location of the robot.</span>
+<span class="sd">        target_position (tuple): x,y location of the target.</span>
+<span class="sd">        target_found (bool): True if the target is found.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">=</span> <span class="n">robot_position</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">target_position</span> <span class="o">=</span> <span class="n">target_position</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">target_found</span> <span class="o">=</span> <span class="n">target_found</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_position</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_found</span><span class="p">))</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">TagState</span><span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">robot_position</span>
+                <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_position</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">target_position</span>
+                <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_found</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">target_found</span>
+            <span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;State(</span><span class="si">%s</span><span class="s2">, </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="p">(</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">robot_position</span><span class="p">),</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">target_position</span><span class="p">),</span>
+            <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">target_found</span><span class="p">),</span>
+        <span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/env/env.html b/docs/html/_modules/problems/tag/env/env.html
new file mode 100644
index 00000000..254da9f9
--- /dev/null
+++ b/docs/html/_modules/problems/tag/env/env.html
@@ -0,0 +1,193 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.env.env &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.env.env</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.transition_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.reward_model</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.components.motion_policy</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.components.grid_map</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="n">interpret</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.visual</span> <span class="kn">import</span> <span class="n">MosViz</span>
+
+
+<div class="viewcode-block" id="TagEnvironment">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.env.TagEnvironment">[docs]</a>
+<span class="k">class</span> <span class="nc">TagEnvironment</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">init_state</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+        <span class="n">target_motion_policy</span> <span class="o">=</span> <span class="n">TagTargetMotionPolicy</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="p">)</span>
+        <span class="n">transition_model</span> <span class="o">=</span> <span class="n">TagTransitionModel</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">target_motion_policy</span><span class="p">)</span>
+        <span class="n">reward_model</span> <span class="o">=</span> <span class="n">TagRewardModel</span><span class="p">(</span><span class="n">small</span><span class="o">=</span><span class="n">small</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="n">big</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">transition_model</span><span class="p">,</span> <span class="n">reward_model</span><span class="p">)</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">width</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">width</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">length</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">length</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">grid_map</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span>
+
+<div class="viewcode-block" id="TagEnvironment.from_str">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.env.TagEnvironment.from_str">[docs]</a>
+    <span class="nd">@classmethod</span>
+    <span class="k">def</span> <span class="nf">from_str</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">worldstr</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="n">dim</span><span class="p">,</span> <span class="n">robots</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">robots</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">,</span> <span class="s2">&quot;Does not support multiple robots.&quot;</span>
+        <span class="n">robot_position</span> <span class="o">=</span> <span class="n">robots</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">robots</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">pose</span><span class="p">[:</span><span class="mi">2</span><span class="p">]</span>
+        <span class="n">targets</span> <span class="o">=</span> <span class="p">[]</span>
+        <span class="n">obstacle_poses</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">objects</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">objid</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">obstacles</span><span class="p">:</span>
+                <span class="n">targets</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">objid</span><span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">obstacle_poses</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">objects</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">pose</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">targets</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">,</span> <span class="s2">&quot;Does not support multiple objects.&quot;</span>
+        <span class="n">target_position</span> <span class="o">=</span> <span class="n">objects</span><span class="p">[</span><span class="n">targets</span><span class="p">[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">pose</span>
+        <span class="n">init_state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+        <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="p">(</span><span class="n">dim</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">dim</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">obstacle_poses</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">TagEnvironment</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/env/visual.html b/docs/html/_modules/problems/tag/env/visual.html
new file mode 100644
index 00000000..4bc13b6b
--- /dev/null
+++ b/docs/html/_modules/problems/tag/env/visual.html
@@ -0,0 +1,438 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.env.visual &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.env.visual</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Largely based on MosViz, except this is not an OO-POMDP&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pygame</span>
+<span class="kn">import</span> <span class="nn">cv2</span>
+<span class="kn">import</span> <span class="nn">math</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.utils</span> <span class="k">as</span> <span class="nn">util</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.state</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.observation_model</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<span class="c1">#### Visualization through pygame ####</span>
+<div class="viewcode-block" id="TagViz">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz">[docs]</a>
+<span class="k">class</span> <span class="nc">TagViz</span><span class="p">:</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">res</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">fps</span><span class="o">=</span><span class="mi">30</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">observation_model</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_env</span> <span class="o">=</span> <span class="n">env</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="n">res</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_img</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_make_gridworld_image</span><span class="p">(</span><span class="n">res</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_observation_model</span> <span class="o">=</span> <span class="n">observation_model</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span> <span class="o">=</span> <span class="n">controllable</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_fps</span> <span class="o">=</span> <span class="n">fps</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">=</span> <span class="mf">0.0</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">_target_color</span> <span class="o">=</span> <span class="p">(</span><span class="mi">200</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">50</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="nf">_make_gridworld_image</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">r</span><span class="p">):</span>
+        <span class="c1"># Preparing 2d array</span>
+        <span class="n">w</span><span class="p">,</span> <span class="n">l</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span>
+        <span class="n">arr2d</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">length</span><span class="p">),</span> <span class="mi">0</span><span class="p">)</span>  <span class="c1"># free grids</span>
+        <span class="c1"># Creating image</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">w</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">l</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="mi">255</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">int32</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">w</span><span class="p">):</span>
+            <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">l</span><span class="p">):</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">grid_map</span><span class="o">.</span><span class="n">obstacle_poses</span><span class="p">:</span>
+                    <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span>  <span class="c1"># free</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="n">arr2d</span><span class="p">[</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">]</span> <span class="o">==</span> <span class="mi">1</span>  <span class="c1"># obstacle</span>
+                    <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                        <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">40</span><span class="p">,</span> <span class="mi">31</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+                    <span class="p">)</span>
+                <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">y</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">x</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">8</span>
+                <span class="p">)</span>
+        <span class="k">return</span> <span class="n">img</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_width</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">img_height</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+
+    <span class="nd">@property</span>
+    <span class="k">def</span> <span class="nf">last_observation</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span>
+
+<div class="viewcode-block" id="TagViz.update">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.update">[docs]</a>
+    <span class="k">def</span> <span class="nf">update</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Update the visualization after there is new real action and observation</span>
+<span class="sd">        and updated belief.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span> <span class="o">=</span> <span class="n">action</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="n">observation</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="o">=</span> <span class="n">belief</span></div>
+
+
+<div class="viewcode-block" id="TagViz.draw_robot">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.draw_robot">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_robot</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">th</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">)):</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">size</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">y</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">x</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">radius</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=</span><span class="mi">6</span><span class="p">)</span></div>
+
+        <span class="c1"># endpoint = (y+radius + int(round(radius*math.sin(th))),</span>
+        <span class="c1">#             x+radius + int(round(radius*math.cos(th))))</span>
+        <span class="c1"># cv2.line(img, (y+radius,x+radius), endpoint, color, 2)</span>
+
+<div class="viewcode-block" id="TagViz.draw_observation">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.draw_observation">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_observation</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">z</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="n">rth</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">255</span><span class="p">)):</span>
+        <span class="k">assert</span> <span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)</span> <span class="o">==</span> <span class="n">TagObservation</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> != TagObservation&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="nb">type</span><span class="p">(</span><span class="n">z</span><span class="p">)))</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+        <span class="k">if</span> <span class="n">z</span><span class="o">.</span><span class="n">target_position</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">lx</span><span class="p">,</span> <span class="n">ly</span> <span class="o">=</span> <span class="n">z</span><span class="o">.</span><span class="n">target_position</span>
+            <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">ly</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">lx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span> <span class="n">size</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span>
+            <span class="p">)</span></div>
+
+
+    <span class="c1"># TODO! Deprecated.</span>
+<div class="viewcode-block" id="TagViz.draw_belief">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.draw_belief">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">size</span><span class="p">,</span> <span class="n">target_color</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;belief (OOBelief)&quot;&quot;&quot;</span>
+        <span class="n">radius</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="n">r</span> <span class="o">/</span> <span class="mi">2</span><span class="p">))</span>
+
+        <span class="n">circle_drawn</span> <span class="o">=</span> <span class="p">{}</span>  <span class="c1"># map from pose to number of times drawn</span>
+
+        <span class="n">hist</span> <span class="o">=</span> <span class="n">belief</span><span class="o">.</span><span class="n">get_histogram</span><span class="p">()</span>
+        <span class="n">color</span> <span class="o">=</span> <span class="n">target_color</span>
+
+        <span class="n">last_val</span> <span class="o">=</span> <span class="o">-</span><span class="mi">1</span>
+        <span class="n">count</span> <span class="o">=</span> <span class="mi">0</span>
+        <span class="k">for</span> <span class="n">state</span> <span class="ow">in</span> <span class="nb">reversed</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">hist</span><span class="p">,</span> <span class="n">key</span><span class="o">=</span><span class="n">hist</span><span class="o">.</span><span class="n">get</span><span class="p">)):</span>
+            <span class="k">if</span> <span class="n">last_val</span> <span class="o">!=</span> <span class="o">-</span><span class="mi">1</span><span class="p">:</span>
+                <span class="n">color</span> <span class="o">=</span> <span class="n">util</span><span class="o">.</span><span class="n">lighter</span><span class="p">(</span><span class="n">color</span><span class="p">,</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span> <span class="o">/</span> <span class="n">last_val</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">color</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">,</span> <span class="mi">255</span><span class="p">]))</span> <span class="o">&lt;</span> <span class="mf">0.999</span><span class="p">:</span>
+                <span class="n">tx</span><span class="p">,</span> <span class="n">ty</span> <span class="o">=</span> <span class="n">state</span><span class="o">.</span><span class="n">target_position</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">circle_drawn</span><span class="p">:</span>
+                    <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">=</span> <span class="mi">0</span>
+                <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)]</span> <span class="o">+=</span> <span class="mi">1</span>
+
+                <span class="n">cv2</span><span class="o">.</span><span class="n">circle</span><span class="p">(</span>
+                    <span class="n">img</span><span class="p">,</span>
+                    <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">radius</span><span class="p">),</span>
+                    <span class="n">size</span> <span class="o">//</span> <span class="n">circle_drawn</span><span class="p">[(</span><span class="n">tx</span><span class="p">,</span> <span class="n">ty</span><span class="p">)],</span>
+                    <span class="n">color</span><span class="p">,</span>
+                    <span class="n">thickness</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
+                <span class="p">)</span>
+                <span class="n">last_val</span> <span class="o">=</span> <span class="n">hist</span><span class="p">[</span><span class="n">state</span><span class="p">]</span>
+
+                <span class="n">count</span> <span class="o">+=</span> <span class="mi">1</span>
+                <span class="k">if</span> <span class="n">last_val</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">:</span>
+                    <span class="k">break</span></div>
+
+
+    <span class="c1"># PyGame interface functions</span>
+<div class="viewcode-block" id="TagViz.on_init">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.on_init">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_init</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;pygame init&quot;&quot;&quot;</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">init</span><span class="p">()</span>  <span class="c1"># calls pygame.font.init()</span>
+        <span class="c1"># init main screen and background</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_mode</span><span class="p">(</span>
+            <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">img_width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">img_height</span><span class="p">),</span> <span class="n">pygame</span><span class="o">.</span><span class="n">HWSURFACE</span>
+        <span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_background</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">Surface</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="o">.</span><span class="n">get_size</span><span class="p">())</span><span class="o">.</span><span class="n">convert</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">time</span><span class="o">.</span><span class="n">Clock</span><span class="p">()</span>
+
+        <span class="c1"># Font</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_myfont</span> <span class="o">=</span> <span class="n">pygame</span><span class="o">.</span><span class="n">font</span><span class="o">.</span><span class="n">SysFont</span><span class="p">(</span><span class="s2">&quot;Comic Sans MS&quot;</span><span class="p">,</span> <span class="mi">30</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">True</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_event">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.on_event">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_event</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">event</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">QUIT</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+        <span class="c1"># TODO! DEPRECATED!</span>
+        <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">type</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">KEYDOWN</span><span class="p">:</span>
+            <span class="n">u</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control signal according to motion model</span>
+            <span class="n">action</span> <span class="o">=</span> <span class="kc">None</span>  <span class="c1"># control input by user</span>
+
+            <span class="k">if</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_LEFT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveWest2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_RIGHT</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveEast2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_DOWN</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveSouth2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_UP</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">MoveNorth2D</span>
+            <span class="k">elif</span> <span class="n">event</span><span class="o">.</span><span class="n">key</span> <span class="o">==</span> <span class="n">pygame</span><span class="o">.</span><span class="n">K_SPACE</span><span class="p">:</span>
+                <span class="n">action</span> <span class="o">=</span> <span class="n">TagAction</span><span class="p">()</span>
+
+            <span class="k">if</span> <span class="n">action</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span>
+
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_controllable</span><span class="p">:</span>
+                <span class="n">reward</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+                <span class="n">robot_pose</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span>
+                <span class="n">z</span> <span class="o">=</span> <span class="kc">None</span>
+                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_observation_model</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                    <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_observation_model</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="o">=</span> <span class="n">z</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;      state: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">z</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;     reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+                <span class="nb">print</span><span class="p">(</span>
+                    <span class="s2">&quot; valid motions: </span><span class="si">%s</span><span class="s2">&quot;</span>
+                    <span class="o">%</span> <span class="nb">str</span><span class="p">(</span>
+                        <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">)</span>
+                    <span class="p">)</span>
+                <span class="p">)</span>
+                <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;------------&quot;</span><span class="p">)</span>
+                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+                    <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+            <span class="k">return</span> <span class="n">action</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_loop">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.on_loop">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_loop</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_playtime</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">tick</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_fps</span><span class="p">)</span> <span class="o">/</span> <span class="mf">1000.0</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_render">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.on_render">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_render</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="c1"># self._display_surf.blit(self._background, (0, 0))</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">render_env</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_display_surf</span><span class="p">)</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span>
+        <span class="n">fps_text</span> <span class="o">=</span> <span class="s2">&quot;FPS: </span><span class="si">{0:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_clock</span><span class="o">.</span><span class="n">get_fps</span><span class="p">())</span>
+        <span class="n">last_action</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_action</span>
+        <span class="n">last_action_str</span> <span class="o">=</span> <span class="s2">&quot;no_action&quot;</span> <span class="k">if</span> <span class="n">last_action</span> <span class="ow">is</span> <span class="kc">None</span> <span class="k">else</span> <span class="nb">str</span><span class="p">(</span><span class="n">last_action</span><span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">set_caption</span><span class="p">(</span>
+            <span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> | Robot(</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">,</span><span class="si">%.2f</span><span class="s2">) | </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">&quot;</span>
+            <span class="o">%</span> <span class="p">(</span><span class="n">last_action_str</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="nb">str</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">),</span> <span class="n">fps_text</span><span class="p">)</span>
+        <span class="p">)</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">display</span><span class="o">.</span><span class="n">flip</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_cleanup">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.on_cleanup">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_cleanup</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">quit</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="TagViz.on_execute">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.on_execute">[docs]</a>
+    <span class="k">def</span> <span class="nf">on_execute</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_running</span> <span class="o">=</span> <span class="kc">False</span>
+
+        <span class="k">while</span> <span class="bp">self</span><span class="o">.</span><span class="n">_running</span><span class="p">:</span>
+            <span class="k">for</span> <span class="n">event</span> <span class="ow">in</span> <span class="n">pygame</span><span class="o">.</span><span class="n">event</span><span class="o">.</span><span class="n">get</span><span class="p">():</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">on_event</span><span class="p">(</span><span class="n">event</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">on_cleanup</span><span class="p">()</span></div>
+
+
+<div class="viewcode-block" id="TagViz.render_env">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.TagViz.render_env">[docs]</a>
+    <span class="k">def</span> <span class="nf">render_env</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">display_surf</span><span class="p">):</span>
+        <span class="n">img</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">copy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_img</span><span class="p">)</span>
+        <span class="n">r</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span>  <span class="c1"># Not radius! It&#39;s resolution.</span>
+
+        <span class="c1"># draw target</span>
+        <span class="n">tx</span><span class="p">,</span> <span class="n">ty</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_position</span>
+        <span class="n">cv2</span><span class="o">.</span><span class="n">rectangle</span><span class="p">(</span>
+            <span class="n">img</span><span class="p">,</span> <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="n">ty</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">,</span> <span class="n">tx</span> <span class="o">*</span> <span class="n">r</span> <span class="o">+</span> <span class="n">r</span><span class="p">),</span> <span class="p">(</span><span class="mi">255</span><span class="p">,</span> <span class="mi">165</span><span class="p">,</span> <span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span>
+        <span class="p">)</span>
+
+        <span class="c1"># draw robot</span>
+        <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">robot_position</span>
+        <span class="n">r</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span>  <span class="c1"># Not radius!</span>
+        <span class="c1"># last_observation = self._last_observation.get(robot_id, None)</span>
+        <span class="c1"># last_viz_observation = self._last_viz_observation.get(robot_id, None)</span>
+        <span class="c1"># last_belief = self._last_belief.get(robot_id, None)</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">TagViz</span><span class="o">.</span><span class="n">draw_belief</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_belief</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">3</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_target_color</span><span class="p">)</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">TagViz</span><span class="o">.</span><span class="n">draw_observation</span><span class="p">(</span>
+                <span class="n">img</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_last_observation</span><span class="p">,</span> <span class="n">rx</span><span class="p">,</span> <span class="n">ry</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">r</span> <span class="o">//</span> <span class="mi">8</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span> <span class="mi">20</span><span class="p">,</span> <span class="mi">180</span><span class="p">)</span>
+            <span class="p">)</span>
+
+        <span class="n">TagViz</span><span class="o">.</span><span class="n">draw_robot</span><span class="p">(</span><span class="n">img</span><span class="p">,</span> <span class="n">rx</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="n">ry</span> <span class="o">*</span> <span class="n">r</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="n">r</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="mi">200</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="mi">150</span><span class="p">))</span>
+        <span class="n">pygame</span><span class="o">.</span><span class="n">surfarray</span><span class="o">.</span><span class="n">blit_array</span><span class="p">(</span><span class="n">display_surf</span><span class="p">,</span> <span class="n">img</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># TODO! DEPRECATED!</span>
+<div class="viewcode-block" id="unittest">
+<a class="viewcode-back" href="../../../../problems/problems.tag.env.html#problems.tag.env.visual.unittest">[docs]</a>
+<span class="k">def</span> <span class="nf">unittest</span><span class="p">():</span>
+    <span class="n">worldmap</span><span class="p">,</span> <span class="n">robot</span> <span class="o">=</span> <span class="n">world0</span>
+    <span class="n">env</span> <span class="o">=</span> <span class="n">TagEnvironment</span><span class="o">.</span><span class="n">from_str</span><span class="p">(</span><span class="n">worldmap</span><span class="p">)</span>
+    <span class="n">observation_model</span> <span class="o">=</span> <span class="n">TagObservationModel</span><span class="p">()</span>
+    <span class="n">viz</span> <span class="o">=</span> <span class="n">TagViz</span><span class="p">(</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">observation_model</span><span class="o">=</span><span class="n">observation_model</span><span class="p">)</span>
+    <span class="n">viz</span><span class="o">.</span><span class="n">on_execute</span><span class="p">()</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">unittest</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/experiment.html b/docs/html/_modules/problems/tag/experiment.html
new file mode 100644
index 00000000..ec228483
--- /dev/null
+++ b/docs/html/_modules/problems/tag/experiment.html
@@ -0,0 +1,187 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.experiment &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.experiment</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;Simple experiment to get mean&quot;&quot;&quot;</span>
+
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.problem</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+
+
+<div class="viewcode-block" id="trial">
+<a class="viewcode-back" href="../../../problems/problems.tag.html#problems.tag.experiment.trial">[docs]</a>
+<span class="k">def</span> <span class="nf">trial</span><span class="p">(</span><span class="n">worldstr</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+    <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="o">.</span><span class="n">from_str</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">free_cells</span> <span class="o">=</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">free_cells</span><span class="p">()</span>
+    <span class="n">init_robot_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">init_target_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="n">problem</span> <span class="o">=</span> <span class="n">TagProblem</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">init_target_position</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
+    <span class="n">discounted_reward</span> <span class="o">=</span> <span class="n">solve</span><span class="p">(</span>
+        <span class="n">problem</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">15</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">planning_time</span><span class="o">=</span><span class="mf">0.7</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>
+        <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="k">return</span> <span class="n">discounted_reward</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../problems/problems.tag.html#problems.tag.experiment.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">all_rewards</span> <span class="o">=</span> <span class="p">[]</span>
+    <span class="k">try</span><span class="p">:</span>
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">100</span><span class="p">):</span>
+            <span class="n">dr</span> <span class="o">=</span> <span class="n">trial</span><span class="p">(</span><span class="n">world0</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">)</span>
+            <span class="n">all_rewards</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">dr</span><span class="p">)</span>
+    <span class="k">finally</span><span class="p">:</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;All done!&quot;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;---------&quot;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Average discounted reward: </span><span class="si">%.3f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">all_rewards</span><span class="p">)))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Std.dev discounted reward: </span><span class="si">%.3f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">all_rewards</span><span class="p">)))</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/models/components/grid_map.html b/docs/html/_modules/problems/tag/models/components/grid_map.html
new file mode 100644
index 00000000..ec1f8045
--- /dev/null
+++ b/docs/html/_modules/problems/tag/models/components/grid_map.html
@@ -0,0 +1,207 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.models.components.grid_map &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.models.components.grid_map</h1><div class="highlight"><pre>
+<span></span><span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.transition_model</span> <span class="kn">import</span> <span class="n">TagTransitionModel</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.multi_object_search.env.env</span> <span class="kn">import</span> <span class="n">interpret</span>
+
+
+<div class="viewcode-block" id="GridMap">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap">[docs]</a>
+<span class="k">class</span> <span class="nc">GridMap</span><span class="p">:</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">length</span><span class="p">,</span> <span class="n">obstacle_poses</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">length</span> <span class="o">=</span> <span class="n">length</span>
+        <span class="c1"># set of obstacle poses</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">obstacle_poses</span> <span class="o">=</span> <span class="n">obstacle_poses</span>
+
+<div class="viewcode-block" id="GridMap.valid_pose">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.valid_pose">[docs]</a>
+    <span class="k">def</span> <span class="nf">valid_pose</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">position</span><span class="p">):</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span>
+            <span class="n">position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">&gt;=</span> <span class="mi">0</span>
+            <span class="ow">and</span> <span class="n">position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span>
+            <span class="ow">and</span> <span class="n">position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">&gt;=</span> <span class="mi">0</span>
+            <span class="ow">and</span> <span class="n">position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">length</span>
+        <span class="p">):</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">if</span> <span class="n">position</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">obstacle_poses</span><span class="p">:</span>
+            <span class="k">return</span> <span class="kc">False</span>
+        <span class="k">return</span> <span class="kc">True</span></div>
+
+
+<div class="viewcode-block" id="GridMap.valid_motions">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.valid_motions">[docs]</a>
+    <span class="k">def</span> <span class="nf">valid_motions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">position</span><span class="p">,</span> <span class="n">all_motions</span><span class="o">=</span><span class="n">MOTION_ACTIONS</span><span class="p">):</span>
+        <span class="n">valid_motions</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="k">for</span> <span class="n">motion_action</span> <span class="ow">in</span> <span class="n">all_motions</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">TagTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">position</span><span class="p">,</span> <span class="n">motion_action</span><span class="p">)</span> <span class="o">==</span> <span class="n">position</span><span class="p">:</span>
+                <span class="k">continue</span>
+            <span class="n">valid_motions</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">motion_action</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">valid_motions</span></div>
+
+
+<div class="viewcode-block" id="GridMap.from_str">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.from_str">[docs]</a>
+    <span class="nd">@classmethod</span>
+    <span class="k">def</span> <span class="nf">from_str</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">worldstr</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="n">dim</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">objects</span><span class="p">,</span> <span class="n">obstacles</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">interpret</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+        <span class="n">obstacle_poses</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="k">for</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">objects</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">objid</span> <span class="ow">in</span> <span class="n">obstacles</span><span class="p">:</span>
+                <span class="n">obstacle_poses</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">objects</span><span class="p">[</span><span class="n">objid</span><span class="p">]</span><span class="o">.</span><span class="n">pose</span><span class="p">)</span>
+        <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="p">(</span><span class="n">dim</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">dim</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">obstacle_poses</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">grid_map</span></div>
+
+
+<div class="viewcode-block" id="GridMap.free_cells">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.free_cells">[docs]</a>
+    <span class="k">def</span> <span class="nf">free_cells</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="n">cells</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span>
+            <span class="p">{</span>
+                <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
+                <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">)</span>
+                <span class="k">for</span> <span class="n">y</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">length</span><span class="p">)</span>
+                <span class="k">if</span> <span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span> <span class="ow">not</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">obstacle_poses</span>
+            <span class="p">}</span>
+        <span class="p">)</span>
+        <span class="k">return</span> <span class="n">cells</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/models/components/motion_policy.html b/docs/html/_modules/problems/tag/models/components/motion_policy.html
new file mode 100644
index 00000000..b040c35f
--- /dev/null
+++ b/docs/html/_modules/problems/tag/models/components/motion_policy.html
@@ -0,0 +1,249 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.models.components.motion_policy &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../../index.html">
+    <img class="logo" src="../../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.models.components.motion_policy</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.utils.math</span> <span class="kn">import</span> <span class="n">euclidean_dist</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.problems.tag.constants</span> <span class="k">as</span> <span class="nn">constants</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.transition_model</span> <span class="kn">import</span> <span class="n">TagTransitionModel</span>
+
+
+<div class="viewcode-block" id="TagTargetMotionPolicy">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy">[docs]</a>
+<span class="k">class</span> <span class="nc">TagTargetMotionPolicy</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">GenerativeDistribution</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span>
+    <span class="p">):</span>  <span class="c1"># With 1.0 - pr_stay chance, the target moves away</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_pr_stay</span> <span class="o">=</span> <span class="n">pr_stay</span>
+
+    <span class="k">def</span> <span class="nf">_compute_candidate_actions</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span>
+    <span class="p">):</span>
+        <span class="n">candidate_actions</span> <span class="o">=</span> <span class="nb">set</span><span class="p">({})</span>
+        <span class="n">cur_dist</span> <span class="o">=</span> <span class="n">euclidean_dist</span><span class="p">(</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">)</span>
+        <span class="k">for</span> <span class="n">action</span> <span class="ow">in</span> <span class="n">valid_target_motion_actions</span><span class="p">:</span>
+            <span class="n">next_target_position</span> <span class="o">=</span> <span class="n">TagTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">action</span>
+            <span class="p">)</span>
+            <span class="n">next_dist</span> <span class="o">=</span> <span class="n">euclidean_dist</span><span class="p">(</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">next_target_position</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">next_dist</span> <span class="o">&gt;</span> <span class="n">cur_dist</span><span class="p">:</span>
+                <span class="n">candidate_actions</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">action</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">candidate_actions</span>
+
+<div class="viewcode-block" id="TagTargetMotionPolicy.probability">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">next_target_position</span><span class="p">,</span>
+        <span class="n">target_position</span><span class="p">,</span>
+        <span class="n">robot_position</span><span class="p">,</span>
+        <span class="n">valid_target_motion_actions</span><span class="p">,</span>
+    <span class="p">):</span>
+        <span class="c1"># If it is impossible to go from target position to the next,</span>
+        <span class="c1"># then it is a zero probability event.</span>
+        <span class="n">diff_x</span> <span class="o">=</span> <span class="nb">abs</span><span class="p">(</span><span class="n">next_target_position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">-</span> <span class="n">target_position</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+        <span class="n">diff_y</span> <span class="o">=</span> <span class="nb">abs</span><span class="p">(</span><span class="n">next_target_position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="n">target_position</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="p">(</span>
+            <span class="p">(</span><span class="n">diff_x</span> <span class="o">==</span> <span class="mi">1</span> <span class="ow">and</span> <span class="n">diff_y</span> <span class="o">==</span> <span class="mi">0</span><span class="p">)</span>
+            <span class="ow">or</span> <span class="p">(</span><span class="n">diff_x</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">diff_y</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
+            <span class="ow">or</span> <span class="p">(</span><span class="n">diff_x</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">diff_y</span> <span class="o">==</span> <span class="mi">0</span><span class="p">)</span>
+        <span class="p">):</span>
+            <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+
+        <span class="n">candidate_actions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_compute_candidate_actions</span><span class="p">(</span>
+            <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span>
+        <span class="p">)</span>
+        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">candidate_actions</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+            <span class="c1"># No action possible, yet next_target_position is a valid</span>
+            <span class="c1"># transition from current.</span>
+            <span class="k">if</span> <span class="n">next_target_position</span> <span class="o">==</span> <span class="n">target_position</span><span class="p">:</span>
+                <span class="c1"># That means the target is either</span>
+                <span class="c1"># stuck or staying. Either way, this is the only thing that</span>
+                <span class="c1"># can happen</span>
+                <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># There are candidate actions</span>
+            <span class="k">if</span> <span class="n">next_target_position</span> <span class="o">==</span> <span class="n">target_position</span><span class="p">:</span>
+                <span class="c1"># The object is staying</span>
+                <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pr_stay</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="c1"># The object has taken an adversarial action.</span>
+                <span class="k">for</span> <span class="n">action</span> <span class="ow">in</span> <span class="n">candidate_actions</span><span class="p">:</span>
+                    <span class="k">if</span> <span class="p">(</span>
+                        <span class="n">target_position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+                        <span class="n">target_position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span>
+                    <span class="p">)</span> <span class="o">==</span> <span class="n">next_target_position</span><span class="p">:</span>
+                        <span class="k">return</span> <span class="p">(</span><span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pr_stay</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">candidate_actions</span><span class="p">)</span>
+                    <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="TagTargetMotionPolicy.random">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.random">[docs]</a>
+    <span class="k">def</span> <span class="nf">random</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span><span class="p">,</span> <span class="n">mpe</span><span class="o">=</span><span class="kc">False</span>
+    <span class="p">):</span>
+        <span class="k">if</span> <span class="n">mpe</span> <span class="ow">or</span> <span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span> <span class="o">&gt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">_pr_stay</span><span class="p">:</span>
+            <span class="c1"># Move away; Pick motion actions that makes the target moves away from the robot</span>
+            <span class="n">candidate_actions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_compute_candidate_actions</span><span class="p">(</span>
+                <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span>
+            <span class="p">)</span>
+            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">candidate_actions</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">target_position</span>
+
+            <span class="n">chosen_action</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">candidate_actions</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+            <span class="k">return</span> <span class="n">TagTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">chosen_action</span>
+            <span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># stay</span>
+            <span class="k">return</span> <span class="n">target_position</span></div>
+
+
+<div class="viewcode-block" id="TagTargetMotionPolicy.mpe">
+<a class="viewcode-back" href="../../../../../problems/problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.mpe">[docs]</a>
+    <span class="k">def</span> <span class="nf">mpe</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">random</span><span class="p">(</span>
+            <span class="n">robot_position</span><span class="p">,</span> <span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span><span class="p">,</span> <span class="n">mpe</span><span class="o">=</span><span class="kc">True</span>
+        <span class="p">)</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/models/observation_model.html b/docs/html/_modules/problems/tag/models/observation_model.html
new file mode 100644
index 00000000..ac6add4f
--- /dev/null
+++ b/docs/html/_modules/problems/tag/models/observation_model.html
@@ -0,0 +1,186 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.models.observation_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.models.observation_model</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.observation</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.problems.tag.constants</span> <span class="k">as</span> <span class="nn">constants</span>
+
+
+<div class="viewcode-block" id="TagObservationModel">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">TagObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObservationModel</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;In this observation model, the robot deterministically</span>
+<span class="sd">    observes the target location when it is in the same grid cell</span>
+<span class="sd">    as the target. Ohterwise the robot does not observe anything.&quot;&quot;&quot;</span>
+
+<div class="viewcode-block" id="TagObservationModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">==</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">target_position</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">target_position</span> <span class="o">==</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">target_position</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span></div>
+
+
+<div class="viewcode-block" id="TagObservationModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;There is no stochaisticity in the observation model&quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">==</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">TagObservation</span><span class="p">(</span><span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">TagObservation</span><span class="p">(</span><span class="kc">None</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="TagObservationModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/models/policy_model.html b/docs/html/_modules/problems/tag/models/policy_model.html
new file mode 100644
index 00000000..2e6ccf42
--- /dev/null
+++ b/docs/html/_modules/problems/tag/models/policy_model.html
@@ -0,0 +1,176 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.models.policy_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.models.policy_model</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.models.transition_model</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="TagPolicyModel">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel">[docs]</a>
+<span class="k">class</span> <span class="nc">TagPolicyModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RolloutPolicy</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">grid_map</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+
+<div class="viewcode-block" id="TagPolicyModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+
+
+<div class="viewcode-block" id="TagPolicyModel.get_all_actions">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel.get_all_actions">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">state</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+                <span class="n">valid_motions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span>
+                    <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">all_motions</span><span class="o">=</span><span class="n">MOTION_ACTIONS</span>
+                <span class="p">)</span>
+                <span class="k">return</span> <span class="n">valid_motions</span> <span class="o">|</span> <span class="nb">set</span><span class="p">({</span><span class="n">TagAction</span><span class="p">()})</span>
+        <span class="k">return</span> <span class="n">MOTION_ACTIONS</span> <span class="o">|</span> <span class="nb">set</span><span class="p">({</span><span class="n">TagAction</span><span class="p">()})</span></div>
+
+
+<div class="viewcode-block" id="TagPolicyModel.rollout">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel.rollout">[docs]</a>
+    <span class="k">def</span> <span class="nf">rollout</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">(</span><span class="n">state</span><span class="o">=</span><span class="n">state</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="n">history</span><span class="p">),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/models/reward_model.html b/docs/html/_modules/problems/tag/models/reward_model.html
new file mode 100644
index 00000000..447c5c7d
--- /dev/null
+++ b/docs/html/_modules/problems/tag/models/reward_model.html
@@ -0,0 +1,180 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.models.reward_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.models.reward_model</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="TagRewardModel">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.reward_model.TagRewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">TagRewardModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RewardModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">small</span> <span class="o">=</span> <span class="n">small</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">big</span> <span class="o">=</span> <span class="n">big</span>
+
+<div class="viewcode-block" id="TagRewardModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.reward_model.TagRewardModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">reward</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">normalized</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span>
+    <span class="p">):</span>
+        <span class="k">if</span> <span class="n">reward</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">_reward_func</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+            <span class="k">return</span> <span class="mf">1.0</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">0.0</span></div>
+
+
+<div class="viewcode-block" id="TagRewardModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.reward_model.TagRewardModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">):</span>
+        <span class="c1"># deterministic</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_reward_func</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="nf">_reward_func</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+            <span class="k">return</span> <span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">small</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="c1"># Tag action</span>
+            <span class="k">assert</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">TagAction</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span> <span class="o">==</span> <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">:</span>
+                <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">big</span>
+            <span class="k">return</span> <span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">big</span></div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/models/transition_model.html b/docs/html/_modules/problems/tag/models/transition_model.html
new file mode 100644
index 00000000..b70de846
--- /dev/null
+++ b/docs/html/_modules/problems/tag/models/transition_model.html
@@ -0,0 +1,245 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.models.transition_model &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../../index.html">
+    <img class="logo" src="../../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.models.transition_model</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The Tag problem. Implemented according to the paper `Anytime Point-Based</span>
+<span class="sd">Approximations for Large POMDPs &lt;https://arxiv.org/pdf/1110.0027.pdf&gt;`_.</span>
+
+<span class="sd">Transition model: the robot moves deterministically. The target&#39;s movement</span>
+<span class="sd">    depends on the robot; With Pr=0.8 the target moves away from the robot,</span>
+<span class="sd">    and with Pr=0.2, the target stays at the same place. The target never</span>
+<span class="sd">    moves closer to the robot.</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">copy</span>
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">pomdp_py.problems.tag.constants</span> <span class="k">as</span> <span class="nn">constants</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.domain.action</span> <span class="kn">import</span> <span class="o">*</span>
+
+
+<div class="viewcode-block" id="TagTransitionModel">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">TagTransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">target_motion_policy</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span> <span class="o">=</span> <span class="n">grid_map</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">target_motion_policy</span> <span class="o">=</span> <span class="n">target_motion_policy</span>
+
+<div class="viewcode-block" id="TagTransitionModel.if_move_by">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.if_move_by">[docs]</a>
+    <span class="nd">@classmethod</span>
+    <span class="k">def</span> <span class="nf">if_move_by</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">position</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">MotionAction</span><span class="p">):</span>
+            <span class="n">dx</span><span class="p">,</span> <span class="n">dy</span> <span class="o">=</span> <span class="n">action</span><span class="o">.</span><span class="n">motion</span>
+            <span class="n">next_position</span> <span class="o">=</span> <span class="p">(</span><span class="n">position</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="n">dx</span><span class="p">,</span> <span class="n">position</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">dy</span><span class="p">)</span>
+            <span class="k">if</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">valid_pose</span><span class="p">(</span><span class="n">next_position</span><span class="p">):</span>
+                <span class="k">return</span> <span class="n">next_position</span>
+        <span class="k">return</span> <span class="n">position</span></div>
+
+
+<div class="viewcode-block" id="TagTransitionModel.probability">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="c1"># Robot motion</span>
+        <span class="n">expected_robot_position</span> <span class="o">=</span> <span class="n">TagTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">action</span>
+        <span class="p">)</span>
+        <span class="k">if</span> <span class="n">expected_robot_position</span> <span class="o">!=</span> <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">TagAction</span><span class="p">):</span>
+            <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span> <span class="o">==</span> <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">:</span>
+                <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+                <span class="k">else</span><span class="p">:</span>
+                    <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">constants</span><span class="o">.</span><span class="n">EPSILON</span>
+
+        <span class="c1"># Target motion</span>
+        <span class="n">valid_target_motion_actions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span>
+            <span class="n">state</span><span class="o">.</span><span class="n">target_position</span>
+        <span class="p">)</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_motion_policy</span><span class="o">.</span><span class="n">probability</span><span class="p">(</span>
+            <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span><span class="p">,</span>
+            <span class="n">state</span><span class="o">.</span><span class="n">target_position</span><span class="p">,</span>
+            <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span>
+            <span class="n">valid_target_motion_actions</span><span class="p">,</span>
+        <span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="TagTransitionModel.sample">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+        <span class="c1"># Robot motion</span>
+        <span class="n">next_state</span> <span class="o">=</span> <span class="n">copy</span><span class="o">.</span><span class="n">deepcopy</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+        <span class="n">next_state</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">=</span> <span class="n">TagTransitionModel</span><span class="o">.</span><span class="n">if_move_by</span><span class="p">(</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">action</span>
+        <span class="p">)</span>
+
+        <span class="c1"># If Tag action</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">TagAction</span><span class="p">):</span>
+            <span class="k">if</span> <span class="ow">not</span> <span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+                <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span> <span class="o">==</span> <span class="n">state</span><span class="o">.</span><span class="n">target_position</span><span class="p">:</span>
+                    <span class="n">next_state</span><span class="o">.</span><span class="n">target_found</span> <span class="o">=</span> <span class="kc">True</span>
+            <span class="k">return</span> <span class="n">next_state</span>
+
+        <span class="c1"># Target motion</span>
+        <span class="n">valid_target_motion_actions</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid_map</span><span class="o">.</span><span class="n">valid_motions</span><span class="p">(</span>
+            <span class="n">state</span><span class="o">.</span><span class="n">target_position</span>
+        <span class="p">)</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="n">argmax</span><span class="p">:</span>
+            <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_motion_policy</span><span class="o">.</span><span class="n">random</span><span class="p">(</span>
+                <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span>
+            <span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">next_state</span><span class="o">.</span><span class="n">target_position</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">target_motion_policy</span><span class="o">.</span><span class="n">mpe</span><span class="p">(</span>
+                <span class="n">state</span><span class="o">.</span><span class="n">robot_position</span><span class="p">,</span> <span class="n">state</span><span class="o">.</span><span class="n">target_position</span><span class="p">,</span> <span class="n">valid_target_motion_actions</span>
+            <span class="p">)</span>
+        <span class="k">return</span> <span class="n">next_state</span></div>
+
+
+<div class="viewcode-block" id="TagTransitionModel.argmax">
+<a class="viewcode-back" href="../../../../problems/problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.argmax">[docs]</a>
+    <span class="k">def</span> <span class="nf">argmax</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">argmax</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span></div>
+</div>
+
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tag/problem.html b/docs/html/_modules/problems/tag/problem.html
new file mode 100644
index 00000000..dfd2cd1f
--- /dev/null
+++ b/docs/html/_modules/problems/tag/problem.html
@@ -0,0 +1,319 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tag.problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tag.problem</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.env.env</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.env.visual</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.agent.agent</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.problems.tag.example_worlds</span> <span class="kn">import</span> <span class="o">*</span>
+<span class="kn">import</span> <span class="nn">time</span>
+
+
+<div class="viewcode-block" id="TagProblem">
+<a class="viewcode-back" href="../../../problems/problems.tag.html#problems.tag.problem.TagProblem">[docs]</a>
+<span class="k">class</span> <span class="nc">TagProblem</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMDP</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span>
+        <span class="n">init_robot_position</span><span class="p">,</span>
+        <span class="n">init_target_position</span><span class="p">,</span>
+        <span class="n">grid_map</span><span class="p">,</span>
+        <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span>
+        <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">,</span>
+        <span class="n">belief_type</span><span class="o">=</span><span class="s2">&quot;hist&quot;</span><span class="p">,</span>
+        <span class="n">num_particles</span><span class="o">=</span><span class="mi">6</span><span class="p">,</span>
+    <span class="p">):</span>
+        <span class="n">init_state</span> <span class="o">=</span> <span class="n">TagState</span><span class="p">(</span><span class="n">init_robot_position</span><span class="p">,</span> <span class="n">init_target_position</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
+        <span class="n">env</span> <span class="o">=</span> <span class="n">TagEnvironment</span><span class="p">(</span><span class="n">init_state</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="n">pr_stay</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;uniform&quot;</span><span class="p">:</span>
+            <span class="n">prior</span> <span class="o">=</span> <span class="p">{}</span>
+        <span class="k">elif</span> <span class="n">prior</span> <span class="o">==</span> <span class="s2">&quot;informed&quot;</span><span class="p">:</span>
+            <span class="n">prior</span> <span class="o">=</span> <span class="p">{</span><span class="n">init_target_position</span><span class="p">:</span> <span class="mf">1.0</span><span class="p">}</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Unrecognized prior type: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">prior</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">belief_type</span> <span class="o">==</span> <span class="s2">&quot;particles&quot;</span><span class="p">:</span>
+            <span class="n">init_belief</span> <span class="o">=</span> <span class="n">initialize_particles_belief</span><span class="p">(</span>
+                <span class="n">grid_map</span><span class="p">,</span> <span class="n">init_robot_position</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">,</span> <span class="n">num_particles</span><span class="o">=</span><span class="n">num_particles</span>
+            <span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">init_belief</span> <span class="o">=</span> <span class="n">initialize_belief</span><span class="p">(</span><span class="n">grid_map</span><span class="p">,</span> <span class="n">init_robot_position</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="n">prior</span><span class="p">)</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">TagAgent</span><span class="p">(</span><span class="n">init_belief</span><span class="p">,</span> <span class="n">grid_map</span><span class="p">,</span> <span class="n">pr_stay</span><span class="o">=</span><span class="n">pr_stay</span><span class="p">,</span> <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;TagProblem&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="solve">
+<a class="viewcode-back" href="../../../problems/problems.tag.html#problems.tag.problem.solve">[docs]</a>
+<span class="k">def</span> <span class="nf">solve</span><span class="p">(</span>
+    <span class="n">problem</span><span class="p">,</span>
+    <span class="n">planner_type</span><span class="o">=</span><span class="s2">&quot;pouct&quot;</span><span class="p">,</span>
+    <span class="n">max_depth</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>  <span class="c1"># planning horizon</span>
+    <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.99</span><span class="p">,</span>
+    <span class="n">planning_time</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>  <span class="c1"># amount of time (s) to plan each step</span>
+    <span class="n">exploration_const</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>  <span class="c1"># exploration constant</span>
+    <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="n">max_time</span><span class="o">=</span><span class="mi">120</span><span class="p">,</span>  <span class="c1"># maximum amount of time allowed to solve the problem</span>
+    <span class="n">max_steps</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+<span class="p">):</span>  <span class="c1"># maximum number of planning steps the agent can take.</span>
+    <span class="k">if</span> <span class="n">planner_type</span> <span class="o">==</span> <span class="s2">&quot;pouct&quot;</span><span class="p">:</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>
+    <span class="k">else</span><span class="p">:</span>
+        <span class="n">planner</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+            <span class="n">max_depth</span><span class="o">=</span><span class="n">max_depth</span><span class="p">,</span>
+            <span class="n">discount_factor</span><span class="o">=</span><span class="n">discount_factor</span><span class="p">,</span>
+            <span class="n">planning_time</span><span class="o">=</span><span class="n">planning_time</span><span class="p">,</span>
+            <span class="n">exploration_const</span><span class="o">=</span><span class="n">exploration_const</span><span class="p">,</span>
+            <span class="n">rollout_policy</span><span class="o">=</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="p">)</span>
+    <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+        <span class="n">viz</span> <span class="o">=</span> <span class="n">TagViz</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="p">,</span> <span class="n">controllable</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">viz</span><span class="o">.</span><span class="n">on_init</span><span class="p">()</span> <span class="o">==</span> <span class="kc">False</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">Exception</span><span class="p">(</span><span class="s2">&quot;Environment failed to initialize&quot;</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">)</span>
+        <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+    <span class="n">_discount</span> <span class="o">=</span> <span class="mf">1.0</span>
+    <span class="n">_time_used</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_find_actions_count</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="n">_total_reward</span> <span class="o">=</span> <span class="mi">0</span>  <span class="c1"># total, undiscounted reward</span>
+    <span class="n">_total_discounted_reward</span> <span class="o">=</span> <span class="mi">0</span>
+    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">max_steps</span><span class="p">):</span>
+        <span class="c1"># Plan action</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="k">break</span>  <span class="c1"># no more time to update.</span>
+
+        <span class="c1"># Execute action</span>
+        <span class="n">reward</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state_transition</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">execute</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+
+        <span class="c1"># Receive observation</span>
+        <span class="n">_start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">provide_observation</span><span class="p">(</span>
+            <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span> <span class="n">real_action</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Updates</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">clear_history</span><span class="p">()</span>  <span class="c1"># truncate history</span>
+        <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">planner_type</span> <span class="o">==</span> <span class="s2">&quot;pouct&quot;</span><span class="p">:</span>
+            <span class="n">belief_update</span><span class="p">(</span><span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">_time_used</span> <span class="o">+=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span> <span class="o">-</span> <span class="n">_start</span>
+
+        <span class="c1"># Info and render</span>
+        <span class="n">_total_reward</span> <span class="o">+=</span> <span class="n">reward</span>
+        <span class="n">_total_discounted_reward</span> <span class="o">+=</span> <span class="n">reward</span> <span class="o">*</span> <span class="n">_discount</span>
+        <span class="n">_discount</span> <span class="o">=</span> <span class="n">_discount</span> <span class="o">*</span> <span class="n">discount_factor</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Action: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_action</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Observation: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">real_observation</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward: </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Cumulative): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">_total_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward (Discounted): </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="nb">str</span><span class="p">(</span><span class="n">_total_discounted_reward</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Find Actions Count: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">_find_actions_count</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;__num_sims__: </span><span class="si">%d</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">visualize</span><span class="p">:</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">real_action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">,</span> <span class="n">problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">)</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_loop</span><span class="p">()</span>
+            <span class="n">viz</span><span class="o">.</span><span class="n">on_render</span><span class="p">()</span>
+
+        <span class="c1"># Termination check</span>
+        <span class="k">if</span> <span class="n">problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">target_found</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Done!&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_time_used</span> <span class="o">&gt;</span> <span class="n">max_time</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Maximum time reached.&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+        <span class="k">if</span> <span class="n">_discount</span> <span class="o">*</span> <span class="mi">10</span> <span class="o">&lt;</span> <span class="mf">1e-4</span><span class="p">:</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Discount factor already too small&quot;</span><span class="p">)</span>
+            <span class="k">break</span>
+
+    <span class="k">return</span> <span class="n">_total_discounted_reward</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../problems/problems.tag.html#problems.tag.problem.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">worldstr</span><span class="p">,</span> <span class="n">robotstr</span> <span class="o">=</span> <span class="n">world0</span>
+    <span class="n">grid_map</span> <span class="o">=</span> <span class="n">GridMap</span><span class="o">.</span><span class="n">from_str</span><span class="p">(</span><span class="n">worldstr</span><span class="p">)</span>
+    <span class="n">free_cells</span> <span class="o">=</span> <span class="n">grid_map</span><span class="o">.</span><span class="n">free_cells</span><span class="p">()</span>
+    <span class="n">init_robot_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+    <span class="n">init_target_position</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">free_cells</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+
+    <span class="n">problem</span> <span class="o">=</span> <span class="n">TagProblem</span><span class="p">(</span>
+        <span class="n">init_robot_position</span><span class="p">,</span>
+        <span class="n">init_target_position</span><span class="p">,</span>
+        <span class="n">grid_map</span><span class="p">,</span>
+        <span class="n">pr_stay</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span>
+        <span class="n">small</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">big</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
+        <span class="n">prior</span><span class="o">=</span><span class="s2">&quot;uniform&quot;</span><span class="p">,</span>
+        <span class="n">belief_type</span><span class="o">=</span><span class="s2">&quot;histogram&quot;</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">solve</span><span class="p">(</span>
+        <span class="n">problem</span><span class="p">,</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">15</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">planning_time</span><span class="o">=</span><span class="mf">0.8</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
+        <span class="n">visualize</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">max_time</span><span class="o">=</span><span class="mi">360</span><span class="p">,</span>
+        <span class="n">max_steps</span><span class="o">=</span><span class="mi">251</span><span class="p">,</span>
+        <span class="n">planner_type</span><span class="o">=</span><span class="s2">&quot;pouct&quot;</span><span class="p">,</span>
+    <span class="p">)</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_modules/problems/tiger/tiger_problem.html b/docs/html/_modules/problems/tiger/tiger_problem.html
new file mode 100644
index 00000000..aaae1506
--- /dev/null
+++ b/docs/html/_modules/problems/tiger/tiger_problem.html
@@ -0,0 +1,589 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../../../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>problems.tiger.tiger_problem &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/alabaster.css?v=51d35e29" />
+    <script src="../../../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../../../_static/doctools.js?v=888ff710"></script>
+    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../../../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../../../genindex.html" />
+    <link rel="search" title="Search" href="../../../search.html" />
+   
+  <link rel="stylesheet" href="../../../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../../../index.html">
+    <img class="logo" src="../../../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../../../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../problems/modules.html">problems</a></li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../../../index.html">Documentation overview</a><ul>
+  <li><a href="../../index.html">Module code</a><ul>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../../../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <h1>Source code for problems.tiger.tiger_problem</h1><div class="highlight"><pre>
+<span></span><span class="sd">&quot;&quot;&quot;The classic Tiger problem.</span>
+
+<span class="sd">This is a POMDP problem; Namely, it specifies both</span>
+<span class="sd">the POMDP (i.e. state, action, observation space)</span>
+<span class="sd">and the T/O/R for the agent as well as the environment.</span>
+
+<span class="sd">The description of the tiger problem is as follows: (Quote from</span>
+<span class="sd">`POMDP: Introduction to Partially Observable Markov Decision Processes</span>
+<span class="sd">&lt;https://cran.r-project.org/web/packages/pomdp/vignettes/POMDP.pdf&gt;`_ by</span>
+<span class="sd">Kamalzadeh and Hahsler )</span>
+
+<span class="sd">A tiger is put with equal probability behind one</span>
+<span class="sd">of two doors, while treasure is put behind the other one.</span>
+<span class="sd">You are standing in front of the two closed doors and</span>
+<span class="sd">need to decide which one to open. If you open the door</span>
+<span class="sd">with the tiger, you will get hurt (negative reward).</span>
+<span class="sd">But if you open the door with treasure, you receive</span>
+<span class="sd">a positive reward. Instead of opening a door right away,</span>
+<span class="sd">you also have the option to wait and listen for tiger noises. But</span>
+<span class="sd">listening is neither free nor entirely accurate. You might hear the</span>
+<span class="sd">tiger behind the left door while it is actually behind the right</span>
+<span class="sd">door and vice versa.</span>
+
+<span class="sd">States: tiger-left, tiger-right</span>
+<span class="sd">Actions: open-left, open-right, listen</span>
+<span class="sd">Rewards:</span>
+<span class="sd">    +10 for opening treasure door. -100 for opening tiger door.</span>
+<span class="sd">    -1 for listening.</span>
+<span class="sd">Observations: You can hear either &quot;tiger-left&quot;, or &quot;tiger-right&quot;.</span>
+
+<span class="sd">Note that in this example, the TigerProblem is a POMDP that</span>
+<span class="sd">also contains the agent and the environment as its fields. In</span>
+<span class="sd">general this doesn&#39;t need to be the case. (Refer to more</span>
+<span class="sd">complicated examples.)</span>
+<span class="sd">&quot;&quot;&quot;</span>
+
+<span class="kn">import</span> <span class="nn">pomdp_py</span>
+<span class="kn">from</span> <span class="nn">pomdp_py.utils</span> <span class="kn">import</span> <span class="n">TreeDebugger</span>
+<span class="kn">import</span> <span class="nn">random</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+<span class="kn">import</span> <span class="nn">sys</span>
+<span class="kn">import</span> <span class="nn">copy</span>
+
+
+<div class="viewcode-block" id="TigerState">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TigerState">[docs]</a>
+<span class="k">class</span> <span class="nc">TigerState</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">State</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">TigerState</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">return</span> <span class="kc">False</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;TigerState(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+<div class="viewcode-block" id="TigerState.other">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TigerState.other">[docs]</a>
+    <span class="k">def</span> <span class="nf">other</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;left&quot;</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-right&quot;</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">)</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="TigerAction">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TigerAction">[docs]</a>
+<span class="k">class</span> <span class="nc">TigerAction</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Action</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">TigerAction</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">return</span> <span class="kc">False</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;TigerAction(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span></div>
+
+
+
+<div class="viewcode-block" id="TigerObservation">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TigerObservation">[docs]</a>
+<span class="k">class</span> <span class="nc">TigerObservation</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">Observation</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">name</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__hash__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="nb">hash</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="fm">__eq__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">):</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">TigerObservation</span><span class="p">):</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+        <span class="k">return</span> <span class="kc">False</span>
+
+    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span>
+
+    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">return</span> <span class="s2">&quot;TigerObservation(</span><span class="si">%s</span><span class="s2">)&quot;</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">name</span></div>
+
+
+
+<span class="c1"># Observation model</span>
+<div class="viewcode-block" id="ObservationModel">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.ObservationModel">[docs]</a>
+<span class="k">class</span> <span class="nc">ObservationModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">ObservationModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">noise</span><span class="o">=</span><span class="mf">0.15</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">noise</span> <span class="o">=</span> <span class="n">noise</span>
+
+<div class="viewcode-block" id="ObservationModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.ObservationModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">observation</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;listen&quot;</span><span class="p">:</span>
+            <span class="c1"># heard the correct growl</span>
+            <span class="k">if</span> <span class="n">observation</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">next_state</span><span class="o">.</span><span class="n">name</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">noise</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">noise</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="mf">0.5</span></div>
+
+
+<div class="viewcode-block" id="ObservationModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.ObservationModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;listen&quot;</span><span class="p">:</span>
+            <span class="n">thresh</span> <span class="o">=</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">noise</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="n">thresh</span> <span class="o">=</span> <span class="mf">0.5</span>
+
+        <span class="k">if</span> <span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span> <span class="o">&lt;</span> <span class="n">thresh</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">TigerObservation</span><span class="p">(</span><span class="n">next_state</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">TigerObservation</span><span class="p">(</span><span class="n">next_state</span><span class="o">.</span><span class="n">other</span><span class="p">()</span><span class="o">.</span><span class="n">name</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="ObservationModel.get_all_observations">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.ObservationModel.get_all_observations">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_observations</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Only need to implement this if you&#39;re using</span>
+<span class="sd">        a solver that needs to enumerate over the observation space</span>
+<span class="sd">        (e.g. value iteration)&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="p">[</span><span class="n">TigerObservation</span><span class="p">(</span><span class="n">s</span><span class="p">)</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">,</span> <span class="s2">&quot;tiger-right&quot;</span><span class="p">}]</span></div>
+</div>
+
+
+
+<span class="c1"># Transition Model</span>
+<div class="viewcode-block" id="TransitionModel">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TransitionModel">[docs]</a>
+<span class="k">class</span> <span class="nc">TransitionModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">TransitionModel</span><span class="p">):</span>
+<div class="viewcode-block" id="TransitionModel.probability">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TransitionModel.probability">[docs]</a>
+    <span class="k">def</span> <span class="nf">probability</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">next_state</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;According to problem spec, the world resets once</span>
+<span class="sd">        action is open-left/open-right. Otherwise, stays the same&quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;open&quot;</span><span class="p">):</span>
+            <span class="k">return</span> <span class="mf">0.5</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">next_state</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="n">state</span><span class="o">.</span><span class="n">name</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="mf">1e-9</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mf">1e-9</span></div>
+
+
+<div class="viewcode-block" id="TransitionModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TransitionModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;open&quot;</span><span class="p">):</span>
+            <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_states</span><span class="p">())</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="k">return</span> <span class="n">TigerState</span><span class="p">(</span><span class="n">state</span><span class="o">.</span><span class="n">name</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="TransitionModel.get_all_states">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TransitionModel.get_all_states">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_states</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Only need to implement this if you&#39;re using</span>
+<span class="sd">        a solver that needs to enumerate over the observation space (e.g. value iteration)</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="p">[</span><span class="n">TigerState</span><span class="p">(</span><span class="n">s</span><span class="p">)</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">,</span> <span class="s2">&quot;tiger-right&quot;</span><span class="p">}]</span></div>
+</div>
+
+
+
+<span class="c1"># Reward Model</span>
+<div class="viewcode-block" id="RewardModel">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.RewardModel">[docs]</a>
+<span class="k">class</span> <span class="nc">RewardModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RewardModel</span><span class="p">):</span>
+    <span class="k">def</span> <span class="nf">_reward_func</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">):</span>
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;open-left&quot;</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;tiger-right&quot;</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mi">10</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="o">-</span><span class="mi">100</span>
+        <span class="k">elif</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;open-right&quot;</span><span class="p">:</span>
+            <span class="k">if</span> <span class="n">state</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;tiger-left&quot;</span><span class="p">:</span>
+                <span class="k">return</span> <span class="mi">10</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="k">return</span> <span class="o">-</span><span class="mi">100</span>
+        <span class="k">else</span><span class="p">:</span>  <span class="c1"># listen</span>
+            <span class="k">return</span> <span class="o">-</span><span class="mi">1</span>
+
+<div class="viewcode-block" id="RewardModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.RewardModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">next_state</span><span class="p">):</span>
+        <span class="c1"># deterministic</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_reward_func</span><span class="p">(</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">)</span></div>
+</div>
+
+
+
+<span class="c1"># Policy Model</span>
+<div class="viewcode-block" id="PolicyModel">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.PolicyModel">[docs]</a>
+<span class="k">class</span> <span class="nc">PolicyModel</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">RolloutPolicy</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;A simple policy model with uniform prior over a</span>
+<span class="sd">    small, finite action space&quot;&quot;&quot;</span>
+
+    <span class="n">ACTIONS</span> <span class="o">=</span> <span class="p">[</span><span class="n">TigerAction</span><span class="p">(</span><span class="n">s</span><span class="p">)</span> <span class="k">for</span> <span class="n">s</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;open-left&quot;</span><span class="p">,</span> <span class="s2">&quot;open-right&quot;</span><span class="p">,</span> <span class="s2">&quot;listen&quot;</span><span class="p">}]</span>
+
+<div class="viewcode-block" id="PolicyModel.sample">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.sample">[docs]</a>
+    <span class="k">def</span> <span class="nf">sample</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">random</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_all_actions</span><span class="p">(),</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span></div>
+
+
+<div class="viewcode-block" id="PolicyModel.rollout">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.rollout">[docs]</a>
+    <span class="k">def</span> <span class="nf">rollout</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Treating this PolicyModel as a rollout policy&quot;&quot;&quot;</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span><span class="n">state</span><span class="p">)</span></div>
+
+
+<div class="viewcode-block" id="PolicyModel.get_all_actions">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.get_all_actions">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_all_actions</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">state</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">history</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+        <span class="k">return</span> <span class="n">PolicyModel</span><span class="o">.</span><span class="n">ACTIONS</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="TigerProblem">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TigerProblem">[docs]</a>
+<span class="k">class</span> <span class="nc">TigerProblem</span><span class="p">(</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMDP</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    In fact, creating a TigerProblem class is entirely optional</span>
+<span class="sd">    to simulate and solve POMDPs. But this is just an example</span>
+<span class="sd">    of how such a class can be created.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+
+    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">obs_noise</span><span class="p">,</span> <span class="n">init_true_state</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;init_belief is a Distribution.&quot;&quot;&quot;</span>
+        <span class="n">agent</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Agent</span><span class="p">(</span>
+            <span class="n">init_belief</span><span class="p">,</span>
+            <span class="n">PolicyModel</span><span class="p">(),</span>
+            <span class="n">TransitionModel</span><span class="p">(),</span>
+            <span class="n">ObservationModel</span><span class="p">(</span><span class="n">obs_noise</span><span class="p">),</span>
+            <span class="n">RewardModel</span><span class="p">(),</span>
+        <span class="p">)</span>
+        <span class="n">env</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Environment</span><span class="p">(</span><span class="n">init_true_state</span><span class="p">,</span> <span class="n">TransitionModel</span><span class="p">(),</span> <span class="n">RewardModel</span><span class="p">())</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">agent</span><span class="p">,</span> <span class="n">env</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s2">&quot;TigerProblem&quot;</span><span class="p">)</span>
+
+<div class="viewcode-block" id="TigerProblem.create">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.TigerProblem.create">[docs]</a>
+    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">create</span><span class="p">(</span><span class="n">state</span><span class="o">=</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">,</span> <span class="n">belief</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">obs_noise</span><span class="o">=</span><span class="mf">0.15</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">        Args:</span>
+<span class="sd">            state (str): could be &#39;tiger-left&#39; or &#39;tiger-right&#39;;</span>
+<span class="sd">                         True state of the environment</span>
+<span class="sd">            belief (float): Initial belief that the target is</span>
+<span class="sd">                            on the left; Between 0-1.</span>
+<span class="sd">            obs_noise (float): Noise for the observation</span>
+<span class="sd">                               model (default 0.15)</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="n">init_true_state</span> <span class="o">=</span> <span class="n">TigerState</span><span class="p">(</span><span class="n">state</span><span class="p">)</span>
+        <span class="n">init_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">(</span>
+            <span class="p">{</span><span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">):</span> <span class="n">belief</span><span class="p">,</span> <span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-right&quot;</span><span class="p">):</span> <span class="mf">1.0</span> <span class="o">-</span> <span class="n">belief</span><span class="p">}</span>
+        <span class="p">)</span>
+        <span class="n">tiger_problem</span> <span class="o">=</span> <span class="n">TigerProblem</span><span class="p">(</span><span class="n">obs_noise</span><span class="p">,</span> <span class="n">init_true_state</span><span class="p">,</span> <span class="n">init_belief</span><span class="p">)</span>
+        <span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">set_belief</span><span class="p">(</span><span class="n">init_belief</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">tiger_problem</span></div>
+</div>
+
+
+
+<div class="viewcode-block" id="test_planner">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.test_planner">[docs]</a>
+<span class="k">def</span> <span class="nf">test_planner</span><span class="p">(</span><span class="n">tiger_problem</span><span class="p">,</span> <span class="n">planner</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">debug_tree</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+<span class="sd">    Runs the action-feedback loop of Tiger problem POMDP</span>
+
+<span class="sd">    Args:</span>
+<span class="sd">        tiger_problem (TigerProblem): a problem instance</span>
+<span class="sd">        planner (Planner): a planner</span>
+<span class="sd">        nsteps (int): Maximum number of steps to run this loop.</span>
+<span class="sd">        debug_tree (bool): True if get into the pdb with a</span>
+<span class="sd">                           TreeDebugger created as &#39;dd&#39; variable.</span>
+<span class="sd">    &quot;&quot;&quot;</span>
+    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">nsteps</span><span class="p">):</span>
+        <span class="n">action</span> <span class="o">=</span> <span class="n">planner</span><span class="o">.</span><span class="n">plan</span><span class="p">(</span><span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="p">)</span>
+        <span class="k">if</span> <span class="n">debug_tree</span><span class="p">:</span>
+            <span class="kn">from</span> <span class="nn">pomdp_py.utils</span> <span class="kn">import</span> <span class="n">TreeDebugger</span>
+
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;==== Step </span><span class="si">%d</span><span class="s2"> ====&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">))</span>
+        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;True state: </span><span class="si">{</span><span class="n">tiger_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Belief: </span><span class="si">{</span><span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Action: </span><span class="si">{</span><span class="n">action</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+        <span class="c1"># There is no state transition for the tiger domain.</span>
+        <span class="c1"># In general, the ennvironment state can be transitioned</span>
+        <span class="c1"># using</span>
+        <span class="c1">#</span>
+        <span class="c1">#   reward = tiger_problem.env.state_transition(action, execute=True)</span>
+        <span class="c1">#</span>
+        <span class="c1"># Or, it is possible that you don&#39;t have control</span>
+        <span class="c1"># over the environment change (e.g. robot acting</span>
+        <span class="c1"># in real world); In that case, you could skip</span>
+        <span class="c1"># the state transition and re-estimate the state</span>
+        <span class="c1"># (e.g. through the perception stack on the robot).</span>
+        <span class="n">reward</span> <span class="o">=</span> <span class="n">tiger_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">reward_model</span><span class="o">.</span><span class="n">sample</span><span class="p">(</span>
+            <span class="n">tiger_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="kc">None</span>
+        <span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Reward:&quot;</span><span class="p">,</span> <span class="n">reward</span><span class="p">)</span>
+
+        <span class="c1"># Let&#39;s create some simulated real observation;</span>
+        <span class="c1"># Here, we use observation based on true state for sanity</span>
+        <span class="c1"># checking solver behavior. In general, this observation</span>
+        <span class="c1"># should be sampled from agent&#39;s observation model, as</span>
+        <span class="c1">#</span>
+        <span class="c1">#    real_observation = tiger_problem.agent.observation_model.sample(tiger_problem.env.state, action)</span>
+        <span class="c1">#</span>
+        <span class="c1"># or coming from an external source (e.g. robot sensor</span>
+        <span class="c1"># reading). Note that tiger_problem.env.state stores the</span>
+        <span class="c1"># environment state after action execution.</span>
+        <span class="n">real_observation</span> <span class="o">=</span> <span class="n">TigerObservation</span><span class="p">(</span><span class="n">tiger_problem</span><span class="o">.</span><span class="n">env</span><span class="o">.</span><span class="n">state</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;&gt;&gt; Observation:&quot;</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">update_history</span><span class="p">(</span><span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+
+        <span class="c1"># Update the belief. If the planner is POMCP, planner.update</span>
+        <span class="c1"># also automatically updates agent belief.</span>
+        <span class="n">planner</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="p">,</span> <span class="n">action</span><span class="p">,</span> <span class="n">real_observation</span><span class="p">)</span>
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">planner</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">):</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Num sims:&quot;</span><span class="p">,</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_num_sims</span><span class="p">)</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Plan time: </span><span class="si">%.5f</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="n">planner</span><span class="o">.</span><span class="n">last_planning_time</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">,</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">):</span>
+            <span class="n">new_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">update_histogram_belief</span><span class="p">(</span>
+                <span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">cur_belief</span><span class="p">,</span>
+                <span class="n">action</span><span class="p">,</span>
+                <span class="n">real_observation</span><span class="p">,</span>
+                <span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">observation_model</span><span class="p">,</span>
+                <span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">transition_model</span><span class="p">,</span>
+            <span class="p">)</span>
+            <span class="n">tiger_problem</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">set_belief</span><span class="p">(</span><span class="n">new_belief</span><span class="p">)</span>
+
+        <span class="k">if</span> <span class="n">action</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;open&quot;</span><span class="p">):</span>
+            <span class="c1"># Make it clearer to see what actions are taken</span>
+            <span class="c1"># until every time door is opened.</span>
+            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span></div>
+
+
+
+<div class="viewcode-block" id="make_tiger">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.make_tiger">[docs]</a>
+<span class="k">def</span> <span class="nf">make_tiger</span><span class="p">(</span><span class="n">noise</span><span class="o">=</span><span class="mf">0.15</span><span class="p">,</span> <span class="n">init_state</span><span class="o">=</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">,</span> <span class="n">init_belief</span><span class="o">=</span><span class="p">[</span><span class="mf">0.5</span><span class="p">,</span> <span class="mf">0.5</span><span class="p">]):</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;Convenient function to quickly build a tiger domain.</span>
+<span class="sd">    Useful for testing&quot;&quot;&quot;</span>
+    <span class="n">tiger</span> <span class="o">=</span> <span class="n">TigerProblem</span><span class="p">(</span>
+        <span class="n">noise</span><span class="p">,</span>
+        <span class="n">TigerState</span><span class="p">(</span><span class="n">init_state</span><span class="p">),</span>
+        <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">(</span>
+            <span class="p">{</span>
+                <span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">):</span> <span class="n">init_belief</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span>
+                <span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-right&quot;</span><span class="p">):</span> <span class="n">init_belief</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span>
+            <span class="p">}</span>
+        <span class="p">),</span>
+    <span class="p">)</span>
+    <span class="k">return</span> <span class="n">tiger</span></div>
+
+
+
+<div class="viewcode-block" id="main">
+<a class="viewcode-back" href="../../../problems/problems.tiger.html#problems.tiger.tiger_problem.main">[docs]</a>
+<span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
+    <span class="n">init_true_state</span> <span class="o">=</span> <span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">([</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">,</span> <span class="s2">&quot;tiger-right&quot;</span><span class="p">])</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Histogram</span><span class="p">(</span>
+        <span class="p">{</span><span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-left&quot;</span><span class="p">):</span> <span class="mf">0.5</span><span class="p">,</span> <span class="n">TigerState</span><span class="p">(</span><span class="s2">&quot;tiger-right&quot;</span><span class="p">):</span> <span class="mf">0.5</span><span class="p">}</span>
+    <span class="p">)</span>
+    <span class="n">tiger</span> <span class="o">=</span> <span class="n">make_tiger</span><span class="p">(</span><span class="n">init_state</span><span class="o">=</span><span class="n">init_true_state</span><span class="p">)</span>
+    <span class="n">init_belief</span> <span class="o">=</span> <span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">belief</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;** Testing value iteration **&quot;</span><span class="p">)</span>
+    <span class="n">vi</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">ValueIteration</span><span class="p">(</span><span class="n">horizon</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">)</span>
+    <span class="n">test_planner</span><span class="p">(</span><span class="n">tiger</span><span class="p">,</span> <span class="n">vi</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">3</span><span class="p">)</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">** Testing POUCT **&quot;</span><span class="p">)</span>
+    <span class="n">pouct</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POUCT</span><span class="p">(</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">num_sims</span><span class="o">=</span><span class="mi">4096</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span>
+        <span class="n">rollout_policy</span><span class="o">=</span><span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="n">show_progress</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">test_planner</span><span class="p">(</span><span class="n">tiger</span><span class="p">,</span> <span class="n">pouct</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
+    <span class="n">TreeDebugger</span><span class="p">(</span><span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">tree</span><span class="p">)</span><span class="o">.</span><span class="n">pp</span>
+
+    <span class="c1"># Reset agent belief</span>
+    <span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">set_belief</span><span class="p">(</span><span class="n">init_belief</span><span class="p">,</span> <span class="n">prior</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+    <span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">tree</span> <span class="o">=</span> <span class="kc">None</span>
+
+    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;** Testing POMCP **&quot;</span><span class="p">)</span>
+    <span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">set_belief</span><span class="p">(</span>
+        <span class="n">pomdp_py</span><span class="o">.</span><span class="n">Particles</span><span class="o">.</span><span class="n">from_histogram</span><span class="p">(</span><span class="n">init_belief</span><span class="p">,</span> <span class="n">num_particles</span><span class="o">=</span><span class="mi">100</span><span class="p">),</span> <span class="n">prior</span><span class="o">=</span><span class="kc">True</span>
+    <span class="p">)</span>
+    <span class="n">pomcp</span> <span class="o">=</span> <span class="n">pomdp_py</span><span class="o">.</span><span class="n">POMCP</span><span class="p">(</span>
+        <span class="n">max_depth</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
+        <span class="n">discount_factor</span><span class="o">=</span><span class="mf">0.95</span><span class="p">,</span>
+        <span class="n">num_sims</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span>
+        <span class="n">exploration_const</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span>
+        <span class="n">rollout_policy</span><span class="o">=</span><span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">policy_model</span><span class="p">,</span>
+        <span class="n">show_progress</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">pbar_update_interval</span><span class="o">=</span><span class="mi">500</span><span class="p">,</span>
+    <span class="p">)</span>
+    <span class="n">test_planner</span><span class="p">(</span><span class="n">tiger</span><span class="p">,</span> <span class="n">pomcp</span><span class="p">,</span> <span class="n">nsteps</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
+    <span class="n">TreeDebugger</span><span class="p">(</span><span class="n">tiger</span><span class="o">.</span><span class="n">agent</span><span class="o">.</span><span class="n">tree</span><span class="p">)</span><span class="o">.</span><span class="n">pp</span></div>
+
+
+
+<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
+    <span class="n">main</span><span class="p">()</span>
+</pre></div>
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/_sources/api/modules.rst.txt b/docs/html/_sources/api/modules.rst.txt
index a7d235a8..7d2b9ddd 100644
--- a/docs/html/_sources/api/modules.rst.txt
+++ b/docs/html/_sources/api/modules.rst.txt
@@ -5,3 +5,4 @@ pomdp_py
    :maxdepth: 4
 
    pomdp_py
+   pomdp_py.problems
diff --git a/docs/html/_sources/api/pomdp_py.problems.light_dark.rst.txt b/docs/html/_sources/api/pomdp_py.problems.light_dark.rst.txt
index 3dc382ef..e11f5d4a 100644
--- a/docs/html/_sources/api/pomdp_py.problems.light_dark.rst.txt
+++ b/docs/html/_sources/api/pomdp_py.problems.light_dark.rst.txt
@@ -1,6 +1,8 @@
 pomdp\_py.problems.light\_dark package
 ======================================
 
+.. include:: ../../../pomdp_py/problems/light_dark/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/html/_sources/api/pomdp_py.problems.load_unload.rst.txt b/docs/html/_sources/api/pomdp_py.problems.load_unload.rst.txt
index 0c600479..bf357ffa 100644
--- a/docs/html/_sources/api/pomdp_py.problems.load_unload.rst.txt
+++ b/docs/html/_sources/api/pomdp_py.problems.load_unload.rst.txt
@@ -1,6 +1,8 @@
 pomdp\_py.problems.load\_unload package
 =======================================
 
+.. include:: ../../../pomdp_py/problems/load_unload/README.rst
+
 Submodules
 ----------
 
diff --git a/docs/html/_sources/api/pomdp_py.problems.maze.rst.txt b/docs/html/_sources/api/pomdp_py.problems.maze.rst.txt
index b30ee522..f780b7f6 100644
--- a/docs/html/_sources/api/pomdp_py.problems.maze.rst.txt
+++ b/docs/html/_sources/api/pomdp_py.problems.maze.rst.txt
@@ -1,6 +1,8 @@
 pomdp\_py.problems.maze package
 ===============================
 
+.. include:: ../../../pomdp_py/problems/maze/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/html/_sources/api/pomdp_py.problems.multi_object_search.rst.txt b/docs/html/_sources/api/pomdp_py.problems.multi_object_search.rst.txt
index 229f9e56..2d03418d 100644
--- a/docs/html/_sources/api/pomdp_py.problems.multi_object_search.rst.txt
+++ b/docs/html/_sources/api/pomdp_py.problems.multi_object_search.rst.txt
@@ -1,6 +1,8 @@
 pomdp\_py.problems.multi\_object\_search package
 ================================================
 
+.. include:: ../../../pomdp_py/problems/multi_object_search/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/html/_sources/api/pomdp_py.problems.rocksample.rst.txt b/docs/html/_sources/api/pomdp_py.problems.rocksample.rst.txt
index 81374a6d..00764146 100644
--- a/docs/html/_sources/api/pomdp_py.problems.rocksample.rst.txt
+++ b/docs/html/_sources/api/pomdp_py.problems.rocksample.rst.txt
@@ -1,6 +1,8 @@
 pomdp\_py.problems.rocksample package
 =====================================
 
+.. include:: ../../../pomdp_py/problems/rocksample/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/html/_sources/api/pomdp_py.problems.tiger.rst.txt b/docs/html/_sources/api/pomdp_py.problems.tiger.rst.txt
index ada2838a..c2e06ded 100644
--- a/docs/html/_sources/api/pomdp_py.problems.tiger.rst.txt
+++ b/docs/html/_sources/api/pomdp_py.problems.tiger.rst.txt
@@ -1,6 +1,8 @@
 pomdp\_py.problems.tiger package
 ================================
 
+.. include:: ../../../pomdp_py/problems/tiger/README.rst
+
 Subpackages
 -----------
 
diff --git a/docs/html/_sources/building_docs.rst.txt b/docs/html/_sources/building_docs.rst.txt
index 9367fd1c..5efe5c8e 100644
--- a/docs/html/_sources/building_docs.rst.txt
+++ b/docs/html/_sources/building_docs.rst.txt
@@ -44,7 +44,7 @@ Building docs for `pomdp_py.problems`
 
 2. Building docs for `pomdp_py`. Run :code:`sphinx-apidoc`::
 
-    sphinx-apidoc -o problems/ ../../pomdp_py.problems
+    sphinx-apidoc -o problems/ ../../pomdp_py/problems
 
 3. Generate web pages::
 
@@ -54,13 +54,13 @@ Building docs for `pomdp_py.problems`
 
 Note that when creating the documentation for a problem under :code:`pomdp_py.problems`,
 you may want to re-use the README file on github for the documentation. To do that,
-first create a read-me file at :code:`pomdp_py.problems/<problem>/README.rst` with desirable
+first create a read-me file at :code:`pomdp_py/problems/<problem>/README.rst` with desirable
 content that describes the problem. Then, include this read-me file at the top of the
 generated :code:`pomdp_py.problems.<problem>.rst`, like so:
 
 .. code-block::
 
-   .. include:: ../../../pomdp_py.problems/<problem>/README.rst
+   .. include:: ../../../pomdp_py/problems/<problem>/README.rst
 
 
 Note on Changelog
diff --git a/docs/html/_sources/changelog.rst.txt b/docs/html/_sources/changelog.rst.txt
index 694f23d1..b81c31ec 100644
--- a/docs/html/_sources/changelog.rst.txt
+++ b/docs/html/_sources/changelog.rst.txt
@@ -3,6 +3,32 @@ Changelog
 
 Best viewed on `the website <https://h2r.github.io/pomdp-py/html/changelog.html>`_.
 
+Version 1.3.5 (03/12/2024)
+--------------------------
+* Refactored :code:`_search` in :py:mod:`~pomdp_py.algorithms.po_uct.POUCT` to be more modular
+* More fields made accessible for :py:mod:`~pomdp_py.algorithms.po_uct.POUCT`
+* Allows initializing :py:mod:`~pomdp_py.framework.basics.Agent` and :py:mod:`~pomdp_py.framework.basics.Environment` without all models ready, and provide those models later (or update them) by :code:`set_models`
+* Minor function renaming for :py:mod:`~pomdp_py.framework.basics.Option`
+* Added :py:mod:`~pomdp_py.framework.oopomdp.DictState`
+* Improved modularity and documentation for the RockSample example
+* :py:mod:`~pomdp_py.representations.distribution.particles.WeightedParticles` now hashable if frozen.
+* Changed :code:`det_dict_hash` to not use sorting
+* Added a GHA workflow  for automatically building, releasing wheels and uploading them to PyPI
+* Repo convention: default branch renamed from :code:`master` to :code:`main`, and :code:`dev-latest` is the development branch.
+
+
+WeightedParticles now hashable if frozen
+Refactor _search in POUCT for more modularity
+added a workflow that builds wheel
+*
+
+Modernize repo without introducing new features.
+* Migrate to :code:`pyproject.toml` to specify dependencies, with minimal :code:`setup.py` to build Cython extensions.
+* Separate core and optional dependencies. Optional dependencies are needed only for `pomdp_py.problems`.
+* Added CI testing to repo.
+* Added pre-commit checks to repo.
+
+
 Version 1.3.4 (01/26/2024)
 --------------------------
 * Modernize repo without introducing new features.
diff --git a/docs/html/_sources/index.rst.txt b/docs/html/_sources/index.rst.txt
index 8601b6b1..b2979662 100644
--- a/docs/html/_sources/index.rst.txt
+++ b/docs/html/_sources/index.rst.txt
@@ -40,7 +40,6 @@ Further
 * :doc:`extensions`
 * :doc:`other_libraries`
 * :doc:`building_docs`
-* :doc:`simple_rl_integration`
 
 .. toctree::
    :maxdepth: 2
@@ -76,7 +75,6 @@ API References
    :caption: API References
 
    api/modules
-   problems/modules
 
 Tools
 -----
diff --git a/docs/html/_sources/problems/modules.rst.txt b/docs/html/_sources/problems/modules.rst.txt
new file mode 100644
index 00000000..614ddc7a
--- /dev/null
+++ b/docs/html/_sources/problems/modules.rst.txt
@@ -0,0 +1,7 @@
+problems
+========
+
+.. toctree::
+   :maxdepth: 4
+
+   problems
diff --git a/docs/html/_sources/problems/problems.lasertag.rst.txt b/docs/html/_sources/problems/problems.lasertag.rst.txt
new file mode 100644
index 00000000..31b8b460
--- /dev/null
+++ b/docs/html/_sources/problems/problems.lasertag.rst.txt
@@ -0,0 +1,10 @@
+problems.lasertag package
+=========================
+
+Module contents
+---------------
+
+.. automodule:: problems.lasertag
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.light_dark.agent.rst.txt b/docs/html/_sources/problems/problems.light_dark.agent.rst.txt
new file mode 100644
index 00000000..9b1be80f
--- /dev/null
+++ b/docs/html/_sources/problems/problems.light_dark.agent.rst.txt
@@ -0,0 +1,21 @@
+problems.light\_dark.agent package
+==================================
+
+Submodules
+----------
+
+problems.light\_dark.agent.belief module
+----------------------------------------
+
+.. automodule:: problems.light_dark.agent.belief
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.light_dark.agent
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.light_dark.domain.rst.txt b/docs/html/_sources/problems/problems.light_dark.domain.rst.txt
new file mode 100644
index 00000000..58431bcb
--- /dev/null
+++ b/docs/html/_sources/problems/problems.light_dark.domain.rst.txt
@@ -0,0 +1,37 @@
+problems.light\_dark.domain package
+===================================
+
+Submodules
+----------
+
+problems.light\_dark.domain.action module
+-----------------------------------------
+
+.. automodule:: problems.light_dark.domain.action
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.light\_dark.domain.observation module
+----------------------------------------------
+
+.. automodule:: problems.light_dark.domain.observation
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.light\_dark.domain.state module
+----------------------------------------
+
+.. automodule:: problems.light_dark.domain.state
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.light_dark.domain
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.light_dark.env.rst.txt b/docs/html/_sources/problems/problems.light_dark.env.rst.txt
new file mode 100644
index 00000000..7c2896ea
--- /dev/null
+++ b/docs/html/_sources/problems/problems.light_dark.env.rst.txt
@@ -0,0 +1,37 @@
+problems.light\_dark.env package
+================================
+
+Submodules
+----------
+
+problems.light\_dark.env.env module
+-----------------------------------
+
+.. automodule:: problems.light_dark.env.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.light\_dark.env.plotting module
+----------------------------------------
+
+.. automodule:: problems.light_dark.env.plotting
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.light\_dark.env.visual module
+--------------------------------------
+
+.. automodule:: problems.light_dark.env.visual
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.light_dark.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.light_dark.models.rst.txt b/docs/html/_sources/problems/problems.light_dark.models.rst.txt
new file mode 100644
index 00000000..8a7ecf3e
--- /dev/null
+++ b/docs/html/_sources/problems/problems.light_dark.models.rst.txt
@@ -0,0 +1,29 @@
+problems.light\_dark.models package
+===================================
+
+Submodules
+----------
+
+problems.light\_dark.models.observation\_model module
+-----------------------------------------------------
+
+.. automodule:: problems.light_dark.models.observation_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.light\_dark.models.transition\_model module
+----------------------------------------------------
+
+.. automodule:: problems.light_dark.models.transition_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.light_dark.models
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.light_dark.rst.txt b/docs/html/_sources/problems/problems.light_dark.rst.txt
new file mode 100644
index 00000000..d50a4c3b
--- /dev/null
+++ b/docs/html/_sources/problems/problems.light_dark.rst.txt
@@ -0,0 +1,40 @@
+problems.light\_dark package
+============================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.light_dark.agent
+   problems.light_dark.domain
+   problems.light_dark.env
+   problems.light_dark.models
+
+Submodules
+----------
+
+problems.light\_dark.problem\_discrete module
+---------------------------------------------
+
+.. automodule:: problems.light_dark.problem_discrete
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.light\_dark.test module
+--------------------------------
+
+.. automodule:: problems.light_dark.test
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.light_dark
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.load_unload.rst.txt b/docs/html/_sources/problems/problems.load_unload.rst.txt
new file mode 100644
index 00000000..9a147284
--- /dev/null
+++ b/docs/html/_sources/problems/problems.load_unload.rst.txt
@@ -0,0 +1,21 @@
+problems.load\_unload package
+=============================
+
+Submodules
+----------
+
+problems.load\_unload.load\_unload module
+-----------------------------------------
+
+.. automodule:: problems.load_unload.load_unload
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.load_unload
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.maze.domain.rst.txt b/docs/html/_sources/problems/problems.maze.domain.rst.txt
new file mode 100644
index 00000000..7553acea
--- /dev/null
+++ b/docs/html/_sources/problems/problems.maze.domain.rst.txt
@@ -0,0 +1,37 @@
+problems.maze.domain package
+============================
+
+Submodules
+----------
+
+problems.maze.domain.action module
+----------------------------------
+
+.. automodule:: problems.maze.domain.action
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.maze.domain.observation module
+---------------------------------------
+
+.. automodule:: problems.maze.domain.observation
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.maze.domain.state module
+---------------------------------
+
+.. automodule:: problems.maze.domain.state
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.maze.domain
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.maze.env.rst.txt b/docs/html/_sources/problems/problems.maze.env.rst.txt
new file mode 100644
index 00000000..2792fb15
--- /dev/null
+++ b/docs/html/_sources/problems/problems.maze.env.rst.txt
@@ -0,0 +1,21 @@
+problems.maze.env package
+=========================
+
+Submodules
+----------
+
+problems.maze.env.env module
+----------------------------
+
+.. automodule:: problems.maze.env.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.maze.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.maze.models.components.rst.txt b/docs/html/_sources/problems/problems.maze.models.components.rst.txt
new file mode 100644
index 00000000..ed312810
--- /dev/null
+++ b/docs/html/_sources/problems/problems.maze.models.components.rst.txt
@@ -0,0 +1,21 @@
+problems.maze.models.components package
+=======================================
+
+Submodules
+----------
+
+problems.maze.models.components.map module
+------------------------------------------
+
+.. automodule:: problems.maze.models.components.map
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.maze.models.components
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.maze.models.rst.txt b/docs/html/_sources/problems/problems.maze.models.rst.txt
new file mode 100644
index 00000000..d94f3aab
--- /dev/null
+++ b/docs/html/_sources/problems/problems.maze.models.rst.txt
@@ -0,0 +1,18 @@
+problems.maze.models package
+============================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.maze.models.components
+
+Module contents
+---------------
+
+.. automodule:: problems.maze.models
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.maze.rst.txt b/docs/html/_sources/problems/problems.maze.rst.txt
new file mode 100644
index 00000000..87955e36
--- /dev/null
+++ b/docs/html/_sources/problems/problems.maze.rst.txt
@@ -0,0 +1,20 @@
+problems.maze package
+=====================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.maze.domain
+   problems.maze.env
+   problems.maze.models
+
+Module contents
+---------------
+
+.. automodule:: problems.maze
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.multi_object_search.agent.rst.txt b/docs/html/_sources/problems/problems.multi_object_search.agent.rst.txt
new file mode 100644
index 00000000..eb404257
--- /dev/null
+++ b/docs/html/_sources/problems/problems.multi_object_search.agent.rst.txt
@@ -0,0 +1,29 @@
+problems.multi\_object\_search.agent package
+============================================
+
+Submodules
+----------
+
+problems.multi\_object\_search.agent.agent module
+-------------------------------------------------
+
+.. automodule:: problems.multi_object_search.agent.agent
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.agent.belief module
+--------------------------------------------------
+
+.. automodule:: problems.multi_object_search.agent.belief
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.multi_object_search.agent
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.multi_object_search.domain.rst.txt b/docs/html/_sources/problems/problems.multi_object_search.domain.rst.txt
new file mode 100644
index 00000000..51956231
--- /dev/null
+++ b/docs/html/_sources/problems/problems.multi_object_search.domain.rst.txt
@@ -0,0 +1,37 @@
+problems.multi\_object\_search.domain package
+=============================================
+
+Submodules
+----------
+
+problems.multi\_object\_search.domain.action module
+---------------------------------------------------
+
+.. automodule:: problems.multi_object_search.domain.action
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.domain.observation module
+--------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.domain.observation
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.domain.state module
+--------------------------------------------------
+
+.. automodule:: problems.multi_object_search.domain.state
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.multi_object_search.domain
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.multi_object_search.env.rst.txt b/docs/html/_sources/problems/problems.multi_object_search.env.rst.txt
new file mode 100644
index 00000000..89927bdd
--- /dev/null
+++ b/docs/html/_sources/problems/problems.multi_object_search.env.rst.txt
@@ -0,0 +1,29 @@
+problems.multi\_object\_search.env package
+==========================================
+
+Submodules
+----------
+
+problems.multi\_object\_search.env.env module
+---------------------------------------------
+
+.. automodule:: problems.multi_object_search.env.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.env.visual module
+------------------------------------------------
+
+.. automodule:: problems.multi_object_search.env.visual
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.multi_object_search.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.multi_object_search.models.components.rst.txt b/docs/html/_sources/problems/problems.multi_object_search.models.components.rst.txt
new file mode 100644
index 00000000..e83608c7
--- /dev/null
+++ b/docs/html/_sources/problems/problems.multi_object_search.models.components.rst.txt
@@ -0,0 +1,29 @@
+problems.multi\_object\_search.models.components package
+========================================================
+
+Submodules
+----------
+
+problems.multi\_object\_search.models.components.grid\_map module
+-----------------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.models.components.grid_map
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.models.components.sensor module
+--------------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.models.components.sensor
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.multi_object_search.models.components
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.multi_object_search.models.rst.txt b/docs/html/_sources/problems/problems.multi_object_search.models.rst.txt
new file mode 100644
index 00000000..e42c033f
--- /dev/null
+++ b/docs/html/_sources/problems/problems.multi_object_search.models.rst.txt
@@ -0,0 +1,53 @@
+problems.multi\_object\_search.models package
+=============================================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.multi_object_search.models.components
+
+Submodules
+----------
+
+problems.multi\_object\_search.models.observation\_model module
+---------------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.models.observation_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.models.policy\_model module
+----------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.models.policy_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.models.reward\_model module
+----------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.models.reward_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.models.transition\_model module
+--------------------------------------------------------------
+
+.. automodule:: problems.multi_object_search.models.transition_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.multi_object_search.models
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.multi_object_search.rst.txt b/docs/html/_sources/problems/problems.multi_object_search.rst.txt
new file mode 100644
index 00000000..4cf63841
--- /dev/null
+++ b/docs/html/_sources/problems/problems.multi_object_search.rst.txt
@@ -0,0 +1,40 @@
+problems.multi\_object\_search package
+======================================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.multi_object_search.agent
+   problems.multi_object_search.domain
+   problems.multi_object_search.env
+   problems.multi_object_search.models
+
+Submodules
+----------
+
+problems.multi\_object\_search.example\_worlds module
+-----------------------------------------------------
+
+.. automodule:: problems.multi_object_search.example_worlds
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.multi\_object\_search.problem module
+---------------------------------------------
+
+.. automodule:: problems.multi_object_search.problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.multi_object_search
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.rocksample.cythonize.rst.txt b/docs/html/_sources/problems/problems.rocksample.cythonize.rst.txt
new file mode 100644
index 00000000..8cef3c24
--- /dev/null
+++ b/docs/html/_sources/problems/problems.rocksample.cythonize.rst.txt
@@ -0,0 +1,37 @@
+problems.rocksample.cythonize package
+=====================================
+
+Submodules
+----------
+
+problems.rocksample.cythonize.rocksample\_problem module
+--------------------------------------------------------
+
+.. automodule:: problems.rocksample.cythonize.rocksample_problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.rocksample.cythonize.rocksample\_problem module
+--------------------------------------------------------
+
+.. automodule:: problems.rocksample.cythonize.rocksample_problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.rocksample.cythonize.run\_rocksample module
+----------------------------------------------------
+
+.. automodule:: problems.rocksample.cythonize.run_rocksample
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.rocksample.cythonize
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.rocksample.rst.txt b/docs/html/_sources/problems/problems.rocksample.rst.txt
new file mode 100644
index 00000000..27865be9
--- /dev/null
+++ b/docs/html/_sources/problems/problems.rocksample.rst.txt
@@ -0,0 +1,29 @@
+problems.rocksample package
+===========================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.rocksample.cythonize
+
+Submodules
+----------
+
+problems.rocksample.rocksample\_problem module
+----------------------------------------------
+
+.. automodule:: problems.rocksample.rocksample_problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.rocksample
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.rst.txt b/docs/html/_sources/problems/problems.rst.txt
new file mode 100644
index 00000000..ce9625b6
--- /dev/null
+++ b/docs/html/_sources/problems/problems.rst.txt
@@ -0,0 +1,25 @@
+problems package
+================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.lasertag
+   problems.light_dark
+   problems.load_unload
+   problems.maze
+   problems.multi_object_search
+   problems.rocksample
+   problems.tag
+   problems.tiger
+
+Module contents
+---------------
+
+.. automodule:: problems
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tag.agent.rst.txt b/docs/html/_sources/problems/problems.tag.agent.rst.txt
new file mode 100644
index 00000000..8c577e71
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tag.agent.rst.txt
@@ -0,0 +1,21 @@
+problems.tag.agent package
+==========================
+
+Submodules
+----------
+
+problems.tag.agent.agent module
+-------------------------------
+
+.. automodule:: problems.tag.agent.agent
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tag.agent
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tag.domain.rst.txt b/docs/html/_sources/problems/problems.tag.domain.rst.txt
new file mode 100644
index 00000000..58c4b03a
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tag.domain.rst.txt
@@ -0,0 +1,37 @@
+problems.tag.domain package
+===========================
+
+Submodules
+----------
+
+problems.tag.domain.action module
+---------------------------------
+
+.. automodule:: problems.tag.domain.action
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.domain.observation module
+--------------------------------------
+
+.. automodule:: problems.tag.domain.observation
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.domain.state module
+--------------------------------
+
+.. automodule:: problems.tag.domain.state
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tag.domain
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tag.env.rst.txt b/docs/html/_sources/problems/problems.tag.env.rst.txt
new file mode 100644
index 00000000..82d6cf6b
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tag.env.rst.txt
@@ -0,0 +1,29 @@
+problems.tag.env package
+========================
+
+Submodules
+----------
+
+problems.tag.env.env module
+---------------------------
+
+.. automodule:: problems.tag.env.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.env.visual module
+------------------------------
+
+.. automodule:: problems.tag.env.visual
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tag.env
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tag.models.components.rst.txt b/docs/html/_sources/problems/problems.tag.models.components.rst.txt
new file mode 100644
index 00000000..5722a155
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tag.models.components.rst.txt
@@ -0,0 +1,29 @@
+problems.tag.models.components package
+======================================
+
+Submodules
+----------
+
+problems.tag.models.components.grid\_map module
+-----------------------------------------------
+
+.. automodule:: problems.tag.models.components.grid_map
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.models.components.motion\_policy module
+----------------------------------------------------
+
+.. automodule:: problems.tag.models.components.motion_policy
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tag.models.components
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tag.models.rst.txt b/docs/html/_sources/problems/problems.tag.models.rst.txt
new file mode 100644
index 00000000..15997dc6
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tag.models.rst.txt
@@ -0,0 +1,53 @@
+problems.tag.models package
+===========================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.tag.models.components
+
+Submodules
+----------
+
+problems.tag.models.observation\_model module
+---------------------------------------------
+
+.. automodule:: problems.tag.models.observation_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.models.policy\_model module
+----------------------------------------
+
+.. automodule:: problems.tag.models.policy_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.models.reward\_model module
+----------------------------------------
+
+.. automodule:: problems.tag.models.reward_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.models.transition\_model module
+--------------------------------------------
+
+.. automodule:: problems.tag.models.transition_model
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tag.models
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tag.rst.txt b/docs/html/_sources/problems/problems.tag.rst.txt
new file mode 100644
index 00000000..d709fc20
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tag.rst.txt
@@ -0,0 +1,56 @@
+problems.tag package
+====================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.tag.agent
+   problems.tag.domain
+   problems.tag.env
+   problems.tag.models
+
+Submodules
+----------
+
+problems.tag.constants module
+-----------------------------
+
+.. automodule:: problems.tag.constants
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.example\_worlds module
+-----------------------------------
+
+.. automodule:: problems.tag.example_worlds
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.experiment module
+------------------------------
+
+.. automodule:: problems.tag.experiment
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tag.problem module
+---------------------------
+
+.. automodule:: problems.tag.problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tag
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tiger.cythonize.rst.txt b/docs/html/_sources/problems/problems.tiger.cythonize.rst.txt
new file mode 100644
index 00000000..e1fb2f32
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tiger.cythonize.rst.txt
@@ -0,0 +1,37 @@
+problems.tiger.cythonize package
+================================
+
+Submodules
+----------
+
+problems.tiger.cythonize.run\_tiger module
+------------------------------------------
+
+.. automodule:: problems.tiger.cythonize.run_tiger
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tiger.cythonize.tiger\_problem module
+----------------------------------------------
+
+.. automodule:: problems.tiger.cythonize.tiger_problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+problems.tiger.cythonize.tiger\_problem module
+----------------------------------------------
+
+.. automodule:: problems.tiger.cythonize.tiger_problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tiger.cythonize
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_sources/problems/problems.tiger.rst.txt b/docs/html/_sources/problems/problems.tiger.rst.txt
new file mode 100644
index 00000000..b1f0ab3e
--- /dev/null
+++ b/docs/html/_sources/problems/problems.tiger.rst.txt
@@ -0,0 +1,29 @@
+problems.tiger package
+======================
+
+Subpackages
+-----------
+
+.. toctree::
+   :maxdepth: 4
+
+   problems.tiger.cythonize
+
+Submodules
+----------
+
+problems.tiger.tiger\_problem module
+------------------------------------
+
+.. automodule:: problems.tiger.tiger_problem
+   :members:
+   :undoc-members:
+   :show-inheritance:
+
+Module contents
+---------------
+
+.. automodule:: problems.tiger
+   :members:
+   :undoc-members:
+   :show-inheritance:
diff --git a/docs/html/_static/documentation_options.js b/docs/html/_static/documentation_options.js
index 14a4c29c..ea843502 100644
--- a/docs/html/_static/documentation_options.js
+++ b/docs/html/_static/documentation_options.js
@@ -1,5 +1,5 @@
 const DOCUMENTATION_OPTIONS = {
-    VERSION: '1.3.4',
+    VERSION: '1.3.5',
     LANGUAGE: 'en',
     COLLAPSE_INDEX: false,
     BUILDER: 'html',
diff --git a/docs/html/_static/pygments.css b/docs/html/_static/pygments.css
index 04a41742..07454c6b 100644
--- a/docs/html/_static/pygments.css
+++ b/docs/html/_static/pygments.css
@@ -22,7 +22,6 @@ span.linenos.special { color: #000000; background-color: #ffffc0; padding-left:
 .highlight .cs { color: #8f5902; font-style: italic } /* Comment.Special */
 .highlight .gd { color: #a40000 } /* Generic.Deleted */
 .highlight .ge { color: #000000; font-style: italic } /* Generic.Emph */
-.highlight .ges { color: #000000 } /* Generic.EmphStrong */
 .highlight .gr { color: #ef2929 } /* Generic.Error */
 .highlight .gh { color: #000080; font-weight: bold } /* Generic.Heading */
 .highlight .gi { color: #00A000 } /* Generic.Inserted */
diff --git a/docs/html/api/modules.html b/docs/html/api/modules.html
index a66adeca..f8411dab 100644
--- a/docs/html/api/modules.html
+++ b/docs/html/api/modules.html
@@ -5,17 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
     <link rel="next" title="pomdp_py package" href="pomdp_py.html" />
-    <link rel="prev" title="Existing POMDP Solvers" href="../existing_solvers.html" />
+    <link rel="prev" title="Changelog" href="../changelog.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -58,11 +58,13 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul class="current">
 <li class="toctree-l1 current"><a class="current reference internal" href="#">pomdp_py</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a></li>
 </ul>
 </li>
 </ul>
@@ -80,7 +82,7 @@ <h3>Navigation</h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
-      <li>Previous: <a href="../existing_solvers.html" title="previous chapter">Existing POMDP Solvers</a></li>
+      <li>Previous: <a href="../changelog.html" title="previous chapter">Changelog</a></li>
       <li>Next: <a href="pomdp_py.html" title="next chapter">pomdp_py package</a></li>
   </ul></li>
 </ul>
@@ -178,6 +180,7 @@ <h1>pomdp_py<a class="headerlink" href="#pomdp-py" title="Link to this heading">
 </ul>
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.framework.html#module-pomdp_py.framework.oopomdp">pomdp_py.framework.oopomdp module</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.DictState"><code class="docutils literal notranslate"><span class="pre">DictState</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief"><code class="docutils literal notranslate"><span class="pre">OOBelief</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservation"><code class="docutils literal notranslate"><span class="pre">OOObservation</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservationModel"><code class="docutils literal notranslate"><span class="pre">OOObservationModel</span></code></a></li>
@@ -292,6 +295,70 @@ <h1>pomdp_py<a class="headerlink" href="#pomdp-py" title="Link to this heading">
 </li>
 </ul>
 </li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.lasertag.html">pomdp_py.problems.lasertag package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.lasertag.html#module-pomdp_py.problems.lasertag">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.html#pomdp-py-problems-light-dark-problem-discrete-module">pomdp_py.problems.light_dark.problem_discrete module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.html#pomdp-py-problems-light-dark-test-module">pomdp_py.problems.light_dark.test module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html">pomdp_py.problems.load_unload package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload.load_unload">pomdp_py.problems.load_unload.load_unload module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.maze.html">pomdp_py.problems.maze package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.maze.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.maze.html#module-pomdp_py.problems.maze">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html">pomdp_py.problems.multi_object_search package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.example_worlds">pomdp_py.problems.multi_object_search.example_worlds module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.problem">pomdp_py.problems.multi_object_search.problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.html">pomdp_py.problems.rocksample package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.rocksample.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.rocksample.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.rocksample.html#module-pomdp_py.problems.rocksample.cythonize">pomdp_py.problems.rocksample.cythonize module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.rocksample.html#module-pomdp_py.problems.rocksample.rocksample_problem">pomdp_py.problems.rocksample.rocksample_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.rocksample.html#module-pomdp_py.problems.rocksample">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.html">pomdp_py.problems.tag package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.constants">pomdp_py.problems.tag.constants module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.example_worlds">pomdp_py.problems.tag.example_worlds module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.experiment">pomdp_py.problems.tag.experiment module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.problem">pomdp_py.problems.tag.problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tiger.html">pomdp_py.problems.tiger package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tiger.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tiger.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tiger.html#module-pomdp_py.problems.tiger.cythonize">pomdp_py.problems.tiger.cythonize module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tiger.html#module-pomdp_py.problems.tiger.tiger_problem">pomdp_py.problems.tiger.tiger_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tiger.html#module-pomdp_py.problems.tiger">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
 </ul>
 </div>
 </section>
diff --git a/docs/html/api/pomdp_py.algorithms.bsp.html b/docs/html/api/pomdp_py.algorithms.bsp.html
index 4d7b7ba8..9cd34384 100644
--- a/docs/html/api/pomdp_py.algorithms.bsp.html
+++ b/docs/html/api/pomdp_py.algorithms.bsp.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.algorithms.bsp package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.algorithms.bsp package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -36,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -79,10 +79,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.algorithms.html b/docs/html/api/pomdp_py.algorithms.html
index c4b5ba74..25d2ac13 100644
--- a/docs/html/api/pomdp_py.algorithms.html
+++ b/docs/html/api/pomdp_py.algorithms.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.algorithms package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.algorithms package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -75,13 +75,19 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </ul>
 </li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT"><code class="docutils literal notranslate"><span class="pre">POUCT</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.action_prior"><code class="docutils literal notranslate"><span class="pre">POUCT.action_prior</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.clear_agent"><code class="docutils literal notranslate"><span class="pre">POUCT.clear_agent()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.discount_factor"><code class="docutils literal notranslate"><span class="pre">POUCT.discount_factor</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.last_num_sims"><code class="docutils literal notranslate"><span class="pre">POUCT.last_num_sims</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.last_planning_time"><code class="docutils literal notranslate"><span class="pre">POUCT.last_planning_time</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.max_depth"><code class="docutils literal notranslate"><span class="pre">POUCT.max_depth</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.num_visits_init"><code class="docutils literal notranslate"><span class="pre">POUCT.num_visits_init</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.plan"><code class="docutils literal notranslate"><span class="pre">POUCT.plan()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.rollout_policy"><code class="docutils literal notranslate"><span class="pre">POUCT.rollout_policy</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.set_rollout_policy"><code class="docutils literal notranslate"><span class="pre">POUCT.set_rollout_policy()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.update"><code class="docutils literal notranslate"><span class="pre">POUCT.update()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.updates_agent_belief"><code class="docutils literal notranslate"><span class="pre">POUCT.updates_agent_belief</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.POUCT.value_init"><code class="docutils literal notranslate"><span class="pre">POUCT.value_init</span></code></a></li>
 </ul>
 </li>
 <li><a class="reference internal" href="#pomdp_py.algorithms.po_uct.QNode"><code class="docutils literal notranslate"><span class="pre">QNode</span></code></a></li>
@@ -172,6 +178,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.utils.html">pomdp_py.utils package</a></li>
 </ul>
 </li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a></li>
 </ul>
 </li>
 </ul>
@@ -410,11 +417,21 @@ <h1>pomdp_py.algorithms package<a class="headerlink" href="#pomdp-py-algorithms-
 </ul>
 </dd>
 </dl>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.action_prior">
+<span class="sig-name descname"><span class="pre">action_prior</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.action_prior" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.clear_agent">
 <span class="sig-name descname"><span class="pre">clear_agent</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.clear_agent" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.discount_factor">
+<span class="sig-name descname"><span class="pre">discount_factor</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.discount_factor" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="py attribute">
 <dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.last_num_sims">
 <span class="sig-name descname"><span class="pre">last_num_sims</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.last_num_sims" title="Link to this definition">¶</a></dt>
@@ -427,6 +444,16 @@ <h1>pomdp_py.algorithms package<a class="headerlink" href="#pomdp-py-algorithms-
 <dd><p>Returns the amount of time (seconds) ran for the last <cite>plan</cite> call.</p>
 </dd></dl>
 
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.max_depth">
+<span class="sig-name descname"><span class="pre">max_depth</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.max_depth" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.num_visits_init">
+<span class="sig-name descname"><span class="pre">num_visits_init</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.num_visits_init" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.plan">
 <span class="sig-name descname"><span class="pre">plan</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">Agent</span> <span class="pre">agent</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.plan" title="Link to this definition">¶</a></dt>
@@ -434,6 +461,11 @@ <h1>pomdp_py.algorithms package<a class="headerlink" href="#pomdp-py-algorithms-
 Bt, ht, O,T,R/G, pi, necessary for planning</p>
 </dd></dl>
 
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.rollout_policy">
+<span class="sig-name descname"><span class="pre">rollout_policy</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.rollout_policy" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.set_rollout_policy">
 <span class="sig-name descname"><span class="pre">set_rollout_policy</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">RolloutPolicy</span> <span class="pre">rollout_policy</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.set_rollout_policy" title="Link to this definition">¶</a></dt>
@@ -452,6 +484,11 @@ <h1>pomdp_py.algorithms package<a class="headerlink" href="#pomdp-py-algorithms-
 <span class="sig-name descname"><span class="pre">updates_agent_belief</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.updates_agent_belief" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.algorithms.po_uct.POUCT.value_init">
+<span class="sig-name descname"><span class="pre">value_init</span></span><a class="headerlink" href="#pomdp_py.algorithms.po_uct.POUCT.value_init" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </dd></dl>
 
 <dl class="py class">
@@ -631,7 +668,7 @@ <h1>pomdp_py.algorithms package<a class="headerlink" href="#pomdp-py-algorithms-
 <span id="pomdp-py-algorithms-value-iteration-module"></span><h2>pomdp_py.algorithms.value_iteration module<a class="headerlink" href="#module-pomdp_py.algorithms.value_iteration" title="Link to this heading">¶</a></h2>
 <p>Implementation of the basic policy tree based value iteration as explained
 in section 4.1 of <cite>Planning and acting in partially observable stochastic
-domains</cite> <span id="id10">[<a class="reference internal" href="../index.html#id21" title="Leslie Pack Kaelbling, Michael L Littman, and Anthony R Cassandra. Planning and acting in partially observable stochastic domains. Artificial intelligence, 101(1-2):99–134, 1998.">1</a>]</span></p>
+domains</cite> <span id="id10">[<a class="reference internal" href="#id31" title="Leslie Pack Kaelbling, Michael L Littman, and Anthony R Cassandra. Planning and acting in partially observable stochastic domains. Artificial intelligence, 101(1-2):99–134, 1998.">1</a>]</span></p>
 <p>Warning: No pruning - the number of policy trees explodes very fast.</p>
 <dl class="py class">
 <dt class="sig sig-object py" id="pomdp_py.algorithms.value_iteration.ValueIteration">
diff --git a/docs/html/api/pomdp_py.algorithms.visual.html b/docs/html/api/pomdp_py.algorithms.visual.html
index 8a063983..4f40daa6 100644
--- a/docs/html/api/pomdp_py.algorithms.visual.html
+++ b/docs/html/api/pomdp_py.algorithms.visual.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.algorithms.visual package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.algorithms.visual package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
diff --git a/docs/html/api/pomdp_py.framework.html b/docs/html/api/pomdp_py.framework.html
index 8b8174a7..b166fa94 100644
--- a/docs/html/api/pomdp_py.framework.html
+++ b/docs/html/api/pomdp_py.framework.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.framework package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.framework package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -69,6 +69,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Agent.init_belief"><code class="docutils literal notranslate"><span class="pre">Agent.init_belief</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Agent.sample_belief"><code class="docutils literal notranslate"><span class="pre">Agent.sample_belief()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Agent.set_belief"><code class="docutils literal notranslate"><span class="pre">Agent.set_belief()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.framework.basics.Agent.set_models"><code class="docutils literal notranslate"><span class="pre">Agent.set_models()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Agent.update"><code class="docutils literal notranslate"><span class="pre">Agent.update()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Agent.update_history"><code class="docutils literal notranslate"><span class="pre">Agent.update_history()</span></code></a></li>
 </ul>
@@ -89,6 +90,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.cur_state"><code class="docutils literal notranslate"><span class="pre">Environment.cur_state</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.provide_observation"><code class="docutils literal notranslate"><span class="pre">Environment.provide_observation()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.reward_model"><code class="docutils literal notranslate"><span class="pre">Environment.reward_model</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.set_models"><code class="docutils literal notranslate"><span class="pre">Environment.set_models()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.state"><code class="docutils literal notranslate"><span class="pre">Environment.state</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.state_transition"><code class="docutils literal notranslate"><span class="pre">Environment.state_transition()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Environment.transition_model"><code class="docutils literal notranslate"><span class="pre">Environment.transition_model</span></code></a></li>
@@ -110,10 +112,10 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </ul>
 </li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Option"><code class="docutils literal notranslate"><span class="pre">Option</span></code></a><ul>
-<li><a class="reference internal" href="#pomdp_py.framework.basics.Option.initiation"><code class="docutils literal notranslate"><span class="pre">Option.initiation()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.framework.basics.Option.initiate"><code class="docutils literal notranslate"><span class="pre">Option.initiate()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Option.policy"><code class="docutils literal notranslate"><span class="pre">Option.policy</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.Option.sample"><code class="docutils literal notranslate"><span class="pre">Option.sample()</span></code></a></li>
-<li><a class="reference internal" href="#pomdp_py.framework.basics.Option.termination"><code class="docutils literal notranslate"><span class="pre">Option.termination()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.framework.basics.Option.terminate"><code class="docutils literal notranslate"><span class="pre">Option.terminate()</span></code></a></li>
 </ul>
 </li>
 <li><a class="reference internal" href="#pomdp_py.framework.basics.POMDP"><code class="docutils literal notranslate"><span class="pre">POMDP</span></code></a></li>
@@ -147,6 +149,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </ul>
 </li>
 <li><a class="reference internal" href="#module-pomdp_py.framework.oopomdp">pomdp_py.framework.oopomdp module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.framework.oopomdp.DictState"><code class="docutils literal notranslate"><span class="pre">DictState</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.oopomdp.OOBelief"><code class="docutils literal notranslate"><span class="pre">OOBelief</span></code></a><ul>
 <li><a class="reference internal" href="#pomdp_py.framework.oopomdp.OOBelief.__getitem__"><code class="docutils literal notranslate"><span class="pre">OOBelief.__getitem__()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.framework.oopomdp.OOBelief.__setitem__"><code class="docutils literal notranslate"><span class="pre">OOBelief.__setitem__()</span></code></a></li>
@@ -219,6 +222,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul class="current">
@@ -232,6 +236,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </li>
 </ul>
 </li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -423,6 +428,12 @@ <h1>pomdp_py.framework package<a class="headerlink" href="#pomdp-py-framework-pa
 <span class="sig-name descname"><span class="pre">set_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Agent.set_belief" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.framework.basics.Agent.set_models">
+<span class="sig-name descname"><span class="pre">set_models</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">transition_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">blackbox_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">policy_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Agent.set_models" title="Link to this definition">¶</a></dt>
+<dd><p>Re-assign the models to be the ones given.</p>
+</dd></dl>
+
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.framework.basics.Agent.update">
 <span class="sig-name descname"><span class="pre">update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_observation</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Agent.update" title="Link to this definition">¶</a></dt>
@@ -451,7 +462,7 @@ <h1>pomdp_py.framework package<a class="headerlink" href="#pomdp-py-framework-pa
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.framework.basics.BlackboxModel.sample">
 <span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.BlackboxModel.sample" title="Link to this definition">¶</a></dt>
-<dd><p>Sample (s’,o,r) ~ G(s’,o,r)</p>
+<dd><p>Sample (s’,o,r) ~ G(s,a)</p>
 </dd></dl>
 
 </dd></dl>
@@ -542,6 +553,12 @@ <h1>pomdp_py.framework package<a class="headerlink" href="#pomdp-py-framework-pa
 <dd><p>The <a class="reference internal" href="#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a> underlying the environment</p>
 </dd></dl>
 
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.framework.basics.Environment.set_models">
+<span class="sig-name descname"><span class="pre">set_models</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">transition_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">blackbox_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Environment.set_models" title="Link to this definition">¶</a></dt>
+<dd><p>Re-assign the models to be the ones given.</p>
+</dd></dl>
+
 <dl class="py attribute">
 <dt class="sig sig-object py" id="pomdp_py.framework.basics.Environment.state">
 <span class="sig-name descname"><span class="pre">state</span></span><a class="headerlink" href="#pomdp_py.framework.basics.Environment.state" title="Link to this definition">¶</a></dt>
@@ -691,9 +708,10 @@ <h1>pomdp_py.framework package<a class="headerlink" href="#pomdp-py-framework-pa
 <p>Described in <cite>Between MDPs and semi-MDPs:
 A framework for temporal abstraction in reinforcement learning</cite></p>
 <dl class="py method">
-<dt class="sig sig-object py" id="pomdp_py.framework.basics.Option.initiation">
-<span class="sig-name descname"><span class="pre">initiation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Option.initiation" title="Link to this definition">¶</a></dt>
-<dd><p>Returns True if the given parameters satisfy the initiation set</p>
+<dt class="sig sig-object py" id="pomdp_py.framework.basics.Option.initiate">
+<span class="sig-name descname"><span class="pre">initiate</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Option.initiate" title="Link to this definition">¶</a></dt>
+<dd><p>initiation(self, state)
+Returns True if the given parameters satisfy the initiation set</p>
 </dd></dl>
 
 <dl class="py attribute">
@@ -711,9 +729,10 @@ <h1>pomdp_py.framework package<a class="headerlink" href="#pomdp-py-framework-pa
 </dd></dl>
 
 <dl class="py method">
-<dt class="sig sig-object py" id="pomdp_py.framework.basics.Option.termination">
-<span class="sig-name descname"><span class="pre">termination</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Option.termination" title="Link to this definition">¶</a></dt>
-<dd><p>Returns a boolean of whether state satisfies the termination
+<dt class="sig sig-object py" id="pomdp_py.framework.basics.Option.terminate">
+<span class="sig-name descname"><span class="pre">terminate</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.framework.basics.Option.terminate" title="Link to this definition">¶</a></dt>
+<dd><p>termination(self, state)
+Returns a boolean of whether state satisfies the termination
 condition; Technically returning a float between 0 and 1 is also allowed.</p>
 </dd></dl>
 
@@ -984,6 +1003,14 @@ <h1>pomdp_py.framework package<a class="headerlink" href="#pomdp-py-framework-pa
 object factoring reduces the scaling of belief
 space from exponential to linear as the number
 of objects increases. See <span id="id1">[<a class="reference internal" href="../examples.mos.html#id20" title="Arthur Wandzel, Yoonseon Oh, Michael Fishman, Nishanth Kumar, and Stefanie Tellex. Multi-object search using object-oriented pomdps. In 2019 International Conference on Robotics and Automation (ICRA), 7194–7200. IEEE, 2019.">1</a>]</span>.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.framework.oopomdp.DictState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.framework.oopomdp.</span></span><span class="sig-name descname"><span class="pre">DictState</span></span><a class="headerlink" href="#pomdp_py.framework.oopomdp.DictState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#pomdp_py.framework.oopomdp.ObjectState" title="pomdp_py.framework.oopomdp.ObjectState"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObjectState</span></code></a></p>
+<p>This is synonymous as ObjectState, but does not convey ‘objectness’
+of the information being described.</p>
+</dd></dl>
+
 <dl class="py class">
 <dt class="sig sig-object py" id="pomdp_py.framework.oopomdp.OOBelief">
 <em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.framework.oopomdp.</span></span><span class="sig-name descname"><span class="pre">OOBelief</span></span><a class="headerlink" href="#pomdp_py.framework.oopomdp.OOBelief" title="Link to this definition">¶</a></dt>
diff --git a/docs/html/api/pomdp_py.html b/docs/html/api/pomdp_py.html
index 67eaefe7..c3d1b9dc 100644
--- a/docs/html/api/pomdp_py.html
+++ b/docs/html/api/pomdp_py.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -70,6 +70,7 @@ <h3>Navigation</h3>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.utils.html">pomdp_py.utils package</a></li>
 </ul>
 </li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a></li>
 </ul>
 </li>
 </ul>
@@ -151,13 +152,19 @@ <h1>pomdp_py package<a class="headerlink" href="#pomdp-py-package" title="Link t
 </ul>
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT"><code class="docutils literal notranslate"><span class="pre">POUCT</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.action_prior"><code class="docutils literal notranslate"><span class="pre">POUCT.action_prior</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.clear_agent"><code class="docutils literal notranslate"><span class="pre">POUCT.clear_agent()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.discount_factor"><code class="docutils literal notranslate"><span class="pre">POUCT.discount_factor</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.last_num_sims"><code class="docutils literal notranslate"><span class="pre">POUCT.last_num_sims</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.last_planning_time"><code class="docutils literal notranslate"><span class="pre">POUCT.last_planning_time</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.max_depth"><code class="docutils literal notranslate"><span class="pre">POUCT.max_depth</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.num_visits_init"><code class="docutils literal notranslate"><span class="pre">POUCT.num_visits_init</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.plan"><code class="docutils literal notranslate"><span class="pre">POUCT.plan()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.rollout_policy"><code class="docutils literal notranslate"><span class="pre">POUCT.rollout_policy</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.set_rollout_policy"><code class="docutils literal notranslate"><span class="pre">POUCT.set_rollout_policy()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.update"><code class="docutils literal notranslate"><span class="pre">POUCT.update()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.updates_agent_belief"><code class="docutils literal notranslate"><span class="pre">POUCT.updates_agent_belief</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.value_init"><code class="docutils literal notranslate"><span class="pre">POUCT.value_init</span></code></a></li>
 </ul>
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.QNode"><code class="docutils literal notranslate"><span class="pre">QNode</span></code></a></li>
@@ -240,6 +247,7 @@ <h1>pomdp_py package<a class="headerlink" href="#pomdp-py-package" title="Link t
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Agent.init_belief"><code class="docutils literal notranslate"><span class="pre">Agent.init_belief</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Agent.sample_belief"><code class="docutils literal notranslate"><span class="pre">Agent.sample_belief()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Agent.set_belief"><code class="docutils literal notranslate"><span class="pre">Agent.set_belief()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Agent.set_models"><code class="docutils literal notranslate"><span class="pre">Agent.set_models()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Agent.update"><code class="docutils literal notranslate"><span class="pre">Agent.update()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Agent.update_history"><code class="docutils literal notranslate"><span class="pre">Agent.update_history()</span></code></a></li>
 </ul>
@@ -260,6 +268,7 @@ <h1>pomdp_py package<a class="headerlink" href="#pomdp-py-package" title="Link t
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.cur_state"><code class="docutils literal notranslate"><span class="pre">Environment.cur_state</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.provide_observation"><code class="docutils literal notranslate"><span class="pre">Environment.provide_observation()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.reward_model"><code class="docutils literal notranslate"><span class="pre">Environment.reward_model</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.set_models"><code class="docutils literal notranslate"><span class="pre">Environment.set_models()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.state"><code class="docutils literal notranslate"><span class="pre">Environment.state</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.state_transition"><code class="docutils literal notranslate"><span class="pre">Environment.state_transition()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment.transition_model"><code class="docutils literal notranslate"><span class="pre">Environment.transition_model</span></code></a></li>
@@ -281,10 +290,10 @@ <h1>pomdp_py package<a class="headerlink" href="#pomdp-py-package" title="Link t
 </ul>
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option"><code class="docutils literal notranslate"><span class="pre">Option</span></code></a><ul>
-<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option.initiation"><code class="docutils literal notranslate"><span class="pre">Option.initiation()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option.initiate"><code class="docutils literal notranslate"><span class="pre">Option.initiate()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option.policy"><code class="docutils literal notranslate"><span class="pre">Option.policy</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option.sample"><code class="docutils literal notranslate"><span class="pre">Option.sample()</span></code></a></li>
-<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option.termination"><code class="docutils literal notranslate"><span class="pre">Option.termination()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Option.terminate"><code class="docutils literal notranslate"><span class="pre">Option.terminate()</span></code></a></li>
 </ul>
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP"><code class="docutils literal notranslate"><span class="pre">POMDP</span></code></a></li>
@@ -318,6 +327,7 @@ <h1>pomdp_py package<a class="headerlink" href="#pomdp-py-package" title="Link t
 </ul>
 </li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.framework.html#module-pomdp_py.framework.oopomdp">pomdp_py.framework.oopomdp module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.DictState"><code class="docutils literal notranslate"><span class="pre">DictState</span></code></a></li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief"><code class="docutils literal notranslate"><span class="pre">OOBelief</span></code></a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief.__getitem__"><code class="docutils literal notranslate"><span class="pre">OOBelief.__getitem__()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief.__setitem__"><code class="docutils literal notranslate"><span class="pre">OOBelief.__setitem__()</span></code></a></li>
@@ -426,6 +436,7 @@ <h1>pomdp_py package<a class="headerlink" href="#pomdp-py-package" title="Link t
 <li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.add"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.add()</span></code></a></li>
 <li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.condense"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.condense()</span></code></a></li>
 <li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.from_histogram()</span></code></a></li>
+<li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.frozen"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.frozen</span></code></a></li>
 <li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.get_histogram"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.get_histogram()</span></code></a></li>
 <li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.mpe"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.mpe()</span></code></a></li>
 <li class="toctree-l5"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.particles"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.particles</span></code></a></li>
diff --git a/docs/html/api/pomdp_py.problems.html b/docs/html/api/pomdp_py.problems.html
index 6b183b20..5e56cd97 100644
--- a/docs/html/api/pomdp_py.problems.html
+++ b/docs/html/api/pomdp_py.problems.html
@@ -5,15 +5,16 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="prev" title="pomdp_py.utils.interfaces package" href="pomdp_py.utils.interfaces.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -70,8 +71,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="current reference internal" href="#">pomdp_py.problems package</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -87,6 +96,9 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+      <li>Previous: <a href="pomdp_py.utils.interfaces.html" title="previous chapter">pomdp_py.utils.interfaces package</a></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -130,11 +142,8 @@ <h1>pomdp_py.problems package<a class="headerlink" href="#pomdp-py-problems-pack
 <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
 <div class="toctree-wrapper compound">
 <ul>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.lasertag.html">pomdp_py.problems.lasertag package</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.lasertag.html#module-pomdp_py.problems.lasertag">Module contents</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a><ul>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a></li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.light_dark.html#light-dark">Light-Dark</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.light_dark.html#subpackages">Subpackages</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.agent.html">pomdp_py.problems.light_dark.agent package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.agent.html#submodules">Submodules</a></li>
@@ -153,7 +162,7 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html">pomdp_py.problems.light_dark.env package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#submodules">Submodules</a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.env">pomdp_py.problems.light_dark.env.env module</a></li>
-<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp-py-problems-light-dark-env-plotting-module">pomdp_py.problems.light_dark.env.plotting module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.plotting">pomdp_py.problems.light_dark.env.plotting module</a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp-py-problems-light-dark-env-visual-module">pomdp_py.problems.light_dark.env.visual module</a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env">Module contents</a></li>
 </ul>
@@ -173,13 +182,50 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.light_dark.html#module-contents">Module contents</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.load_unload.html">pomdp_py.problems.load_unload package</a><ul>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.load_unload.html">pomdp_py.problems.load_unload package</a></li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.load_unload.html#load-unload">Load/Unload</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.load_unload.html#submodules">Submodules</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp-py-problems-load-unload-load-unload-module">pomdp_py.problems.load_unload.load_unload module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload.load_unload">pomdp_py.problems.load_unload.load_unload module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUState"><code class="docutils literal notranslate"><span class="pre">LUState</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUAction"><code class="docutils literal notranslate"><span class="pre">LUAction</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservation"><code class="docutils literal notranslate"><span class="pre">LUObservation</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel"><code class="docutils literal notranslate"><span class="pre">LUObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel"><code class="docutils literal notranslate"><span class="pre">LURewardModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.probability"><code class="docutils literal notranslate"><span class="pre">LURewardModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.sample"><code class="docutils literal notranslate"><span class="pre">LURewardModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">LURewardModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.argmax()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.get_all_actions()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem"><code class="docutils literal notranslate"><span class="pre">LoadUnloadProblem</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.generate_random_state"><code class="docutils literal notranslate"><span class="pre">generate_random_state()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.generate_init_belief"><code class="docutils literal notranslate"><span class="pre">generate_init_belief()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload">Module contents</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.maze.html">pomdp_py.problems.maze package</a><ul>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.maze.html">pomdp_py.problems.maze package</a></li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.maze.html#maze">Maze</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.maze.html#subpackages">Subpackages</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.maze.domain.html">pomdp_py.problems.maze.domain package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.maze.domain.html#submodules">Submodules</a></li>
@@ -203,12 +249,13 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 </ul>
 </li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.maze.html#module-pomdp_py.problems.maze">Module contents</a><ul>
-<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.maze.html#maze">Maze</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.maze.html#id1">Maze</a></li>
 </ul>
 </li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html">pomdp_py.problems.multi_object_search package</a><ul>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html">pomdp_py.problems.multi_object_search package</a></li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#multi-object-search-mos-task">Multi-Object Search (MOS) Task</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#subpackages">Subpackages</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.agent.html">pomdp_py.problems.multi_object_search.agent package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.agent.html#submodules">Submodules</a></li>
@@ -228,7 +275,7 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html">pomdp_py.problems.multi_object_search.env package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#submodules">Submodules</a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.env">pomdp_py.problems.multi_object_search.env.env module</a></li>
-<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp-py-problems-multi-object-search-env-visual-module">pomdp_py.problems.multi_object_search.env.visual module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.visual">pomdp_py.problems.multi_object_search.env.visual module</a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env">Module contents</a></li>
 </ul>
 </li>
@@ -249,11 +296,19 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.example_worlds.random_world"><code class="docutils literal notranslate"><span class="pre">random_world()</span></code></a></li>
 </ul>
 </li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#pomdp-py-problems-multi-object-search-problem-module">pomdp_py.problems.multi_object_search.problem module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.problem">pomdp_py.problems.multi_object_search.problem module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.MosOOPOMDP"><code class="docutils literal notranslate"><span class="pre">MosOOPOMDP</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.belief_update"><code class="docutils literal notranslate"><span class="pre">belief_update()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search">Module contents</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.rocksample.html">pomdp_py.problems.rocksample package</a><ul>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.rocksample.html">pomdp_py.problems.rocksample package</a></li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.rocksample.html#rocksample">RockSample</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.rocksample.html#pomdp-problems-rocksample-rocksample-problem-module">pomdp_problems.rocksample.rocksample_problem module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.rocksample.html#subpackages">Subpackages</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.cythonize.html">pomdp_py.problems.rocksample.cythonize package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.rocksample.cythonize.html#submodules">Submodules</a></li>
@@ -325,6 +380,8 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.init_particles_belief"><code class="docutils literal notranslate"><span class="pre">init_particles_belief()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.minimal_instance"><code class="docutils literal notranslate"><span class="pre">minimal_instance()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.create_instance"><code class="docutils literal notranslate"><span class="pre">create_instance()</span></code></a></li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
 </ul>
 </li>
@@ -349,8 +406,8 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 </li>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.env.html">pomdp_py.problems.tag.env package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#submodules">Submodules</a></li>
-<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp-py-problems-tag-env-env-module">pomdp_py.problems.tag.env.env module</a></li>
-<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp-py-problems-tag-env-visual-module">pomdp_py.problems.tag.env.visual module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.env">pomdp_py.problems.tag.env.env module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.visual">pomdp_py.problems.tag.env.visual module</a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env">Module contents</a></li>
 </ul>
 </li>
@@ -369,12 +426,22 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#submodules">Submodules</a></li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.constants">pomdp_py.problems.tag.constants module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.example_worlds">pomdp_py.problems.tag.example_worlds module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp-py-problems-tag-experiment-module">pomdp_py.problems.tag.experiment module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp-py-problems-tag-problem-module">pomdp_py.problems.tag.problem module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.experiment">pomdp_py.problems.tag.experiment module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp_py.problems.tag.experiment.trial"><code class="docutils literal notranslate"><span class="pre">trial()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp_py.problems.tag.experiment.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.problem">pomdp_py.problems.tag.problem module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.TagProblem"><code class="docutils literal notranslate"><span class="pre">TagProblem</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.html#module-pomdp_py.problems.tag">Module contents</a></li>
 </ul>
 </li>
-<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.tiger.html">pomdp_py.problems.tiger package</a><ul>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.tiger.html">pomdp_py.problems.tiger package</a></li>
+<li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.tiger.html#tiger">Tiger</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tiger.html#subpackages">Subpackages</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tiger.cythonize.html">pomdp_py.problems.tiger.cythonize package</a><ul>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tiger.cythonize.html#submodules">Submodules</a></li>
diff --git a/docs/html/api/pomdp_py.problems.lasertag.html b/docs/html/api/pomdp_py.problems.lasertag.html
index 0d866c44..e20825fa 100644
--- a/docs/html/api/pomdp_py.problems.lasertag.html
+++ b/docs/html/api/pomdp_py.problems.lasertag.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.lasertag package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.lasertag package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -66,10 +66,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.light_dark.agent.html b/docs/html/api/pomdp_py.problems.light_dark.agent.html
index 9c8f4437..bd466758 100644
--- a/docs/html/api/pomdp_py.problems.light_dark.agent.html
+++ b/docs/html/api/pomdp_py.problems.light_dark.agent.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.light_dark.agent package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.light_dark.agent package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.light_dark.domain package" href="pomdp_py.problems.light_dark.domain.html" />
+    <link rel="prev" title="pomdp_py.problems.light_dark package" href="pomdp_py.problems.light_dark.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -71,8 +73,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -88,6 +98,14 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.light_dark.html" title="previous chapter">pomdp_py.problems.light_dark package</a></li>
+      <li>Next: <a href="pomdp_py.problems.light_dark.domain.html" title="next chapter">pomdp_py.problems.light_dark.domain package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
diff --git a/docs/html/api/pomdp_py.problems.light_dark.domain.html b/docs/html/api/pomdp_py.problems.light_dark.domain.html
index df4b6a32..dc3c2f4e 100644
--- a/docs/html/api/pomdp_py.problems.light_dark.domain.html
+++ b/docs/html/api/pomdp_py.problems.light_dark.domain.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.light_dark.domain package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.light_dark.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.light_dark.env package" href="pomdp_py.problems.light_dark.env.html" />
+    <link rel="prev" title="pomdp_py.problems.light_dark.agent package" href="pomdp_py.problems.light_dark.agent.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -73,8 +75,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -90,6 +100,14 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.light_dark.agent.html" title="previous chapter">pomdp_py.problems.light_dark.agent package</a></li>
+      <li>Next: <a href="pomdp_py.problems.light_dark.env.html" title="next chapter">pomdp_py.problems.light_dark.env package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
diff --git a/docs/html/api/pomdp_py.problems.light_dark.env.html b/docs/html/api/pomdp_py.problems.light_dark.env.html
index 4c0bb0d7..7b3bd54c 100644
--- a/docs/html/api/pomdp_py.problems.light_dark.env.html
+++ b/docs/html/api/pomdp_py.problems.light_dark.env.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.light_dark.env package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.light_dark.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.light_dark.models package" href="pomdp_py.problems.light_dark.models.html" />
+    <link rel="prev" title="pomdp_py.problems.light_dark.domain package" href="pomdp_py.problems.light_dark.domain.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -63,7 +65,13 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </li>
 </ul>
 </li>
-<li><a class="reference internal" href="#pomdp-py-problems-light-dark-env-plotting-module">pomdp_py.problems.light_dark.env.plotting module</a></li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.light_dark.env.plotting">pomdp_py.problems.light_dark.env.plotting module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.light_dark.env.plotting.plot_points"><code class="docutils literal notranslate"><span class="pre">plot_points()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.light_dark.env.plotting.plot_polygons"><code class="docutils literal notranslate"><span class="pre">plot_polygons()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.light_dark.env.plotting.plot_line"><code class="docutils literal notranslate"><span class="pre">plot_line()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.light_dark.env.plotting.plot_circle"><code class="docutils literal notranslate"><span class="pre">plot_circle()</span></code></a></li>
+</ul>
+</li>
 <li><a class="reference internal" href="#pomdp-py-problems-light-dark-env-visual-module">pomdp_py.problems.light_dark.env.visual module</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.light_dark.env">Module contents</a></li>
 </ul>
@@ -80,8 +88,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -97,6 +113,14 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.light_dark.domain.html" title="previous chapter">pomdp_py.problems.light_dark.domain package</a></li>
+      <li>Next: <a href="pomdp_py.problems.light_dark.models.html" title="next chapter">pomdp_py.problems.light_dark.models package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -160,8 +184,34 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 </dd></dl>
 
 </section>
-<section id="pomdp-py-problems-light-dark-env-plotting-module">
-<h2>pomdp_py.problems.light_dark.env.plotting module<a class="headerlink" href="#pomdp-py-problems-light-dark-env-plotting-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.light_dark.env.plotting">
+<span id="pomdp-py-problems-light-dark-env-plotting-module"></span><h2>pomdp_py.problems.light_dark.env.plotting module<a class="headerlink" href="#module-pomdp_py.problems.light_dark.env.plotting" title="Link to this heading">¶</a></h2>
+<p>Plotting utilties</p>
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.light_dark.env.plotting.plot_points">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.light_dark.env.plotting.</span></span><span class="sig-name descname"><span class="pre">plot_points</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">xvals</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">yvals</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">label</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">connected</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">style</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'--'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">linewidth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">xlabel</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'x'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ylabel</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'f(x)'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">loc</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'lower</span> <span class="pre">right'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/light_dark/env/plotting.html#plot_points"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.light_dark.env.plotting.plot_points" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.light_dark.env.plotting.plot_polygons">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.light_dark.env.plotting.</span></span><span class="sig-name descname"><span class="pre">plot_polygons</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">verts</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">colors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">edgecolor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/light_dark/env/plotting.html#plot_polygons"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.light_dark.env.plotting.plot_polygons" title="Link to this definition">¶</a></dt>
+<dd><p><cite>verts</cite> is a sequence of ( verts0, verts1, …) where verts_i is a sequence of
+xy tuples of vertices, or an equivalent numpy array of shape (nv, 2).</p>
+<p><cite>c</cite> is a sequence of (color0, color1, …) where color_i is a color,
+represented by a hex string (7 characters #xxxxxx).</p>
+<p>Creates a PolygonCollection object in the axis <cite>ax</cite>.</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.light_dark.env.plotting.plot_line">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.light_dark.env.plotting.</span></span><span class="sig-name descname"><span class="pre">plot_line</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">ax</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">p1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">p2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">linewidth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'black'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">zorder</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">alpha</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">linestyle</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'-'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/light_dark/env/plotting.html#plot_line"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.light_dark.env.plotting.plot_line" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.light_dark.env.plotting.plot_circle">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.light_dark.env.plotting.</span></span><span class="sig-name descname"><span class="pre">plot_circle</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">ax</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">center</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">radius</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'blue'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fill</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">zorder</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">linewidth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">edgecolor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">label_text</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">alpha</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">text_color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'white'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/light_dark/env/plotting.html#plot_circle"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.light_dark.env.plotting.plot_circle" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
 <section id="pomdp-py-problems-light-dark-env-visual-module">
 <h2>pomdp_py.problems.light_dark.env.visual module<a class="headerlink" href="#pomdp-py-problems-light-dark-env-visual-module" title="Link to this heading">¶</a></h2>
diff --git a/docs/html/api/pomdp_py.problems.light_dark.html b/docs/html/api/pomdp_py.problems.light_dark.html
index 2dd03a63..59ffbfb0 100644
--- a/docs/html/api/pomdp_py.problems.light_dark.html
+++ b/docs/html/api/pomdp_py.problems.light_dark.html
@@ -5,15 +5,16 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.light_dark package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.light_dark package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.light_dark.agent package" href="pomdp_py.problems.light_dark.agent.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -53,7 +54,8 @@
   <div>
     <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
-<li><a class="reference internal" href="#">pomdp_py.problems.light_dark package</a><ul>
+<li><a class="reference internal" href="#">pomdp_py.problems.light_dark package</a></li>
+<li><a class="reference internal" href="#light-dark">Light-Dark</a><ul>
 <li><a class="reference internal" href="#subpackages">Subpackages</a></li>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
 <li><a class="reference internal" href="#pomdp-py-problems-light-dark-problem-discrete-module">pomdp_py.problems.light_dark.problem_discrete module</a></li>
@@ -73,8 +75,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -90,6 +100,11 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+      <li>Next: <a href="pomdp_py.problems.light_dark.agent.html" title="next chapter">pomdp_py.problems.light_dark.agent package</a></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -129,6 +144,24 @@ <h3 class="donation">Donate/support</h3>
             
   <section id="pomdp-py-problems-light-dark-package">
 <h1>pomdp_py.problems.light_dark package<a class="headerlink" href="#pomdp-py-problems-light-dark-package" title="Link to this heading">¶</a></h1>
+</section>
+<section id="light-dark">
+<h1>Light-Dark<a class="headerlink" href="#light-dark" title="Link to this heading">¶</a></h1>
+<p>A simple continuous domain.</p>
+<p>Reference: <a class="reference external" href="http://groups.csail.mit.edu/robotics-center/public_papers/Platt10.pdf">Belief space planning assuming maximum likelihood observations</a>.</p>
+<p><cite>Quoting from the original paper on problem description</cite>:</p>
+<blockquote>
+<div><p>In the light-dark domain, a robot must localize its position in the plane before approaching the goal. The robot’s ability to localize itself depends upon the amount of light present at its actual position. Light varies as a quadratic function of the horizontal coordinate. Depending upon the goal position, the initial robot position, and the configuration of the light, the robot may need to move away from its ultimate goal in order to localize itself. Figure 1 illustrates the configuration of the light-dark domain used in our experiments. The goal position is at the origin, marked by an X in the figure. The intensity in the figure illustrates the magnitude of the light over the plane. The robot’s initial position is unknown.</p>
+</div></blockquote>
+<figure class="align-default" id="id1">
+<img alt="Figure from the paper" src="https://i.imgur.com/7OYr6Hh.jpg" />
+<figcaption>
+<p><span class="caption-text">Light-Dark domain</span><a class="headerlink" href="#id1" title="Link to this image">¶</a></p>
+</figcaption>
+</figure>
+<p>Note that a variant of this domain appears in <a class="reference external" href="https://arxiv.org/pdf/1709.06196.pdf">Online algorithms for POMDPs with continuous state, action, and observation spaces</a> where the state and action spaces are discrete and the observation space is kept continuous. Here we do not implement this variant; You can implement it and create a pull request!</p>
+<p>There is an implementation of a variant of LightDarkDomain in the JuliaPOMDP suite (<a class="reference external" href="https://github.com/zsunberg/LightDarkPOMDPs.jl">repo</a>).</p>
+<p><strong>BLQR planning implementation not complete yet.</strong></p>
 <section id="subpackages">
 <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
 <div class="toctree-wrapper compound">
@@ -157,7 +190,13 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 </li>
 </ul>
 </li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp-py-problems-light-dark-env-plotting-module">pomdp_py.problems.light_dark.env.plotting module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.plotting">pomdp_py.problems.light_dark.env.plotting module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_points"><code class="docutils literal notranslate"><span class="pre">plot_points()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_polygons"><code class="docutils literal notranslate"><span class="pre">plot_polygons()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_line"><code class="docutils literal notranslate"><span class="pre">plot_line()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_circle"><code class="docutils literal notranslate"><span class="pre">plot_circle()</span></code></a></li>
+</ul>
+</li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#pomdp-py-problems-light-dark-env-visual-module">pomdp_py.problems.light_dark.env.visual module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env">Module contents</a></li>
 </ul>
diff --git a/docs/html/api/pomdp_py.problems.light_dark.models.html b/docs/html/api/pomdp_py.problems.light_dark.models.html
index 6319ce86..7707e266 100644
--- a/docs/html/api/pomdp_py.problems.light_dark.models.html
+++ b/docs/html/api/pomdp_py.problems.light_dark.models.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.light_dark.models package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.light_dark.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.load_unload package" href="pomdp_py.problems.load_unload.html" />
+    <link rel="prev" title="pomdp_py.problems.light_dark.env package" href="pomdp_py.problems.light_dark.env.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -72,8 +74,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -89,6 +99,14 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.light_dark.html">pomdp_py.problems.light_dark package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.light_dark.env.html" title="previous chapter">pomdp_py.problems.light_dark.env package</a></li>
+      <li>Next: <a href="pomdp_py.problems.load_unload.html" title="next chapter">pomdp_py.problems.load_unload package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
diff --git a/docs/html/api/pomdp_py.problems.load_unload.html b/docs/html/api/pomdp_py.problems.load_unload.html
index baea5d00..743db933 100644
--- a/docs/html/api/pomdp_py.problems.load_unload.html
+++ b/docs/html/api/pomdp_py.problems.load_unload.html
@@ -5,15 +5,18 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.load_unload package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.load_unload package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.maze package" href="pomdp_py.problems.maze.html" />
+    <link rel="prev" title="pomdp_py.problems.light_dark.models package" href="pomdp_py.problems.light_dark.models.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -53,9 +56,45 @@
   <div>
     <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
-<li><a class="reference internal" href="#">pomdp_py.problems.load_unload package</a><ul>
+<li><a class="reference internal" href="#">pomdp_py.problems.load_unload package</a></li>
+<li><a class="reference internal" href="#load-unload">Load/Unload</a><ul>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
-<li><a class="reference internal" href="#pomdp-py-problems-load-unload-load-unload-module">pomdp_py.problems.load_unload.load_unload module</a></li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.load_unload.load_unload">pomdp_py.problems.load_unload.load_unload module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUState"><code class="docutils literal notranslate"><span class="pre">LUState</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUAction"><code class="docutils literal notranslate"><span class="pre">LUAction</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUObservation"><code class="docutils literal notranslate"><span class="pre">LUObservation</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel"><code class="docutils literal notranslate"><span class="pre">LUObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel"><code class="docutils literal notranslate"><span class="pre">LURewardModel</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel.probability"><code class="docutils literal notranslate"><span class="pre">LURewardModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel.sample"><code class="docutils literal notranslate"><span class="pre">LURewardModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">LURewardModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.argmax()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.get_all_actions()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem"><code class="docutils literal notranslate"><span class="pre">LoadUnloadProblem</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.generate_random_state"><code class="docutils literal notranslate"><span class="pre">generate_random_state()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.generate_init_belief"><code class="docutils literal notranslate"><span class="pre">generate_init_belief()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.load_unload.load_unload.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.load_unload">Module contents</a></li>
 </ul>
 </li>
@@ -71,8 +110,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -88,6 +135,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.light_dark.models.html" title="previous chapter">pomdp_py.problems.light_dark.models package</a></li>
+      <li>Next: <a href="pomdp_py.problems.maze.html" title="next chapter">pomdp_py.problems.maze package</a></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -127,11 +180,313 @@ <h3 class="donation">Donate/support</h3>
             
   <section id="pomdp-py-problems-load-unload-package">
 <h1>pomdp_py.problems.load_unload package<a class="headerlink" href="#pomdp-py-problems-load-unload-package" title="Link to this heading">¶</a></h1>
+</section>
+<section id="load-unload">
+<h1>Load/Unload<a class="headerlink" href="#load-unload" title="Link to this heading">¶</a></h1>
+<p>Problem originally introduced in <a class="reference external" href="https://arxiv.org/pdf/1301.6720.pdf">Solving POMDPs by Searching the Space of Finite Policies</a></p>
+<p><cite>Quoting from the original paper on problem description</cite>:</p>
+<blockquote>
+<div><p>The load/unload problem with 8 locations: the agent starts in the “Unload” location (U) and receives a reward each time it returns to this place after passing through the “Load” location (L). The problem is partially observable because the agent cannot distinguish the different locations in between Load and Unload, and because it cannot perceive if it is loaded or not (<span class="math notranslate nohighlight">\(|S| = 14\)</span>, <span class="math notranslate nohighlight">\(|O| = 3\)</span> and <span class="math notranslate nohighlight">\(|A| = 2\)</span>).</p>
+</div></blockquote>
+<p>Figure from the paper:</p>
+<figure class="align-default" id="id1">
+<img alt="Load/Unload Problem." src="https://i.imgur.com/3OYqqko.png" />
+<figcaption>
+<p><span class="caption-text">Load/Unload problem</span><a class="headerlink" href="#id1" title="Link to this image">¶</a></p>
+</figcaption>
+</figure>
+<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">python</span> <span class="o">-</span><span class="n">m</span> <span class="n">pomdp_py</span> <span class="o">-</span><span class="n">r</span> <span class="n">load_unload</span>
+</pre></div>
+</div>
 <section id="submodules">
 <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
 </section>
-<section id="pomdp-py-problems-load-unload-load-unload-module">
-<h2>pomdp_py.problems.load_unload.load_unload module<a class="headerlink" href="#pomdp-py-problems-load-unload-load-unload-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.load_unload.load_unload">
+<span id="pomdp-py-problems-load-unload-load-unload-module"></span><h2>pomdp_py.problems.load_unload.load_unload module<a class="headerlink" href="#module-pomdp_py.problems.load_unload.load_unload" title="Link to this heading">¶</a></h2>
+<p>The load unload problem. An agent is placed on a one dimensional grid world
+and is tasked with loading itself up on the right side of the world and
+unloading on the left. The agent can observe whether or not it is in the load or
+unload block but can not tell its exact location of whether it is loaded or
+unloaded. Therefore the agent must maintain belief about it’s location and load
+status.</p>
+<p>States are defined by the location of the agent and whether or not it is loaded
+Actions: “move-left”, “move-right”
+Rewards:</p>
+<blockquote>
+<div><p>+100 for moving into the unload block while loaded
+-1 otherwise</p>
+</div></blockquote>
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">loaded</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><code class="xref py py-class docutils literal notranslate"><span class="pre">State</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUAction</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUObservation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUObservation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">obs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUObservation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUObservation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUObservationModel</span></span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel" title="pomdp_py.framework.basics.ObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObservationModel</span></code></a></p>
+<p>This problem is small enough for the probabilities to be directly given
+externally</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUObservationModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><em>Observation</em></a>) – the observation <span class="math notranslate nohighlight">\(o\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns observation randomly sampled according to the
+distribution of this observation model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>next_state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the observation <span class="math notranslate nohighlight">\(o\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation">Observation</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUObservationModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely observation</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUTransitionModel</span></span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<p>This problem is small enough for the probabilities to be directly given
+externally</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUTransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next state randomly sampled according to the
+distribution of this transition model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the next state <span class="math notranslate nohighlight">\(s'\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State">State</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LURewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LURewardModel</span></span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LURewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LURewardModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LURewardModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>reward</strong> (<em>float</em>) – the reward <span class="math notranslate nohighlight">\(r\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LURewardModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LURewardModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns reward randomly sampled according to the
+distribution of this reward model. This is required,
+i.e. assumed to be implemented for a reward model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the reward <span class="math notranslate nohighlight">\(r\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LURewardModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUPolicyModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUPolicyModel</span></span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUPolicyModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RandomRollout" title="pomdp_py.algorithms.po_uct.RandomRollout"><code class="xref py py-class docutils literal notranslate"><span class="pre">RandomRollout</span></code></a></p>
+<p>This is an extremely dumb policy model; To keep consistent
+with the framework.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUPolicyModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\pi(a|s)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>action</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\pi(a|s)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUPolicyModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns action randomly sampled according to the
+distribution of this policy model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>state</strong> (<a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the action <span class="math notranslate nohighlight">\(a\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action">Action</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUPolicyModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions">
+<span class="sig-name descname"><span class="pre">get_all_actions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LUPolicyModel.get_all_actions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a set of all possible actions, if feasible.</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LoadUnloadProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#LoadUnloadProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.generate_random_state">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">generate_random_state</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#generate_random_state"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.generate_random_state" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.generate_init_belief">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">generate_init_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">num_particles</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#generate_init_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.generate_init_belief" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.test_planner">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">test_planner</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">load_unload_problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">nsteps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.95</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#test_planner"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.test_planner" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.load_unload.load_unload.main">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/load_unload/load_unload.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.load_unload.load_unload.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
 <section id="module-pomdp_py.problems.load_unload">
 <span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-pomdp_py.problems.load_unload" title="Link to this heading">¶</a></h2>
diff --git a/docs/html/api/pomdp_py.problems.maze.domain.html b/docs/html/api/pomdp_py.problems.maze.domain.html
index 744253c5..4fbf0dc5 100644
--- a/docs/html/api/pomdp_py.problems.maze.domain.html
+++ b/docs/html/api/pomdp_py.problems.maze.domain.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.maze.domain package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -76,10 +76,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.maze.env.html b/docs/html/api/pomdp_py.problems.maze.env.html
index 7cad0380..263901e3 100644
--- a/docs/html/api/pomdp_py.problems.maze.env.html
+++ b/docs/html/api/pomdp_py.problems.maze.env.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.maze.env package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -71,10 +71,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.maze.html b/docs/html/api/pomdp_py.problems.maze.html
index 3e004320..2f942352 100644
--- a/docs/html/api/pomdp_py.problems.maze.html
+++ b/docs/html/api/pomdp_py.problems.maze.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.maze package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.maze.domain package" href="pomdp_py.problems.maze.domain.html" />
+    <link rel="prev" title="pomdp_py.problems.load_unload package" href="pomdp_py.problems.load_unload.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -53,10 +55,11 @@
   <div>
     <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
-<li><a class="reference internal" href="#">pomdp_py.problems.maze package</a><ul>
+<li><a class="reference internal" href="#">pomdp_py.problems.maze package</a></li>
+<li><a class="reference internal" href="#maze">Maze</a><ul>
 <li><a class="reference internal" href="#subpackages">Subpackages</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.maze">Module contents</a><ul>
-<li><a class="reference internal" href="#maze">Maze</a></li>
+<li><a class="reference internal" href="#id1">Maze</a></li>
 </ul>
 </li>
 </ul>
@@ -70,10 +73,19 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -89,6 +101,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.load_unload.html" title="previous chapter">pomdp_py.problems.load_unload package</a></li>
+      <li>Next: <a href="pomdp_py.problems.maze.domain.html" title="next chapter">pomdp_py.problems.maze.domain package</a></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -128,6 +146,21 @@ <h3 class="donation">Donate/support</h3>
             
   <section id="pomdp-py-problems-maze-package">
 <h1>pomdp_py.problems.maze package<a class="headerlink" href="#pomdp-py-problems-maze-package" title="Link to this heading">¶</a></h1>
+</section>
+<section id="maze">
+<h1>Maze<a class="headerlink" href="#maze" title="Link to this heading">¶</a></h1>
+<p>Problem originally introduced in <a class="reference external" href="https://arxiv.org/pdf/1301.6720.pdf">Solving POMDPs by Searching the Space of Finite Policies</a></p>
+<p><cite>Quoting from the original paper on problem description</cite>:</p>
+<blockquote>
+<div><p>A partially observable stochastic maze: the agent must go from the starting state marked with an “S” to the goal marked with an “G”. The problem  is partially observable because the agent cannot perceive its true location, but only its orientation and the presence or the absence of a wall on each side of the square defining its current state.  The problem is stochastic because there is a non-zero probability of slipping, so that the agent does not always know if its last attempt to make a move had any consequence on its actual position in the maze.</p>
+</div></blockquote>
+<figure class="align-default" id="id3">
+<img alt="Figure from the paper" src="https://i.imgur.com/i1RDsrL.png" />
+<figcaption>
+<p><span class="caption-text">Maze POMDP</span><a class="headerlink" href="#id3" title="Link to this image">¶</a></p>
+</figcaption>
+</figure>
+<p><strong>TODO</strong></p>
 <section id="subpackages">
 <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
 <div class="toctree-wrapper compound">
@@ -173,17 +206,17 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 </section>
 <section id="module-pomdp_py.problems.maze">
 <span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-pomdp_py.problems.maze" title="Link to this heading">¶</a></h2>
-<section id="maze">
-<h3>Maze<a class="headerlink" href="#maze" title="Link to this heading">¶</a></h3>
+<section id="id1">
+<h3>Maze<a class="headerlink" href="#id1" title="Link to this heading">¶</a></h3>
 <p>Problem originally introduced in <a class="reference external" href="https://arxiv.org/pdf/1301.6720.pdf">Solving POMDPs by Searching the Space of Finite Policies</a></p>
 <p><cite>Quoting from the original paper on problem description</cite>:</p>
 <blockquote>
 <div><p>A partially observable stochastic maze: the agent must go from the starting state marked with an “S” to the goal marked with an “G”. The problem  is partially observable because the agent cannot perceive its true location, but only its orientation and the presence or the absence of a wall on each side of the square defining its current state.  The problem is stochastic because there is a non-zero probability of slipping, so that the agent does not always know if its last attempt to make a move had any consequence on its actual position in the maze.</p>
 </div></blockquote>
-<figure class="align-default" id="id1">
+<figure class="align-default" id="id4">
 <img alt="Figure from the paper" src="https://i.imgur.com/i1RDsrL.png" />
 <figcaption>
-<p><span class="caption-text">Maze POMDP</span><a class="headerlink" href="#id1" title="Link to this image">¶</a></p>
+<p><span class="caption-text">Maze POMDP</span><a class="headerlink" href="#id4" title="Link to this image">¶</a></p>
 </figcaption>
 </figure>
 <p><strong>Not yet implemented</strong></p>
diff --git a/docs/html/api/pomdp_py.problems.maze.models.components.html b/docs/html/api/pomdp_py.problems.maze.models.components.html
index 34352876..bce559b3 100644
--- a/docs/html/api/pomdp_py.problems.maze.models.components.html
+++ b/docs/html/api/pomdp_py.problems.maze.models.components.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.maze.models.components package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.models.components package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.multi_object_search package" href="pomdp_py.problems.multi_object_search.html" />
+    <link rel="prev" title="pomdp_py.problems.maze.models package" href="pomdp_py.problems.maze.models.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -71,8 +73,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -88,6 +98,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.maze.html">pomdp_py.problems.maze package</a><ul>
+  <li><a href="pomdp_py.problems.maze.models.html">pomdp_py.problems.maze.models package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.maze.models.html" title="previous chapter">pomdp_py.problems.maze.models package</a></li>
+      <li>Next: <a href="pomdp_py.problems.multi_object_search.html" title="next chapter">pomdp_py.problems.multi_object_search package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
diff --git a/docs/html/api/pomdp_py.problems.maze.models.html b/docs/html/api/pomdp_py.problems.maze.models.html
index ce19be16..653095c8 100644
--- a/docs/html/api/pomdp_py.problems.maze.models.html
+++ b/docs/html/api/pomdp_py.problems.maze.models.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.maze.models package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.maze.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.maze.models.components package" href="pomdp_py.problems.maze.models.components.html" />
+    <link rel="prev" title="pomdp_py.problems.maze.env package" href="pomdp_py.problems.maze.env.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -70,8 +72,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -87,6 +97,14 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.maze.html">pomdp_py.problems.maze package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.maze.env.html" title="previous chapter">pomdp_py.problems.maze.env package</a></li>
+      <li>Next: <a href="pomdp_py.problems.maze.models.components.html" title="next chapter">pomdp_py.problems.maze.models.components package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
diff --git a/docs/html/api/pomdp_py.problems.multi_object_search.agent.html b/docs/html/api/pomdp_py.problems.multi_object_search.agent.html
index 8f2c2124..9f711dad 100644
--- a/docs/html/api/pomdp_py.problems.multi_object_search.agent.html
+++ b/docs/html/api/pomdp_py.problems.multi_object_search.agent.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.multi_object_search.agent package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.agent package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -83,10 +83,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.multi_object_search.domain.html b/docs/html/api/pomdp_py.problems.multi_object_search.domain.html
index 39dc05d0..d9d2ad4b 100644
--- a/docs/html/api/pomdp_py.problems.multi_object_search.domain.html
+++ b/docs/html/api/pomdp_py.problems.multi_object_search.domain.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.multi_object_search.domain package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -36,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -126,10 +126,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.multi_object_search.env.html b/docs/html/api/pomdp_py.problems.multi_object_search.env.html
index abb0bbe9..18b1647c 100644
--- a/docs/html/api/pomdp_py.problems.multi_object_search.env.html
+++ b/docs/html/api/pomdp_py.problems.multi_object_search.env.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.multi_object_search.env package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -68,7 +68,28 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.env.make_proximity_sensor"><code class="docutils literal notranslate"><span class="pre">make_proximity_sensor()</span></code></a></li>
 </ul>
 </li>
-<li><a class="reference internal" href="#pomdp-py-problems-multi-object-search-env-visual-module">pomdp_py.problems.multi_object_search.env.visual module</a></li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.multi_object_search.env.visual">pomdp_py.problems.multi_object_search.env.visual module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.object_color"><code class="docutils literal notranslate"><span class="pre">object_color()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz"><code class="docutils literal notranslate"><span class="pre">MosViz</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_width"><code class="docutils literal notranslate"><span class="pre">MosViz.img_width</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_height"><code class="docutils literal notranslate"><span class="pre">MosViz.img_height</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.last_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.last_observation</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.update"><code class="docutils literal notranslate"><span class="pre">MosViz.update()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_robot()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_observation()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_belief()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_init"><code class="docutils literal notranslate"><span class="pre">MosViz.on_init()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_event"><code class="docutils literal notranslate"><span class="pre">MosViz.on_event()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_loop"><code class="docutils literal notranslate"><span class="pre">MosViz.on_loop()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_render"><code class="docutils literal notranslate"><span class="pre">MosViz.on_render()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">MosViz.on_cleanup()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_execute"><code class="docutils literal notranslate"><span class="pre">MosViz.on_execute()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.render_env"><code class="docutils literal notranslate"><span class="pre">MosViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.multi_object_search.env">Module contents</a></li>
 </ul>
 </li>
@@ -86,6 +107,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -288,8 +310,107 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 </dd></dl>
 
 </section>
-<section id="pomdp-py-problems-multi-object-search-env-visual-module">
-<h2>pomdp_py.problems.multi_object_search.env.visual module<a class="headerlink" href="#pomdp-py-problems-multi-object-search-env-visual-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.multi_object_search.env.visual">
+<span id="pomdp-py-problems-multi-object-search-env-visual-module"></span><h2>pomdp_py.problems.multi_object_search.env.visual module<a class="headerlink" href="#module-pomdp_py.problems.multi_object_search.env.visual" title="Link to this heading">¶</a></h2>
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.object_color">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.env.visual.</span></span><span class="sig-name descname"><span class="pre">object_color</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">count</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#object_color"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.object_color" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.env.visual.</span></span><span class="sig-name descname"><span class="pre">MosViz</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">env</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">res</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">controllable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.img_width">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_width</span></span><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_width" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.img_height">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_height</span></span><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_height" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.last_observation">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">last_observation</span></span><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.last_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.update">
+<span class="sig-name descname"><span class="pre">update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">viz_observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.update" title="Link to this definition">¶</a></dt>
+<dd><p>Update the visualization after there is new real action and observation
+and updated belief.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation" title="pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation"><em>MosOOObservation</em></a>) – Real observation</p></li>
+<li><p><strong>viz_observation</strong> (<a class="reference internal" href="pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation" title="pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation"><em>MosOOObservation</em></a>) – An observation used to visualize
+the sensing region.</p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_robot">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_robot</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">th</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(255,</span> <span class="pre">12,</span> <span class="pre">12)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.draw_robot"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_robot" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_observation">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_observation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">z</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rx</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ry</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rth</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(12,</span> <span class="pre">12,</span> <span class="pre">255)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.draw_observation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_belief">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_colors</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.draw_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_belief" title="Link to this definition">¶</a></dt>
+<dd><p>belief (OOBelief)</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.on_init">
+<span class="sig-name descname"><span class="pre">on_init</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.on_init"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_init" title="Link to this definition">¶</a></dt>
+<dd><p>pygame init</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.on_event">
+<span class="sig-name descname"><span class="pre">on_event</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">event</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.on_event"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_event" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.on_loop">
+<span class="sig-name descname"><span class="pre">on_loop</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.on_loop"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_loop" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.on_render">
+<span class="sig-name descname"><span class="pre">on_render</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.on_render"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_render" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.on_cleanup">
+<span class="sig-name descname"><span class="pre">on_cleanup</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.on_cleanup"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_cleanup" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.on_execute">
+<span class="sig-name descname"><span class="pre">on_execute</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.on_execute"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_execute" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.MosViz.render_env">
+<span class="sig-name descname"><span class="pre">render_env</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">display_surf</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#MosViz.render_env"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.MosViz.render_env" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.env.visual.unittest">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.env.visual.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/env/visual.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.env.visual.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
 <section id="module-pomdp_py.problems.multi_object_search.env">
 <span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-pomdp_py.problems.multi_object_search.env" title="Link to this heading">¶</a></h2>
diff --git a/docs/html/api/pomdp_py.problems.multi_object_search.html b/docs/html/api/pomdp_py.problems.multi_object_search.html
index b95a3d01..fdb0c05c 100644
--- a/docs/html/api/pomdp_py.problems.multi_object_search.html
+++ b/docs/html/api/pomdp_py.problems.multi_object_search.html
@@ -5,15 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.multi_object_search package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.multi_object_search.agent package" href="pomdp_py.problems.multi_object_search.agent.html" />
+    <link rel="prev" title="pomdp_py.problems.maze.models.components package" href="pomdp_py.problems.maze.models.components.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -35,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -53,14 +55,21 @@
   <div>
     <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
-<li><a class="reference internal" href="#">pomdp_py.problems.multi_object_search package</a><ul>
+<li><a class="reference internal" href="#">pomdp_py.problems.multi_object_search package</a></li>
+<li><a class="reference internal" href="#multi-object-search-mos-task">Multi-Object Search (MOS) Task</a><ul>
 <li><a class="reference internal" href="#subpackages">Subpackages</a></li>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.multi_object_search.example_worlds">pomdp_py.problems.multi_object_search.example_worlds module</a><ul>
 <li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.example_worlds.random_world"><code class="docutils literal notranslate"><span class="pre">random_world()</span></code></a></li>
 </ul>
 </li>
-<li><a class="reference internal" href="#pomdp-py-problems-multi-object-search-problem-module">pomdp_py.problems.multi_object_search.problem module</a></li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.multi_object_search.problem">pomdp_py.problems.multi_object_search.problem module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.problem.MosOOPOMDP"><code class="docutils literal notranslate"><span class="pre">MosOOPOMDP</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.problem.belief_update"><code class="docutils literal notranslate"><span class="pre">belief_update()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.multi_object_search.problem.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.multi_object_search">Module contents</a></li>
 </ul>
 </li>
@@ -76,8 +85,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -93,6 +110,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.maze.models.components.html" title="previous chapter">pomdp_py.problems.maze.models.components package</a></li>
+      <li>Next: <a href="pomdp_py.problems.multi_object_search.agent.html" title="next chapter">pomdp_py.problems.multi_object_search.agent package</a></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -132,6 +155,15 @@ <h3 class="donation">Donate/support</h3>
             
   <section id="pomdp-py-problems-multi-object-search-package">
 <h1>pomdp_py.problems.multi_object_search package<a class="headerlink" href="#pomdp-py-problems-multi-object-search-package" title="Link to this heading">¶</a></h1>
+</section>
+<section id="multi-object-search-mos-task">
+<h1>Multi-Object Search (MOS) Task<a class="headerlink" href="#multi-object-search-mos-task" title="Link to this heading">¶</a></h1>
+<p>This task is based on the Multi-Object Search (MOS) task described in the
+following paper</p>
+<p><a class="reference external" href="https://h2r.cs.brown.edu/wp-content/uploads/wandzel19.pdf">Multi-Object Search using Object-Oriented POMDPs</a> (ICRA 2019)</p>
+<p>In this implementation, we consider a different (simpler) motion action scheme,
+instead of based on topological graph and room connectivity.</p>
+<p>Refer to <span class="xref std std-doc">examples.mos</span> for more details.</p>
 <section id="subpackages">
 <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
 <div class="toctree-wrapper compound">
@@ -235,7 +267,28 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 <li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.env.make_proximity_sensor"><code class="docutils literal notranslate"><span class="pre">make_proximity_sensor()</span></code></a></li>
 </ul>
 </li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp-py-problems-multi-object-search-env-visual-module">pomdp_py.problems.multi_object_search.env.visual module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.visual">pomdp_py.problems.multi_object_search.env.visual module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.object_color"><code class="docutils literal notranslate"><span class="pre">object_color()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz"><code class="docutils literal notranslate"><span class="pre">MosViz</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_width"><code class="docutils literal notranslate"><span class="pre">MosViz.img_width</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_height"><code class="docutils literal notranslate"><span class="pre">MosViz.img_height</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.last_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.last_observation</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.update"><code class="docutils literal notranslate"><span class="pre">MosViz.update()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_robot()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_observation()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_belief()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_init"><code class="docutils literal notranslate"><span class="pre">MosViz.on_init()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_event"><code class="docutils literal notranslate"><span class="pre">MosViz.on_event()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_loop"><code class="docutils literal notranslate"><span class="pre">MosViz.on_loop()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_render"><code class="docutils literal notranslate"><span class="pre">MosViz.on_render()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">MosViz.on_cleanup()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_execute"><code class="docutils literal notranslate"><span class="pre">MosViz.on_execute()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.render_env"><code class="docutils literal notranslate"><span class="pre">MosViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env">Module contents</a></li>
 </ul>
 </li>
@@ -327,8 +380,54 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 <dd></dd></dl>
 
 </section>
-<section id="pomdp-py-problems-multi-object-search-problem-module">
-<h2>pomdp_py.problems.multi_object_search.problem module<a class="headerlink" href="#pomdp-py-problems-multi-object-search-problem-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.multi_object_search.problem">
+<span id="pomdp-py-problems-multi-object-search-problem-module"></span><h2>pomdp_py.problems.multi_object_search.problem module<a class="headerlink" href="#module-pomdp_py.problems.multi_object_search.problem" title="Link to this heading">¶</a></h2>
+<p>2D Multi-Object Search (MOS) Task.
+Uses the domain, models, and agent/environment
+to actually define the POMDP problem for multi-object search.
+Then, solve it using POUCT or POMCP.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.problem.MosOOPOMDP">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">MosOOPOMDP</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">env</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensors</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sigma</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.01</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief_rep</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'histogram'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">agent_has_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/problem.html#MosOOPOMDP"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.problem.MosOOPOMDP" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOPOMDP" title="pomdp_py.framework.oopomdp.OOPOMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOPOMDP</span></code></a></p>
+<p>A MosOOPOMDP is instantiated given a string description
+of the search world, sensor descriptions for robots,
+and the necessary parameters for the agent’s models.</p>
+<p>Note: This is of course a simulation, where you can
+generate a world and know where the target objects are
+and then construct the Environment object. But in the
+real robot scenario, you don’t know where the objects
+are. In that case, as I have done it in the past, you
+could construct an Environment object and give None to
+the object poses.</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.problem.belief_update">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">belief_update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">agent</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_robot_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/problem.html#belief_update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.problem.belief_update" title="Link to this definition">¶</a></dt>
+<dd><p>Updates the agent’s belief; The belief update may happen
+through planner update (e.g. when planner is POMCP).</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.problem.solve">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">solve</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_depth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount_factor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.99</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planning_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">exploration_const</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">visualize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">120</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_steps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">500</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/problem.html#solve"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.problem.solve" title="Link to this definition">¶</a></dt>
+<dd><p>This function terminates when:
+- maximum time (max_time) reached; This time includes planning and updates
+- agent has planned <cite>max_steps</cite> number of steps
+- agent has taken n FindAction(s) where n = number of target objects.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>visualize</strong> (<em>bool</em>) – </p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.multi_object_search.problem.unittest">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/multi_object_search/problem.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.multi_object_search.problem.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
 <section id="module-pomdp_py.problems.multi_object_search">
 <span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-pomdp_py.problems.multi_object_search" title="Link to this heading">¶</a></h2>
diff --git a/docs/html/api/pomdp_py.problems.multi_object_search.models.components.html b/docs/html/api/pomdp_py.problems.multi_object_search.models.components.html
index d76bb4a9..690193fb 100644
--- a/docs/html/api/pomdp_py.problems.multi_object_search.models.components.html
+++ b/docs/html/api/pomdp_py.problems.multi_object_search.models.components.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.multi_object_search.models.components package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models.components package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -99,10 +99,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.multi_object_search.models.html b/docs/html/api/pomdp_py.problems.multi_object_search.models.html
index dba29a7a..a881763d 100644
--- a/docs/html/api/pomdp_py.problems.multi_object_search.models.html
+++ b/docs/html/api/pomdp_py.problems.multi_object_search.models.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.multi_object_search.models package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.multi_object_search.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -36,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -127,10 +127,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.rocksample.cythonize.html b/docs/html/api/pomdp_py.problems.rocksample.cythonize.html
index 0ba069b2..fca269a5 100644
--- a/docs/html/api/pomdp_py.problems.rocksample.cythonize.html
+++ b/docs/html/api/pomdp_py.problems.rocksample.cythonize.html
@@ -5,16 +5,18 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.rocksample.cythonize package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.rocksample.cythonize package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.tag package" href="pomdp_py.problems.tag.html" />
+    <link rel="prev" title="pomdp_py.problems.rocksample package" href="pomdp_py.problems.rocksample.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -36,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -356,8 +358,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -373,6 +383,14 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.rocksample.html">pomdp_py.problems.rocksample package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.rocksample.html" title="previous chapter">pomdp_py.problems.rocksample package</a></li>
+      <li>Next: <a href="pomdp_py.problems.tag.html" title="next chapter">pomdp_py.problems.tag package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
diff --git a/docs/html/api/pomdp_py.problems.rocksample.html b/docs/html/api/pomdp_py.problems.rocksample.html
index 0dca7711..3a425e9e 100644
--- a/docs/html/api/pomdp_py.problems.rocksample.html
+++ b/docs/html/api/pomdp_py.problems.rocksample.html
@@ -5,16 +5,18 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.rocksample package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.rocksample package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.rocksample.cythonize package" href="pomdp_py.problems.rocksample.cythonize.html" />
+    <link rel="prev" title="pomdp_py.problems.multi_object_search.models.components package" href="pomdp_py.problems.multi_object_search.models.components.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -36,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -54,7 +56,9 @@
   <div>
     <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
-<li><a class="reference internal" href="#">pomdp_py.problems.rocksample package</a><ul>
+<li><a class="reference internal" href="#">pomdp_py.problems.rocksample package</a></li>
+<li><a class="reference internal" href="#rocksample">RockSample</a><ul>
+<li><a class="reference internal" href="#pomdp-problems-rocksample-rocksample-problem-module">pomdp_problems.rocksample.rocksample_problem module</a></li>
 <li><a class="reference internal" href="#subpackages">Subpackages</a></li>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.rocksample.cythonize">pomdp_py.problems.rocksample.cythonize module</a></li>
@@ -114,6 +118,8 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </li>
 <li><a class="reference internal" href="#pomdp_py.problems.rocksample.rocksample_problem.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.problems.rocksample.rocksample_problem.init_particles_belief"><code class="docutils literal notranslate"><span class="pre">init_particles_belief()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.rocksample.rocksample_problem.minimal_instance"><code class="docutils literal notranslate"><span class="pre">minimal_instance()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.rocksample.rocksample_problem.create_instance"><code class="docutils literal notranslate"><span class="pre">create_instance()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.problems.rocksample.rocksample_problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
 </ul>
 </li>
@@ -132,8 +138,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -149,6 +163,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.multi_object_search.models.components.html" title="previous chapter">pomdp_py.problems.multi_object_search.models.components package</a></li>
+      <li>Next: <a href="pomdp_py.problems.rocksample.cythonize.html" title="next chapter">pomdp_py.problems.rocksample.cythonize package</a></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -188,6 +208,17 @@ <h3 class="donation">Donate/support</h3>
             
   <section id="pomdp-py-problems-rocksample-package">
 <h1>pomdp_py.problems.rocksample package<a class="headerlink" href="#pomdp-py-problems-rocksample-package" title="Link to this heading">¶</a></h1>
+</section>
+<section id="rocksample">
+<h1>RockSample<a class="headerlink" href="#rocksample" title="Link to this heading">¶</a></h1>
+<p>Classic POMDP domain.</p>
+<p>Reference:</p>
+<ul class="simple">
+<li><p><a class="reference external" href="https://arxiv.org/pdf/1207.4166.pdf">Heuristic Search Value Iteration for POMDPs</a></p></li>
+</ul>
+<section id="pomdp-problems-rocksample-rocksample-problem-module">
+<h2>pomdp_problems.rocksample.rocksample_problem module<a class="headerlink" href="#pomdp-problems-rocksample-rocksample-problem-module" title="Link to this heading">¶</a></h2>
+</section>
 <section id="subpackages">
 <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
 <div class="toctree-wrapper compound">
@@ -516,8 +547,11 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 Check_i: receives a noisy observation about RockType_i
 (noise determined by eta (<span class="math notranslate nohighlight">\(\eta\)</span>). eta=1 -&gt; perfect sensor; eta=0 -&gt; uniform)</p>
 </div></blockquote>
-<p>Observation: observes the property of rock i when taking Check_i.</p>
 <dl class="simple">
+<dt>Observation: observes the property of rock i when taking Check_i.  The</dt><dd><p>observation may be noisy, depending on an efficiency parameter which
+decreases exponentially as the distance increases between the rover and
+rock i. ‘half_efficiency_dist’ influences this parameter (larger, more robust)</p>
+</dd>
 <dt>Reward: +10 for Sample a good rock. -10 for Sampling a bad rock.</dt><dd><p>Move to exit area +10. Other actions have no cost or reward.</p>
 </dd>
 </dl>
@@ -839,7 +873,7 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 
 <dl class="py class">
 <dt class="sig sig-object py" id="pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RockSampleProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rock_locs</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/rocksample/rocksample_problem.html#RockSampleProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem" title="Link to this definition">¶</a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RockSampleProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rock_locs</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">half_efficiency_dist</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/rocksample/rocksample_problem.html#RockSampleProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem" title="Link to this definition">¶</a></dt>
 <dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location">
@@ -875,6 +909,16 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 <span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">init_particles_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'uniform'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/rocksample/rocksample_problem.html#init_particles_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.rocksample.rocksample_problem.init_particles_belief" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.rocksample.rocksample_problem.minimal_instance">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">minimal_instance</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/rocksample/rocksample_problem.html#minimal_instance"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.rocksample.rocksample_problem.minimal_instance" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.rocksample.rocksample_problem.create_instance">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">create_instance</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/rocksample/rocksample_problem.html#create_instance"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.rocksample.rocksample_problem.create_instance" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="py function">
 <dt class="sig sig-object py" id="pomdp_py.problems.rocksample.rocksample_problem.main">
 <span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/rocksample/rocksample_problem.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.rocksample.rocksample_problem.main" title="Link to this definition">¶</a></dt>
diff --git a/docs/html/api/pomdp_py.problems.tag.agent.html b/docs/html/api/pomdp_py.problems.tag.agent.html
index 2325870f..b390fede 100644
--- a/docs/html/api/pomdp_py.problems.tag.agent.html
+++ b/docs/html/api/pomdp_py.problems.tag.agent.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tag.agent package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.agent package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -77,10 +77,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.tag.domain.html b/docs/html/api/pomdp_py.problems.tag.domain.html
index d901fdf8..4c1adea2 100644
--- a/docs/html/api/pomdp_py.problems.tag.domain.html
+++ b/docs/html/api/pomdp_py.problems.tag.domain.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tag.domain package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -79,10 +79,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.tag.env.html b/docs/html/api/pomdp_py.problems.tag.env.html
index eba0e942..aa965965 100644
--- a/docs/html/api/pomdp_py.problems.tag.env.html
+++ b/docs/html/api/pomdp_py.problems.tag.env.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tag.env package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -55,8 +55,37 @@ <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
 <li><a class="reference internal" href="#">pomdp_py.problems.tag.env package</a><ul>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
-<li><a class="reference internal" href="#pomdp-py-problems-tag-env-env-module">pomdp_py.problems.tag.env.env module</a></li>
-<li><a class="reference internal" href="#pomdp-py-problems-tag-env-visual-module">pomdp_py.problems.tag.env.visual module</a></li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.tag.env.env">pomdp_py.problems.tag.env.env module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.env.TagEnvironment"><code class="docutils literal notranslate"><span class="pre">TagEnvironment</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.env.TagEnvironment.width"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.width</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.env.TagEnvironment.length"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.length</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.env.TagEnvironment.grid_map"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.grid_map</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.env.TagEnvironment.from_str"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.from_str()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.tag.env.visual">pomdp_py.problems.tag.env.visual module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz"><code class="docutils literal notranslate"><span class="pre">TagViz</span></code></a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.img_width"><code class="docutils literal notranslate"><span class="pre">TagViz.img_width</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.img_height"><code class="docutils literal notranslate"><span class="pre">TagViz.img_height</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.last_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.last_observation</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.update"><code class="docutils literal notranslate"><span class="pre">TagViz.update()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_robot()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_observation()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_belief()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.on_init"><code class="docutils literal notranslate"><span class="pre">TagViz.on_init()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.on_event"><code class="docutils literal notranslate"><span class="pre">TagViz.on_event()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.on_loop"><code class="docutils literal notranslate"><span class="pre">TagViz.on_loop()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.on_render"><code class="docutils literal notranslate"><span class="pre">TagViz.on_render()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">TagViz.on_cleanup()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.on_execute"><code class="docutils literal notranslate"><span class="pre">TagViz.on_execute()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.TagViz.render_env"><code class="docutils literal notranslate"><span class="pre">TagViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.tag.env">Module contents</a></li>
 </ul>
 </li>
@@ -74,6 +103,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -131,11 +161,123 @@ <h1>pomdp_py.problems.tag.env package<a class="headerlink" href="#pomdp-py-probl
 <section id="submodules">
 <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
 </section>
-<section id="pomdp-py-problems-tag-env-env-module">
-<h2>pomdp_py.problems.tag.env.env module<a class="headerlink" href="#pomdp-py-problems-tag-env-env-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.tag.env.env">
+<span id="pomdp-py-problems-tag-env-env-module"></span><h2>pomdp_py.problems.tag.env.env module<a class="headerlink" href="#module-pomdp_py.problems.tag.env.env" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.env.TagEnvironment">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.env.env.</span></span><span class="sig-name descname"><span class="pre">TagEnvironment</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pr_stay</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/env.html#TagEnvironment"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.env.TagEnvironment" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.Environment" title="pomdp_py.framework.basics.Environment"><code class="xref py py-class docutils literal notranslate"><span class="pre">Environment</span></code></a></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.env.TagEnvironment.width">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">width</span></span><a class="headerlink" href="#pomdp_py.problems.tag.env.env.TagEnvironment.width" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.env.TagEnvironment.length">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">length</span></span><a class="headerlink" href="#pomdp_py.problems.tag.env.env.TagEnvironment.length" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.env.TagEnvironment.grid_map">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">grid_map</span></span><a class="headerlink" href="#pomdp_py.problems.tag.env.env.TagEnvironment.grid_map" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.env.TagEnvironment.from_str">
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">from_str</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldstr</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/env.html#TagEnvironment.from_str"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.env.TagEnvironment.from_str" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
 </section>
-<section id="pomdp-py-problems-tag-env-visual-module">
-<h2>pomdp_py.problems.tag.env.visual module<a class="headerlink" href="#pomdp-py-problems-tag-env-visual-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.tag.env.visual">
+<span id="pomdp-py-problems-tag-env-visual-module"></span><h2>pomdp_py.problems.tag.env.visual module<a class="headerlink" href="#module-pomdp_py.problems.tag.env.visual" title="Link to this heading">¶</a></h2>
+<p>Largely based on MosViz, except this is not an OO-POMDP</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.env.visual.</span></span><span class="sig-name descname"><span class="pre">TagViz</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">env</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">res</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">controllable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.img_width">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_width</span></span><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.img_width" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.img_height">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_height</span></span><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.img_height" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.last_observation">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">last_observation</span></span><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.last_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.update">
+<span class="sig-name descname"><span class="pre">update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.update" title="Link to this definition">¶</a></dt>
+<dd><p>Update the visualization after there is new real action and observation
+and updated belief.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.draw_robot">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_robot</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">th</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(255,</span> <span class="pre">12,</span> <span class="pre">12)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.draw_robot"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.draw_robot" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.draw_observation">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_observation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">z</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rx</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ry</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rth</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(12,</span> <span class="pre">12,</span> <span class="pre">255)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.draw_observation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.draw_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.draw_belief">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_color</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.draw_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.draw_belief" title="Link to this definition">¶</a></dt>
+<dd><p>belief (OOBelief)</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.on_init">
+<span class="sig-name descname"><span class="pre">on_init</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.on_init"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.on_init" title="Link to this definition">¶</a></dt>
+<dd><p>pygame init</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.on_event">
+<span class="sig-name descname"><span class="pre">on_event</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">event</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.on_event"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.on_event" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.on_loop">
+<span class="sig-name descname"><span class="pre">on_loop</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.on_loop"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.on_loop" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.on_render">
+<span class="sig-name descname"><span class="pre">on_render</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.on_render"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.on_render" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.on_cleanup">
+<span class="sig-name descname"><span class="pre">on_cleanup</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.on_cleanup"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.on_cleanup" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.on_execute">
+<span class="sig-name descname"><span class="pre">on_execute</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.on_execute"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.on_execute" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.TagViz.render_env">
+<span class="sig-name descname"><span class="pre">render_env</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">display_surf</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#TagViz.render_env"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.TagViz.render_env" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.env.visual.unittest">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.env.visual.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/env/visual.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.env.visual.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
 <section id="module-pomdp_py.problems.tag.env">
 <span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-pomdp_py.problems.tag.env" title="Link to this heading">¶</a></h2>
diff --git a/docs/html/api/pomdp_py.problems.tag.html b/docs/html/api/pomdp_py.problems.tag.html
index 9900e2b7..a14e95a5 100644
--- a/docs/html/api/pomdp_py.problems.tag.html
+++ b/docs/html/api/pomdp_py.problems.tag.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tag package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -58,8 +58,17 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.tag.constants">pomdp_py.problems.tag.constants module</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.tag.example_worlds">pomdp_py.problems.tag.example_worlds module</a></li>
-<li><a class="reference internal" href="#pomdp-py-problems-tag-experiment-module">pomdp_py.problems.tag.experiment module</a></li>
-<li><a class="reference internal" href="#pomdp-py-problems-tag-problem-module">pomdp_py.problems.tag.problem module</a></li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.tag.experiment">pomdp_py.problems.tag.experiment module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.experiment.trial"><code class="docutils literal notranslate"><span class="pre">trial()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.experiment.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-pomdp_py.problems.tag.problem">pomdp_py.problems.tag.problem module</a><ul>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.problem.TagProblem"><code class="docutils literal notranslate"><span class="pre">TagProblem</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.problems.tag.problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.tag">Module contents</a></li>
 </ul>
 </li>
@@ -77,6 +86,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -169,8 +179,37 @@ <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this hea
 </li>
 <li class="toctree-l1"><a class="reference internal" href="pomdp_py.problems.tag.env.html">pomdp_py.problems.tag.env package</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.env.html#submodules">Submodules</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp-py-problems-tag-env-env-module">pomdp_py.problems.tag.env.env module</a></li>
-<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp-py-problems-tag-env-visual-module">pomdp_py.problems.tag.env.visual module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.env">pomdp_py.problems.tag.env.env module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment"><code class="docutils literal notranslate"><span class="pre">TagEnvironment</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.width"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.width</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.length"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.length</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.grid_map"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.grid_map</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.from_str"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.from_str()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.visual">pomdp_py.problems.tag.env.visual module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz"><code class="docutils literal notranslate"><span class="pre">TagViz</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.img_width"><code class="docutils literal notranslate"><span class="pre">TagViz.img_width</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.img_height"><code class="docutils literal notranslate"><span class="pre">TagViz.img_height</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.last_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.last_observation</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.update"><code class="docutils literal notranslate"><span class="pre">TagViz.update()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_robot()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_observation()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_belief()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_init"><code class="docutils literal notranslate"><span class="pre">TagViz.on_init()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_event"><code class="docutils literal notranslate"><span class="pre">TagViz.on_event()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_loop"><code class="docutils literal notranslate"><span class="pre">TagViz.on_loop()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_render"><code class="docutils literal notranslate"><span class="pre">TagViz.on_render()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">TagViz.on_cleanup()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_execute"><code class="docutils literal notranslate"><span class="pre">TagViz.on_execute()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.render_env"><code class="docutils literal notranslate"><span class="pre">TagViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
 <li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env">Module contents</a></li>
 </ul>
 </li>
@@ -237,11 +276,38 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 <section id="module-pomdp_py.problems.tag.example_worlds">
 <span id="pomdp-py-problems-tag-example-worlds-module"></span><h2>pomdp_py.problems.tag.example_worlds module<a class="headerlink" href="#module-pomdp_py.problems.tag.example_worlds" title="Link to this heading">¶</a></h2>
 </section>
-<section id="pomdp-py-problems-tag-experiment-module">
-<h2>pomdp_py.problems.tag.experiment module<a class="headerlink" href="#pomdp-py-problems-tag-experiment-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.tag.experiment">
+<span id="pomdp-py-problems-tag-experiment-module"></span><h2>pomdp_py.problems.tag.experiment module<a class="headerlink" href="#module-pomdp_py.problems.tag.experiment" title="Link to this heading">¶</a></h2>
+<p>Simple experiment to get mean</p>
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.experiment.trial">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.experiment.</span></span><span class="sig-name descname"><span class="pre">trial</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldstr</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/experiment.html#trial"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.experiment.trial" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.experiment.main">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.experiment.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/experiment.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.experiment.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
-<section id="pomdp-py-problems-tag-problem-module">
-<h2>pomdp_py.problems.tag.problem module<a class="headerlink" href="#pomdp-py-problems-tag-problem-module" title="Link to this heading">¶</a></h2>
+<section id="module-pomdp_py.problems.tag.problem">
+<span id="pomdp-py-problems-tag-problem-module"></span><h2>pomdp_py.problems.tag.problem module<a class="headerlink" href="#module-pomdp_py.problems.tag.problem" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.problem.TagProblem">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.problem.</span></span><span class="sig-name descname"><span class="pre">TagProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_target_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pr_stay</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'uniform'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'hist'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">6</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/problem.html#TagProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.problem.TagProblem" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.problem.solve">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.problem.</span></span><span class="sig-name descname"><span class="pre">solve</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'pouct'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_depth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount_factor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.99</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planning_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">exploration_const</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">visualize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">120</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_steps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">500</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/problem.html#solve"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.problem.solve" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="pomdp_py.problems.tag.problem.main">
+<span class="sig-prename descclassname"><span class="pre">pomdp_py.problems.tag.problem.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/pomdp_py/problems/tag/problem.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#pomdp_py.problems.tag.problem.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </section>
 <section id="module-pomdp_py.problems.tag">
 <span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-pomdp_py.problems.tag" title="Link to this heading">¶</a></h2>
diff --git a/docs/html/api/pomdp_py.problems.tag.models.components.html b/docs/html/api/pomdp_py.problems.tag.models.components.html
index 8f0f82e4..b2e639be 100644
--- a/docs/html/api/pomdp_py.problems.tag.models.components.html
+++ b/docs/html/api/pomdp_py.problems.tag.models.components.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tag.models.components package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models.components package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -86,10 +86,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.tag.models.html b/docs/html/api/pomdp_py.problems.tag.models.html
index 64cc448e..b41b4813 100644
--- a/docs/html/api/pomdp_py.problems.tag.models.html
+++ b/docs/html/api/pomdp_py.problems.tag.models.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tag.models package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tag.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -36,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -105,10 +105,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.problems.tiger.cythonize.html b/docs/html/api/pomdp_py.problems.tiger.cythonize.html
index aed43ea0..ab58e664 100644
--- a/docs/html/api/pomdp_py.problems.tiger.cythonize.html
+++ b/docs/html/api/pomdp_py.problems.tiger.cythonize.html
@@ -5,16 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tiger.cythonize package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tiger.cythonize package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="prev" title="pomdp_py.problems.tiger package" href="pomdp_py.problems.tiger.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -36,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -288,8 +289,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -305,6 +314,13 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+  <li><a href="pomdp_py.problems.tiger.html">pomdp_py.problems.tiger package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.tiger.html" title="previous chapter">pomdp_py.problems.tiger package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -531,7 +547,7 @@ <h2>pomdp_py.problems.tiger.cythonize.run_tiger module<a class="headerlink" href
 <dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
 <dl class="py attribute">
 <dt class="sig sig-object py" id="pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.ACTIONS">
-<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(listen),</span> <span class="pre">TigerAction(open-left),</span> <span class="pre">TigerAction(open-right)]</span></em><a class="headerlink" href="#pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.ACTIONS" title="Link to this definition">¶</a></dt>
+<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(open-right),</span> <span class="pre">TigerAction(listen),</span> <span class="pre">TigerAction(open-left)]</span></em><a class="headerlink" href="#pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.ACTIONS" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="py attribute">
@@ -910,7 +926,7 @@ <h2>pomdp_py.problems.tiger.cythonize.tiger_problem module<a class="headerlink"
 <dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
 <dl class="py attribute">
 <dt class="sig sig-object py" id="id17">
-<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(listen),</span> <span class="pre">TigerAction(open-left),</span> <span class="pre">TigerAction(open-right)]</span></em><a class="headerlink" href="#id17" title="Link to this definition">¶</a></dt>
+<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(open-right),</span> <span class="pre">TigerAction(listen),</span> <span class="pre">TigerAction(open-left)]</span></em><a class="headerlink" href="#id17" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="py attribute">
@@ -1289,7 +1305,7 @@ <h2>pomdp_py.problems.tiger.cythonize.tiger_problem module<a class="headerlink"
 <dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
 <dl class="py attribute">
 <dt class="sig sig-object py" id="id56">
-<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(listen),</span> <span class="pre">TigerAction(open-left),</span> <span class="pre">TigerAction(open-right)]</span></em><a class="headerlink" href="#id56" title="Link to this definition">¶</a></dt>
+<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(open-right),</span> <span class="pre">TigerAction(listen),</span> <span class="pre">TigerAction(open-left)]</span></em><a class="headerlink" href="#id56" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="py attribute">
@@ -1668,7 +1684,7 @@ <h2>pomdp_py.problems.tiger.cythonize.tiger_problem module<a class="headerlink"
 <dd><p>Bases: <a class="reference internal" href="pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
 <dl class="py attribute">
 <dt class="sig sig-object py" id="id95">
-<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(listen),</span> <span class="pre">TigerAction(open-left),</span> <span class="pre">TigerAction(open-right)]</span></em><a class="headerlink" href="#id95" title="Link to this definition">¶</a></dt>
+<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(open-right),</span> <span class="pre">TigerAction(listen),</span> <span class="pre">TigerAction(open-left)]</span></em><a class="headerlink" href="#id95" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="py attribute">
diff --git a/docs/html/api/pomdp_py.problems.tiger.html b/docs/html/api/pomdp_py.problems.tiger.html
index 5f7671c9..88676056 100644
--- a/docs/html/api/pomdp_py.problems.tiger.html
+++ b/docs/html/api/pomdp_py.problems.tiger.html
@@ -5,16 +5,18 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.problems.tiger package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.problems.tiger package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems.tiger.cythonize package" href="pomdp_py.problems.tiger.cythonize.html" />
+    <link rel="prev" title="pomdp_py.problems.tag.models.components package" href="pomdp_py.problems.tag.models.components.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
   
@@ -36,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -54,7 +56,8 @@
   <div>
     <h3><a href="../index.html">Table of Contents</a></h3>
     <ul>
-<li><a class="reference internal" href="#">pomdp_py.problems.tiger package</a><ul>
+<li><a class="reference internal" href="#">pomdp_py.problems.tiger package</a></li>
+<li><a class="reference internal" href="#tiger">Tiger</a><ul>
 <li><a class="reference internal" href="#subpackages">Subpackages</a></li>
 <li><a class="reference internal" href="#submodules">Submodules</a></li>
 <li><a class="reference internal" href="#module-pomdp_py.problems.tiger.cythonize">pomdp_py.problems.tiger.cythonize module</a></li>
@@ -112,8 +115,16 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<ul class="current">
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">pomdp_py</a><ul class="current">
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.html">pomdp_py package</a></li>
+<li class="toctree-l2 current"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
 </ul>
 
 
@@ -129,6 +140,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <h3>Related Topics</h3>
 <ul>
   <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">pomdp_py</a><ul>
+  <li><a href="pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+      <li>Previous: <a href="pomdp_py.problems.tag.models.components.html" title="previous chapter">pomdp_py.problems.tag.models.components package</a></li>
+      <li>Next: <a href="pomdp_py.problems.tiger.cythonize.html" title="next chapter">pomdp_py.problems.tiger.cythonize package</a></li>
+  </ul></li>
+  </ul></li>
   </ul></li>
 </ul>
 </div>
@@ -168,6 +185,12 @@ <h3 class="donation">Donate/support</h3>
             
   <section id="pomdp-py-problems-tiger-package">
 <h1>pomdp_py.problems.tiger package<a class="headerlink" href="#pomdp-py-problems-tiger-package" title="Link to this heading">¶</a></h1>
+</section>
+<section id="tiger">
+<h1>Tiger<a class="headerlink" href="#tiger" title="Link to this heading">¶</a></h1>
+<p>Classic problem from <a class="reference external" href="https://www.sciencedirect.com/science/article/pii/S000437029800023X">Planning and acting in partially observable stochastic
+domains</a></p>
+<p>Refer to <span class="xref std std-doc">examples.tiger</span> for more details.</p>
 <section id="subpackages">
 <h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
 <div class="toctree-wrapper compound">
@@ -592,7 +615,7 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Link to this headi
 small, finite action space</p>
 <dl class="py attribute">
 <dt class="sig sig-object py" id="pomdp_py.problems.tiger.tiger_problem.PolicyModel.ACTIONS">
-<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(open-right),</span> <span class="pre">TigerAction(open-left),</span> <span class="pre">TigerAction(listen)]</span></em><a class="headerlink" href="#pomdp_py.problems.tiger.tiger_problem.PolicyModel.ACTIONS" title="Link to this definition">¶</a></dt>
+<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(open-right),</span> <span class="pre">TigerAction(listen),</span> <span class="pre">TigerAction(open-left)]</span></em><a class="headerlink" href="#pomdp_py.problems.tiger.tiger_problem.PolicyModel.ACTIONS" title="Link to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="py method">
diff --git a/docs/html/api/pomdp_py.representations.belief.html b/docs/html/api/pomdp_py.representations.belief.html
index f7f3654f..4e2f223e 100644
--- a/docs/html/api/pomdp_py.representations.belief.html
+++ b/docs/html/api/pomdp_py.representations.belief.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.representations.belief package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.representations.belief package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -79,6 +79,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul class="current">
@@ -92,6 +93,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </li>
 </ul>
 </li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.representations.distribution.html b/docs/html/api/pomdp_py.representations.distribution.html
index 21f060a1..89ba2820 100644
--- a/docs/html/api/pomdp_py.representations.distribution.html
+++ b/docs/html/api/pomdp_py.representations.distribution.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.representations.distribution package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.representations.distribution package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -86,6 +86,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.add"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.add()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.condense"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.condense()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.from_histogram()</span></code></a></li>
+<li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.frozen"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.frozen</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.get_histogram"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.get_histogram()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.mpe"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.mpe()</span></code></a></li>
 <li><a class="reference internal" href="#pomdp_py.representations.distribution.particles.WeightedParticles.particles"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.particles</span></code></a></li>
@@ -121,6 +122,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul class="current">
@@ -134,6 +136,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 </li>
 </ul>
 </li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -330,6 +333,8 @@ <h1>pomdp_py.representations.distribution package<a class="headerlink" href="#po
 are comparable; “none” if no approximation, return 0.</p></li>
 <li><p><strong>distance_func</strong> – Used when approx_method is ‘nearest’. Returns
 a number given two values in this particle set.</p></li>
+<li><p><strong>frozen</strong> – if true, then this WeightedParticles object cannot be modified. This
+makes it hashable.</p></li>
 </ul>
 </dd>
 </dl>
@@ -360,11 +365,16 @@ <h1>pomdp_py.representations.distribution package<a class="headerlink" href="#po
 
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram">
-<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">from_histogram</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">histogram</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram" title="Link to this definition">¶</a></dt>
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">from_histogram</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">histogram</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">frozen</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram" title="Link to this definition">¶</a></dt>
 <dd><p>Given a pomdp_py.Histogram return a particle representation of it,
 which is an approximation</p>
 </dd></dl>
 
+<dl class="py attribute">
+<dt class="sig sig-object py" id="pomdp_py.representations.distribution.particles.WeightedParticles.frozen">
+<span class="sig-name descname"><span class="pre">frozen</span></span><a class="headerlink" href="#pomdp_py.representations.distribution.particles.WeightedParticles.frozen" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
 <dl class="py method">
 <dt class="sig sig-object py" id="pomdp_py.representations.distribution.particles.WeightedParticles.get_histogram">
 <span class="sig-name descname"><span class="pre">get_histogram</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.representations.distribution.particles.WeightedParticles.get_histogram" title="Link to this definition">¶</a></dt>
diff --git a/docs/html/api/pomdp_py.representations.html b/docs/html/api/pomdp_py.representations.html
index 86acc920..c2f5b368 100644
--- a/docs/html/api/pomdp_py.representations.html
+++ b/docs/html/api/pomdp_py.representations.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.representations package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.representations package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -58,6 +58,7 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul class="current">
@@ -71,6 +72,7 @@ <h3>Navigation</h3>
 </li>
 </ul>
 </li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -177,6 +179,7 @@ <h1>pomdp_py.representations package<a class="headerlink" href="#pomdp-py-repres
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.add"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.add()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.condense"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.condense()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.from_histogram()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.frozen"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.frozen</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.get_histogram"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.get_histogram()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.mpe"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.mpe()</span></code></a></li>
 <li class="toctree-l4"><a class="reference internal" href="pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.particles"><code class="docutils literal notranslate"><span class="pre">WeightedParticles.particles</span></code></a></li>
diff --git a/docs/html/api/pomdp_py.utils.debugging.html b/docs/html/api/pomdp_py.utils.debugging.html
index f9badc1d..5944ea6c 100644
--- a/docs/html/api/pomdp_py.utils.debugging.html
+++ b/docs/html/api/pomdp_py.utils.debugging.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.utils.debugging module &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.debugging module &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -105,10 +105,12 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/api/pomdp_py.utils.html b/docs/html/api/pomdp_py.utils.html
index db7cd7d1..c05252f5 100644
--- a/docs/html/api/pomdp_py.utils.html
+++ b/docs/html/api/pomdp_py.utils.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.utils package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -262,6 +262,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l3 current"><a class="current reference internal" href="#">pomdp_py.utils package</a></li>
 </ul>
 </li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a></li>
 </ul>
 </li>
 </ul>
@@ -420,7 +421,7 @@ <h2>pomdp_py.utils.cython_utils.cpython-37m-x86_64-linux-gnu module<a class="hea
 <dl class="py function">
 <dt class="sig sig-object py" id="pomdp_py.utils.cython_utils.det_dict_hash">
 <span class="sig-prename descclassname"><span class="pre">pomdp_py.utils.cython_utils.</span></span><span class="sig-name descname"><span class="pre">det_dict_hash</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dct</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">keep</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">9</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#pomdp_py.utils.cython_utils.det_dict_hash" title="Link to this definition">¶</a></dt>
-<dd><p>deterministic hash of a dictionary.</p>
+<dd><p>Deterministic hash of a dictionary without sorting.</p>
 </dd></dl>
 
 </section>
diff --git a/docs/html/api/pomdp_py.utils.interfaces.html b/docs/html/api/pomdp_py.utils.interfaces.html
index 8c21c46d..03a153fc 100644
--- a/docs/html/api/pomdp_py.utils.interfaces.html
+++ b/docs/html/api/pomdp_py.utils.interfaces.html
@@ -5,15 +5,16 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.utils.interfaces package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.utils.interfaces package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="pomdp_py.problems package" href="pomdp_py.problems.html" />
     <link rel="prev" title="pomdp_py.utils package" href="pomdp_py.utils.html" />
    
   <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
@@ -36,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -79,6 +80,7 @@ <h3><a href="../index.html">Table of Contents</a></h3>
 <li class="toctree-l3 current"><a class="reference internal" href="pomdp_py.utils.html">pomdp_py.utils package</a></li>
 </ul>
 </li>
+<li class="toctree-l2"><a class="reference internal" href="pomdp_py.problems.html">pomdp_py.problems package</a></li>
 </ul>
 </li>
 </ul>
@@ -100,6 +102,7 @@ <h3>Related Topics</h3>
   <li><a href="pomdp_py.html">pomdp_py package</a><ul>
   <li><a href="pomdp_py.utils.html">pomdp_py.utils package</a><ul>
       <li>Previous: <a href="pomdp_py.utils.html" title="previous chapter">pomdp_py.utils package</a></li>
+      <li>Next: <a href="pomdp_py.problems.html" title="next chapter">pomdp_py.problems package</a></li>
   </ul></li>
   </ul></li>
   </ul></li>
diff --git a/docs/html/api/pomdp_py.visual.html b/docs/html/api/pomdp_py.visual.html
index 1cac4a07..ade180ad 100644
--- a/docs/html/api/pomdp_py.visual.html
+++ b/docs/html/api/pomdp_py.visual.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py.visual package &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py.visual package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
-    <script src="../_static/documentation_options.js?v=e358f374"></script>
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
     <script src="../_static/doctools.js?v=888ff710"></script>
     <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="../_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
diff --git a/docs/html/building_docs.html b/docs/html/building_docs.html
index 146044d9..35b1c6b7 100644
--- a/docs/html/building_docs.html
+++ b/docs/html/building_docs.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Building Documentations &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Building Documentations &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -68,6 +68,7 @@ <h3><a href="index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
@@ -165,7 +166,7 @@ <h2>Building docs for <cite>pomdp_py.problems</cite><a class="headerlink" href="
 </div>
 </li>
 <li><p>Building docs for <cite>pomdp_py</cite>. Run <code class="code docutils literal notranslate"><span class="pre">sphinx-apidoc</span></code>:</p>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">sphinx</span><span class="o">-</span><span class="n">apidoc</span> <span class="o">-</span><span class="n">o</span> <span class="n">problems</span><span class="o">/</span> <span class="o">../../</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">problems</span>
+<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">sphinx</span><span class="o">-</span><span class="n">apidoc</span> <span class="o">-</span><span class="n">o</span> <span class="n">problems</span><span class="o">/</span> <span class="o">../../</span><span class="n">pomdp_py</span><span class="o">/</span><span class="n">problems</span>
 </pre></div>
 </div>
 </li>
@@ -178,16 +179,16 @@ <h2>Building docs for <cite>pomdp_py.problems</cite><a class="headerlink" href="
 </ol>
 <p>Note that when creating the documentation for a problem under <code class="code docutils literal notranslate"><span class="pre">pomdp_py.problems</span></code>,
 you may want to re-use the README file on github for the documentation. To do that,
-first create a read-me file at <code class="code docutils literal notranslate"><span class="pre">pomdp_py.problems/&lt;problem&gt;/README.rst</span></code> with desirable
+first create a read-me file at <code class="code docutils literal notranslate"><span class="pre">pomdp_py/problems/&lt;problem&gt;/README.rst</span></code> with desirable
 content that describes the problem. Then, include this read-me file at the top of the
 generated <code class="code docutils literal notranslate"><span class="pre">pomdp_py.problems.&lt;problem&gt;.rst</span></code>, like so:</p>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="o">..</span> <span class="n">include</span><span class="p">::</span> <span class="o">../../../</span><span class="n">pomdp_py</span><span class="o">.</span><span class="n">problems</span><span class="o">/&lt;</span><span class="n">problem</span><span class="o">&gt;/</span><span class="n">README</span><span class="o">.</span><span class="n">rst</span>
+<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="o">..</span> <span class="n">include</span><span class="p">::</span> <span class="o">../../../</span><span class="n">pomdp_py</span><span class="o">/</span><span class="n">problems</span><span class="o">/&lt;</span><span class="n">problem</span><span class="o">&gt;/</span><span class="n">README</span><span class="o">.</span><span class="n">rst</span>
 </pre></div>
 </div>
 </section>
 <section id="note-on-changelog">
 <h2>Note on Changelog<a class="headerlink" href="#note-on-changelog" title="Link to this heading">¶</a></h2>
-<p><span class="xref std std-doc">changelog</span> is generated based on <code class="code docutils literal notranslate"><span class="pre">CHANGELOG.rst</span></code> in the repository’s root directory.
+<p><a class="reference internal" href="changelog.html"><span class="doc">Changelog</span></a> is generated based on <code class="code docutils literal notranslate"><span class="pre">CHANGELOG.rst</span></code> in the repository’s root directory.
 When the website is constructed, the <code class="code docutils literal notranslate"><span class="pre">_sphinx_src/changelog.rst</span></code> is a symbolic
 link to <code class="code docutils literal notranslate"><span class="pre">CHANGELOG.rst</span></code>, created by</p>
 <div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">cd</span> <span class="n">_sphinx_src</span>
diff --git a/docs/html/changelog.html b/docs/html/changelog.html
index 86d770e7..e23e6a6f 100644
--- a/docs/html/changelog.html
+++ b/docs/html/changelog.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Changelog &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Changelog &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -56,6 +56,7 @@
     <h3><a href="index.html">Table of Contents</a></h3>
     <ul>
 <li><a class="reference internal" href="#">Changelog</a><ul>
+<li><a class="reference internal" href="#version-1-3-5-03-12-2024">Version 1.3.5 (03/12/2024)</a></li>
 <li><a class="reference internal" href="#version-1-3-4-01-26-2024">Version 1.3.4 (01/26/2024)</a></li>
 <li><a class="reference internal" href="#version-1-3-3-07-25-2023">Version 1.3.3 (07/25/2023)</a></li>
 <li><a class="reference internal" href="#version-1-3-2-04-03-2022">Version 1.3.2 (04/03/2022)</a></li>
@@ -85,6 +86,7 @@ <h3><a href="index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
 <li class="toctree-l1 current"><a class="current reference internal" href="#">What's New?</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="#version-1-3-5-03-12-2024">Version 1.3.5 (03/12/2024)</a></li>
 <li class="toctree-l2"><a class="reference internal" href="#version-1-3-4-01-26-2024">Version 1.3.4 (01/26/2024)</a></li>
 <li class="toctree-l2"><a class="reference internal" href="#version-1-3-3-07-25-2023">Version 1.3.3 (07/25/2023)</a></li>
 <li class="toctree-l2"><a class="reference internal" href="#version-1-3-2-04-03-2022">Version 1.3.2 (04/03/2022)</a></li>
@@ -108,6 +110,7 @@ <h3><a href="index.html">Table of Contents</a></h3>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -165,6 +168,30 @@ <h3 class="donation">Donate/support</h3>
   <section id="changelog">
 <h1>Changelog<a class="headerlink" href="#changelog" title="Link to this heading">¶</a></h1>
 <p>Best viewed on <a class="reference external" href="https://h2r.github.io/pomdp-py/html/changelog.html">the website</a>.</p>
+<section id="version-1-3-5-03-12-2024">
+<h2>Version 1.3.5 (03/12/2024)<a class="headerlink" href="#version-1-3-5-03-12-2024" title="Link to this heading">¶</a></h2>
+<ul class="simple">
+<li><p>Refactored <code class="code docutils literal notranslate"><span class="pre">_search</span></code> in <a class="reference internal" href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT" title="pomdp_py.algorithms.po_uct.POUCT"><code class="xref py py-mod docutils literal notranslate"><span class="pre">POUCT</span></code></a> to be more modular</p></li>
+<li><p>More fields made accessible for <a class="reference internal" href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT" title="pomdp_py.algorithms.po_uct.POUCT"><code class="xref py py-mod docutils literal notranslate"><span class="pre">POUCT</span></code></a></p></li>
+<li><p>Allows initializing <a class="reference internal" href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Agent" title="pomdp_py.framework.basics.Agent"><code class="xref py py-mod docutils literal notranslate"><span class="pre">Agent</span></code></a> and <a class="reference internal" href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Environment" title="pomdp_py.framework.basics.Environment"><code class="xref py py-mod docutils literal notranslate"><span class="pre">Environment</span></code></a> without all models ready, and provide those models later (or update them) by <code class="code docutils literal notranslate"><span class="pre">set_models</span></code></p></li>
+<li><p>Minor function renaming for <a class="reference internal" href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Option" title="pomdp_py.framework.basics.Option"><code class="xref py py-mod docutils literal notranslate"><span class="pre">Option</span></code></a></p></li>
+<li><p>Added <a class="reference internal" href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.DictState" title="pomdp_py.framework.oopomdp.DictState"><code class="xref py py-mod docutils literal notranslate"><span class="pre">DictState</span></code></a></p></li>
+<li><p>Improved modularity and documentation for the RockSample example</p></li>
+<li><p><a class="reference internal" href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles" title="pomdp_py.representations.distribution.particles.WeightedParticles"><code class="xref py py-mod docutils literal notranslate"><span class="pre">WeightedParticles</span></code></a> now hashable if frozen.</p></li>
+<li><p>Changed <code class="code docutils literal notranslate"><span class="pre">det_dict_hash</span></code> to not use sorting</p></li>
+<li><p>Added a GHA workflow  for automatically building, releasing wheels and uploading them to PyPI</p></li>
+<li><p>Repo convention: default branch renamed from <code class="code docutils literal notranslate"><span class="pre">master</span></code> to <code class="code docutils literal notranslate"><span class="pre">main</span></code>, and <code class="code docutils literal notranslate"><span class="pre">dev-latest</span></code> is the development branch.</p></li>
+</ul>
+<p>WeightedParticles now hashable if frozen
+Refactor _search in POUCT for more modularity
+added a workflow that builds wheel
+*</p>
+<p>Modernize repo without introducing new features.
+* Migrate to <code class="code docutils literal notranslate"><span class="pre">pyproject.toml</span></code> to specify dependencies, with minimal <code class="code docutils literal notranslate"><span class="pre">setup.py</span></code> to build Cython extensions.
+* Separate core and optional dependencies. Optional dependencies are needed only for <cite>pomdp_py.problems</cite>.
+* Added CI testing to repo.
+* Added pre-commit checks to repo.</p>
+</section>
 <section id="version-1-3-4-01-26-2024">
 <h2>Version 1.3.4 (01/26/2024)<a class="headerlink" href="#version-1-3-4-01-26-2024" title="Link to this heading">¶</a></h2>
 <ul class="simple">
@@ -214,7 +241,7 @@ <h2>Version 1.3.0.1 (09/30/2021)<a class="headerlink" href="#version-1-3-0-1-09-
 <ul class="simple">
 <li><p>Removed dependency on <code class="code docutils literal notranslate"><span class="pre">pygraphviz</span></code>;</p></li>
 <li><p>Added <code class="code docutils literal notranslate"><span class="pre">utils.debugging.Treedebugger</span></code>, which makes it easier to inspect the search tree.
-See <a class="reference internal" href="api/pomdp_py.utils.html#module-pomdp_py.utils.debugging" title="pomdp_py.utils.debugging"><code class="xref py py-mod docutils literal notranslate"><span class="pre">debugging</span></code></a>.</p></li>
+See <a class="reference internal" href="api/pomdp_py.utils.debugging.html#module-pomdp_py.utils.debugging" title="pomdp_py.utils.debugging"><code class="xref py py-mod docutils literal notranslate"><span class="pre">debugging</span></code></a>.</p></li>
 <li><p>Added <code class="code docutils literal notranslate"><span class="pre">WeightedParticles</span></code>; Refactored <code class="code docutils literal notranslate"><span class="pre">Particles</span></code>. (<a class="reference internal" href="api/pomdp_py.representations.distribution.html#module-pomdp_py.representations.distribution.particles" title="pomdp_py.representations.distribution.particles"><code class="xref py py-mod docutils literal notranslate"><span class="pre">particles</span></code></a>)</p></li>
 <li><p>Optionally show progress bar while simulating in POUCT/POMCP.</p></li>
 <li><p>Added a CLI interface to simplify running example domains, e.g. <code class="code docutils literal notranslate"><span class="pre">python</span> <span class="pre">-m</span> <span class="pre">pomdp_py</span> <span class="pre">-r</span> <span class="pre">tiger</span></code> runs Tiger.</p></li>
diff --git a/docs/html/design_principles.html b/docs/html/design_principles.html
index 51eb198c..b83e92e1 100644
--- a/docs/html/design_principles.html
+++ b/docs/html/design_principles.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Design Principles &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Design Principles &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -59,10 +59,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1 current"><a class="current reference internal" href="#">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/examples.action_prior.html b/docs/html/examples.action_prior.html
index f638039b..916ef0f0 100644
--- a/docs/html/examples.action_prior.html
+++ b/docs/html/examples.action_prior.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Preference-based Action Prior &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Preference-based Action Prior &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -56,10 +56,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -116,7 +118,7 @@ <h3 class="donation">Donate/support</h3>
 <h1>Preference-based Action Prior<a class="headerlink" href="#preference-based-action-prior" title="Link to this heading">¶</a></h1>
 <p>The code below is a minimum example of defining a
 <a class="reference internal" href="api/pomdp_py.framework.html#pomdp_py.framework.basics.PolicyModel" title="pomdp_py.framework.basics.PolicyModel"><code class="xref py py-mod docutils literal notranslate"><span class="pre">PolicyModel</span></code></a>
-that supports a rollout policy based on preference-based action prior <span id="id1">[<a class="reference internal" href="api/pomdp_py.algorithms.html#id33" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>.
+that supports a rollout policy based on preference-based action prior <span id="id1">[<a class="reference internal" href="examples.tiger.html#id37" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>.
 The action prior is specified through the
 <a class="reference internal" href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.ActionPrior" title="pomdp_py.algorithms.po_uct.ActionPrior"><code class="xref py py-mod docutils literal notranslate"><span class="pre">ActionPrior</span></code></a> object,
 which returns a set of preferred actions given a state (and/or history).</p>
@@ -152,12 +154,12 @@ <h1>Preference-based Action Prior<a class="headerlink" href="#preference-based-a
 </pre></div>
 </div>
 <p>Note that the notion of “action prior” here is narrow; It
-follows the original POMCP paper <span id="id2">[<a class="reference internal" href="api/pomdp_py.algorithms.html#id33" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>.
+follows the original POMCP paper <span id="id2">[<a class="reference internal" href="examples.tiger.html#id37" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>.
 In general, you could express a prior over the action distribution
 explicitly through the <code class="code docutils literal notranslate"><span class="pre">sample</span></code> and <code class="code docutils literal notranslate"><span class="pre">rollout</span></code> function in
 <a class="reference internal" href="api/pomdp_py.framework.html#pomdp_py.framework.basics.PolicyModel" title="pomdp_py.framework.basics.PolicyModel"><code class="xref py py-mod docutils literal notranslate"><span class="pre">PolicyModel</span></code></a>. Refer to the <a class="reference external" href="https://h2r.github.io/pomdp-py/html/examples.tiger.html#:~:text=e.g.%20continuous).-,Next,-%2C%20we%20define%20the">Tiger</a>
 tutorial for more details (the paragraph on PolicyModel).</p>
-<p>As described in <span id="id3">[<a class="reference internal" href="api/pomdp_py.algorithms.html#id33" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>, you could choose to set an initial visit count and initial value corresponding
+<p>As described in <span id="id3">[<a class="reference internal" href="examples.tiger.html#id37" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>, you could choose to set an initial visit count and initial value corresponding
 to a preferred action; To take this into account during POMDP planning using POUCT or POMCP,
 you need to supply the <a class="reference internal" href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.ActionPrior" title="pomdp_py.algorithms.po_uct.ActionPrior"><code class="xref py py-mod docutils literal notranslate"><span class="pre">ActionPrior</span></code></a> object
 when you initialize the <a class="reference internal" href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT" title="pomdp_py.algorithms.po_uct.POUCT"><code class="xref py py-mod docutils literal notranslate"><span class="pre">POUCT</span></code></a>
diff --git a/docs/html/examples.external_solvers.html b/docs/html/examples.external_solvers.html
index 579072fe..8dd08ea7 100644
--- a/docs/html/examples.external_solvers.html
+++ b/docs/html/examples.external_solvers.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Using External Solvers &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Using External Solvers &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -36,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -97,10 +97,12 @@ <h3><a href="index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/examples.html b/docs/html/examples.html
index 2d65d4c7..29c10950 100644
--- a/docs/html/examples.html
+++ b/docs/html/examples.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Examples &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Examples &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -73,10 +73,12 @@ <h3><a href="index.html">Table of Contents</a></h3>
 </li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/examples.mos.html b/docs/html/examples.mos.html
index bae0bce9..d9292fd1 100644
--- a/docs/html/examples.mos.html
+++ b/docs/html/examples.mos.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Multi-Object Search (MOS) &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Multi-Object Search (MOS) &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -75,10 +75,12 @@ <h3><a href="index.html">Table of Contents</a></h3>
 </li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -207,7 +209,7 @@ <h1>Multi-Object Search (MOS)<a class="headerlink" href="#multi-object-search-mo
 As in the above package tree, files such as <code class="code docutils literal notranslate"><span class="pre">state.py</span></code> or
 <code class="code docutils literal notranslate"><span class="pre">transition_model.py</span></code> are self-evident in their role. The
 <code class="code docutils literal notranslate"><span class="pre">problem.py</span></code> file is where the
-<code class="xref py py-mod docutils literal notranslate"><span class="pre">MosOOPOMDP</span></code> class is defined, and
+<a class="reference internal" href="api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.MosOOPOMDP" title="pomdp_py.problems.multi_object_search.problem.MosOOPOMDP"><code class="xref py py-mod docutils literal notranslate"><span class="pre">MosOOPOMDP</span></code></a> class is defined, and
 where the logic of <cite>action-feedback loop</cite> is implemented (see
 <a class="reference internal" href="examples.tiger.html"><span class="doc">Tiger</span></a> for more detail).</p>
 </section>
@@ -217,7 +219,7 @@ <h1>Multi-Object Search (MOS)<a class="headerlink" href="#multi-object-search-mo
 <div class="highlight-shell notranslate"><div class="highlight"><pre><span></span>$<span class="w"> </span>python<span class="w"> </span>-m<span class="w"> </span>pomdp_py.problems.multi_object_search.problem
 </pre></div>
 </div>
-<p>A gridworld with randomly placed obstacles, targets and robot initial pose is generated; The robot is equipped with either a disk-shape sensor or a laser sensor <a class="reference external" href="_modules/problems/multi_object_search/problem.html#unittest">[source]</a>. A command-line interface is not yet provided; Check <code class="xref py py-mod docutils literal notranslate"><span class="pre">interpret</span></code>,
+<p>A gridworld with randomly placed obstacles, targets and robot initial pose is generated; The robot is equipped with either a disk-shape sensor or a laser sensor <a class="reference external" href="_modules/problems/multi_object_search/problem.html#unittest">[source]</a>. A command-line interface is not yet provided; Check <a class="reference internal" href="problems/problems.multi_object_search.env.html#problems.multi_object_search.env.env.interpret" title="problems.multi_object_search.env.env.interpret"><code class="xref py py-mod docutils literal notranslate"><span class="pre">interpret</span></code></a>,
 <a class="reference internal" href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.env.equip_sensors" title="pomdp_py.problems.multi_object_search.env.env.equip_sensors"><code class="xref py py-mod docutils literal notranslate"><span class="pre">equip_sensors</span></code></a>,
 <a class="reference internal" href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.env.make_laser_sensor" title="pomdp_py.problems.multi_object_search.env.env.make_laser_sensor"><code class="xref py py-mod docutils literal notranslate"><span class="pre">make_laser_sensor</span></code></a>,
 <a class="reference internal" href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.env.make_proximity_sensor" title="pomdp_py.problems.multi_object_search.env.env.make_proximity_sensor"><code class="xref py py-mod docutils literal notranslate"><span class="pre">make_proximity_sensor</span></code></a>
diff --git a/docs/html/examples.tiger.html b/docs/html/examples.tiger.html
index d733dc68..c8a306ae 100644
--- a/docs/html/examples.tiger.html
+++ b/docs/html/examples.tiger.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Tiger &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Tiger &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -78,10 +78,12 @@ <h3><a href="index.html">Table of Contents</a></h3>
 </li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/existing_domains.html b/docs/html/existing_domains.html
index cfd3592d..4b3021f3 100644
--- a/docs/html/existing_domains.html
+++ b/docs/html/existing_domains.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Existing POMDP Domains &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Existing POMDP Domains &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -56,10 +56,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -117,16 +119,19 @@ <h1>Existing POMDP Domains<a class="headerlink" href="#existing-pomdp-domains" t
 <p>Several domains have been implemented:</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="api/pomdp_py.problems.tiger.html#module-pomdp_py.problems.tiger.tiger_problem" title="pomdp_py.problems.tiger.tiger_problem"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.tiger.tiger_problem</span></code></a></p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="api/pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.problem" title="pomdp_py.problems.multi_object_search.problem"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.multi_object_search.problem</span></code></a></p></td>
+<td><p>2D Multi-Object Search (MOS) Task.</p></td>
+</tr>
+<tr class="row-even"><td><p><a class="reference internal" href="api/pomdp_py.problems.tiger.html#module-pomdp_py.problems.tiger.tiger_problem" title="pomdp_py.problems.tiger.tiger_problem"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.tiger.tiger_problem</span></code></a></p></td>
 <td><p>The classic Tiger problem.</p></td>
 </tr>
-<tr class="row-even"><td><p><a class="reference internal" href="api/pomdp_py.problems.rocksample.html#module-pomdp_py.problems.rocksample.rocksample_problem" title="pomdp_py.problems.rocksample.rocksample_problem"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem</span></code></a></p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="api/pomdp_py.problems.rocksample.html#module-pomdp_py.problems.rocksample.rocksample_problem" title="pomdp_py.problems.rocksample.rocksample_problem"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.rocksample.rocksample_problem</span></code></a></p></td>
 <td><p>RockSample(n,k) problem</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag" title="pomdp_py.problems.tag"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.tag</span></code></a></p></td>
+<tr class="row-even"><td><p><a class="reference internal" href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag" title="pomdp_py.problems.tag"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.tag</span></code></a></p></td>
 <td><p></p></td>
 </tr>
-<tr class="row-even"><td><p><a class="reference internal" href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload" title="pomdp_py.problems.load_unload"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.load_unload</span></code></a></p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload" title="pomdp_py.problems.load_unload"><code class="xref py py-obj docutils literal notranslate"><span class="pre">pomdp_py.problems.load_unload</span></code></a></p></td>
 <td><p></p></td>
 </tr>
 </tbody>
diff --git a/docs/html/existing_solvers.html b/docs/html/existing_solvers.html
index c8d34471..caf0f92b 100644
--- a/docs/html/existing_solvers.html
+++ b/docs/html/existing_solvers.html
@@ -5,17 +5,17 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Existing POMDP Solvers &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Existing POMDP Solvers &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
     <link rel="icon" href="_static/favicon.ico"/>
     <link rel="index" title="Index" href="genindex.html" />
     <link rel="search" title="Search" href="search.html" />
-    <link rel="next" title="pomdp_py" href="api/modules.html" />
+    <link rel="next" title="Changelog" href="changelog.html" />
     <link rel="prev" title="Design Principles" href="design_principles.html" />
    
   <link rel="stylesheet" href="_static/custom.css" type="text/css" />
@@ -38,7 +38,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -59,10 +59,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1 current"><a class="current reference internal" href="#">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
@@ -79,7 +81,7 @@ <h3>Related Topics</h3>
 <ul>
   <li><a href="index.html">Documentation overview</a><ul>
       <li>Previous: <a href="design_principles.html" title="previous chapter">Design Principles</a></li>
-      <li>Next: <a href="api/modules.html" title="next chapter">pomdp_py</a></li>
+      <li>Next: <a href="changelog.html" title="next chapter">Changelog</a></li>
   </ul></li>
 </ul>
 </div>
@@ -123,7 +125,7 @@ <h1>Existing POMDP Solvers<a class="headerlink" href="#existing-pomdp-solvers" t
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="api/pomdp_py.algorithms.html#module-pomdp_py.algorithms.po_rollout" title="pomdp_py.algorithms.po_rollout"><code class="xref py py-obj docutils literal notranslate"><span class="pre">po_rollout</span></code></a></p></td>
-<td><p>PO-rollout: Baseline algorithm in the POMCP paper <span id="id1">[<a class="reference internal" href="api/pomdp_py.algorithms.html#id33" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>.</p></td>
+<td><p>PO-rollout: Baseline algorithm in the POMCP paper <span id="id1">[<a class="reference internal" href="examples.tiger.html#id37" title="David Silver and Joel Veness. Monte-carlo planning in large pomdps. In Advances in neural information processing systems, 2164–2172. 2010.">2</a>]</span>.</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="api/pomdp_py.algorithms.html#module-pomdp_py.algorithms.po_uct" title="pomdp_py.algorithms.po_uct"><code class="xref py py-obj docutils literal notranslate"><span class="pre">po_uct</span></code></a></p></td>
 <td><p>This algorithm is PO-UCT (Partially Observable UCT).</p></td>
diff --git a/docs/html/extensions.html b/docs/html/extensions.html
index 92ff1b69..b7711f1d 100644
--- a/docs/html/extensions.html
+++ b/docs/html/extensions.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Use Case Extensions &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Use Case Extensions &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -56,10 +56,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/genindex.html b/docs/html/genindex.html
index 65f348e5..1c97d4f3 100644
--- a/docs/html/genindex.html
+++ b/docs/html/genindex.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>Index &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Index &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -34,7 +34,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -199,6 +199,8 @@ <h2 id="A">A</h2>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.Action">(class in pomdp_py.problems.rocksample.rocksample_problem)</a>
 </li>
       </ul></li>
+      <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.action_prior">action_prior (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
+</li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.ActionPrior">ActionPrior (class in pomdp_py.algorithms.po_uct)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tiger.cythonize.html#id17">ACTIONS (pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem attribute)</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id56">[1]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id95">[2]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.ACTIONS">[3]</a>
@@ -247,6 +249,14 @@ <h2 id="A">A</h2>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservationModel.argmax">(pomdp_py.framework.oopomdp.OOObservationModel method)</a>
 </li>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOTransitionModel.argmax">(pomdp_py.framework.oopomdp.OOTransitionModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax">(pomdp_py.problems.load_unload.load_unload.LUObservationModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax">(pomdp_py.problems.load_unload.load_unload.LUPolicyModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax">(pomdp_py.problems.load_unload.load_unload.LURewardModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax">(pomdp_py.problems.load_unload.load_unload.LUTransitionModel method)</a>
 </li>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.observation_model.ObjectObservationModel.argmax">(pomdp_py.problems.multi_object_search.models.observation_model.ObjectObservationModel method)</a>
 </li>
@@ -321,8 +331,12 @@ <h2 id="B">B</h2>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Agent.belief">(pomdp_py.framework.basics.Agent attribute)</a>
 </li>
       </ul></li>
-      <li><a href="api/pomdp_py.problems.tag.agent.html#pomdp_py.problems.tag.agent.agent.belief_update">belief_update() (in module pomdp_py.problems.tag.agent.agent)</a>
+      <li><a href="api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.belief_update">belief_update() (in module pomdp_py.problems.multi_object_search.problem)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.agent.html#pomdp_py.problems.tag.agent.agent.belief_update">(in module pomdp_py.problems.tag.agent.agent)</a>
 </li>
+      </ul></li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.bestseq">bestseq (pomdp_py.utils.debugging.TreeDebugger property)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.bestseq">[1]</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.bestseqd">bestseqd() (pomdp_py.utils.debugging.TreeDebugger method)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.bestseqd">[1]</a>
@@ -410,6 +424,8 @@ <h2 id="C">C</h2>
       <li><a href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.gaussian.Gaussian.covariance">covariance (pomdp_py.representations.distribution.gaussian.Gaussian attribute)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tiger.html#pomdp_py.problems.tiger.tiger_problem.TigerProblem.create">create() (pomdp_py.problems.tiger.tiger_problem.TigerProblem static method)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.create_instance">create_instance() (in module pomdp_py.problems.rocksample.rocksample_problem)</a>
 </li>
       <li><a href="api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.create_plan">create_plan() (pomdp_py.algorithms.bsp.blqr.BLQR method)</a>, <a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.create_plan">[1]</a>
 </li>
@@ -433,18 +449,40 @@ <h2 id="D">D</h2>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.templates.DetObservationModel">DetObservationModel (class in pomdp_py.utils.templates)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.templates.DetRewardModel">DetRewardModel (class in pomdp_py.utils.templates)</a>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.templates.DetTransitionModel">DetTransitionModel (class in pomdp_py.utils.templates)</a>
+</li>
+      <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.DictState">DictState (class in pomdp_py.framework.oopomdp)</a>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.bcolors.disable">disable() (pomdp_py.utils.typ.bcolors static method)</a>
+</li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.discount_factor">discount_factor (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Distribution">Distribution (class in pomdp_py.framework.basics)</a>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.down">down (pomdp_py.utils.misc.special_char attribute)</a>
 </li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_belief">draw_belief() (pomdp_py.problems.multi_object_search.env.visual.MosViz static method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_belief">(pomdp_py.problems.tag.env.visual.TagViz static method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_observation">draw_observation() (pomdp_py.problems.multi_object_search.env.visual.MosViz static method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_observation">(pomdp_py.problems.tag.env.visual.TagViz static method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.draw_robot">draw_robot() (pomdp_py.problems.multi_object_search.env.visual.MosViz static method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.draw_robot">(pomdp_py.problems.tag.env.visual.TagViz static method)</a>
+</li>
+      </ul></li>
   </ul></td>
 </tr></table>
 
@@ -501,24 +539,30 @@ <h2 id="F">F</h2>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.action.MotionAction.FORWARD">FORWARD (pomdp_py.problems.multi_object_search.domain.action.MotionAction attribute)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.problems.tag.models.components.html#pomdp_py.problems.tag.models.components.grid_map.GridMap.free_cells">free_cells() (pomdp_py.problems.tag.models.components.grid_map.GridMap method)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.Particles.from_histogram">from_histogram() (pomdp_py.representations.distribution.particles.Particles class method)</a>
 
       <ul>
         <li><a href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.from_histogram">(pomdp_py.representations.distribution.particles.WeightedParticles class method)</a>
 </li>
       </ul></li>
-      <li><a href="api/pomdp_py.problems.tag.models.components.html#pomdp_py.problems.tag.models.components.grid_map.GridMap.from_str">from_str() (pomdp_py.problems.tag.models.components.grid_map.GridMap class method)</a>
+      <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.from_str">from_str() (pomdp_py.problems.tag.env.env.TagEnvironment class method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.models.components.html#pomdp_py.problems.tag.models.components.grid_map.GridMap.from_str">(pomdp_py.problems.tag.models.components.grid_map.GridMap class method)</a>
 </li>
+      </ul></li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RootVNode.from_vnode">from_vnode() (pomdp_py.algorithms.po_uct.RootVNode class method)</a>
 
       <ul>
         <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.pomcp.RootVNodeParticles.from_vnode">(pomdp_py.algorithms.pomcp.RootVNodeParticles class method)</a>
 </li>
       </ul></li>
+      <li><a href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.WeightedParticles.frozen">frozen (pomdp_py.representations.distribution.particles.WeightedParticles attribute)</a>
+</li>
   </ul></td>
 </tr></table>
 
@@ -526,6 +570,8 @@ <h2 id="G">G</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.gaussian.Gaussian">Gaussian (class in pomdp_py.representations.distribution.gaussian)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.generate_init_belief">generate_init_belief() (in module pomdp_py.problems.load_unload.load_unload)</a>
 </li>
       <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id133">generate_instance() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem static method)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id35">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id84">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.generate_instance">[3]</a>
 
@@ -533,6 +579,8 @@ <h2 id="G">G</h2>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance">(pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem static method)</a>
 </li>
       </ul></li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.generate_random_state">generate_random_state() (in module pomdp_py.problems.load_unload.load_unload)</a>
+</li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.GenerativeDistribution">GenerativeDistribution (class in pomdp_py.framework.basics)</a>
 </li>
       <li><a href="api/pomdp_py.representations.distribution.html#pomdp_py.representations.distribution.particles.Particles.get_abstraction">get_abstraction() (pomdp_py.representations.distribution.particles.Particles method)</a>
@@ -540,6 +588,8 @@ <h2 id="G">G</h2>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.PolicyModel.get_all_actions">get_all_actions() (pomdp_py.framework.basics.PolicyModel method)</a>
 
       <ul>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions">(pomdp_py.problems.load_unload.load_unload.LUPolicyModel method)</a>
+</li>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.policy_model.PolicyModel.get_all_actions">(pomdp_py.problems.multi_object_search.models.policy_model.PolicyModel method)</a>
 </li>
         <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id116">(pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel method)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id18">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id67">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.get_all_actions">[3]</a>
@@ -622,6 +672,8 @@ <h2 id="G">G</h2>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.bcolors.GREEN">GREEN (pomdp_py.utils.typ.bcolors attribute)</a>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.green">green() (in module pomdp_py.utils.typ)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.grid_map">grid_map (pomdp_py.problems.tag.env.env.TagEnvironment property)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.models.components.html#pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap">GridMap (class in pomdp_py.problems.multi_object_search.models.components.grid_map)</a>
 
@@ -661,6 +713,18 @@ <h2 id="I">I</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.tag.models.html#pomdp_py.problems.tag.models.transition_model.TagTransitionModel.if_move_by">(pomdp_py.problems.tag.models.transition_model.TagTransitionModel class method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_height">img_height (pomdp_py.problems.multi_object_search.env.visual.MosViz property)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.img_height">(pomdp_py.problems.tag.env.visual.TagViz property)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.img_width">img_width (pomdp_py.problems.multi_object_search.env.visual.MosViz property)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.img_width">(pomdp_py.problems.tag.env.visual.TagViz property)</a>
 </li>
       </ul></li>
       <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.transition_model.in_boundary">in_boundary() (in module pomdp_py.problems.multi_object_search.models.transition_model)</a>
@@ -685,17 +749,17 @@ <h2 id="I">I</h2>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.init_particles_belief">(in module pomdp_py.problems.rocksample.rocksample_problem)</a>
 </li>
       </ul></li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.problems.multi_object_search.agent.html#pomdp_py.problems.multi_object_search.agent.belief.initialize_belief">initialize_belief() (in module pomdp_py.problems.multi_object_search.agent.belief)</a>
 
       <ul>
         <li><a href="api/pomdp_py.problems.tag.agent.html#pomdp_py.problems.tag.agent.agent.initialize_belief">(in module pomdp_py.problems.tag.agent.agent)</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.problems.tag.agent.html#pomdp_py.problems.tag.agent.agent.initialize_particles_belief">initialize_particles_belief() (in module pomdp_py.problems.tag.agent.agent)</a>
 </li>
-      <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Option.initiation">initiation() (pomdp_py.framework.basics.Option method)</a>
+      <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Option.initiate">initiate() (pomdp_py.framework.basics.Option method)</a>
 </li>
       <li><a href="api/pomdp_py.algorithms.bsp.html#pomdp_py.algorithms.bsp.blqr.BLQR.integrate_belief_segment">integrate_belief_segment() (pomdp_py.algorithms.bsp.blqr.BLQR method)</a>, <a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.bsp.blqr.BLQR.integrate_belief_segment">[1]</a>
 </li>
@@ -745,6 +809,12 @@ <h2 id="L">L</h2>
 </li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.last_num_sims">last_num_sims (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
 </li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.last_observation">last_observation (pomdp_py.problems.multi_object_search.env.visual.MosViz property)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.last_observation">(pomdp_py.problems.tag.env.visual.TagViz property)</a>
+</li>
+      </ul></li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.last_planning_time">last_planning_time (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.layer">layer() (pomdp_py.utils.debugging.TreeDebugger method)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.layer">[1]</a>
@@ -755,15 +825,19 @@ <h2 id="L">L</h2>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.left">left (pomdp_py.utils.misc.special_char attribute)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.leftt">leftt (pomdp_py.utils.misc.special_char attribute)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.length">length (pomdp_py.problems.tag.env.env.TagEnvironment property)</a>
 </li>
       <li><a href="api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.env.LightDarkEnvironment.light">light (pomdp_py.problems.light_dark.env.env.LightDarkEnvironment property)</a>
 </li>
       <li><a href="api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.env.LightDarkEnvironment">LightDarkEnvironment (class in pomdp_py.problems.light_dark.env.env)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.colors.lighter">lighter() (in module pomdp_py.utils.colors)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem">LoadUnloadProblem (class in pomdp_py.problems.load_unload.load_unload)</a>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.longbottomleft">longbottomleft (pomdp_py.utils.misc.special_char attribute)</a>
 </li>
@@ -778,6 +852,20 @@ <h2 id="L">L</h2>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.longtopright">longtopright (pomdp_py.utils.misc.special_char attribute)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.action.LookAction">LookAction (class in pomdp_py.problems.multi_object_search.domain.action)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUAction">LUAction (class in pomdp_py.problems.load_unload.load_unload)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservation">LUObservation (class in pomdp_py.problems.load_unload.load_unload)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel">LUObservationModel (class in pomdp_py.problems.load_unload.load_unload)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel">LUPolicyModel (class in pomdp_py.problems.load_unload.load_unload)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel">LURewardModel (class in pomdp_py.problems.load_unload.load_unload)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUState">LUState (class in pomdp_py.problems.load_unload.load_unload)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel">LUTransitionModel (class in pomdp_py.problems.load_unload.load_unload)</a>
 </li>
   </ul></td>
 </tr></table>
@@ -789,10 +877,16 @@ <h2 id="M">M</h2>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.magenta">magenta() (in module pomdp_py.utils.typ)</a>
 </li>
-      <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id145">main() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id47">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id96">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.main">[3]</a>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.main">main() (in module pomdp_py.problems.load_unload.load_unload)</a>
 
       <ul>
+        <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id145">(in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id47">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id96">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.main">[3]</a>
+</li>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.main">(in module pomdp_py.problems.rocksample.rocksample_problem)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.experiment.main">(in module pomdp_py.problems.tag.experiment)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.main">(in module pomdp_py.problems.tag.problem)</a>
 </li>
         <li><a href="api/pomdp_py.problems.tiger.cythonize.html#id115">(in module pomdp_py.problems.tiger.cythonize.tiger_problem)</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id37">[1]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id76">[2]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#pomdp_py.problems.tiger.cythonize.tiger_problem.main">[3]</a>
 </li>
@@ -812,6 +906,8 @@ <h2 id="M">M</h2>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.mark_sequence">mark_sequence() (pomdp_py.utils.debugging.TreeDebugger method)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.mark_sequence">[1]</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.markp">markp() (pomdp_py.utils.debugging.TreeDebugger method)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.markp">[1]</a>
+</li>
+      <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.max_depth">max_depth (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
 </li>
       <li><a href="api/pomdp_py.problems.maze.env.html#pomdp_py.problems.maze.env.env.MazeEnvironment">MazeEnvironment (class in pomdp_py.problems.maze.env.env)</a>
 </li>
@@ -825,6 +921,8 @@ <h2 id="M">M</h2>
         <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation.merge">(pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation class method)</a>
 </li>
       </ul></li>
+      <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.minimal_instance">minimal_instance() (in module pomdp_py.problems.rocksample.rocksample_problem)</a>
+</li>
       <li>
     module
 
@@ -848,14 +946,16 @@ <h2 id="M">M</h2>
         <li><a href="api/pomdp_py.framework.html#module-pomdp_py.framework.planner">pomdp_py.framework.planner</a>
 </li>
         <li><a href="api/pomdp_py.problems.html#module-pomdp_py.problems">pomdp_py.problems</a>
-</li>
-        <li><a href="api/pomdp_py.problems.lasertag.html#module-pomdp_py.problems.lasertag">pomdp_py.problems.lasertag</a>
 </li>
         <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env">pomdp_py.problems.light_dark.env</a>
 </li>
         <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.env">pomdp_py.problems.light_dark.env.env</a>
+</li>
+        <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.plotting">pomdp_py.problems.light_dark.env.plotting</a>
 </li>
         <li><a href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload">pomdp_py.problems.load_unload</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload.load_unload">pomdp_py.problems.load_unload.load_unload</a>
 </li>
         <li><a href="api/pomdp_py.problems.maze.html#module-pomdp_py.problems.maze">pomdp_py.problems.maze</a>
 </li>
@@ -894,6 +994,8 @@ <h2 id="M">M</h2>
         <li><a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env">pomdp_py.problems.multi_object_search.env</a>
 </li>
         <li><a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.env">pomdp_py.problems.multi_object_search.env.env</a>
+</li>
+        <li><a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.visual">pomdp_py.problems.multi_object_search.env.visual</a>
 </li>
         <li><a href="api/pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.example_worlds">pomdp_py.problems.multi_object_search.example_worlds</a>
 </li>
@@ -912,6 +1014,8 @@ <h2 id="M">M</h2>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#module-pomdp_py.problems.multi_object_search.models.reward_model">pomdp_py.problems.multi_object_search.models.reward_model</a>
 </li>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#module-pomdp_py.problems.multi_object_search.models.transition_model">pomdp_py.problems.multi_object_search.models.transition_model</a>
+</li>
+        <li><a href="api/pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.problem">pomdp_py.problems.multi_object_search.problem</a>
 </li>
         <li><a href="api/pomdp_py.problems.rocksample.html#module-pomdp_py.problems.rocksample">pomdp_py.problems.rocksample</a>
 </li>
@@ -938,8 +1042,14 @@ <h2 id="M">M</h2>
         <li><a href="api/pomdp_py.problems.tag.domain.html#module-pomdp_py.problems.tag.domain.state">pomdp_py.problems.tag.domain.state</a>
 </li>
         <li><a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env">pomdp_py.problems.tag.env</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.env">pomdp_py.problems.tag.env.env</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.visual">pomdp_py.problems.tag.env.visual</a>
 </li>
         <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.example_worlds">pomdp_py.problems.tag.example_worlds</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.experiment">pomdp_py.problems.tag.experiment</a>
 </li>
         <li><a href="api/pomdp_py.problems.tag.models.html#module-pomdp_py.problems.tag.models">pomdp_py.problems.tag.models</a>
 </li>
@@ -956,6 +1066,8 @@ <h2 id="M">M</h2>
         <li><a href="api/pomdp_py.problems.tag.models.html#module-pomdp_py.problems.tag.models.reward_model">pomdp_py.problems.tag.models.reward_model</a>
 </li>
         <li><a href="api/pomdp_py.problems.tag.models.html#module-pomdp_py.problems.tag.models.transition_model">pomdp_py.problems.tag.models.transition_model</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.problem">pomdp_py.problems.tag.problem</a>
 </li>
         <li><a href="api/pomdp_py.problems.tiger.html#module-pomdp_py.problems.tiger">pomdp_py.problems.tiger</a>
 </li>
@@ -1005,12 +1117,16 @@ <h2 id="M">M</h2>
       <li><a href="api/pomdp_py.problems.multi_object_search.agent.html#pomdp_py.problems.multi_object_search.agent.belief.MosOOBelief">MosOOBelief (class in pomdp_py.problems.multi_object_search.agent.belief)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation">MosOOObservation (class in pomdp_py.problems.multi_object_search.domain.observation)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.MosOOPOMDP">MosOOPOMDP (class in pomdp_py.problems.multi_object_search.problem)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.state.MosOOState">MosOOState (class in pomdp_py.problems.multi_object_search.domain.state)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.reward_model.MosRewardModel">MosRewardModel (class in pomdp_py.problems.multi_object_search.models.reward_model)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.transition_model.MosTransitionModel">MosTransitionModel (class in pomdp_py.problems.multi_object_search.models.transition_model)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz">MosViz (class in pomdp_py.problems.multi_object_search.env.visual)</a>
 </li>
       <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id106">motion (pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction attribute)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id57">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id8">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.motion">[3]</a>
 </li>
@@ -1062,10 +1178,10 @@ <h2 id="N">N</h2>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.MoveAction.NORTH">(pomdp_py.problems.rocksample.rocksample_problem.MoveAction attribute)</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.action.MotionAction.NORTH2D">NORTH2D (pomdp_py.problems.multi_object_search.domain.action.MotionAction attribute)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.note">note() (in module pomdp_py.utils.typ)</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.nq">nq (pomdp_py.utils.debugging.TreeDebugger property)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.nq">[1]</a>
@@ -1077,6 +1193,8 @@ <h2 id="N">N</h2>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.num_nodes">num_nodes() (pomdp_py.utils.debugging.TreeDebugger method)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.num_nodes">[1]</a>
 </li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.TreeNode.num_visits">num_visits (pomdp_py.algorithms.po_uct.TreeNode attribute)</a>
+</li>
+      <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.num_visits_init">num_visits_init (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.nv">nv (pomdp_py.utils.debugging.TreeDebugger property)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.nv">[1]</a>
 </li>
@@ -1089,6 +1207,8 @@ <h2 id="O">O</h2>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief.object_belief">object_belief() (pomdp_py.framework.oopomdp.OOBelief method)</a>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief.object_beliefs">object_beliefs (pomdp_py.framework.oopomdp.OOBelief attribute)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.object_color">object_color() (in module pomdp_py.problems.multi_object_search.env.visual)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.state.MosOOState.object_pose">object_pose() (pomdp_py.problems.multi_object_search.domain.state.MosOOState method)</a>
 </li>
@@ -1116,8 +1236,6 @@ <h2 id="O">O</h2>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.Observation">(class in pomdp_py.problems.rocksample.rocksample_problem)</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservationModel.observation_models">observation_models (pomdp_py.framework.oopomdp.OOObservationModel attribute)</a>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel">ObservationModel (class in pomdp_py.framework.basics)</a>
@@ -1132,6 +1250,44 @@ <h2 id="O">O</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.components.html#pomdp_py.problems.multi_object_search.models.components.sensor.Sensor.observe">(pomdp_py.problems.multi_object_search.models.components.sensor.Sensor method)</a>
+</li>
+      </ul></li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_cleanup">on_cleanup() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_cleanup">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_event">on_event() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_event">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_execute">on_execute() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_execute">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_init">on_init() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_init">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_loop">on_loop() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_loop">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
+</li>
+      </ul></li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.on_render">on_render() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.on_render">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
 </li>
       </ul></li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief">OOBelief (class in pomdp_py.framework.oopomdp)</a>
@@ -1189,6 +1345,14 @@ <h2 id="P">P</h2>
 </li>
       </ul></li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.planner.Planner">Planner (class in pomdp_py.framework.planner)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_circle">plot_circle() (in module pomdp_py.problems.light_dark.env.plotting)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_line">plot_line() (in module pomdp_py.problems.light_dark.env.plotting)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_points">plot_points() (in module pomdp_py.problems.light_dark.env.plotting)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.light_dark.env.html#pomdp_py.problems.light_dark.env.plotting.plot_polygons">plot_polygons() (in module pomdp_py.problems.light_dark.env.plotting)</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.pm">pm (pomdp_py.utils.debugging.TreeDebugger property)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.pm">[1]</a>
 </li>
@@ -1279,24 +1443,24 @@ <h2 id="P">P</h2>
 </li>
       </ul></li>
       <li>
-    pomdp_py.problems.lasertag
+    pomdp_py.problems.light_dark.env
 
       <ul>
-        <li><a href="api/pomdp_py.problems.lasertag.html#module-pomdp_py.problems.lasertag">module</a>
+        <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env">module</a>
 </li>
       </ul></li>
       <li>
-    pomdp_py.problems.light_dark.env
+    pomdp_py.problems.light_dark.env.env
 
       <ul>
-        <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env">module</a>
+        <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.env">module</a>
 </li>
       </ul></li>
       <li>
-    pomdp_py.problems.light_dark.env.env
+    pomdp_py.problems.light_dark.env.plotting
 
       <ul>
-        <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.env">module</a>
+        <li><a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.plotting">module</a>
 </li>
       </ul></li>
       <li>
@@ -1304,6 +1468,13 @@ <h2 id="P">P</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.load_unload.load_unload
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload.load_unload">module</a>
 </li>
       </ul></li>
       <li>
@@ -1437,6 +1608,13 @@ <h2 id="P">P</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.env">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.multi_object_search.env.visual
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.visual">module</a>
 </li>
       </ul></li>
       <li>
@@ -1500,6 +1678,13 @@ <h2 id="P">P</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#module-pomdp_py.problems.multi_object_search.models.transition_model">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.multi_object_search.problem
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.problem">module</a>
 </li>
       </ul></li>
       <li>
@@ -1537,8 +1722,6 @@ <h2 id="P">P</h2>
         <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag">module</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li>
     pomdp_py.problems.tag.agent
 
@@ -1546,6 +1729,8 @@ <h2 id="P">P</h2>
         <li><a href="api/pomdp_py.problems.tag.agent.html#module-pomdp_py.problems.tag.agent">module</a>
 </li>
       </ul></li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li>
     pomdp_py.problems.tag.agent.agent
 
@@ -1593,6 +1778,20 @@ <h2 id="P">P</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.tag.env.env
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.env">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.tag.env.visual
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.visual">module</a>
 </li>
       </ul></li>
       <li>
@@ -1600,6 +1799,13 @@ <h2 id="P">P</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.example_worlds">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.tag.experiment
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.experiment">module</a>
 </li>
       </ul></li>
       <li>
@@ -1656,6 +1862,13 @@ <h2 id="P">P</h2>
 
       <ul>
         <li><a href="api/pomdp_py.problems.tag.models.html#module-pomdp_py.problems.tag.models.transition_model">module</a>
+</li>
+      </ul></li>
+      <li>
+    pomdp_py.problems.tag.problem
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.problem">module</a>
 </li>
       </ul></li>
       <li>
@@ -1822,6 +2035,14 @@ <h2 id="P">P</h2>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservationModel.probability">(pomdp_py.framework.oopomdp.OOObservationModel method)</a>
 </li>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOTransitionModel.probability">(pomdp_py.framework.oopomdp.OOTransitionModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability">(pomdp_py.problems.load_unload.load_unload.LUObservationModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability">(pomdp_py.problems.load_unload.load_unload.LUPolicyModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.probability">(pomdp_py.problems.load_unload.load_unload.LURewardModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability">(pomdp_py.problems.load_unload.load_unload.LUTransitionModel method)</a>
 </li>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.observation_model.ObjectObservationModel.probability">(pomdp_py.problems.multi_object_search.models.observation_model.ObjectObservationModel method)</a>
 </li>
@@ -1952,6 +2173,12 @@ <h2 id="R">R</h2>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.remap">remap() (in module pomdp_py.utils.misc)</a>
 </li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.render_env">render_env() (pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.render_env">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
+</li>
+      </ul></li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.templates.DetRewardModel.reward_func">reward_func() (pomdp_py.utils.templates.DetRewardModel method)</a>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Environment.reward_model">reward_model (pomdp_py.framework.basics.Environment attribute)</a>
@@ -1971,11 +2198,11 @@ <h2 id="R">R</h2>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.rightt">rightt (pomdp_py.utils.misc.special_char attribute)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.models.components.html#pomdp_py.problems.multi_object_search.models.components.sensor.Sensor.robot_id">robot_id (pomdp_py.problems.multi_object_search.models.components.sensor.Sensor property)</a>
-</li>
-      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.env.MosEnvironment.robot_ids">robot_ids (pomdp_py.problems.multi_object_search.env.env.MosEnvironment property)</a>
 </li>
   </ul></td>
   <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.env.MosEnvironment.robot_ids">robot_ids (pomdp_py.problems.multi_object_search.env.env.MosEnvironment property)</a>
+</li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.state.RobotState.robot_pose">robot_pose (pomdp_py.problems.multi_object_search.domain.state.RobotState property)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.state.RobotState">RobotState (class in pomdp_py.problems.multi_object_search.domain.state)</a>
@@ -2016,6 +2243,8 @@ <h2 id="R">R</h2>
         <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.templates.UniformPolicyModel.rollout">(pomdp_py.utils.templates.UniformPolicyModel method)</a>
 </li>
       </ul></li>
+      <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.rollout_policy">rollout_policy (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
+</li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RolloutPolicy">RolloutPolicy (class in pomdp_py.algorithms.po_uct)</a>
 </li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger.root">root (pomdp_py.utils.debugging.TreeDebugger property)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger.root">[1]</a>
@@ -2086,6 +2315,14 @@ <h2 id="S">S</h2>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservationModel.sample">(pomdp_py.framework.oopomdp.OOObservationModel method)</a>
 </li>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOTransitionModel.sample">(pomdp_py.framework.oopomdp.OOTransitionModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample">(pomdp_py.problems.load_unload.load_unload.LUObservationModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample">(pomdp_py.problems.load_unload.load_unload.LUPolicyModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LURewardModel.sample">(pomdp_py.problems.load_unload.load_unload.LURewardModel method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample">(pomdp_py.problems.load_unload.load_unload.LUTransitionModel method)</a>
 </li>
         <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.observation_model.MosObservationModel.sample">(pomdp_py.problems.multi_object_search.models.observation_model.MosObservationModel method)</a>
 </li>
@@ -2192,6 +2429,12 @@ <h2 id="S">S</h2>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Agent.set_belief">set_belief() (pomdp_py.framework.basics.Agent method)</a>
 </li>
+      <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Agent.set_models">set_models() (pomdp_py.framework.basics.Agent method)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Environment.set_models">(pomdp_py.framework.basics.Environment method)</a>
+</li>
+      </ul></li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief.set_object_belief">set_object_belief() (pomdp_py.framework.oopomdp.OOBelief method)</a>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOState.set_object_state">set_object_state() (pomdp_py.framework.oopomdp.OOState method)</a>
@@ -2220,6 +2463,12 @@ <h2 id="S">S</h2>
 </li>
       <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOState.situation">situation (pomdp_py.framework.oopomdp.OOState attribute)</a>
 </li>
+      <li><a href="api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.solve">solve() (in module pomdp_py.problems.multi_object_search.problem)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.solve">(in module pomdp_py.problems.tag.problem)</a>
+</li>
+      </ul></li>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.sorted_by_str">sorted_by_str() (in module pomdp_py.utils.debugging)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.sorted_by_str">[1]</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.action.MotionAction.SOUTH">SOUTH (pomdp_py.problems.multi_object_search.domain.action.MotionAction attribute)</a>
@@ -2277,12 +2526,16 @@ <h2 id="T">T</h2>
       <li><a href="api/pomdp_py.problems.tag.domain.html#pomdp_py.problems.tag.domain.action.TagAction">TagAction (class in pomdp_py.problems.tag.domain.action)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tag.agent.html#pomdp_py.problems.tag.agent.agent.TagAgent">TagAgent (class in pomdp_py.problems.tag.agent.agent)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment">TagEnvironment (class in pomdp_py.problems.tag.env.env)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tag.domain.html#pomdp_py.problems.tag.domain.observation.TagObservation">TagObservation (class in pomdp_py.problems.tag.domain.observation)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tag.models.html#pomdp_py.problems.tag.models.observation_model.TagObservationModel">TagObservationModel (class in pomdp_py.problems.tag.models.observation_model)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tag.models.html#pomdp_py.problems.tag.models.policy_model.TagPolicyModel">TagPolicyModel (class in pomdp_py.problems.tag.models.policy_model)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.problem.TagProblem">TagProblem (class in pomdp_py.problems.tag.problem)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tag.models.html#pomdp_py.problems.tag.models.reward_model.TagRewardModel">TagRewardModel (class in pomdp_py.problems.tag.models.reward_model)</a>
 </li>
@@ -2291,14 +2544,18 @@ <h2 id="T">T</h2>
       <li><a href="api/pomdp_py.problems.tag.models.components.html#pomdp_py.problems.tag.models.components.motion_policy.TagTargetMotionPolicy">TagTargetMotionPolicy (class in pomdp_py.problems.tag.models.components.motion_policy)</a>
 </li>
       <li><a href="api/pomdp_py.problems.tag.models.html#pomdp_py.problems.tag.models.transition_model.TagTransitionModel">TagTransitionModel (class in pomdp_py.problems.tag.models.transition_model)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz">TagViz (class in pomdp_py.problems.tag.env.visual)</a>
 </li>
       <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id127">terminal (pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState attribute)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id29">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id78">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.terminal">[3]</a>
 </li>
-      <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Option.termination">termination() (pomdp_py.framework.basics.Option method)</a>
+      <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.Option.terminate">terminate() (pomdp_py.framework.basics.Option method)</a>
 </li>
-      <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id146">test_planner() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id48">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id97">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.test_planner">[3]</a>
+      <li><a href="api/pomdp_py.problems.load_unload.html#pomdp_py.problems.load_unload.load_unload.test_planner">test_planner() (in module pomdp_py.problems.load_unload.load_unload)</a>
 
       <ul>
+        <li><a href="api/pomdp_py.problems.rocksample.cythonize.html#id146">(in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id48">[1]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#id97">[2]</a>, <a href="api/pomdp_py.problems.rocksample.cythonize.html#pomdp_py.problems.rocksample.cythonize.rocksample_problem.test_planner">[3]</a>
+</li>
         <li><a href="api/pomdp_py.problems.rocksample.html#pomdp_py.problems.rocksample.rocksample_problem.test_planner">(in module pomdp_py.problems.rocksample.rocksample_problem)</a>
 </li>
         <li><a href="api/pomdp_py.problems.tiger.cythonize.html#id116">(in module pomdp_py.problems.tiger.cythonize.tiger_problem)</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id38">[1]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id77">[2]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#pomdp_py.problems.tiger.cythonize.tiger_problem.test_planner">[3]</a>
@@ -2312,14 +2569,14 @@ <h2 id="T">T</h2>
         <li><a href="api/pomdp_py.problems.tiger.html#pomdp_py.problems.tiger.tiger_problem.TigerAction">(class in pomdp_py.problems.tiger.tiger_problem)</a>
 </li>
       </ul></li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.problems.tiger.cythonize.html#id3">TigerObservation (class in pomdp_py.problems.tiger.cythonize.tiger_problem)</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id42">[1]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id81">[2]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation">[3]</a>
 
       <ul>
         <li><a href="api/pomdp_py.problems.tiger.html#pomdp_py.problems.tiger.tiger_problem.TigerObservation">(class in pomdp_py.problems.tiger.tiger_problem)</a>
 </li>
       </ul></li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.problems.tiger.cythonize.html#id44">TigerObservationModel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id5">[1]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id83">[2]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel">[3]</a>
 </li>
       <li><a href="api/pomdp_py.problems.tiger.cythonize.html#id11">TigerPolicyModel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id50">[1]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#id89">[2]</a>, <a href="api/pomdp_py.problems.tiger.cythonize.html#pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel">[3]</a>
@@ -2369,6 +2626,8 @@ <h2 id="T">T</h2>
       <li><a href="api/pomdp_py.utils.debugging.html#pomdp_py.utils.debugging.TreeDebugger">TreeDebugger (class in pomdp_py.utils.debugging)</a>, <a href="api/pomdp_py.utils.html#pomdp_py.utils.debugging.TreeDebugger">[1]</a>
 </li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.TreeNode">TreeNode (class in pomdp_py.algorithms.po_uct)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.html#pomdp_py.problems.tag.experiment.trial">trial() (in module pomdp_py.problems.tag.experiment)</a>
 </li>
   </ul></td>
 </tr></table>
@@ -2378,8 +2637,16 @@ <h2 id="U">U</h2>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.templates.UniformPolicyModel">UniformPolicyModel (class in pomdp_py.utils.templates)</a>
 </li>
-      <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.observation_model.unittest">unittest() (in module pomdp_py.problems.multi_object_search.models.observation_model)</a>
+      <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.unittest">unittest() (in module pomdp_py.problems.multi_object_search.env.visual)</a>
+
+      <ul>
+        <li><a href="api/pomdp_py.problems.multi_object_search.models.html#pomdp_py.problems.multi_object_search.models.observation_model.unittest">(in module pomdp_py.problems.multi_object_search.models.observation_model)</a>
 </li>
+        <li><a href="api/pomdp_py.problems.multi_object_search.html#pomdp_py.problems.multi_object_search.problem.unittest">(in module pomdp_py.problems.multi_object_search.problem)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.unittest">(in module pomdp_py.problems.tag.env.visual)</a>
+</li>
+      </ul></li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.misc.special_char.up">up (pomdp_py.utils.misc.special_char attribute)</a>
 </li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_rollout.PORollout.update">update() (pomdp_py.algorithms.po_rollout.PORollout method)</a>
@@ -2394,6 +2661,10 @@ <h2 id="U">U</h2>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.basics.PolicyModel.update">(pomdp_py.framework.basics.PolicyModel method)</a>
 </li>
         <li><a href="api/pomdp_py.framework.html#pomdp_py.framework.planner.Planner.update">(pomdp_py.framework.planner.Planner method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.multi_object_search.env.html#pomdp_py.problems.multi_object_search.env.visual.MosViz.update">(pomdp_py.problems.multi_object_search.env.visual.MosViz method)</a>
+</li>
+        <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.visual.TagViz.update">(pomdp_py.problems.tag.env.visual.TagViz method)</a>
 </li>
         <li><a href="examples.external_solvers.html#pomdp_py.utils.interfaces.conversion.PolicyGraph.update">(pomdp_py.utils.interfaces.conversion.PolicyGraph method)</a>
 </li>
@@ -2442,9 +2713,11 @@ <h2 id="V">V</h2>
         <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.VNode.value">(pomdp_py.algorithms.po_uct.VNode attribute)</a>
 </li>
       </ul></li>
+      <li><a href="examples.external_solvers.html#pomdp_py.utils.interfaces.conversion.AlphaVectorPolicy.value">value() (pomdp_py.utils.interfaces.conversion.AlphaVectorPolicy method)</a>
+</li>
   </ul></td>
   <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="examples.external_solvers.html#pomdp_py.utils.interfaces.conversion.AlphaVectorPolicy.value">value() (pomdp_py.utils.interfaces.conversion.AlphaVectorPolicy method)</a>
+      <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.POUCT.value_init">value_init (pomdp_py.algorithms.po_uct.POUCT attribute)</a>
 </li>
       <li><a href="api/pomdp_py.algorithms.html#pomdp_py.algorithms.value_iteration.ValueIteration">ValueIteration (class in pomdp_py.algorithms.value_iteration)</a>
 </li>
@@ -2487,6 +2760,8 @@ <h2 id="W">W</h2>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.bcolors.WHITE">WHITE (pomdp_py.utils.typ.bcolors attribute)</a>
 </li>
       <li><a href="api/pomdp_py.utils.html#pomdp_py.utils.typ.white">white() (in module pomdp_py.utils.typ)</a>
+</li>
+      <li><a href="api/pomdp_py.problems.tag.env.html#pomdp_py.problems.tag.env.env.TagEnvironment.width">width (pomdp_py.problems.tag.env.env.TagEnvironment property)</a>
 </li>
       <li><a href="api/pomdp_py.problems.multi_object_search.models.components.html#pomdp_py.problems.multi_object_search.models.components.sensor.Laser2DSensor.within_range">within_range() (pomdp_py.problems.multi_object_search.models.components.sensor.Laser2DSensor method)</a>
 
diff --git a/docs/html/index.html b/docs/html/index.html
index cafc5b24..e00bcb8e 100644
--- a/docs/html/index.html
+++ b/docs/html/index.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>pomdp_py Documentation &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>pomdp_py Documentation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -36,7 +36,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -136,7 +136,7 @@ <h1>pomdp_py Documentation<a class="headerlink" href="#pomdp-py-documentation" t
 <h2>Overview<a class="headerlink" href="#overview" title="Link to this heading">¶</a></h2>
 <p><a class="reference external" href="https://github.com/h2r/pomdp-py">pomdp_py</a> is a <strong>general purpose POMDP library</strong> written in Python and Cython. It features simple and comprehensive interfaces to describe POMDP or MDP problems. Originally written to support POMDP planning research, the interfaces also allow extensions to model-free or model-based learning in (PO)MDPs, multi-agent POMDP planning/learning, and task transfer or transfer learning.</p>
 <p><strong>Why pomdp_py?</strong> It provides a POMDP framework in Python with clean and intuitive interfaces. This makes POMDP-related research or projects accessible to more people. It also helps sharing code and developing a community.</p>
-<p>POMDP stands for <strong>P</strong>artially <strong>O</strong>bservable <strong>M</strong>arkov <strong>D</strong>ecision <strong>P</strong>rocess <span id="id1">[<a class="reference internal" href="#id21" title="Leslie Pack Kaelbling, Michael L Littman, and Anthony R Cassandra. Planning and acting in partially observable stochastic domains. Artificial intelligence, 101(1-2):99–134, 1998.">1</a>]</span>.</p>
+<p>POMDP stands for <strong>P</strong>artially <strong>O</strong>bservable <strong>M</strong>arkov <strong>D</strong>ecision <strong>P</strong>rocess <span id="id1">[<a class="reference internal" href="api/pomdp_py.algorithms.html#id31" title="Leslie Pack Kaelbling, Michael L Littman, and Anthony R Cassandra. Planning and acting in partially observable stochastic domains. Artificial intelligence, 101(1-2):99–134, 1998.">1</a>]</span>.</p>
 <p>The code is available <a class="reference external" href="https://github.com/h2r/pomdp-py">on github</a>. We welcome contributions to this library in:</p>
 <ol class="arabic simple">
 <li><p>Implementation of additional POMDP solvers (see <a class="reference internal" href="existing_solvers.html"><span class="doc">Existing POMDP Solvers</span></a>)</p></li>
@@ -169,7 +169,6 @@ <h2>Further<a class="headerlink" href="#further" title="Link to this heading">¶
 <li><p><a class="reference internal" href="extensions.html"><span class="doc">Use Case Extensions</span></a></p></li>
 <li><p><a class="reference internal" href="other_libraries.html"><span class="doc">Other POMDP Libraries</span></a></p></li>
 <li><p><a class="reference internal" href="building_docs.html"><span class="doc">Building Documentations</span></a></p></li>
-<li><p><a class="reference internal" href="simple_rl_integration.html"><span class="doc">Integration with simple_rl</span></a></p></li>
 </ul>
 <div class="toctree-wrapper compound">
 </div>
@@ -201,6 +200,11 @@ <h2>API References<a class="headerlink" href="#api-references" title="Link to th
 <li class="toctree-l3"><a class="reference internal" href="api/pomdp_py.utils.html">pomdp_py.utils package</a></li>
 </ul>
 </li>
+<li class="toctree-l2"><a class="reference internal" href="api/pomdp_py.problems.html">pomdp_py.problems package</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="api/pomdp_py.problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="api/pomdp_py.problems.html#module-pomdp_py.problems">Module contents</a></li>
+</ul>
+</li>
 </ul>
 </li>
 </ul>
diff --git a/docs/html/installation.html b/docs/html/installation.html
index 053aa07c..6a929526 100644
--- a/docs/html/installation.html
+++ b/docs/html/installation.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Installation &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Installation &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -77,10 +77,12 @@ <h3><a href="index.html">Table of Contents</a></h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/modules.html b/docs/html/modules.html
index 24ddc07d..739a22e9 100644
--- a/docs/html/modules.html
+++ b/docs/html/modules.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>docs &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>docs &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -56,10 +56,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/objects.inv b/docs/html/objects.inv
index 9fc6e5739615022104c4f443a5997976c3c0861c..807ff44a75b4ac88fb1b45b2b1c2b4901dfb45a8 100644
GIT binary patch
delta 7033
zcmV-<8;0c3GPF04cz;`WoVb>L_phk6W*%l9!X(b6<9>5ucRFkA*vEE~(@!iF$W`h9
zB7*WIzy3%F3aW~WE?YpqbjOtVz7J_@>%NuJI86QY*+bEaGLo<3%v)yZB7Ocnrr{>S
zi<b+OlK)HF(|PMWj{ZxgeDU9l7e`&`meEh91gZn*eYp77jekH5B9vu|SN)($XkNfD
z%CVnDC@J*fd`&|bX#C^e-=v{{k0T0=PLdq2m;hhmh~Rra!>br4xeFeaGMxL_&(uji
zmBMl82Q<t5`%Mz$gaXi{)Mqq`=q3j<#TwGPzPhQwtt_$))C(evn2%N<McT^1CFk6D
z_<tCFL@X3ED1XlxS#EL+$^>IIt<V`a%<`$9(uf4lj)-JUb_y;_yR6SprLhS>t)Ihr
zr$zm|W`r^b+uwuqR=h~L!@0+dai4&SUow!47fjbzUq9YK$u7V=DUoX~GX$vEN_1#P
zP$P#V3+RSh+&%vS7t#w4lWbx?BXQ;kUig-TBr88BF@J{Vh|!ZD;xu2wLyL@gAQ{Os
zpClxQCjfK1HRPeIg_Z2co!10_ZhRj!bLGEFmIoAVFu1Aw>kADrls~*dNl0VBe$fG_
z*X+?jlwgT_y)`xv$xToPl4<@8wAd;@@19Zal#&t~R;{-t8E<Aly~Z8G7&0d+JTF+2
zC}cQsA%C{v`JKQQjsg-H)YzmgAhzO7E0~c<P~HRM{<kVRf13}06p(ov2Pt6JoTKrE
z;_~A)KtXM>!1@q1B3ui+kLjZQ6&za+c8yq0cz-+t%Hl&{Zv^qcPF|2W$sKn&Q}(2C
z%+PkG38E72;d<Z1-=CW_R@u@IZ&Ow88H({EWq&`sCCW&Ub>~Q(vNJ>W!OFpX=jZQ1
z4q#Q|U?3<Dg`qDDsypXQK%=NRanWh8hR}4GVfKKW;b*xR&Ojq8RA2*Cl}@DrtQcnb
zZWL!IP9xj^2Qxb{dUgcMD>{xcP}rf4fH9=sun7R@4-pD}Ea}sw$O0JGvjaKU7q)<w
zwtof$ea5r3s0Co&you=f{tD;3b&Gx9fnW}w0mGjs4}{Sq25XTTfF4TI=-JO1O87Xj
zcR9?MVp*DstlV&JuE`N>m~2kmz^9BpkPtUpL<boq*T-CD6S#}r0e6@G1+-f$t-+xS
z;1f=YzVicy_iXLhu&%y?L#&?_E#Qj3;D44XPNCYCtKAB0UjPk2z=nGt6}CVR&_z+U
zb@*Lzg?shD1rK-GOSB{r$)8<OfcAQ>Qb40Du!_M2f$RI0s0wRxCa?}N)5|f7NdlJx
z*H@Qk*DysS*K7b?MgtJmTQq?yM=`it!ivFxduUR?dxj=Ds2w+fLC3K-MOPEh{C^sN
zu;$kUc4Qn)3V7paqJtX8ZPnklFTJ~M=NHf<_CR6HVjsNnO!b_iBN7Mpw@(9agZm7i
zc34g{;-{25tLFG}yTuj&eYG7K)Wb77d`gRlKx+^sns>&t0HR`6cvn{+wll4OaFDZL
zE!dee>?JrNz~J%#lP>?p0n{XUKYu#J`pE$UEA~Qx3m4N*j<N=BVBd=A)q7XL^?EU8
zE9?XsqBZXZcH=}G&3*I`G^RZotru9Gayd28!vfRB*8~uQ-x>|JjV#dIn4^RaX!;C|
zxvITkZENm0WJbHg-%kHS;)4s$Tni@oX4?vZxe(a#StqWW8sugi*p2VRy??qHL3QKr
zFGqnkNrnA`df*z-i4E<*XD;C(9DQ+C2s5COWr^lp*QgdHwud&bo6igrW~Q<o_3-qI
zK8J7+5srJdA66;4%V(P+BCB=ohln%b<Us*)_XTZ+@mRbI@#u^{QQ3jg%WOr->tvD@
z#Qe<^Gw#;M<1W&<<xV4-=YJ$wjZmr;Rq+o$AS{q=Sl3J%+{a1Ah$N%(rIaLjHZEiI
zyegN*AUP=t{Y@hNr(z~`Y84x4q@IAsyZAb=bGw^Qmq=xn$O&72x7{7(U}xJQwNgLa
zA^%Vp9gbRMG2aQ>h{bEP4Zsck$cCk}x(~;yvO@2KZA6>WUU+vyJ%3)I_K&&YcvR<$
zoH34QL`Ks;?&wD|CjOtV#XqlQQs;$SF2T##5RC!&a5oo-SFTFd^R}*uV?>fMcye3?
zn32;vP<%1^g%x`7BAG(>y-3FMzswXBP?=f}y9{&Wlw$uF#|S*0*3jdCa+s@L&2aTK
z1%s#9gz0>N+Kg6}RDV^q`dpbIvUkb<(3%?CCF)^loY7H`E>o+jFH;9JPHBS6=@AW@
z`b8DSO_Y=Ef*VFGSgX(-zGcSc)$z>q8Ie5rYtB0dcJGpA{fF6ARoKy&@#O}O%(_z3
zSTC5OEF`_ijlm6lZgZe1p?~Y!h&qP0n>m&u&&fpO7uM<3f`4gI?^AWYY-pR>JuasL
zJk@F7AsMFpe~=`cTEhjUKc?1jNyY!>q{91f`tkq2pWdAH?t&Os()sD_-OS`1&nbWY
zxVo8HiCvukF{cvya&>d}=iKzn%7kt{fBJJyC3gGq&-2Uk+u14dzkQ#drhor6M@_S;
zakp1r=ci{@9)IBb`K%gQA!oAu(VVq()K_oLX%=HRy@^eSnQ|a!@X*dwvM3X8%}&?A
zIizt^$<4U)F{%SS-j}Zz7ZbSv<w<@=m0vCa6o#X^4&WpU8WO70kSWb3vE4pBnbO8l
z_mZZ~8<pb*BWe%@M8YXcrYWW>nyIwh&?TL?Y-$N*-G9mad%8)&d1T9sO2}j4pZ)}b
z6xUJP-!yD;G}doj@CyH_x47G<!j`@)dJ>v9DR5fUqcOS?gnw>G${!{fWts76jfH^i
zb%m3X`;}Epp&~{<u+M7*W@SN4CW5DYA~DIIClc~NvJHwRaa598RM2na*Qh>fhuI4m
zdK^5HH-C~0r69c{X(=k`lqyKP^4D1T5SvpSk0g{A+)XE=xXW+PK&Dee6JKnLNjB+}
zCc;(Vhu&)+$I<YFgWd=jqo}Cvy_--%MCsJ_z;F^`Hl+xuz^?`X6R8+F$?i}=6}5#%
zQ*~&(4X+DgZ~Cb8Pcq)$BV|#Tjk;HKm%7}PCV&4j&H>G@SKs&B`Lf~18|?~K!GY4_
ztr!XY7^Sln=6&M-xRe6*yWt)BAccvWy~Go$dTMhdo%N_~R^=*Xc^6`cdwh1g6*-Ht
zZ4>8_#J?vv3VnL-KM?#lw<6w?EBoPi<|@TQaq&09D-n$;BfrdNUq{otrc@l!L-EWr
zSATk>e}K?OlCOF7;+=xk{0#QGngE-plbW+C@8b0K{KkAa-?_f)o2!3+zWjXm*NipJ
z)sdI-nzQ6HbKC!@Hs+t;3h^f3Eeb|S5vbpI+~!VTGv{U|EvH;sIJvNcaLf~qhYz$A
z+iJAqIt|Hlqf0#&#R&Qi_R-BJ>)NHMhkr1cPNH6{lj(HM$q=n)HLdi>+tViZYfTxR
zR`@cfIpP_`HXBcpe&Dn5v`y>_I(0D`MRb$TO4D@yX#bAiiRyn-hWCl0NGsf&(_9ff
znc1qD&?)t)nz-)wNt>>!wcY4EQFYswA~H!kMxXNxYEd<zy{o93k8#Ou+A}QEHh*1n
zD%Dnf<evZffc@q3d^Jw&bJax7sDg+i3?z^P#2MC;9(i-BE`2iRW|4hbXJnWp@t5Mf
z5t4Dq#-9^7P$XAHt8+dh3QFrxvZHOgDu0yc75gulgWPIW(aKHhe!bIgjD21ec}Am$
z(Mhc*z<PKY4SqDLcE1hPi4{zzk$*UN<{l#<zce|vuNks69{TDPWl+GejR5cC8VAY&
z!@9MQ@Z<zaNAYvH+&a8q-KXi*%a>N7E_ojkB5z*3d<CRKBWhT`pkpXO8d0eF6}^U1
zq!AUTU(p*VMe0##`USm(5+t{9LP&aNCF$lCrh5HmsX{AUNWYZ#a8kUV8-G-F#%;^#
z1WuOXkgHeEtCzrf)W=x;x?Vx+(i>Fui#vuEr#y=4*Y(;`m(~Jezmzv{QlL!gEubX*
z1;l=B?*O$yTKaE*y3`jC`!&4>)C5%VY`wbHI$5uj<Ckz!fGXbcD?mwr#(jJYs0+rB
zj%_`-Vg#Um5pN(wh<G~$sDF2R{1!x!_$hx*aRwpj9f+hHvzR0@=!C5zTVJg`ncpwx
zJ**rkXLJHA3(z6GehI7%#woqF^xyo^ZShF?g0p@($FOpm_n~DuN&@=~dkw6Rh^PvL
z_c$3w*5cj(i%S_v^7=A2D{XIqwUuYT?-|B^L<7}WGW{aoS&O`TPJeA1>DRx3sPI0V
zo&mHyuiwL{`E+#!BIg7~4oMy`vmUU#c?qLN`F5RtHFn-y)-RCR!Z&t~+~9;zzZ^TS
zU0kM_B9@aN!kNwmME$Dl+_m!6m;EB_{Id4FnEhe~{jcr%p4PHr%l8`84yC17$aO<w
zLc_H<06w!dHwa?0wSP4TX0tUk2xg<TGGk)Xg&$)=%as&BUZa66B){<p7E*-CP}PFp
zbfp7^a_k}pTe$$zFonfguS5WGk8J3sD+@4`V;efiN&yi6$OUaPdkaT9c7cP<#sX>>
zx8SX2SK(-FXHfx_n9r61iZGrP1=L_a`)MUcdzRCh&1g2$o`2P7*3zEVWOmY?)npdZ
znALc;(VS6x0o|A?;QndPU+T<^8S~mroEp=DOpqG0n@oh7lksnjQ8a$h+RU`}kmhKm
zFoVidDNLP;RA^O&sUJox((2%jf$rU*)#*y<I-xxlJ$O%CE5Q6Uucwr$^k|LP^p8#%
z(Fg}XP(*%Voqx)2OJ(G7lt}|xRB@#++v@d0Uhbs`seB(~BQXjTZ=bazDC}6V@!n?|
zq|m!Y*Yrc0SBUbj(VC~${v_3FK}|nKUPQ+~L$Q~m{sC$iyp<^xMXO&NXM`*ALF;0;
z9Tr`9@1F6YSe7$ICvHyEjITc!c+`$6!pTbUCLlW^^?w_OG<cM+`_ebB^5PBt6-w86
zX^SqAHLvTkqtUyL%Z^L+x-DZC&Fi$RcpMsUMPqawmNA>wbyqels@GXraVTF`Wy7L)
z9hD7*;&oFt6w2308Ix#T7iG+%d>xcNgH})mRe0UIl+;HW_=)=n5~~lGbz#*fUbg5;
zusI{L?SF>ARlcsNPOO*_Cf6~wzGup(bKQ~~V)g5kdiZUKy<!0*z)_SbR(UrfwEF)p
zB<Nln<yJ=(7HJ$2@~eFrNp|$Qu){7|p*zG@IKM0&UvD*yQau#3cyT&a(R2vXTh|{^
znDTO%jV6<u6il0{!$9l1(_V_ZOZMquc-6O;IDg_dwnIn}${S3y`8A{3o7&h;Ja7Jm
zTDvi=K5CE6U^gTvz4}H(P+E5eq!||7)PQyZRr8P2+U02VQG0Bz9YP<qyHYfWxNTaJ
z2Qf26GpoCm(fR{hSRFPsD(qU3lbtAVY}qOj99X#efiU&ij%xRX@Up6#FcoGcw70Hk
zV1KFyEFA(RE39(mZ;?(VKZ|rakwN#~(C3hUYaA8qV?5Sp^zOu8%IoB9<RpCm(v(<l
zNxOsn6#%=Jpct#|qwJD#3?M_b&FPTv8cKpj1Johq4VaXwo7@<mWER5Sf(jG67z=w*
zT$$_;^$tvwX3N>3=Ql7t>dk0}l=r4m^nV6+9qcCn?ADd(<Ryd(gW+a}oL3NXKn(Td
z7($Azjh-0$UG*+o2lE?CX7BXl-RG+>w^mKx$y-|$S08TAZ@!%ZNO@-~<@WCM?%Yy@
zvHR4UOXy&K55R8kvrZsXz%{X5Vc<0dfq1R1Q1F^sY~5B@0C)u%s(U!Qh+kU~+kbb~
zyW+YlDA1oE>XPslNP=};?TX-TAf@VL6uW&h8%e)GN`mqs@1aBi`H>SSJ=VVDm5F;@
zZb%e1JEX%iLS6K)jOq8smF60bjWuLA&q=bfqknBqzpbt2>?RIXeRi>n)x?KtA5`mP
z?{k}G6ML!?h`V28I)gMcw>m&$H-9x_OK##qZ8<gFq$ZugjD<Oa$;i)w&2;v`f>L9F
z+m_0$T^NiC%^4hji@|z>34_7Hf(ec0{EY=gd1Bvbv1pCzj0rrNuhlm48}XP8&+J%C
zhdq|8BeZ~);{;7M&HkV^`VZ`H*Nok881^j>Sr|?k&Tx{;UR8Nc-YZVyuYVZo=}~sQ
z+10ZgV)D?E51wVa?b8Qbh6JcYbbVo;3_X5%Vy0$QI81L#zCF0_Je#*nhuOR%!ugkO
z|K&4Gk_WP)Y}<UgCojubCt!jxd2=$zTcJ&s5tOJG^v>(b#obEkeQL0`HdDjo7ObA{
z^M;G$IQIQ+m+o3ZHnoI+K7aHMf}FD>Myg0X6N!j1N~WamJM!U{dgu&=TlS2sVl-OD
z8+0B3oL$|J|Jmes?(SN6$9H(`BC_d4h!M-KJxn5FN5Z(3prL|fenMGX1Z@hZ%Z$<7
zU>o_Ej?kcc4d96C-sW|a-?<}d;q_1$j-1sE^5Qt~$d$iMM=@(skAHfm6*7bT*r^ty
zIKws-lQ;tJdl3)^hf`I}1OD;*3jJcT`G}doc^!%fXcFQi!_zC7)}6NM`Gu1Se8{1c
zNgeB<oY6X1eIlmx@`q|>;_XFTj?GN6<gs`Hs)axAi}6$Z+}*2{KL<3T3<kto<0n6-
zK3gsOW>_1D-B3j&_<s!h#h*S021bO?7!^g#tZ~Xq4K@k+xheJ8W3HB>DC{z>*qY>n
zSXl$g3yZCj0r%l3Tbs)Z@p7|TmHXQ)v~6*`JBIOD@s}*s){dg0s2wnG*%!Xh3=suC
zy8WveB+l{-|Adz+aYJCa0l3g2G&wkG2#<)<{_vYds1b1aM1SbHZ$pL|CPw$*A08tH
zU6ll+pCVaG(73!VZE){(M8?=DH0Ck|FRmnlhfLrh;r(c`iT$EdWlo?I8uo26GQ)iU
zmkMp74r-}@<h?Iw)EGW5;cF)!z}#cTa5%gt*9afJeP)#A;Goc-o$)6TF6wB1$W1f!
z979*DTtp}p8-Eu8a)Km$n8gh%w;deSkQrrsbnY*otK2jLER@}&K+YVB0j3zKpGN5#
zeZxUc*<mEiGW2og;V1rXf+D|&T*ItM<jpN?6YTCycgH6-B#uN?%;PxWk_4X^O4lw*
zsR8e}e40$oN~THD5^@}hCa1nkcTb}Im`>0fPv9hF(tn+4i2=aw*@;73FGDPof$@PA
zdk@4<*(NzWGpLUqSKTV}i5UUm-S|tKKVqDiJLwYV$r|C=8sV2E!ky*&DCNDJC!Y@>
z`$NquK&jukr~t-Q{cQ;$CZ179Q2%jT1)v8USRjxrur+%Q;r*S_#Lv(@wv*y9Tn5Uw
zzz{P0jDI_RTQM1lNrad!N{R!*Jy5Vlrn9sMINt5o54Rt0K40JUuFvSAE@__AIKub2
z16Wqw^#hCxiy6|#1Qc)`kpzPx77byB1K1A-FLeP3j7XD}BNMHm;muTFI}z+gYEDxp
zYB?^vU`L3skl7mXk-YT&V4yCF$w?7$P*^~D>3<m*+=Hcq&M_ZqY!AGe_oKEr-Wkr7
zV_7I_Yr|AKIcq~ObWT<STjlh>8QfstC_~sXaJ=X_f@1?_tm;v5b4YMI(>;!@3Vlli
z&OlfOJusCB40?$D;R#f+?$C0>hc@7DrUO?qMvg5TsKIrSKv`Xh59#0zA)(bmdyRHj
z<$s70mNYKx#g&u#nvi?SVwEUK=8)=viYzz=BNJI*Tjut2YTKE6PQ7KlSJk9=Y6S1Y
z#n*G29%>Wn>f#It>f>LhUx1*_znpypg8FoGehww;^7PaBm%CFSw3~CNod5pk=Q}8a
z`0M=Q;_5pPSV%Iow5oSosLTqaTz)m1wtp=UXcXEZ1kWh3L%@vL>>dyhD`vG6B_K$0
zPwfz5v=V0o>_8HlTNWw9mL-~Pf&gck9SHA|B?CcD6+qU+HaDIzZ+#y%FvM@N!OIp|
z9{wKEVDUn}Qa&!yE~@vBnqd2HY)N)rS)?fV!Hs3-RS!ig%1FMBvrd#c$u3~?-G2dW
zZ<(bk_&ixBM}aZKBd;k}p(-yl?_?{HS_$tNit!_5KRSuFDfS5JH(P<Lm|dN?+n`>%
zu-o@~QRN{OKSVvkThexLHPKXQy~0^(kr!_aODK_*g@m+-1gE1!zM>$d#8%dVlLsv!
zJiUSnfvPN_ydqvlMdL!cg$nk77JrIDf0Ky+DX6Fuck(yz`k7<&3lCF@R9##J!Z3-l
z%{3DDQL5Qlky6RRs+7H)!&X%!Q?;i?;$B)M8)|~pmr(18*t@)Xq0BNMZ4>3hr^~-_
zkoy@%ELbb(I((^9R13bgB319)`KpFGC4b%ao^mDXd{;-MS`}+~QLV<czkjGBP@z7y
zyro<{JKxpOs8)HqskG{{3XHyZ^_tFT@S~g{8x&io?NZc0Q>AU(E~+D7_wIp(B16BZ
z9Ib{mR5!3L+TR~!Q1x2dq&;j(UP+`=^+I*pK2{|!BN8fkl`>%;;jq`JuN+n*?Dq-{
zG*w!yTHpHGuo(4PEn_+l>wnmWT3&SCB|OZdQ-j+s4p}JNJKUyXFXBWe`F>=IUCw<J
z6{<3_t}<gI5bt6LQ;C1)_9j&o2N5|IYWS^+WMqXd>Uz3pu^;iH6RZ&wp&zzB3DrW-
zK#?<1ZA|s?fdQ(<IfFK?22SgD4NUK}&gtw;<P_Ht@vreYz>eCTAAcmqhw{<lj0T%{
zTbf6~8YL?n(VdLlK9ui%to}SI&Y2{2m5LCzO!3C{AVo~KQ-Pnw6G0_t^EJs9*H@Qk
z*S{}5)+k3Iz9$KOk+1QKMniOnyA%2StayoI;)Q&v3Da=(>M-&p4wI2p;-`!x0ZI2}
zFb{r|xpP)LUR-Y<AAePB&6l?dig(V-zqU!eGL$(7r>yn8W&#OvT^vajC+1%)QHH}s
zxg+ITBsuCl+R}>Ndj4hcRUFUcV&!j(Tlw2jv#?vyDkE52ieBi8tD+aWxRqnM|GB)n
z{okYA5@|(gv_Qpu82laXdZby4Lf_-w{jJJp`BYjSxBcR`8h@xYOLl*21*&r*$4R!|
z!qiWzY{ZL?yo8FJls_Et&KXHU{IqMQ)l>Q2XYtRYI#~(dNU@y|->KF7l`I#l@*#fM
z#V>zAb>OA)$qSM6#ZmM3UCO=pxVHL<e2rIVvExXg-hFN)7nQHb(<5F5TXH0Qeo_5U
znv`5@mwD5&&T_D`#vuIPQE`KcACV<PjO-@f`$@iZRou8D3;Lq^=}25M@Idh6u-~h$
zxvAbbYJ9`M$6Xh_n%!?~OtEZVY|fyR)#_Tb2!+k66hUFYb>_<g=APsz+r%+q&q^3F
X=~2#}Uyyt_U+y?8$&da6EBxaI4biTW

delta 6418
zcmV+t8SUn@H_<YXcz?@w+qjmU`zy3o_n><ac5LV6nmM*BmDP5vYde)&BQA)9C6q~m
z0Vvzb*I$67L`vcVj{}i4Nh}iBdlNV~cmpYo!_-e#9*X9ak!%rjZ^qL}y811q;WEOL
zw-c0-|4W<0d5bKL{;LT2=D#Ozj@rV_qMu9&R0q)eeEqLGiGLbIi1W#DH>eVt7ch)6
z?57b*a=kcP&=3Y1KRx=(G?eghM4{11lHoa%;4>T%{OEH$k8zT@;9)7lna_WwPSU9q
zjzd47Jo6uyNsti=K$B9R(I}$J49pZONN;+3SAknuWD}?tL>Mt2%|WuXkwHk#gz<=f
z7=A%4lr$*I7=M{9GYrZEV>OM?To`8g)K6(df|Vnpq9i*7FLJvq&rrFs3_z`4z<K9+
z`J6IB8HDZcKzehLrNZGnV#b6|K=~UElJJsgdi(w20ZMib23}Mv<h+O`%h=~6=71Ja
zhnIyjA<5j&NQ~h*z{-9F>8Q+C1b}6I7nHjy<leu&(SHy_8TK7YLK*{BaC@L$y=sO?
z<q~(gF$fUJbx;SAY4#^*wygoZM@D1+IVrJW)p`rUGs;$w*89LPhD?byo);`g6f&H+
z5bH_T{7g8>xD)ti6fHqrGN`c?wt(0?Mz3H-R)D5VbUXZY*7=)s0HlCS+c-!8+gJik
zR2erHQ-6Sr+F*gz!xbW2ExC*7qK=dt8xJ-`EF+@X#(|P}AJ{v9cwi?lNt~pPyOhZb
zu}?D0&}PU0q7d%jdVk8_U+Xkh$<hsPQ&b-rit!6&Pu>i167cpEsY13U$SzpfOKbi7
z9mpQ6b$1B}%0r>(EDD2aPdO9ND602BTMgC_nt#qXX3xkOKF?&A0~%SO02`pHG%5{X
zNkWur5(8+C;xxiFa4@rzJzNK{eKoc*q+iQC0O-#V3Z7>4^+wbi5sZ)6g6wUyT0j>@
z0R(+1k~KG1Ft=Mr^n8DgGf@r2zVAS=fak#QSIIMBG>O5gjvAnc(llE68AFNa&~;8g
z7=KgDN>lOUwPnNjqdG^hWQE^%1D`VbOhR0*x*Q}_F(ctJnH(lj4(-;EDsbpD`ht_Z
z9r}#noli41tT%4qkdq2|B{dfj+)~9Ul>5KkE@So?Py+<4TX#`mGjtDKW@S_3*%eo~
zQx0742(LOrGZK+(<%$BdVRD-S8fA`^H-FR#WPMWNRx?B}4zh%GkeptISxgehG??Dr
zTux!Ksh9%+bQ?85SdUQ$UOS84X=Ez~2QH#c0q-5^=%AKd2L|nK-sLSqK=Z2s!kS+l
z*pYG6Dd3Hxjt*)Z_v<#deeOMM8o+=iu>%Tg7Q5hU&s2@kIU;djf4emBHn__GYJZ32
zz#V=~g|o_v9#ozKo3)1k=<`kQpz5O8;ZvGF1RB#X(Y)K+&zq4(iz2iO2RXRZfX$s@
z&%hA@I)r<eboMt6pazM%(IMs!_83^c76@Fp95{EBG;p2qMojNfG*KyYqSuQtn`0-?
z5VdbRup1}hXuP6>pf*%dt8Ku_lz+?Ngbo&%I=Lc%=&V*~5RJ_pG&km0KnFBkL1WG<
zZ&=xyJB}iu-QjPB>>=^N1#{PeNw(b7LSQZgwm;R1>!t*`>9@7xJ8`dWdOYp;yHiM@
zRZ?#MpdPqFbYeqW@Z2Rlgrm>*Y+we|6D-lZX@zQ$V>@U)tJ%yjVMZ34QGfS$Xy|iD
z2NB`8WBJ`WM0@^hLWr!uEJJezuys%sR5D*=eu#vAoII;wZ$;2%I2?<2EgxNqCo0QD
zI+?8~MM+P1PAp=kB41Vq<j%uEb5j)h%S8UCl9N?vg=~z`FRTD6gDIkUA&n79R6&c-
zde|Ncx|baTQ0%U=IRKB+x_^Uq%6_h@UF_;>a)zGy2BR-f^J43us;brfqam_)BYtSP
z!)>AthN|(XBE1N$s=f>z&^V=ukgZEoMO0y2Mj6?3-7sRoLWOQWmKm2<Z6MZXM8y(n
zbKWtqdpDGKZwpXWVMkwX=<Z$9>`G0o<vB!N6!bDRdZ&imra)an_kSeH0d@3ETsW3e
ztdfezull}&wrNFpE$VHm*2sposommoDxhyGl(Gy{{@+Ow4z1yu(x;&{+)(-7m{fS5
z&oBP}$NAl5=Xly-C0(80Ka5Py$(YjT_uIRX<=FMr?_<ibZ?|_3e~eAfs7&bY>z6;q
zlw<c7e_Y*M-H%R@|9|I?@oD<^Ut`oXsuFj9`+a<RM&$v1T#c%dm2w74AI(uqM{V``
zm}cIG(;L`ym?(R4dY69<C5ti{YjnDLR<s>PRWYqQ9;4dR<9+*neLav1P#)xWRQQW2
zfZT9Y=K-7~K~2JXU2RJFAhz43hbv7Mx|cL;+NdmCIiLoaL4PD1GH2>y)>$)@mODD5
z1LsX8p)5Pxf27MK97nQ@D2F^I|MUkCq&Sb-9MiDM(U`w=!7Kfz-sEnV3S0Uz>q%%{
zrNC)XKa0baApCPlQt>e1lyT$P8VdoN6Z{7y_t#c2go+qFVLx9SS7yXuB1Fhn5|eB-
zgpk)_XW|QGQGdt}y0&4Px|~EUei^5L=GUvQQ)!KC`0+-oSX6MJ^mubdLO(|7XoY!S
z#2+_>K>ez%MIWRvd8Vg)LVJ#xIJC~n%Zw^t3t8T^bjc@|_ZyL;$lE4yq9XGj364Ua
zKKjoDzl<%5cjOksLU`mV<wJS(1jBQ=4~3Io=Dmf3X@6c&Dt8B<c;ty&c%*-T&=-;|
zMDY@hg8BFicDin`jnheuS(SHvet&gmKK$%l-}LVG-(PROKKwOejbnA>rM!BtZe(uz
zA63Wv6I>x)2BJp6D9Mi$GVZsz6If5Vkx9#_kQNRuZ0{h70sF&yTJmWi)uTm}<+;(-
zyFL4m`hWK3eaDk@&C+^z=#N06(kA~A=p2(FE)$Yv*uHKs(^H)EI=Ek}%TPKs^)M--
zb>8X#l9W$s9YEW_zMxfC?}dZ|Xd2ER?Oqx%Q2DRR@V-zKsT^H<m{gH1nbE2l&?$AP
z8o2CtNgJ-HHQhfkP;uLpA`?mVG^@iUP=l%g?SEZG-FS?vSXMN`JZ;i7rd(~*M;^u7
zXY9{b<JCB@&s7sSq5>k9+>xN@Adaw{bjTZ1ap{sdHjC`iIwHd)i9eI;V^MLA#^J{V
z_7oMfqU&|3js!6pJk@fcyJ1uXR%i&-0tYLRxe58D$+3xM$X0vkmjNLJoY)BPE*3aY
zK7Wg#T?+}%&Y*PUugjUS{<+02O~-HFT8X+5)jdSo9KSsV(xGu6LARh2C_x$<+`AQ>
zLMhVNaNDiu9h4&V4X)jS-a`p0R@*^H`d}sL?jELieY8}ewG**h$|pD}-p?gkx0`J9
z=?qSmV(Yk5&+%JeJ?hQjZe7RFy7bz=-GAavpv5USc)N9-TI$l8>*<#A4o(V`NxcV@
zq(9fwt?dJ#Hb_hV2&hYauBThmCqPX=1<%&2YfWi%N;!E8Ck3eBog4#70yOTE6F^-s
zhIC@<!4)?bcZ+xjAwq8DB|xp)llLHs<g09zVh$nc1Bj&Z!rTZ#k*%-R9(V1Q^M46e
z4wN%G1C|BokWSwMYlCr0r<VR(Ji5;xO{>8+3&T1+ftBNx_grG1Bs@b&V4q;8zzRv?
z<5wbDoD3staqob|rHmxKH$^FGdk?Iw+@|};F!m!FAjJ*z-6B6&i+ot6ww3hhM-Ua>
z=krT|y65y0jG8aEw;*!PVC0bG8GkeD4$Hf@Flv+!?(SA&=go`q1u|Or&d!k=Z06{e
zW9PNyx#oU~SVn>fbDguzyH(k_>-AyhmLlx@vRqK@*KYi>6w~W}ZRhv2rWG5$*PwJL
zO~pda8yXWD&cy-nna#OD5Sz`dK`@)mp+PVk&6ODwn@;=~6I#xs0P-4jY=0s7jeD?=
zB22of7W}3&9Wa!K&T_Ds3m^?cSe*4t1Q7Ru4c&BR0fzF>h7K}Q0K|XbjJ6rQg`+)m
zhJ%g90%|yH##@c9!qM7}q5>*0A1wtGVLU1dsKI{p(@Ko?D5o`>(P*YUtI?>XJ*~;;
zq&=(2D5No~@o1wtqxJ;4F@Kfa0H!f5$UvnryUBp0F`3Q4V+X0)RrYGP*vn9=H`i{$
z>fjy%-FrZD#d~jeSoGkv@3l2zD@ugFOvBO@^qP$kjoC%0wp2z1Uzs$ZdE-y%fME6V
zp?qg+6<7;d{Z3Xpg4~W3>#|*@UJAVnt4u$nep!$B8m(bl?N3s@fPcsIV~Q&u#Ahg0
z`syE`c9lXIQc<+_;pgfFO!;K-DzFx^-pS#O@l5%2P6l^FtbX!$2fq!mmv;aI97SBQ
z%5)<_bVYf_29%(C!ns==iuXhTi739>FAhCAcv;wDmmc>4u{q9)>mH{YO$R9+3R=84
z9V%;D1nG@y9#EL_aDRY}CX+)yO{=Q?GXb~TIf|p}yYw);>ci`f_>JulQiSpVyEeb(
z0gR?LwsrKJ_(HAOXseIfVKbNw2BlY@hy|r}XF!@K_?a5e)|qPJ<FsaZtv+gp&9y`5
zqIQ>y28Y9$=H%Y-F0z`{oyxWTzy?-_RgDU})*)X`6gakQ6@LlP7Eb0^<tC*(oQfIe
z;dD;%*@>agQT*0e*4xE+qR;3($Y08XcunLa{Pfn8SZ}<oh5Z<S-Aho6)#g0gWSjuV
zQ1y>35>BBcXgJFjDeu6ftebSTwlud8_8wH2oaxN%MQtfUo2U<9qBOmHi=K~QdemKh
zi<D2MQuI0@Er0B10PNO<>Fh0p3WKgui=1N!IUt65b^;;A)<(~a{jTyFw>IW?mdxJy
z#lzRzZ}(PJ-`RUx6}O-7ukQXl2axi?R?7Xu`NNf^2xIrD*Y9m%{{+Bp@3YPzRKQiS
zZAUh03Ig$3ZO1lhYO!@&ZHF}~$WWbNZX-UmBDQa=w|||%sGvZ9Fr!VvdmstcWwq_J
zMFT18Mn=9Af!j#>2q_85hkSw(1>{H0p!8V#l4BG1I$M$`tT#yeS8lb@9~;x}_AAXb
zoEU51ILk;fx1&Ebr{9!Tb9NJls=Ro%mDR+DYOkVgW$$vEW&?Yw1BlySWIBS>H@4bC
zV>dKoOMh<SLTx!U-J~X+!H9)9gGtZNg3WaF!Gcm_GS-&Ltz8)O3e6cDe~ZC<g9(Gd
z#DWQp=J<^Tg%>caw)f7QN~>3AOyJRMftj-pG3%b$v6yyyELjgw16uYIG}$!UgWBj%
z*x$?<yWucwTkf+koHERDk`=A0aubi2Zxxy|)PK>UY>U~}vg~8>&`flmi+bCq&$!&L
zv=-6!g<UfA_=}B86|2HdA6xRxt|I5jykXi;<}DG<zjX7L&oD`z$(*uH_356x%wwJ1
zT*l<}!60vrmYfrmsAu$6bmi=BB=x@3*c+><esT*|&-X>eMKT=we!EL|ErAa$A)wEl
zoqr(b?1+)|0TTm>h%rirr0?3E;Fh{?y}w&_PUbN>Si&1L9srzORgwQu=XdVz8h8)y
z@R~*N;YG+E%eFlXB4bO!VGBV`1>t@|S)A`E4~I*PgSo*b@<Td8gXT4WBdS`P(>lL%
zN7TUUp)fpfQrF1yt*Zwv{7pLYQIo3IGk>g*5v0dfu{ek`Y*I0ZBk+D;GGAmk9I9yU
z@gKge&@G0KN6Y}uYhOe_lMp8y53gicce<}<P;a&`=U}axE)hez)_pZ2ak28?hUG|-
z<RyOsszp5SIs_(v-QJWeUI#Ry3<kto;8#DRKAX?FhBa%5?NIqqi5&a+PhS87BY#3@
zjPfjI);Q&<pUZ^&T$cLmG3PUx6?O@iuLtr$tgHs*h535LK=^RP7v}OpJX_A^<)ShR
zZ5tf#fnj`^|0;5|v2~^>Y75NEjV)y~#VlLFAfn)@-M^YaVxDpQ6JBb88v@G>z=h_A
z6@sIN@Q66g7T~B6aQ;MS)wK%341W`&NAM4i5rZyD64FmmkxS6HqAV?O=Xu@6*eNvT
zECtW5B!Y)b;347tXtIp`yijo`&<PE@R`!_TK7&hzHc<zqR6>f@7c^=NpO)~YQ*>Y+
zF=IIFUkGc24_`ksN;7a!=+EZjNrdw<+I=RY8G44Hi&Z9%u#~F>0aAh_qJNtu3@fwk
z9958<GSNHtXRCE;ngQm@9#K#X*U1j1?5Uqe=>q+UgN(BMqY}$gVY!E2Mcf2MKBtk4
zX-iU^<;<4B_JVMCd~y}wfvECv94A}_!54<og^OIO!8^{MI+L@UsgqR4t%K8K)Gxw4
zl4$opcW91RaFR0U*04kmV1N7Q#6GUa5#uy<pxApRe#(}~{zg50^myH@G9Q?c5Z;|X
z!`TbQiMf+5abB$vR@Ml=ED;_o<D*oxa$bGWfkcrdl=@{T3SdIj-<A+^;2DJkb?<Ri
z0D8uO1p?uLt=S6*?{7{MpQA@?C&gp9JW1UGL(1^EaQwDnIEhJwn13xwiUT4%P_RIz
zqqKWC-u?H__ZN3xr`<Q`>Y~nQmeDxEkC_8lCZ``9;KE{t^d$iWTtp<npon=z$Z-Js
z;o!M00f7-|GIwO66*Rn=N^B>B-AK)7>O`%;g%|7y5f+j!km$)5-X9FqMK(FfA^{2u
zxJ*Ieo-G}8hDBFnvwzFfydAZ{@h)+ue1L?awkAxq?W#5eeVbD?uvNC)o5A&-)?^4<
zo-8g~j^NmU39Gt4+Z+<y&UE)ct3uxsh08$oz*LSs&_nD#6F?Q~0nL`8YXk0PT5vTF
zrm<xMHMlksD61>+AsyU4B(z#+uh9&ve2jx7jSG8m<)pqR<bRQ}SmkIUb4c~mfh;(B
zj{~y6woL6+YTKAwrQWPst7?)x6@vHq`umkl3$+e)dwmH6b@A8vHz261Z<iN9P+#t@
zuApSyoPW9c_HYh_c6SAp@<0Cg`T%7Re_dT)-~Ips3kgRvt8%x2;#MH#^sCvhZH_>r
z&<-J3p~MaWGk<2YdO$+VnblO3gdoWywL^&WtDTV@NJ2BqEM?d-NBJ@cFz0q4qDhwY
zoGhvUvLLppvBIMEebK;>?}`eKPk0vo7SdqyrifBL&cjaD@sH|YyD>H-TTvz{3Z8_q
zY(@1@G^dPYi<q~fR6(`@>v4Oqy%|qc@I|mzjvS+p=YN@SIh(0KRfKG3E0G!r9~p}A
z3uRBOM4J#h1XavN;PpXSt+<<$w6<Y4@j6jG(NMxHL-T(4b;uT;3aN)s4tV+@>PV@E
zu&tyOnksE^@x2y#9;07EiL5N7xO!YmN$s}si3+x|7J0$Bj*#^==aXJkWeMe_<vJ>A
zSENl;uz!2BP!#&hME<9sq6*x~U&HHWj?pjNPbovSapeg8B+52d3*1GiW@mXwB@0`J
z?BwjXsyvvgJ=Fqt(kj_d9jv+*Sx>~yb;=WEmL6%#C?h_d{f&dn=NPeIp`dF&Qmd#2
zd~HRl-nliZhB_sG-4su`5VgkDQK?qM8X~HdxPRt|Isz5SV?!+E;@KKkN26NdZKu*I
z%PKJX;?+w!qrp=-BG)Un3frcrhNeneyF*k*!1fIT6Get@QA%ywj%ICti&jQf^je#s
z9c)ToNrqGPLRHu<RwXYZ11foyGGG^Bzt^ZP!Br#d_6jvLRa&i5-x#f5jC!dqPHyhk
zv41&GdD41ga6gYu32wR`WTJ4paFdFiBQ9FWcaOr@=G;Y5p(@YMRc5Rmw>#;>RN~*d
zqe)f8-Vq=ZHT*_J#ZeAz)YbUZWcP@XR<PPB4BfER)~g1B8cH$r)x=coSLmUtZER@b
zs^K(#SI>A-;~>(`$WeajkoX#30Bot<dVf)1d@dhNE@`lgH@SHfEKoAX5#37I&BG$@
z#ro$_zOf~#id2MzWy%<vof|RTj6HspPb8J3%@%}Drnfhj)88f+70OYFA4!7WWDESJ
zRuS#vZk_LbnMV?scv3{F!_-{8I!qBsz;H58{FIR-AnDGK>E6pCbuRPAlj-L1(SMq)
z9(ki6k8@T2+648=1Iq<CWsULb0Sb_5z6Vxr(SI{T9EX!~3CvUmIcnWY(}>=<;b!t(
z?gtfOi+7Xz;@wd_vm4RYMliXNt<X2Oc`I~sU-aev=jQhQe~-3vq!Fc71Le0~h&aOa
z6lN_meTRGd-8!9%r-kJS+t1%sK!1%%vi+_Rs7i?pCw#Ytsh+Nr5l=2e4&^CXyf_k#
zGm?b(b=ywYPm6e8<)24YuoAu&Vlx82RjNf4p2=kZA%5P*FJGYQq^I)98yWP?QT_ck
z<xV`It$I>K69rl>aZ)IEUu(f-;mgzXNEE?_6iHWa)-OtvDrWbKv}u^w*ngVTkpAx|
zzbD0y$c!OIwgd0HDk9zH_o@^beZ78lB(D;9Citb_@2xMhS;si4eM8U3P4iaG_BYms
zST+&sBPeCDn#vl1=WES;7WuOJnX|o&Yz(l@(JICZ$re@Eqr51n<ZNCpsyr?1MmVS=
gzKmnUR!SH}(4&m4-jJ+6xeFfzEXj`k0}Z#ZEI_?r0{{R3

diff --git a/docs/html/other_libraries.html b/docs/html/other_libraries.html
index dbb4dfe6..7b0e01ed 100644
--- a/docs/html/other_libraries.html
+++ b/docs/html/other_libraries.html
@@ -5,10 +5,10 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Other POMDP Libraries &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Other POMDP Libraries &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -35,7 +35,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -56,10 +56,12 @@ <h3>Navigation</h3>
 <li class="toctree-l1"><a class="reference internal" href="examples.html">Examples</a></li>
 <li class="toctree-l1"><a class="reference internal" href="design_principles.html">Design Principles</a></li>
 <li class="toctree-l1"><a class="reference internal" href="existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="changelog.html">What's New?</a></li>
 </ul>
 <p class="caption" role="heading"><span class="caption-text">API References</span></p>
 <ul>
 <li class="toctree-l1"><a class="reference internal" href="api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1"><a class="reference internal" href="problems/modules.html">problems</a></li>
 </ul>
 
 
diff --git a/docs/html/problems/modules.html b/docs/html/problems/modules.html
new file mode 100644
index 00000000..63d3079a
--- /dev/null
+++ b/docs/html/problems/modules.html
@@ -0,0 +1,217 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems package" href="problems.html" />
+    <link rel="prev" title="pomdp_py.utils.interfaces package" href="../api/pomdp_py.utils.interfaces.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+<h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="current reference internal" href="#">problems</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.html">problems package</a></li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+      <li>Previous: <a href="../api/pomdp_py.utils.interfaces.html" title="previous chapter">pomdp_py.utils.interfaces package</a></li>
+      <li>Next: <a href="problems.html" title="next chapter">problems package</a></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems">
+<h1>problems<a class="headerlink" href="#problems" title="Link to this heading">¶</a></h1>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.html">problems package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.lasertag.html">problems.lasertag package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.lasertag.html#module-problems.lasertag">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.light_dark.html">problems.light_dark package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.html#problems-light-dark-problem-discrete-module">problems.light_dark.problem_discrete module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.html#problems-light-dark-test-module">problems.light_dark.test module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html">problems.load_unload package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#module-problems.load_unload.load_unload">problems.load_unload.load_unload module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#module-problems.load_unload">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.html">problems.maze package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.html#module-problems.maze">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.html#module-problems.multi_object_search.example_worlds">problems.multi_object_search.example_worlds module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.html#module-problems.multi_object_search.problem">problems.multi_object_search.problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.html#module-problems.multi_object_search">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html">problems.rocksample package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#module-problems.rocksample.rocksample_problem">problems.rocksample.rocksample_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#module-problems.rocksample">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.html">problems.tag package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#module-problems.tag.constants">problems.tag.constants module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#module-problems.tag.example_worlds">problems.tag.example_worlds module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#module-problems.tag.experiment">problems.tag.experiment module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#module-problems.tag.problem">problems.tag.problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.html#module-problems.tag">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html">problems.tiger package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#module-problems.tiger.tiger_problem">problems.tiger.tiger_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#module-problems.tiger">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/modules.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.html b/docs/html/problems/problems.html
new file mode 100644
index 00000000..b7bd6b8b
--- /dev/null
+++ b/docs/html/problems/problems.html
@@ -0,0 +1,526 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.lasertag package" href="problems.lasertag.html" />
+    <link rel="prev" title="problems" href="modules.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="current reference internal" href="#">problems package</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+      <li>Previous: <a href="modules.html" title="previous chapter">problems</a></li>
+      <li>Next: <a href="problems.lasertag.html" title="next chapter">problems.lasertag package</a></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-package">
+<h1>problems package<a class="headerlink" href="#problems-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.lasertag.html">problems.lasertag package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.lasertag.html#module-problems.lasertag">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.light_dark.html">problems.light_dark package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.light_dark.agent.html">problems.light_dark.agent package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.agent.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.agent.html#problems-light-dark-agent-belief-module">problems.light_dark.agent.belief module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.agent.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.light_dark.domain.html">problems.light_dark.domain package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.domain.html#problems-light-dark-domain-action-module">problems.light_dark.domain.action module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.domain.html#problems-light-dark-domain-observation-module">problems.light_dark.domain.observation module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.domain.html#problems-light-dark-domain-state-module">problems.light_dark.domain.state module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.domain.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.light_dark.env.html">problems.light_dark.env package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.env.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.env.html#problems-light-dark-env-env-module">problems.light_dark.env.env module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.env.html#problems-light-dark-env-plotting-module">problems.light_dark.env.plotting module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.env.html#problems-light-dark-env-visual-module">problems.light_dark.env.visual module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.env.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.light_dark.models.html">problems.light_dark.models package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.models.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.models.html#problems-light-dark-models-observation-model-module">problems.light_dark.models.observation_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.models.html#problems-light-dark-models-transition-model-module">problems.light_dark.models.transition_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.light_dark.models.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.html#problems-light-dark-problem-discrete-module">problems.light_dark.problem_discrete module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.html#problems-light-dark-test-module">problems.light_dark.test module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.load_unload.html">problems.load_unload package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.load_unload.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.load_unload.html#module-problems.load_unload.load_unload">problems.load_unload.load_unload module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUState"><code class="docutils literal notranslate"><span class="pre">LUState</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUAction"><code class="docutils literal notranslate"><span class="pre">LUAction</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUObservation"><code class="docutils literal notranslate"><span class="pre">LUObservation</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel"><code class="docutils literal notranslate"><span class="pre">LUObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LURewardModel"><code class="docutils literal notranslate"><span class="pre">LURewardModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LURewardModel.probability"><code class="docutils literal notranslate"><span class="pre">LURewardModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LURewardModel.sample"><code class="docutils literal notranslate"><span class="pre">LURewardModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LURewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">LURewardModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.argmax()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LUPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.get_all_actions()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.LoadUnloadProblem"><code class="docutils literal notranslate"><span class="pre">LoadUnloadProblem</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.generate_random_state"><code class="docutils literal notranslate"><span class="pre">generate_random_state()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.generate_init_belief"><code class="docutils literal notranslate"><span class="pre">generate_init_belief()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.load_unload.html#problems.load_unload.load_unload.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.load_unload.html#module-problems.load_unload">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.maze.html">problems.maze package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.domain.html">problems.maze.domain package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain.action">problems.maze.domain.action module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain.observation">problems.maze.domain.observation module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain.state">problems.maze.domain.state module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.env.html">problems.maze.env package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.env.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.env.html#module-problems.maze.env.env">problems.maze.env.env module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.env.html#module-problems.maze.env">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.models.html">problems.maze.models package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.models.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.models.html#module-problems.maze.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.html#module-problems.maze">Module contents</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.html#maze">Maze</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.agent.html">problems.multi_object_search.agent package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#module-problems.multi_object_search.agent.agent">problems.multi_object_search.agent.agent module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#module-problems.multi_object_search.agent.belief">problems.multi_object_search.agent.belief module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#module-problems.multi_object_search.agent">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html">problems.multi_object_search.domain package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain.action">problems.multi_object_search.domain.action module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain.observation">problems.multi_object_search.domain.observation module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain.state">problems.multi_object_search.domain.state module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html">problems.multi_object_search.env package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#module-problems.multi_object_search.env.env">problems.multi_object_search.env.env module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#module-problems.multi_object_search.env.visual">problems.multi_object_search.env.visual module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#module-problems.multi_object_search.env">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html">problems.multi_object_search.models package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.observation_model">problems.multi_object_search.models.observation_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.policy_model">problems.multi_object_search.models.policy_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.reward_model">problems.multi_object_search.models.reward_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.transition_model">problems.multi_object_search.models.transition_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.html#module-problems.multi_object_search.example_worlds">problems.multi_object_search.example_worlds module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.html#problems.multi_object_search.example_worlds.random_world"><code class="docutils literal notranslate"><span class="pre">random_world()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.html#module-problems.multi_object_search.problem">problems.multi_object_search.problem module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.html#problems.multi_object_search.problem.MosOOPOMDP"><code class="docutils literal notranslate"><span class="pre">MosOOPOMDP</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.html#problems.multi_object_search.problem.belief_update"><code class="docutils literal notranslate"><span class="pre">belief_update()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.html#problems.multi_object_search.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.html#problems.multi_object_search.problem.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.html#module-problems.multi_object_search">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.rocksample.html">problems.rocksample package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.cythonize.html">problems.rocksample.cythonize package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.cythonize.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.cythonize.html#module-problems.rocksample.cythonize.rocksample_problem">problems.rocksample.cythonize.rocksample_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.cythonize.html#id1">problems.rocksample.cythonize.rocksample_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.cythonize.html#problems-rocksample-cythonize-run-rocksample-module">problems.rocksample.cythonize.run_rocksample module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.cythonize.html#module-problems.rocksample.cythonize">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.html#module-problems.rocksample.rocksample_problem">problems.rocksample.rocksample_problem module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.euclidean_dist"><code class="docutils literal notranslate"><span class="pre">euclidean_dist()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockType"><code class="docutils literal notranslate"><span class="pre">RockType</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockType.GOOD"><code class="docutils literal notranslate"><span class="pre">RockType.GOOD</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockType.BAD"><code class="docutils literal notranslate"><span class="pre">RockType.BAD</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockType.invert"><code class="docutils literal notranslate"><span class="pre">RockType.invert()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockType.random"><code class="docutils literal notranslate"><span class="pre">RockType.random()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.State"><code class="docutils literal notranslate"><span class="pre">State</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.Action"><code class="docutils literal notranslate"><span class="pre">Action</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.MoveAction"><code class="docutils literal notranslate"><span class="pre">MoveAction</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.MoveAction.EAST"><code class="docutils literal notranslate"><span class="pre">MoveAction.EAST</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.MoveAction.WEST"><code class="docutils literal notranslate"><span class="pre">MoveAction.WEST</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.MoveAction.NORTH"><code class="docutils literal notranslate"><span class="pre">MoveAction.NORTH</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.MoveAction.SOUTH"><code class="docutils literal notranslate"><span class="pre">MoveAction.SOUTH</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.SampleAction"><code class="docutils literal notranslate"><span class="pre">SampleAction</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.CheckAction"><code class="docutils literal notranslate"><span class="pre">CheckAction</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.Observation"><code class="docutils literal notranslate"><span class="pre">Observation</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel"><code class="docutils literal notranslate"><span class="pre">RSObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">RSObservationModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">RSObservationModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel"><code class="docutils literal notranslate"><span class="pre">RSRewardModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel.sample"><code class="docutils literal notranslate"><span class="pre">RSRewardModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSRewardModel.argmax()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSRewardModel.probability"><code class="docutils literal notranslate"><span class="pre">RSRewardModel.probability()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.argmax()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.get_all_actions()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RSPolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.rollout()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.random_free_location()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.in_exit_area()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.generate_instance()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.RockSampleProblem.print_state"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.print_state()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.init_particles_belief"><code class="docutils literal notranslate"><span class="pre">init_particles_belief()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.minimal_instance"><code class="docutils literal notranslate"><span class="pre">minimal_instance()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.create_instance"><code class="docutils literal notranslate"><span class="pre">create_instance()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.rocksample.html#problems.rocksample.rocksample_problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.html#module-problems.rocksample">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.tag.html">problems.tag package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.agent.html">problems.tag.agent package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.agent.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.agent.html#module-problems.tag.agent.agent">problems.tag.agent.agent module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.agent.html#module-problems.tag.agent">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.domain.html">problems.tag.domain package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain.action">problems.tag.domain.action module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain.observation">problems.tag.domain.observation module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain.state">problems.tag.domain.state module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.env.html">problems.tag.env package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#module-problems.tag.env.env">problems.tag.env.env module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#module-problems.tag.env.visual">problems.tag.env.visual module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#module-problems.tag.env">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.html">problems.tag.models package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#subpackages">Subpackages</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.observation_model">problems.tag.models.observation_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.policy_model">problems.tag.models.policy_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.reward_model">problems.tag.models.reward_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.transition_model">problems.tag.models.transition_model module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#module-problems.tag.constants">problems.tag.constants module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#module-problems.tag.example_worlds">problems.tag.example_worlds module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#module-problems.tag.experiment">problems.tag.experiment module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.html#problems.tag.experiment.trial"><code class="docutils literal notranslate"><span class="pre">trial()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.html#problems.tag.experiment.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#module-problems.tag.problem">problems.tag.problem module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.html#problems.tag.problem.TagProblem"><code class="docutils literal notranslate"><span class="pre">TagProblem</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.html#problems.tag.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.html#problems.tag.problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.html#module-problems.tag">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.tiger.html">problems.tiger package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.cythonize.html">problems.tiger.cythonize package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.cythonize.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.cythonize.html#problems-tiger-cythonize-run-tiger-module">problems.tiger.cythonize.run_tiger module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.cythonize.html#module-problems.tiger.cythonize.tiger_problem">problems.tiger.cythonize.tiger_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.cythonize.html#id1">problems.tiger.cythonize.tiger_problem module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.cythonize.html#module-problems.tiger.cythonize">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.html#module-problems.tiger.tiger_problem">problems.tiger.tiger_problem module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TigerState"><code class="docutils literal notranslate"><span class="pre">TigerState</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TigerState.other"><code class="docutils literal notranslate"><span class="pre">TigerState.other()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TigerAction"><code class="docutils literal notranslate"><span class="pre">TigerAction</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TigerObservation"><code class="docutils literal notranslate"><span class="pre">TigerObservation</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.ObservationModel"><code class="docutils literal notranslate"><span class="pre">ObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.ObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">ObservationModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.ObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">ObservationModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.ObservationModel.get_all_observations"><code class="docutils literal notranslate"><span class="pre">ObservationModel.get_all_observations()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TransitionModel"><code class="docutils literal notranslate"><span class="pre">TransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">TransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">TransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TransitionModel.get_all_states"><code class="docutils literal notranslate"><span class="pre">TransitionModel.get_all_states()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.RewardModel"><code class="docutils literal notranslate"><span class="pre">RewardModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.RewardModel.sample"><code class="docutils literal notranslate"><span class="pre">RewardModel.sample()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.PolicyModel"><code class="docutils literal notranslate"><span class="pre">PolicyModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.ACTIONS"><code class="docutils literal notranslate"><span class="pre">PolicyModel.ACTIONS</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">PolicyModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">PolicyModel.rollout()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.PolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">PolicyModel.get_all_actions()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TigerProblem"><code class="docutils literal notranslate"><span class="pre">TigerProblem</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.TigerProblem.create"><code class="docutils literal notranslate"><span class="pre">TigerProblem.create()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.make_tiger"><code class="docutils literal notranslate"><span class="pre">make_tiger()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tiger.html#problems.tiger.tiger_problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.html#module-problems.tiger">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="module-problems">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.lasertag.html b/docs/html/problems/problems.lasertag.html
new file mode 100644
index 00000000..7091c4b7
--- /dev/null
+++ b/docs/html/problems/problems.lasertag.html
@@ -0,0 +1,172 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.lasertag package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.light_dark package" href="problems.light_dark.html" />
+    <link rel="prev" title="problems package" href="problems.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.lasertag package</a><ul>
+<li><a class="reference internal" href="#module-problems.lasertag">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.html" title="previous chapter">problems package</a></li>
+      <li>Next: <a href="problems.light_dark.html" title="next chapter">problems.light_dark package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-lasertag-package">
+<h1>problems.lasertag package<a class="headerlink" href="#problems-lasertag-package" title="Link to this heading">¶</a></h1>
+<section id="module-problems.lasertag">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.lasertag" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.lasertag.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.light_dark.agent.html b/docs/html/problems/problems.light_dark.agent.html
new file mode 100644
index 00000000..b7177cd4
--- /dev/null
+++ b/docs/html/problems/problems.light_dark.agent.html
@@ -0,0 +1,182 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.light_dark.agent package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.light_dark.domain package" href="problems.light_dark.domain.html" />
+    <link rel="prev" title="problems.light_dark package" href="problems.light_dark.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.light_dark.agent package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-light-dark-agent-belief-module">problems.light_dark.agent.belief module</a></li>
+<li><a class="reference internal" href="#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.light_dark.html">problems.light_dark package</a><ul>
+      <li>Previous: <a href="problems.light_dark.html" title="previous chapter">problems.light_dark package</a></li>
+      <li>Next: <a href="problems.light_dark.domain.html" title="next chapter">problems.light_dark.domain package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-light-dark-agent-package">
+<h1>problems.light_dark.agent package<a class="headerlink" href="#problems-light-dark-agent-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-agent-belief-module">
+<h2>problems.light_dark.agent.belief module<a class="headerlink" href="#problems-light-dark-agent-belief-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-contents">
+<h2>Module contents<a class="headerlink" href="#module-contents" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.light_dark.agent.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.light_dark.domain.html b/docs/html/problems/problems.light_dark.domain.html
new file mode 100644
index 00000000..d73c5ae5
--- /dev/null
+++ b/docs/html/problems/problems.light_dark.domain.html
@@ -0,0 +1,190 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.light_dark.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.light_dark.env package" href="problems.light_dark.env.html" />
+    <link rel="prev" title="problems.light_dark.agent package" href="problems.light_dark.agent.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.light_dark.domain package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-light-dark-domain-action-module">problems.light_dark.domain.action module</a></li>
+<li><a class="reference internal" href="#problems-light-dark-domain-observation-module">problems.light_dark.domain.observation module</a></li>
+<li><a class="reference internal" href="#problems-light-dark-domain-state-module">problems.light_dark.domain.state module</a></li>
+<li><a class="reference internal" href="#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.light_dark.html">problems.light_dark package</a><ul>
+      <li>Previous: <a href="problems.light_dark.agent.html" title="previous chapter">problems.light_dark.agent package</a></li>
+      <li>Next: <a href="problems.light_dark.env.html" title="next chapter">problems.light_dark.env package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-light-dark-domain-package">
+<h1>problems.light_dark.domain package<a class="headerlink" href="#problems-light-dark-domain-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-domain-action-module">
+<h2>problems.light_dark.domain.action module<a class="headerlink" href="#problems-light-dark-domain-action-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-domain-observation-module">
+<h2>problems.light_dark.domain.observation module<a class="headerlink" href="#problems-light-dark-domain-observation-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-domain-state-module">
+<h2>problems.light_dark.domain.state module<a class="headerlink" href="#problems-light-dark-domain-state-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-contents">
+<h2>Module contents<a class="headerlink" href="#module-contents" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.light_dark.domain.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.light_dark.env.html b/docs/html/problems/problems.light_dark.env.html
new file mode 100644
index 00000000..0e9ec74c
--- /dev/null
+++ b/docs/html/problems/problems.light_dark.env.html
@@ -0,0 +1,190 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.light_dark.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.light_dark.models package" href="problems.light_dark.models.html" />
+    <link rel="prev" title="problems.light_dark.domain package" href="problems.light_dark.domain.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.light_dark.env package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-light-dark-env-env-module">problems.light_dark.env.env module</a></li>
+<li><a class="reference internal" href="#problems-light-dark-env-plotting-module">problems.light_dark.env.plotting module</a></li>
+<li><a class="reference internal" href="#problems-light-dark-env-visual-module">problems.light_dark.env.visual module</a></li>
+<li><a class="reference internal" href="#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.light_dark.html">problems.light_dark package</a><ul>
+      <li>Previous: <a href="problems.light_dark.domain.html" title="previous chapter">problems.light_dark.domain package</a></li>
+      <li>Next: <a href="problems.light_dark.models.html" title="next chapter">problems.light_dark.models package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-light-dark-env-package">
+<h1>problems.light_dark.env package<a class="headerlink" href="#problems-light-dark-env-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-env-env-module">
+<h2>problems.light_dark.env.env module<a class="headerlink" href="#problems-light-dark-env-env-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-env-plotting-module">
+<h2>problems.light_dark.env.plotting module<a class="headerlink" href="#problems-light-dark-env-plotting-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-env-visual-module">
+<h2>problems.light_dark.env.visual module<a class="headerlink" href="#problems-light-dark-env-visual-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-contents">
+<h2>Module contents<a class="headerlink" href="#module-contents" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.light_dark.env.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.light_dark.html b/docs/html/problems/problems.light_dark.html
new file mode 100644
index 00000000..c89e2ec7
--- /dev/null
+++ b/docs/html/problems/problems.light_dark.html
@@ -0,0 +1,221 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.light_dark package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.light_dark.agent package" href="problems.light_dark.agent.html" />
+    <link rel="prev" title="problems.lasertag package" href="problems.lasertag.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.light_dark package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-light-dark-problem-discrete-module">problems.light_dark.problem_discrete module</a></li>
+<li><a class="reference internal" href="#problems-light-dark-test-module">problems.light_dark.test module</a></li>
+<li><a class="reference internal" href="#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.lasertag.html" title="previous chapter">problems.lasertag package</a></li>
+      <li>Next: <a href="problems.light_dark.agent.html" title="next chapter">problems.light_dark.agent package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-light-dark-package">
+<h1>problems.light_dark package<a class="headerlink" href="#problems-light-dark-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.light_dark.agent.html">problems.light_dark.agent package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.agent.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.agent.html#problems-light-dark-agent-belief-module">problems.light_dark.agent.belief module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.agent.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.light_dark.domain.html">problems.light_dark.domain package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.domain.html#problems-light-dark-domain-action-module">problems.light_dark.domain.action module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.domain.html#problems-light-dark-domain-observation-module">problems.light_dark.domain.observation module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.domain.html#problems-light-dark-domain-state-module">problems.light_dark.domain.state module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.domain.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.light_dark.env.html">problems.light_dark.env package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.env.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.env.html#problems-light-dark-env-env-module">problems.light_dark.env.env module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.env.html#problems-light-dark-env-plotting-module">problems.light_dark.env.plotting module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.env.html#problems-light-dark-env-visual-module">problems.light_dark.env.visual module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.env.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.light_dark.models.html">problems.light_dark.models package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.models.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.models.html#problems-light-dark-models-observation-model-module">problems.light_dark.models.observation_model module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.models.html#problems-light-dark-models-transition-model-module">problems.light_dark.models.transition_model module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.light_dark.models.html#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-problem-discrete-module">
+<h2>problems.light_dark.problem_discrete module<a class="headerlink" href="#problems-light-dark-problem-discrete-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-test-module">
+<h2>problems.light_dark.test module<a class="headerlink" href="#problems-light-dark-test-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-contents">
+<h2>Module contents<a class="headerlink" href="#module-contents" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.light_dark.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.light_dark.models.html b/docs/html/problems/problems.light_dark.models.html
new file mode 100644
index 00000000..cd2a1694
--- /dev/null
+++ b/docs/html/problems/problems.light_dark.models.html
@@ -0,0 +1,186 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.light_dark.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.load_unload package" href="problems.load_unload.html" />
+    <link rel="prev" title="problems.light_dark.env package" href="problems.light_dark.env.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.light_dark.models package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-light-dark-models-observation-model-module">problems.light_dark.models.observation_model module</a></li>
+<li><a class="reference internal" href="#problems-light-dark-models-transition-model-module">problems.light_dark.models.transition_model module</a></li>
+<li><a class="reference internal" href="#module-contents">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.light_dark.html">problems.light_dark package</a><ul>
+      <li>Previous: <a href="problems.light_dark.env.html" title="previous chapter">problems.light_dark.env package</a></li>
+      <li>Next: <a href="problems.load_unload.html" title="next chapter">problems.load_unload package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-light-dark-models-package">
+<h1>problems.light_dark.models package<a class="headerlink" href="#problems-light-dark-models-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-models-observation-model-module">
+<h2>problems.light_dark.models.observation_model module<a class="headerlink" href="#problems-light-dark-models-observation-model-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-light-dark-models-transition-model-module">
+<h2>problems.light_dark.models.transition_model module<a class="headerlink" href="#problems-light-dark-models-transition-model-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-contents">
+<h2>Module contents<a class="headerlink" href="#module-contents" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.light_dark.models.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.load_unload.html b/docs/html/problems/problems.load_unload.html
new file mode 100644
index 00000000..d1c1f117
--- /dev/null
+++ b/docs/html/problems/problems.load_unload.html
@@ -0,0 +1,500 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.load_unload package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.maze package" href="problems.maze.html" />
+    <link rel="prev" title="problems.light_dark.models package" href="problems.light_dark.models.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.load_unload package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.load_unload.load_unload">problems.load_unload.load_unload module</a><ul>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUState"><code class="docutils literal notranslate"><span class="pre">LUState</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUAction"><code class="docutils literal notranslate"><span class="pre">LUAction</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUObservation"><code class="docutils literal notranslate"><span class="pre">LUObservation</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUObservationModel"><code class="docutils literal notranslate"><span class="pre">LUObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUTransitionModel"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LURewardModel"><code class="docutils literal notranslate"><span class="pre">LURewardModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LURewardModel.probability"><code class="docutils literal notranslate"><span class="pre">LURewardModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LURewardModel.sample"><code class="docutils literal notranslate"><span class="pre">LURewardModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LURewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">LURewardModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUPolicyModel"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUPolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUPolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.argmax()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LUPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">LUPolicyModel.get_all_actions()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.LoadUnloadProblem"><code class="docutils literal notranslate"><span class="pre">LoadUnloadProblem</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.generate_random_state"><code class="docutils literal notranslate"><span class="pre">generate_random_state()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.generate_init_belief"><code class="docutils literal notranslate"><span class="pre">generate_init_belief()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li><a class="reference internal" href="#problems.load_unload.load_unload.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.load_unload">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.light_dark.models.html" title="previous chapter">problems.light_dark.models package</a></li>
+      <li>Next: <a href="problems.maze.html" title="next chapter">problems.maze package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-load-unload-package">
+<h1>problems.load_unload package<a class="headerlink" href="#problems-load-unload-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.load_unload.load_unload">
+<span id="problems-load-unload-load-unload-module"></span><h2>problems.load_unload.load_unload module<a class="headerlink" href="#module-problems.load_unload.load_unload" title="Link to this heading">¶</a></h2>
+<p>The load unload problem. An agent is placed on a one dimensional grid world
+and is tasked with loading itself up on the right side of the world and
+unloading on the left. The agent can observe whether or not it is in the load or
+unload block but can not tell its exact location of whether it is loaded or
+unloaded. Therefore the agent must maintain belief about it’s location and load
+status.</p>
+<p>States are defined by the location of the agent and whether or not it is loaded
+Actions: “move-left”, “move-right”
+Rewards:</p>
+<blockquote>
+<div><p>+100 for moving into the unload block while loaded
+-1 otherwise</p>
+</div></blockquote>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">loaded</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><code class="xref py py-class docutils literal notranslate"><span class="pre">State</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUAction</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUObservation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUObservation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">obs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUObservation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUObservation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUObservationModel</span></span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel" title="pomdp_py.framework.basics.ObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObservationModel</span></code></a></p>
+<p>This problem is small enough for the probabilities to be directly given
+externally</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUObservationModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUObservationModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUObservationModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><em>Observation</em></a>) – the observation <span class="math notranslate nohighlight">\(o\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns observation randomly sampled according to the
+distribution of this observation model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the observation <span class="math notranslate nohighlight">\(o\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation">Observation</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUObservationModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUObservationModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUObservationModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely observation</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUTransitionModel</span></span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<p>This problem is small enough for the probabilities to be directly given
+externally</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUTransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUTransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUTransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next state randomly sampled according to the
+distribution of this transition model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the next state <span class="math notranslate nohighlight">\(s'\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State">State</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LURewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LURewardModel</span></span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LURewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LURewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LURewardModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LURewardModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LURewardModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>reward</strong> (<em>float</em>) – the reward <span class="math notranslate nohighlight">\(r\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LURewardModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LURewardModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LURewardModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns reward randomly sampled according to the
+distribution of this reward model. This is required,
+i.e. assumed to be implemented for a reward model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the reward <span class="math notranslate nohighlight">\(r\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LURewardModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LURewardModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LURewardModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUPolicyModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LUPolicyModel</span></span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUPolicyModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUPolicyModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RandomRollout" title="pomdp_py.algorithms.po_uct.RandomRollout"><code class="xref py py-class docutils literal notranslate"><span class="pre">RandomRollout</span></code></a></p>
+<p>This is an extremely dumb policy model; To keep consistent
+with the framework.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUPolicyModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUPolicyModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUPolicyModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\pi(a|s)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\pi(a|s)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUPolicyModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUPolicyModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUPolicyModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns action randomly sampled according to the
+distribution of this policy model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the action <span class="math notranslate nohighlight">\(a\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action">Action</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUPolicyModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUPolicyModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUPolicyModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LUPolicyModel.get_all_actions">
+<span class="sig-name descname"><span class="pre">get_all_actions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LUPolicyModel.get_all_actions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LUPolicyModel.get_all_actions" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a set of all possible actions, if feasible.</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.LoadUnloadProblem">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">LoadUnloadProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#LoadUnloadProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.LoadUnloadProblem" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.generate_random_state">
+<span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">generate_random_state</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#generate_random_state"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.generate_random_state" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.generate_init_belief">
+<span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">generate_init_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">num_particles</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#generate_init_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.generate_init_belief" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.test_planner">
+<span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">test_planner</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">load_unload_problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">nsteps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.95</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#test_planner"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.test_planner" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.load_unload.load_unload.main">
+<span class="sig-prename descclassname"><span class="pre">problems.load_unload.load_unload.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/load_unload/load_unload.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.load_unload.load_unload.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.load_unload">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.load_unload" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.load_unload.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.maze.domain.html b/docs/html/problems/problems.maze.domain.html
new file mode 100644
index 00000000..406f3b20
--- /dev/null
+++ b/docs/html/problems/problems.maze.domain.html
@@ -0,0 +1,211 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.maze.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.maze.env package" href="problems.maze.env.html" />
+    <link rel="prev" title="problems.maze package" href="problems.maze.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.maze.domain package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.maze.domain.action">problems.maze.domain.action module</a></li>
+<li><a class="reference internal" href="#module-problems.maze.domain.observation">problems.maze.domain.observation module</a><ul>
+<li><a class="reference internal" href="#problems.maze.domain.observation.Observation"><code class="docutils literal notranslate"><span class="pre">Observation</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.maze.domain.state">problems.maze.domain.state module</a><ul>
+<li><a class="reference internal" href="#problems.maze.domain.state.State"><code class="docutils literal notranslate"><span class="pre">State</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.maze.domain">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.maze.html">problems.maze package</a><ul>
+      <li>Previous: <a href="problems.maze.html" title="previous chapter">problems.maze package</a></li>
+      <li>Next: <a href="problems.maze.env.html" title="next chapter">problems.maze.env package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-maze-domain-package">
+<h1>problems.maze.domain package<a class="headerlink" href="#problems-maze-domain-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.maze.domain.action">
+<span id="problems-maze-domain-action-module"></span><h2>problems.maze.domain.action module<a class="headerlink" href="#module-problems.maze.domain.action" title="Link to this heading">¶</a></h2>
+<p>The agent can take motion action and a look action.</p>
+</section>
+<section id="module-problems.maze.domain.observation">
+<span id="problems-maze-domain-observation-module"></span><h2>problems.maze.domain.observation module<a class="headerlink" href="#module-problems.maze.domain.observation" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.maze.domain.observation.Observation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.maze.domain.observation.</span></span><span class="sig-name descname"><span class="pre">Observation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">walls</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">orientation</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/maze/domain/observation.html#Observation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.maze.domain.observation.Observation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+</dd></dl>
+
+</section>
+<section id="module-problems.maze.domain.state">
+<span id="problems-maze-domain-state-module"></span><h2>problems.maze.domain.state module<a class="headerlink" href="#module-problems.maze.domain.state" title="Link to this heading">¶</a></h2>
+<p>Defines the State for the maze domain, which is the position of the robot and its orientation.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.maze.domain.state.State">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.maze.domain.state.</span></span><span class="sig-name descname"><span class="pre">State</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">positition</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">orientation</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/maze/domain/state.html#State"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.maze.domain.state.State" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><code class="xref py py-class docutils literal notranslate"><span class="pre">State</span></code></a></p>
+<p>The state of the problem is just the robot position</p>
+</dd></dl>
+
+</section>
+<section id="module-problems.maze.domain">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.maze.domain" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.maze.domain.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.maze.env.html b/docs/html/problems/problems.maze.env.html
new file mode 100644
index 00000000..4e7db673
--- /dev/null
+++ b/docs/html/problems/problems.maze.env.html
@@ -0,0 +1,191 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.maze.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.maze.models package" href="problems.maze.models.html" />
+    <link rel="prev" title="problems.maze.domain package" href="problems.maze.domain.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.maze.env package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.maze.env.env">problems.maze.env.env module</a><ul>
+<li><a class="reference internal" href="#problems.maze.env.env.MazeEnvironment"><code class="docutils literal notranslate"><span class="pre">MazeEnvironment</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.maze.env">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.maze.html">problems.maze package</a><ul>
+      <li>Previous: <a href="problems.maze.domain.html" title="previous chapter">problems.maze.domain package</a></li>
+      <li>Next: <a href="problems.maze.models.html" title="next chapter">problems.maze.models package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-maze-env-package">
+<h1>problems.maze.env package<a class="headerlink" href="#problems-maze-env-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.maze.env.env">
+<span id="problems-maze-env-env-module"></span><h2>problems.maze.env.env module<a class="headerlink" href="#module-problems.maze.env.env" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.maze.env.env.MazeEnvironment">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.maze.env.env.</span></span><span class="sig-name descname"><span class="pre">MazeEnvironment</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/maze/env/env.html#MazeEnvironment"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.maze.env.env.MazeEnvironment" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Environment" title="pomdp_py.framework.basics.Environment"><code class="xref py py-class docutils literal notranslate"><span class="pre">Environment</span></code></a></p>
+</dd></dl>
+
+</section>
+<section id="module-problems.maze.env">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.maze.env" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.maze.env.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.maze.html b/docs/html/problems/problems.maze.html
new file mode 100644
index 00000000..272d9975
--- /dev/null
+++ b/docs/html/problems/problems.maze.html
@@ -0,0 +1,234 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.maze package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.maze.domain package" href="problems.maze.domain.html" />
+    <link rel="prev" title="problems.load_unload package" href="problems.load_unload.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.maze package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#module-problems.maze">Module contents</a><ul>
+<li><a class="reference internal" href="#maze">Maze</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.load_unload.html" title="previous chapter">problems.load_unload package</a></li>
+      <li>Next: <a href="problems.maze.domain.html" title="next chapter">problems.maze.domain package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-maze-package">
+<h1>problems.maze package<a class="headerlink" href="#problems-maze-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.maze.domain.html">problems.maze.domain package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain.action">problems.maze.domain.action module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain.observation">problems.maze.domain.observation module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.domain.html#problems.maze.domain.observation.Observation"><code class="docutils literal notranslate"><span class="pre">Observation</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain.state">problems.maze.domain.state module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.domain.html#problems.maze.domain.state.State"><code class="docutils literal notranslate"><span class="pre">State</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.domain.html#module-problems.maze.domain">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.maze.env.html">problems.maze.env package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.env.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.env.html#module-problems.maze.env.env">problems.maze.env.env module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.env.html#problems.maze.env.env.MazeEnvironment"><code class="docutils literal notranslate"><span class="pre">MazeEnvironment</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.env.html#module-problems.maze.env">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.maze.models.html">problems.maze.models package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.models.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.maze.models.components.html">problems.maze.models.components package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.models.components.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.models.components.html#problems-maze-models-components-map-module">problems.maze.models.components.map module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.maze.models.components.html#module-problems.maze.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.models.html#module-problems.maze.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="module-problems.maze">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.maze" title="Link to this heading">¶</a></h2>
+<section id="maze">
+<h3>Maze<a class="headerlink" href="#maze" title="Link to this heading">¶</a></h3>
+<p>Problem originally introduced in <a class="reference external" href="https://arxiv.org/pdf/1301.6720.pdf">Solving POMDPs by Searching the Space of Finite Policies</a></p>
+<p><cite>Quoting from the original paper on problem description</cite>:</p>
+<blockquote>
+<div><p>A partially observable stochastic maze: the agent must go from the starting state marked with an “S” to the goal marked with an “G”. The problem  is partially observable because the agent cannot perceive its true location, but only its orientation and the presence or the absence of a wall on each side of the square defining its current state.  The problem is stochastic because there is a non-zero probability of slipping, so that the agent does not always know if its last attempt to make a move had any consequence on its actual position in the maze.</p>
+</div></blockquote>
+<figure class="align-default" id="id1">
+<img alt="Figure from the paper" src="https://i.imgur.com/i1RDsrL.png" />
+<figcaption>
+<p><span class="caption-text">Maze POMDP</span><a class="headerlink" href="#id1" title="Link to this image">¶</a></p>
+</figcaption>
+</figure>
+<p><strong>Not yet implemented</strong></p>
+</section>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.maze.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.maze.models.components.html b/docs/html/problems/problems.maze.models.components.html
new file mode 100644
index 00000000..e13d0d52
--- /dev/null
+++ b/docs/html/problems/problems.maze.models.components.html
@@ -0,0 +1,184 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.maze.models.components package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.multi_object_search package" href="problems.multi_object_search.html" />
+    <link rel="prev" title="problems.maze.models package" href="problems.maze.models.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.maze.models.components package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-maze-models-components-map-module">problems.maze.models.components.map module</a></li>
+<li><a class="reference internal" href="#module-problems.maze.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.maze.html">problems.maze package</a><ul>
+  <li><a href="problems.maze.models.html">problems.maze.models package</a><ul>
+      <li>Previous: <a href="problems.maze.models.html" title="previous chapter">problems.maze.models package</a></li>
+      <li>Next: <a href="problems.multi_object_search.html" title="next chapter">problems.multi_object_search package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-maze-models-components-package">
+<h1>problems.maze.models.components package<a class="headerlink" href="#problems-maze-models-components-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-maze-models-components-map-module">
+<h2>problems.maze.models.components.map module<a class="headerlink" href="#problems-maze-models-components-map-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.maze.models.components">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.maze.models.components" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.maze.models.components.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.maze.models.html b/docs/html/problems/problems.maze.models.html
new file mode 100644
index 00000000..a55b9698
--- /dev/null
+++ b/docs/html/problems/problems.maze.models.html
@@ -0,0 +1,188 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.maze.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.maze.models.components package" href="problems.maze.models.components.html" />
+    <link rel="prev" title="problems.maze.env package" href="problems.maze.env.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.maze.models package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#module-problems.maze.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.maze.html">problems.maze package</a><ul>
+      <li>Previous: <a href="problems.maze.env.html" title="previous chapter">problems.maze.env package</a></li>
+      <li>Next: <a href="problems.maze.models.components.html" title="next chapter">problems.maze.models.components package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-maze-models-package">
+<h1>problems.maze.models package<a class="headerlink" href="#problems-maze-models-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.maze.models.components.html">problems.maze.models.components package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.models.components.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.models.components.html#problems-maze-models-components-map-module">problems.maze.models.components.map module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.maze.models.components.html#module-problems.maze.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="module-problems.maze.models">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.maze.models" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.maze.models.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.multi_object_search.agent.html b/docs/html/problems/problems.multi_object_search.agent.html
new file mode 100644
index 00000000..00c2653f
--- /dev/null
+++ b/docs/html/problems/problems.multi_object_search.agent.html
@@ -0,0 +1,265 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.multi_object_search.agent package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.multi_object_search.domain package" href="problems.multi_object_search.domain.html" />
+    <link rel="prev" title="problems.multi_object_search package" href="problems.multi_object_search.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.multi_object_search.agent package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.agent.agent">problems.multi_object_search.agent.agent module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.agent.agent.MosAgent"><code class="docutils literal notranslate"><span class="pre">MosAgent</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.agent.agent.MosAgent.clear_history"><code class="docutils literal notranslate"><span class="pre">MosAgent.clear_history()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.agent.belief">problems.multi_object_search.agent.belief module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.agent.belief.MosOOBelief"><code class="docutils literal notranslate"><span class="pre">MosOOBelief</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.agent.belief.MosOOBelief.mpe"><code class="docutils literal notranslate"><span class="pre">MosOOBelief.mpe()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.agent.belief.MosOOBelief.random"><code class="docutils literal notranslate"><span class="pre">MosOOBelief.random()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.agent.belief.initialize_belief"><code class="docutils literal notranslate"><span class="pre">initialize_belief()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.agent">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+      <li>Previous: <a href="problems.multi_object_search.html" title="previous chapter">problems.multi_object_search package</a></li>
+      <li>Next: <a href="problems.multi_object_search.domain.html" title="next chapter">problems.multi_object_search.domain package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-multi-object-search-agent-package">
+<h1>problems.multi_object_search.agent package<a class="headerlink" href="#problems-multi-object-search-agent-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.multi_object_search.agent.agent">
+<span id="problems-multi-object-search-agent-agent-module"></span><h2>problems.multi_object_search.agent.agent module<a class="headerlink" href="#module-problems.multi_object_search.agent.agent" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.agent.agent.MosAgent">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.agent.agent.</span></span><span class="sig-name descname"><span class="pre">MosAgent</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_robot_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">object_ids</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sigma</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.01</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief_rep</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'histogram'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/agent/agent.html#MosAgent"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.agent.agent.MosAgent" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Agent" title="pomdp_py.framework.basics.Agent"><code class="xref py py-class docutils literal notranslate"><span class="pre">Agent</span></code></a></p>
+<p>One agent is one robot.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.agent.agent.MosAgent.clear_history">
+<span class="sig-name descname"><span class="pre">clear_history</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/agent/agent.html#MosAgent.clear_history"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.agent.agent.MosAgent.clear_history" title="Link to this definition">¶</a></dt>
+<dd><p>Custum function; clear history</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.agent.belief">
+<span id="problems-multi-object-search-agent-belief-module"></span><h2>problems.multi_object_search.agent.belief module<a class="headerlink" href="#module-problems.multi_object_search.agent.belief" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.agent.belief.MosOOBelief">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.agent.belief.</span></span><span class="sig-name descname"><span class="pre">MosOOBelief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">object_beliefs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/agent/belief.html#MosOOBelief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.agent.belief.MosOOBelief" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOBelief" title="pomdp_py.framework.oopomdp.OOBelief"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOBelief</span></code></a></p>
+<p>This is needed to make sure the belief is sampling the right
+type of State for this problem.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.agent.belief.MosOOBelief.mpe">
+<span class="sig-name descname"><span class="pre">mpe</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">return_oostate</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/agent/belief.html#MosOOBelief.mpe"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.agent.belief.MosOOBelief.mpe" title="Link to this definition">¶</a></dt>
+<dd><p>Returns most likely state.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.agent.belief.MosOOBelief.random">
+<span class="sig-name descname"><span class="pre">random</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">return_oostate</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/agent/belief.html#MosOOBelief.random"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.agent.belief.MosOOBelief.random" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a random state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.agent.belief.initialize_belief">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.agent.belief.</span></span><span class="sig-name descname"><span class="pre">initialize_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">object_ids</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">representation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'histogram'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_orientations</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/agent/belief.html#initialize_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.agent.belief.initialize_belief" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a GenerativeDistribution that is the belief representation for
+the multi-object search problem.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>dim</strong> (<em>tuple</em>) – a tuple (width, length) of the search space gridworld.</p></li>
+<li><p><strong>robot_id</strong> (<em>int</em>) – robot id that this belief is initialized for.</p></li>
+<li><p><strong>object_ids</strong> (<em>dict</em>) – a set of object ids that we want to model the belief distribution
+over; They are <cite>assumed</cite> to be the target objects, not obstacles,
+because the robot doesn’t really care about obstacle locations and
+modeling them just adds computation cost.</p></li>
+<li><p><strong>prior</strong> (<em>dict</em>) – A mapping {(objid|robot_id) -&gt; {(x,y) -&gt; [0,1]}}. If used, then
+all locations not included in the prior will be treated to have 0 probability.
+If unspecified for an object, then the belief over that object is assumed
+to be a uniform distribution.</p></li>
+<li><p><strong>robot_orientations</strong> (<em>dict</em>) – Mapping from robot id to their initial orientation (radian).
+Assumed to be 0 if robot id not in this dictionary.</p></li>
+<li><p><strong>num_particles</strong> (<em>int</em>) – Maximum number of particles used to represent the belief</p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the initial belief representation.</p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.GenerativeDistribution" title="pomdp_py.framework.basics.GenerativeDistribution">GenerativeDistribution</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.agent">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.multi_object_search.agent" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.multi_object_search.agent.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.multi_object_search.domain.html b/docs/html/problems/problems.multi_object_search.domain.html
new file mode 100644
index 00000000..8ba83391
--- /dev/null
+++ b/docs/html/problems/problems.multi_object_search.domain.html
@@ -0,0 +1,485 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.multi_object_search.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.multi_object_search.env package" href="problems.multi_object_search.env.html" />
+    <link rel="prev" title="problems.multi_object_search.agent package" href="problems.multi_object_search.agent.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.multi_object_search.domain package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.domain.action">problems.multi_object_search.domain.action module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.Action"><code class="docutils literal notranslate"><span class="pre">Action</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction"><code class="docutils literal notranslate"><span class="pre">MotionAction</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.SCHEME_XYTH"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEME_XYTH</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.EAST"><code class="docutils literal notranslate"><span class="pre">MotionAction.EAST</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.WEST"><code class="docutils literal notranslate"><span class="pre">MotionAction.WEST</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.NORTH"><code class="docutils literal notranslate"><span class="pre">MotionAction.NORTH</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.SOUTH"><code class="docutils literal notranslate"><span class="pre">MotionAction.SOUTH</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.SCHEME_VW"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEME_VW</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.FORWARD"><code class="docutils literal notranslate"><span class="pre">MotionAction.FORWARD</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.BACKWARD"><code class="docutils literal notranslate"><span class="pre">MotionAction.BACKWARD</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.LEFT"><code class="docutils literal notranslate"><span class="pre">MotionAction.LEFT</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.RIGHT"><code class="docutils literal notranslate"><span class="pre">MotionAction.RIGHT</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.SCHEME_XY"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEME_XY</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.EAST2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.EAST2D</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.WEST2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.WEST2D</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.NORTH2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.NORTH2D</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.SOUTH2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.SOUTH2D</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.MotionAction.SCHEMES"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEMES</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.LookAction"><code class="docutils literal notranslate"><span class="pre">LookAction</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.action.FindAction"><code class="docutils literal notranslate"><span class="pre">FindAction</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.domain.observation">problems.multi_object_search.domain.observation module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.observation.ObjectObservation"><code class="docutils literal notranslate"><span class="pre">ObjectObservation</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.observation.ObjectObservation.NULL"><code class="docutils literal notranslate"><span class="pre">ObjectObservation.NULL</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.observation.MosOOObservation"><code class="docutils literal notranslate"><span class="pre">MosOOObservation</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.observation.MosOOObservation.for_obj"><code class="docutils literal notranslate"><span class="pre">MosOOObservation.for_obj()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.observation.MosOOObservation.factor"><code class="docutils literal notranslate"><span class="pre">MosOOObservation.factor()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.observation.MosOOObservation.merge"><code class="docutils literal notranslate"><span class="pre">MosOOObservation.merge()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.domain.state">problems.multi_object_search.domain.state module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.ObjectState"><code class="docutils literal notranslate"><span class="pre">ObjectState</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.ObjectState.pose"><code class="docutils literal notranslate"><span class="pre">ObjectState.pose</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.ObjectState.objid"><code class="docutils literal notranslate"><span class="pre">ObjectState.objid</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.RobotState"><code class="docutils literal notranslate"><span class="pre">RobotState</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.RobotState.pose"><code class="docutils literal notranslate"><span class="pre">RobotState.pose</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.RobotState.robot_pose"><code class="docutils literal notranslate"><span class="pre">RobotState.robot_pose</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.RobotState.objects_found"><code class="docutils literal notranslate"><span class="pre">RobotState.objects_found</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.MosOOState"><code class="docutils literal notranslate"><span class="pre">MosOOState</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.MosOOState.object_pose"><code class="docutils literal notranslate"><span class="pre">MosOOState.object_pose()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.MosOOState.pose"><code class="docutils literal notranslate"><span class="pre">MosOOState.pose()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.domain.state.MosOOState.object_poses"><code class="docutils literal notranslate"><span class="pre">MosOOState.object_poses</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.domain">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+      <li>Previous: <a href="problems.multi_object_search.agent.html" title="previous chapter">problems.multi_object_search.agent package</a></li>
+      <li>Next: <a href="problems.multi_object_search.env.html" title="next chapter">problems.multi_object_search.env package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-multi-object-search-domain-package">
+<h1>problems.multi_object_search.domain package<a class="headerlink" href="#problems-multi-object-search-domain-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.multi_object_search.domain.action">
+<span id="problems-multi-object-search-domain-action-module"></span><h2>problems.multi_object_search.domain.action module<a class="headerlink" href="#module-problems.multi_object_search.domain.action" title="Link to this heading">¶</a></h2>
+<p>Defines the Action for the 2D Multi-Object Search domain;</p>
+<p>Action space:</p>
+<blockquote>
+<div><p>Motion <span class="math notranslate nohighlight">\(\cup\)</span> Look <span class="math notranslate nohighlight">\(\cup\)</span> Find</p>
+</div></blockquote>
+<ul class="simple">
+<li><p>Motion Actions scheme 1: South, East, West, North.</p></li>
+<li><p>Motion Actions scheme 2: Left 45deg, Right 45deg, Forward</p></li>
+<li><p>Look: Interprets sensor input as observation</p></li>
+<li><p>Find: Marks objects observed in the last Look action as
+(differs from original paper; reduces action space)</p></li>
+</ul>
+<p>It is possible to force “Look” after every N/S/E/W action;
+then the Look action could be dropped. This is optional behavior.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.Action">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.action.</span></span><span class="sig-name descname"><span class="pre">Action</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/action.html#Action"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.action.Action" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+<p>Mos action; Simple named action.</p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.action.</span></span><span class="sig-name descname"><span class="pre">MotionAction</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">motion</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">scheme</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'xy'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">distance_cost</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">motion_name</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/action.html#MotionAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.multi_object_search.domain.action.Action" title="problems.multi_object_search.domain.action.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.SCHEME_XYTH">
+<span class="sig-name descname"><span class="pre">SCHEME_XYTH</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'xyth'</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.SCHEME_XYTH" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.EAST">
+<span class="sig-name descname"><span class="pre">EAST</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(1,</span> <span class="pre">0,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.EAST" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.WEST">
+<span class="sig-name descname"><span class="pre">WEST</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(-1,</span> <span class="pre">0,</span> <span class="pre">3.141592653589793)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.WEST" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.NORTH">
+<span class="sig-name descname"><span class="pre">NORTH</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">-1,</span> <span class="pre">4.71238898038469)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.NORTH" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.SOUTH">
+<span class="sig-name descname"><span class="pre">SOUTH</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">1,</span> <span class="pre">1.5707963267948966)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.SOUTH" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.SCHEME_VW">
+<span class="sig-name descname"><span class="pre">SCHEME_VW</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'vw'</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.SCHEME_VW" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.FORWARD">
+<span class="sig-name descname"><span class="pre">FORWARD</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(1,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.FORWARD" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.BACKWARD">
+<span class="sig-name descname"><span class="pre">BACKWARD</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(-1,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.BACKWARD" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.LEFT">
+<span class="sig-name descname"><span class="pre">LEFT</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">-0.7853981633974483)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.LEFT" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.RIGHT">
+<span class="sig-name descname"><span class="pre">RIGHT</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">0.7853981633974483)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.RIGHT" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.SCHEME_XY">
+<span class="sig-name descname"><span class="pre">SCHEME_XY</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'xy'</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.SCHEME_XY" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.EAST2D">
+<span class="sig-name descname"><span class="pre">EAST2D</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(1,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.EAST2D" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.WEST2D">
+<span class="sig-name descname"><span class="pre">WEST2D</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(-1,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.WEST2D" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.NORTH2D">
+<span class="sig-name descname"><span class="pre">NORTH2D</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">-1)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.NORTH2D" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.SOUTH2D">
+<span class="sig-name descname"><span class="pre">SOUTH2D</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">1)</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.SOUTH2D" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.MotionAction.SCHEMES">
+<span class="sig-name descname"><span class="pre">SCHEMES</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">{'vw',</span> <span class="pre">'xy',</span> <span class="pre">'xyth'}</span></em><a class="headerlink" href="#problems.multi_object_search.domain.action.MotionAction.SCHEMES" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.LookAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.action.</span></span><span class="sig-name descname"><span class="pre">LookAction</span></span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/action.html#LookAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.action.LookAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.multi_object_search.domain.action.Action" title="problems.multi_object_search.domain.action.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.action.FindAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.action.</span></span><span class="sig-name descname"><span class="pre">FindAction</span></span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/action.html#FindAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.action.FindAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.multi_object_search.domain.action.Action" title="problems.multi_object_search.domain.action.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.domain.observation">
+<span id="problems-multi-object-search-domain-observation-module"></span><h2>problems.multi_object_search.domain.observation module<a class="headerlink" href="#module-problems.multi_object_search.domain.observation" title="Link to this heading">¶</a></h2>
+<p>Defines the Observation for the 2D Multi-Object Search domain;</p>
+<p>Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)
+(extensions: action space changes, different sensor model, gridworld instead of topological graph)</p>
+<p>Observation:</p>
+<blockquote>
+<div><p><code class="code docutils literal notranslate"><span class="pre">{objid</span> <span class="pre">:</span> <span class="pre">pose(x,y)</span> <span class="pre">or</span> <span class="pre">NULL}</span></code>.
+The sensor model could vary;
+it could be a fan-shaped model as the original paper, or
+it could be something else. But the resulting observation
+should be a map from object id to observed pose or NULL (not observed).</p>
+</div></blockquote>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.observation.ObjectObservation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.observation.</span></span><span class="sig-name descname"><span class="pre">ObjectObservation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pose</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/observation.html#ObjectObservation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.observation.ObjectObservation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+<p>The xy pose of the object is observed; or NULL if not observed</p>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.observation.ObjectObservation.NULL">
+<span class="sig-name descname"><span class="pre">NULL</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">None</span></em><a class="headerlink" href="#problems.multi_object_search.domain.observation.ObjectObservation.NULL" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.observation.MosOOObservation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.observation.</span></span><span class="sig-name descname"><span class="pre">MosOOObservation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objposes</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/observation.html#MosOOObservation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.observation.MosOOObservation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservation" title="pomdp_py.framework.oopomdp.OOObservation"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOObservation</span></code></a></p>
+<p>Observation for Mos that can be factored by objects;
+thus this is an OOObservation.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.observation.MosOOObservation.for_obj">
+<span class="sig-name descname"><span class="pre">for_obj</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/observation.html#MosOOObservation.for_obj"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.observation.MosOOObservation.for_obj" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.observation.MosOOObservation.factor">
+<span class="sig-name descname"><span class="pre">factor</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">params</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/observation.html#MosOOObservation.factor"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.observation.MosOOObservation.factor" title="Link to this definition">¶</a></dt>
+<dd><p>Factor this OO-observation by objects</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.observation.MosOOObservation.merge">
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">merge</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">object_observations</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">params</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/observation.html#MosOOObservation.merge"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.observation.MosOOObservation.merge" title="Link to this definition">¶</a></dt>
+<dd><p>Merge <cite>object_observations</cite> into a single OOObservation object;</p>
+<p>object_observation (dict): Maps from objid to ObjectObservation</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.domain.state">
+<span id="problems-multi-object-search-domain-state-module"></span><h2>problems.multi_object_search.domain.state module<a class="headerlink" href="#module-problems.multi_object_search.domain.state" title="Link to this heading">¶</a></h2>
+<p>Defines the State for the 2D Multi-Object Search domain;</p>
+<p>Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)
+(extensions: action space changes, different sensor model, gridworld instead of
+topological graph)</p>
+<p>Description: Multi-Object Search in a 2D grid world.</p>
+<p>State space:</p>
+<blockquote>
+<div><p><span class="math notranslate nohighlight">\(S_1 \times S_2 \times ... S_n \times S_r\)</span>
+where <span class="math notranslate nohighlight">\(S_i (1\leq i\leq n)\)</span> is the object state, with attribute
+“pose” <span class="math notranslate nohighlight">\((x,y)\)</span> and Sr is the state of the robot, with attribute
+“pose” <span class="math notranslate nohighlight">\((x,y)\)</span> and “objects_found” (set).</p>
+</div></blockquote>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.ObjectState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.state.</span></span><span class="sig-name descname"><span class="pre">ObjectState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">objclass</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pose</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/state.html#ObjectState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.state.ObjectState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.ObjectState" title="pomdp_py.framework.oopomdp.ObjectState"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObjectState</span></code></a></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.ObjectState.pose">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">pose</span></span><a class="headerlink" href="#problems.multi_object_search.domain.state.ObjectState.pose" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.ObjectState.objid">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">objid</span></span><a class="headerlink" href="#problems.multi_object_search.domain.state.ObjectState.objid" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.RobotState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.state.</span></span><span class="sig-name descname"><span class="pre">RobotState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">objects_found</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">camera_direction</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/state.html#RobotState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.state.RobotState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.ObjectState" title="pomdp_py.framework.oopomdp.ObjectState"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObjectState</span></code></a></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.RobotState.pose">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">pose</span></span><a class="headerlink" href="#problems.multi_object_search.domain.state.RobotState.pose" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.RobotState.robot_pose">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">robot_pose</span></span><a class="headerlink" href="#problems.multi_object_search.domain.state.RobotState.robot_pose" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.RobotState.objects_found">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">objects_found</span></span><a class="headerlink" href="#problems.multi_object_search.domain.state.RobotState.objects_found" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.MosOOState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.domain.state.</span></span><span class="sig-name descname"><span class="pre">MosOOState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">object_states</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/state.html#MosOOState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.state.MosOOState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOState" title="pomdp_py.framework.oopomdp.OOState"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOState</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.MosOOState.object_pose">
+<span class="sig-name descname"><span class="pre">object_pose</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/state.html#MosOOState.object_pose"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.state.MosOOState.object_pose" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.MosOOState.pose">
+<span class="sig-name descname"><span class="pre">pose</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/domain/state.html#MosOOState.pose"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.domain.state.MosOOState.pose" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.domain.state.MosOOState.object_poses">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">object_poses</span></span><a class="headerlink" href="#problems.multi_object_search.domain.state.MosOOState.object_poses" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.domain">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.multi_object_search.domain" title="Link to this heading">¶</a></h2>
+<p><strong>Defines state, action and observation</strong></p>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.multi_object_search.domain.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.multi_object_search.env.html b/docs/html/problems/problems.multi_object_search.env.html
new file mode 100644
index 00000000..7220e3a6
--- /dev/null
+++ b/docs/html/problems/problems.multi_object_search.env.html
@@ -0,0 +1,460 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.multi_object_search.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.multi_object_search.models package" href="problems.multi_object_search.models.html" />
+    <link rel="prev" title="problems.multi_object_search.domain package" href="problems.multi_object_search.domain.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.multi_object_search.env package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.env.env">problems.multi_object_search.env.env module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.MosEnvironment"><code class="docutils literal notranslate"><span class="pre">MosEnvironment</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.MosEnvironment.robot_ids"><code class="docutils literal notranslate"><span class="pre">MosEnvironment.robot_ids</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.MosEnvironment.state_transition"><code class="docutils literal notranslate"><span class="pre">MosEnvironment.state_transition()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.interpret"><code class="docutils literal notranslate"><span class="pre">interpret()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.interpret_robot_id"><code class="docutils literal notranslate"><span class="pre">interpret_robot_id()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.equip_sensors"><code class="docutils literal notranslate"><span class="pre">equip_sensors()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.make_laser_sensor"><code class="docutils literal notranslate"><span class="pre">make_laser_sensor()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.env.make_proximity_sensor"><code class="docutils literal notranslate"><span class="pre">make_proximity_sensor()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.env.visual">problems.multi_object_search.env.visual module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.object_color"><code class="docutils literal notranslate"><span class="pre">object_color()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz"><code class="docutils literal notranslate"><span class="pre">MosViz</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.img_width"><code class="docutils literal notranslate"><span class="pre">MosViz.img_width</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.img_height"><code class="docutils literal notranslate"><span class="pre">MosViz.img_height</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.last_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.last_observation</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.update"><code class="docutils literal notranslate"><span class="pre">MosViz.update()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_robot()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_observation()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_belief()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.on_init"><code class="docutils literal notranslate"><span class="pre">MosViz.on_init()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.on_event"><code class="docutils literal notranslate"><span class="pre">MosViz.on_event()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.on_loop"><code class="docutils literal notranslate"><span class="pre">MosViz.on_loop()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.on_render"><code class="docutils literal notranslate"><span class="pre">MosViz.on_render()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">MosViz.on_cleanup()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.on_execute"><code class="docutils literal notranslate"><span class="pre">MosViz.on_execute()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.MosViz.render_env"><code class="docutils literal notranslate"><span class="pre">MosViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.env">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+      <li>Previous: <a href="problems.multi_object_search.domain.html" title="previous chapter">problems.multi_object_search.domain package</a></li>
+      <li>Next: <a href="problems.multi_object_search.models.html" title="next chapter">problems.multi_object_search.models package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-multi-object-search-env-package">
+<h1>problems.multi_object_search.env package<a class="headerlink" href="#problems-multi-object-search-env-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.multi_object_search.env.env">
+<span id="problems-multi-object-search-env-env-module"></span><h2>problems.multi_object_search.env.env module<a class="headerlink" href="#module-problems.multi_object_search.env.env" title="Link to this heading">¶</a></h2>
+<p>The Environment</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.MosEnvironment">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.env.</span></span><span class="sig-name descname"><span class="pre">MosEnvironment</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obstacles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#MosEnvironment"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.MosEnvironment" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Environment" title="pomdp_py.framework.basics.Environment"><code class="xref py py-class docutils literal notranslate"><span class="pre">Environment</span></code></a></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.MosEnvironment.robot_ids">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">robot_ids</span></span><a class="headerlink" href="#problems.multi_object_search.env.env.MosEnvironment.robot_ids" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.MosEnvironment.state_transition">
+<span class="sig-name descname"><span class="pre">state_transition</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">execute</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#MosEnvironment.state_transition"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.MosEnvironment.state_transition" title="Link to this definition">¶</a></dt>
+<dd><p>Overriding parent class function.
+Simulates a state transition given <cite>action</cite>. If <cite>execute</cite> is set to True,
+then the resulting state will be the new current state of the environment.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – action that triggers the state transition</p></li>
+<li><p><strong>execute</strong> (<em>bool</em>) – If True, the resulting state of the transition will
+become the current state.</p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>reward as a result of <cite>action</cite> and state
+transition, if <cite>execute</cite> is True (next_state, reward) if <cite>execute</cite>
+is False.</p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float or tuple</p>
+</dd>
+</dl>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.interpret">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.env.</span></span><span class="sig-name descname"><span class="pre">interpret</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldstr</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#interpret"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.interpret" title="Link to this definition">¶</a></dt>
+<dd><p>Interprets a problem instance description in <cite>worldstr</cite>
+and returns the corresponding MosEnvironment.</p>
+<p>For example: This string</p>
+<div class="highlight-text notranslate"><div class="highlight"><pre><span></span>rx...
+.x.xT
+.....
+***
+r: laser fov=90 min_range=1 max_range=10
+</pre></div>
+</div>
+<p>describes a 3 by 5 world where x indicates obsticles and T indicates
+the “target object”. T could be replaced by any upper-case letter A-Z
+which will serve as the object’s id. Lower-case letters a-z (except for x)
+serve as id for robot(s).</p>
+<p>After the world, the <code class="code docutils literal notranslate"><span class="pre">***</span></code> signals description of the sensor for each robot.
+For example “r laser 90 1 10” means that robot <cite>r</cite> will have a Laser2Dsensor
+with fov 90, min_range 1.0, and max_range of 10.0.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>worldstr</strong> (<em>str</em>) – a string that describes the initial state of the world.</p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the corresponding environment for the world description.</p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="#problems.multi_object_search.env.env.MosEnvironment" title="problems.multi_object_search.env.env.MosEnvironment">MosEnvironment</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.interpret_robot_id">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.env.</span></span><span class="sig-name descname"><span class="pre">interpret_robot_id</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#interpret_robot_id"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.interpret_robot_id" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.equip_sensors">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.env.</span></span><span class="sig-name descname"><span class="pre">equip_sensors</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldmap</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensors</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#equip_sensors"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.equip_sensors" title="Link to this definition">¶</a></dt>
+<dd><dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>worldmap</strong> (<em>str</em>) – a string that describes the initial state of the world.</p></li>
+<li><p><strong>sensors</strong> (<em>dict</em><em>) </em><em>a map from robot character representation</em><em> (</em><em>e.g. 'r'</em>) – </p></li>
+</ul>
+</dd>
+</dl>
+<p>string that describes its sensor (e.g. ‘laser fov=90 min_range=1 max_range=5
+angle_increment=5’)</p>
+<dl class="field-list simple">
+<dt class="field-odd">Returns<span class="colon">:</span></dt>
+<dd class="field-odd"><p>A string that can be used as input to the <cite>interpret</cite> function</p>
+</dd>
+<dt class="field-even">Return type<span class="colon">:</span></dt>
+<dd class="field-even"><p>str</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.make_laser_sensor">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.env.</span></span><span class="sig-name descname"><span class="pre">make_laser_sensor</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">fov</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dist_range</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">angle_increment</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">occlusion</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#make_laser_sensor"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.make_laser_sensor" title="Link to this definition">¶</a></dt>
+<dd><p>Returns string representation of the laser scanner configuration.
+For example:  “laser fov=90 min_range=1 max_range=10”</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>fov</strong> (<em>int</em><em> or </em><em>float</em>) – angle between the start and end beams of one scan (degree).</p></li>
+<li><p><strong>dist_range</strong> (<em>tuple</em>) – (min_range, max_range)</p></li>
+<li><p><strong>angle_increment</strong> (<em>int</em><em> or </em><em>float</em>) – angular distance between measurements (rad).</p></li>
+<li><p><strong>occlusion</strong> (<em>bool</em>) – True if consider occlusion</p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>String representation of the laser scanner configuration.</p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>str</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.env.make_proximity_sensor">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.env.</span></span><span class="sig-name descname"><span class="pre">make_proximity_sensor</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">radius</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">occlusion</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/env.html#make_proximity_sensor"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.env.make_proximity_sensor" title="Link to this definition">¶</a></dt>
+<dd><p>Returns string representation of the proximity sensor configuration.
+For example: “proximity radius=5 occlusion_enabled=False”</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>radius</strong> (<em>int</em><em> or </em><em>float</em>) – </p></li>
+<li><p><strong>occlusion</strong> (<em>bool</em>) – True if consider occlusion</p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>String representation of the proximity sensor configuration.</p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>str</p>
+</dd>
+</dl>
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.env.visual">
+<span id="problems-multi-object-search-env-visual-module"></span><h2>problems.multi_object_search.env.visual module<a class="headerlink" href="#module-problems.multi_object_search.env.visual" title="Link to this heading">¶</a></h2>
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.object_color">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.visual.</span></span><span class="sig-name descname"><span class="pre">object_color</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">count</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#object_color"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.object_color" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.visual.</span></span><span class="sig-name descname"><span class="pre">MosViz</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">env</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">res</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">controllable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.img_width">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_width</span></span><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.img_width" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.img_height">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_height</span></span><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.img_height" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.last_observation">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">last_observation</span></span><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.last_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.update">
+<span class="sig-name descname"><span class="pre">update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">viz_observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.update" title="Link to this definition">¶</a></dt>
+<dd><p>Update the visualization after there is new real action and observation
+and updated belief.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="../api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation" title="pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation"><em>MosOOObservation</em></a>) – Real observation</p></li>
+<li><p><strong>viz_observation</strong> (<a class="reference internal" href="../api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation" title="pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation"><em>MosOOObservation</em></a>) – An observation used to visualize
+the sensing region.</p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.draw_robot">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_robot</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">th</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(255,</span> <span class="pre">12,</span> <span class="pre">12)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.draw_robot"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.draw_robot" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.draw_observation">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_observation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">z</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rx</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ry</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rth</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(12,</span> <span class="pre">12,</span> <span class="pre">255)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.draw_observation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.draw_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.draw_belief">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_colors</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.draw_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.draw_belief" title="Link to this definition">¶</a></dt>
+<dd><p>belief (OOBelief)</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.on_init">
+<span class="sig-name descname"><span class="pre">on_init</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.on_init"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.on_init" title="Link to this definition">¶</a></dt>
+<dd><p>pygame init</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.on_event">
+<span class="sig-name descname"><span class="pre">on_event</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">event</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.on_event"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.on_event" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.on_loop">
+<span class="sig-name descname"><span class="pre">on_loop</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.on_loop"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.on_loop" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.on_render">
+<span class="sig-name descname"><span class="pre">on_render</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.on_render"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.on_render" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.on_cleanup">
+<span class="sig-name descname"><span class="pre">on_cleanup</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.on_cleanup"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.on_cleanup" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.on_execute">
+<span class="sig-name descname"><span class="pre">on_execute</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.on_execute"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.on_execute" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.MosViz.render_env">
+<span class="sig-name descname"><span class="pre">render_env</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">display_surf</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#MosViz.render_env"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.MosViz.render_env" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.env.visual.unittest">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.env.visual.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/env/visual.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.env.visual.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.env">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.multi_object_search.env" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.multi_object_search.env.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.multi_object_search.html b/docs/html/problems/problems.multi_object_search.html
new file mode 100644
index 00000000..349da32b
--- /dev/null
+++ b/docs/html/problems/problems.multi_object_search.html
@@ -0,0 +1,450 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.multi_object_search package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.multi_object_search.agent package" href="problems.multi_object_search.agent.html" />
+    <link rel="prev" title="problems.maze.models.components package" href="problems.maze.models.components.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.multi_object_search package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.example_worlds">problems.multi_object_search.example_worlds module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.example_worlds.random_world"><code class="docutils literal notranslate"><span class="pre">random_world()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.problem">problems.multi_object_search.problem module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.problem.MosOOPOMDP"><code class="docutils literal notranslate"><span class="pre">MosOOPOMDP</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.problem.belief_update"><code class="docutils literal notranslate"><span class="pre">belief_update()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.problem.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.maze.models.components.html" title="previous chapter">problems.maze.models.components package</a></li>
+      <li>Next: <a href="problems.multi_object_search.agent.html" title="next chapter">problems.multi_object_search.agent package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-multi-object-search-package">
+<h1>problems.multi_object_search package<a class="headerlink" href="#problems-multi-object-search-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.multi_object_search.agent.html">problems.multi_object_search.agent package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.agent.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.agent.html#module-problems.multi_object_search.agent.agent">problems.multi_object_search.agent.agent module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.agent.html#problems.multi_object_search.agent.agent.MosAgent"><code class="docutils literal notranslate"><span class="pre">MosAgent</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#problems.multi_object_search.agent.agent.MosAgent.clear_history"><code class="docutils literal notranslate"><span class="pre">MosAgent.clear_history()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.agent.html#module-problems.multi_object_search.agent.belief">problems.multi_object_search.agent.belief module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.MosOOBelief"><code class="docutils literal notranslate"><span class="pre">MosOOBelief</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.MosOOBelief.mpe"><code class="docutils literal notranslate"><span class="pre">MosOOBelief.mpe()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.MosOOBelief.random"><code class="docutils literal notranslate"><span class="pre">MosOOBelief.random()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.agent.html#problems.multi_object_search.agent.belief.initialize_belief"><code class="docutils literal notranslate"><span class="pre">initialize_belief()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.agent.html#module-problems.multi_object_search.agent">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.multi_object_search.domain.html">problems.multi_object_search.domain package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain.action">problems.multi_object_search.domain.action module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.Action"><code class="docutils literal notranslate"><span class="pre">Action</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction"><code class="docutils literal notranslate"><span class="pre">MotionAction</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.SCHEME_XYTH"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEME_XYTH</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.EAST"><code class="docutils literal notranslate"><span class="pre">MotionAction.EAST</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.WEST"><code class="docutils literal notranslate"><span class="pre">MotionAction.WEST</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.NORTH"><code class="docutils literal notranslate"><span class="pre">MotionAction.NORTH</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.SOUTH"><code class="docutils literal notranslate"><span class="pre">MotionAction.SOUTH</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.SCHEME_VW"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEME_VW</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.FORWARD"><code class="docutils literal notranslate"><span class="pre">MotionAction.FORWARD</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.BACKWARD"><code class="docutils literal notranslate"><span class="pre">MotionAction.BACKWARD</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.LEFT"><code class="docutils literal notranslate"><span class="pre">MotionAction.LEFT</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.RIGHT"><code class="docutils literal notranslate"><span class="pre">MotionAction.RIGHT</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.SCHEME_XY"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEME_XY</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.EAST2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.EAST2D</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.WEST2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.WEST2D</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.NORTH2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.NORTH2D</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.SOUTH2D"><code class="docutils literal notranslate"><span class="pre">MotionAction.SOUTH2D</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.MotionAction.SCHEMES"><code class="docutils literal notranslate"><span class="pre">MotionAction.SCHEMES</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.LookAction"><code class="docutils literal notranslate"><span class="pre">LookAction</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.action.FindAction"><code class="docutils literal notranslate"><span class="pre">FindAction</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain.observation">problems.multi_object_search.domain.observation module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.ObjectObservation"><code class="docutils literal notranslate"><span class="pre">ObjectObservation</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.ObjectObservation.NULL"><code class="docutils literal notranslate"><span class="pre">ObjectObservation.NULL</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation"><code class="docutils literal notranslate"><span class="pre">MosOOObservation</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation.for_obj"><code class="docutils literal notranslate"><span class="pre">MosOOObservation.for_obj()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation.factor"><code class="docutils literal notranslate"><span class="pre">MosOOObservation.factor()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.observation.MosOOObservation.merge"><code class="docutils literal notranslate"><span class="pre">MosOOObservation.merge()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain.state">problems.multi_object_search.domain.state module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.ObjectState"><code class="docutils literal notranslate"><span class="pre">ObjectState</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.ObjectState.pose"><code class="docutils literal notranslate"><span class="pre">ObjectState.pose</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.ObjectState.objid"><code class="docutils literal notranslate"><span class="pre">ObjectState.objid</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.RobotState"><code class="docutils literal notranslate"><span class="pre">RobotState</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.RobotState.pose"><code class="docutils literal notranslate"><span class="pre">RobotState.pose</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.RobotState.robot_pose"><code class="docutils literal notranslate"><span class="pre">RobotState.robot_pose</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.RobotState.objects_found"><code class="docutils literal notranslate"><span class="pre">RobotState.objects_found</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState"><code class="docutils literal notranslate"><span class="pre">MosOOState</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState.object_pose"><code class="docutils literal notranslate"><span class="pre">MosOOState.object_pose()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState.pose"><code class="docutils literal notranslate"><span class="pre">MosOOState.pose()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.domain.html#problems.multi_object_search.domain.state.MosOOState.object_poses"><code class="docutils literal notranslate"><span class="pre">MosOOState.object_poses</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.domain.html#module-problems.multi_object_search.domain">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.multi_object_search.env.html">problems.multi_object_search.env package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.env.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.env.html#module-problems.multi_object_search.env.env">problems.multi_object_search.env.env module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.MosEnvironment"><code class="docutils literal notranslate"><span class="pre">MosEnvironment</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.MosEnvironment.robot_ids"><code class="docutils literal notranslate"><span class="pre">MosEnvironment.robot_ids</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.MosEnvironment.state_transition"><code class="docutils literal notranslate"><span class="pre">MosEnvironment.state_transition()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.interpret"><code class="docutils literal notranslate"><span class="pre">interpret()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.interpret_robot_id"><code class="docutils literal notranslate"><span class="pre">interpret_robot_id()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.equip_sensors"><code class="docutils literal notranslate"><span class="pre">equip_sensors()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.make_laser_sensor"><code class="docutils literal notranslate"><span class="pre">make_laser_sensor()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.env.make_proximity_sensor"><code class="docutils literal notranslate"><span class="pre">make_proximity_sensor()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.env.html#module-problems.multi_object_search.env.visual">problems.multi_object_search.env.visual module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.object_color"><code class="docutils literal notranslate"><span class="pre">object_color()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz"><code class="docutils literal notranslate"><span class="pre">MosViz</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.img_width"><code class="docutils literal notranslate"><span class="pre">MosViz.img_width</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.img_height"><code class="docutils literal notranslate"><span class="pre">MosViz.img_height</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.last_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.last_observation</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.update"><code class="docutils literal notranslate"><span class="pre">MosViz.update()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_robot()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_observation()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">MosViz.draw_belief()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_init"><code class="docutils literal notranslate"><span class="pre">MosViz.on_init()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_event"><code class="docutils literal notranslate"><span class="pre">MosViz.on_event()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_loop"><code class="docutils literal notranslate"><span class="pre">MosViz.on_loop()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_render"><code class="docutils literal notranslate"><span class="pre">MosViz.on_render()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">MosViz.on_cleanup()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.on_execute"><code class="docutils literal notranslate"><span class="pre">MosViz.on_execute()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.MosViz.render_env"><code class="docutils literal notranslate"><span class="pre">MosViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.env.html#problems.multi_object_search.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.env.html#module-problems.multi_object_search.env">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.multi_object_search.models.html">problems.multi_object_search.models package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html">problems.multi_object_search.models.components package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#module-problems.multi_object_search.models.components.grid_map">problems.multi_object_search.models.components.grid_map module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#module-problems.multi_object_search.models.components.sensor">problems.multi_object_search.models.components.sensor module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#module-problems.multi_object_search.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.observation_model">problems.multi_object_search.models.observation_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.MosObservationModel"><code class="docutils literal notranslate"><span class="pre">MosObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.MosObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">MosObservationModel.sample()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.ObjectObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.observation_model.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.policy_model">problems.multi_object_search.models.policy_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel"><code class="docutils literal notranslate"><span class="pre">PolicyModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">PolicyModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">PolicyModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">PolicyModel.argmax()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">PolicyModel.get_all_actions()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.policy_model.PolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">PolicyModel.rollout()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.reward_model">problems.multi_object_search.models.reward_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel"><code class="docutils literal notranslate"><span class="pre">MosRewardModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel.probability"><code class="docutils literal notranslate"><span class="pre">MosRewardModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel.sample"><code class="docutils literal notranslate"><span class="pre">MosRewardModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.MosRewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">MosRewardModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.reward_model.GoalRewardModel"><code class="docutils literal notranslate"><span class="pre">GoalRewardModel</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models.transition_model">problems.multi_object_search.models.transition_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.MosTransitionModel"><code class="docutils literal notranslate"><span class="pre">MosTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.MosTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">MosTransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.MosTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">MosTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.if_move_by"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.if_move_by()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.argmax()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.RobotTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.sample()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.valid_pose"><code class="docutils literal notranslate"><span class="pre">valid_pose()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.html#problems.multi_object_search.models.transition_model.in_boundary"><code class="docutils literal notranslate"><span class="pre">in_boundary()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.html#module-problems.multi_object_search.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.multi_object_search.example_worlds">
+<span id="problems-multi-object-search-example-worlds-module"></span><h2>problems.multi_object_search.example_worlds module<a class="headerlink" href="#module-problems.multi_object_search.example_worlds" title="Link to this heading">¶</a></h2>
+<p>This file has some examples of world string.</p>
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.example_worlds.random_world">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.example_worlds.</span></span><span class="sig-name descname"><span class="pre">random_world</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">width</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">length</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_obj</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_obstacles</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_char</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'r'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/example_worlds.html#random_world"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.example_worlds.random_world" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.problem">
+<span id="problems-multi-object-search-problem-module"></span><h2>problems.multi_object_search.problem module<a class="headerlink" href="#module-problems.multi_object_search.problem" title="Link to this heading">¶</a></h2>
+<p>2D Multi-Object Search (MOS) Task.
+Uses the domain, models, and agent/environment
+to actually define the POMDP problem for multi-object search.
+Then, solve it using POUCT or POMCP.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.problem.MosOOPOMDP">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">MosOOPOMDP</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">env</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensors</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sigma</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.01</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief_rep</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'histogram'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">agent_has_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/problem.html#MosOOPOMDP"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.problem.MosOOPOMDP" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOPOMDP" title="pomdp_py.framework.oopomdp.OOPOMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOPOMDP</span></code></a></p>
+<p>A MosOOPOMDP is instantiated given a string description
+of the search world, sensor descriptions for robots,
+and the necessary parameters for the agent’s models.</p>
+<p>Note: This is of course a simulation, where you can
+generate a world and know where the target objects are
+and then construct the Environment object. But in the
+real robot scenario, you don’t know where the objects
+are. In that case, as I have done it in the past, you
+could construct an Environment object and give None to
+the object poses.</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.problem.belief_update">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">belief_update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">agent</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_robot_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/problem.html#belief_update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.problem.belief_update" title="Link to this definition">¶</a></dt>
+<dd><p>Updates the agent’s belief; The belief update may happen
+through planner update (e.g. when planner is POMCP).</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.problem.solve">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">solve</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_depth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount_factor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.99</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planning_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">exploration_const</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">visualize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">120</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_steps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">500</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/problem.html#solve"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.problem.solve" title="Link to this definition">¶</a></dt>
+<dd><p>This function terminates when:
+- maximum time (max_time) reached; This time includes planning and updates
+- agent has planned <cite>max_steps</cite> number of steps
+- agent has taken n FindAction(s) where n = number of target objects.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>visualize</strong> (<em>bool</em>) – </p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.problem.unittest">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.problem.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/problem.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.problem.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.multi_object_search" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.multi_object_search.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.multi_object_search.models.components.html b/docs/html/problems/problems.multi_object_search.models.components.html
new file mode 100644
index 00000000..9b53f50b
--- /dev/null
+++ b/docs/html/problems/problems.multi_object_search.models.components.html
@@ -0,0 +1,349 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.multi_object_search.models.components package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.rocksample package" href="problems.rocksample.html" />
+    <link rel="prev" title="problems.multi_object_search.models package" href="problems.multi_object_search.models.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.multi_object_search.models.components package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.components.grid_map">problems.multi_object_search.models.components.grid_map module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.grid_map.GridMap"><code class="docutils literal notranslate"><span class="pre">GridMap</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.grid_map.GridMap.valid_motions"><code class="docutils literal notranslate"><span class="pre">GridMap.valid_motions()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.components.sensor">problems.multi_object_search.models.components.sensor module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.euclidean_dist"><code class="docutils literal notranslate"><span class="pre">euclidean_dist()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.to_rad"><code class="docutils literal notranslate"><span class="pre">to_rad()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.in_range"><code class="docutils literal notranslate"><span class="pre">in_range()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor"><code class="docutils literal notranslate"><span class="pre">Sensor</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor.LASER"><code class="docutils literal notranslate"><span class="pre">Sensor.LASER</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor.PROXIMITY"><code class="docutils literal notranslate"><span class="pre">Sensor.PROXIMITY</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor.observe"><code class="docutils literal notranslate"><span class="pre">Sensor.observe()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor.within_range"><code class="docutils literal notranslate"><span class="pre">Sensor.within_range()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor.sensing_region_size"><code class="docutils literal notranslate"><span class="pre">Sensor.sensing_region_size</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Sensor.robot_id"><code class="docutils literal notranslate"><span class="pre">Sensor.robot_id</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.in_field_of_view"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.in_field_of_view()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.within_range"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.within_range()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.shoot_beam"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.shoot_beam()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.valid_beam"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.valid_beam()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.observe"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.observe()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.sensing_region_size"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.sensing_region_size</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.components.sensor.ProximitySensor"><code class="docutils literal notranslate"><span class="pre">ProximitySensor</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+  <li><a href="problems.multi_object_search.models.html">problems.multi_object_search.models package</a><ul>
+      <li>Previous: <a href="problems.multi_object_search.models.html" title="previous chapter">problems.multi_object_search.models package</a></li>
+      <li>Next: <a href="problems.rocksample.html" title="next chapter">problems.rocksample package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-multi-object-search-models-components-package">
+<h1>problems.multi_object_search.models.components package<a class="headerlink" href="#problems-multi-object-search-models-components-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.multi_object_search.models.components.grid_map">
+<span id="problems-multi-object-search-models-components-grid-map-module"></span><h2>problems.multi_object_search.models.components.grid_map module<a class="headerlink" href="#module-problems.multi_object_search.models.components.grid_map" title="Link to this heading">¶</a></h2>
+<p>Optional grid map to assist collision avoidance during planning.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.grid_map.GridMap">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.grid_map.</span></span><span class="sig-name descname"><span class="pre">GridMap</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">width</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">length</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obstacles</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/grid_map.html#GridMap"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.grid_map.GridMap" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<p>This map assists the agent to avoid planning invalid
+actions that will run into obstacles. Used if we assume
+the agent has a map. This map does not contain information
+about the object locations.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.grid_map.GridMap.valid_motions">
+<span class="sig-name descname"><span class="pre">valid_motions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">all_motion_actions</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/grid_map.html#GridMap.valid_motions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.grid_map.GridMap.valid_motions" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a set of MotionAction(s) that are valid to
+be executed from robot pose (i.e. they will not bump
+into obstacles). The validity is determined under
+the assumption that the robot dynamics is deterministic.</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.models.components.sensor">
+<span id="problems-multi-object-search-models-components-sensor-module"></span><h2>problems.multi_object_search.models.components.sensor module<a class="headerlink" href="#module-problems.multi_object_search.models.components.sensor" title="Link to this heading">¶</a></h2>
+<p>Sensor model (for example, laser scanner)</p>
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.euclidean_dist">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.sensor.</span></span><span class="sig-name descname"><span class="pre">euclidean_dist</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">p1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">p2</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#euclidean_dist"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.euclidean_dist" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.to_rad">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.sensor.</span></span><span class="sig-name descname"><span class="pre">to_rad</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">deg</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#to_rad"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.to_rad" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.in_range">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.sensor.</span></span><span class="sig-name descname"><span class="pre">in_range</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">val</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rang</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#in_range"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.in_range" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.sensor.</span></span><span class="sig-name descname"><span class="pre">Sensor</span></span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Sensor"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor.LASER">
+<span class="sig-name descname"><span class="pre">LASER</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'laser'</span></em><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor.LASER" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor.PROXIMITY">
+<span class="sig-name descname"><span class="pre">PROXIMITY</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'proximity'</span></em><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor.PROXIMITY" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor.observe">
+<span class="sig-name descname"><span class="pre">observe</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">env_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Sensor.observe"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor.observe" title="Link to this definition">¶</a></dt>
+<dd><p>Returns an Observation with this sensor model.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor.within_range">
+<span class="sig-name descname"><span class="pre">within_range</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">point</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Sensor.within_range"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor.within_range" title="Link to this definition">¶</a></dt>
+<dd><p>Returns true if the point is within range of the sensor; but the point might not
+actually be visible due to occlusion or “gap” between beams</p>
+</dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor.sensing_region_size">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">sensing_region_size</span></span><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor.sensing_region_size" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Sensor.robot_id">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">robot_id</span></span><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Sensor.robot_id" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.sensor.</span></span><span class="sig-name descname"><span class="pre">Laser2DSensor</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fov</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">90</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">min_range</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_range</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">angle_increment</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">occlusion_enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Laser2DSensor"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<p>Fan shaped 2D laser sensor</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor.in_field_of_view">
+<span class="sig-name descname"><span class="pre">in_field_of_view</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">view_angles</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Laser2DSensor.in_field_of_view"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.in_field_of_view" title="Link to this definition">¶</a></dt>
+<dd><p>Determines if the beame at angle <cite>th</cite> is in a field of view of size <cite>view_angles</cite>.
+For example, the view_angles=180, means the range scanner scans 180 degrees
+in front of the robot. By our angle convention, 180 degrees maps to [0,90] and [270, 360].</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor.within_range">
+<span class="sig-name descname"><span class="pre">within_range</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">point</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Laser2DSensor.within_range"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.within_range" title="Link to this definition">¶</a></dt>
+<dd><p>Returns true if the point is within range of the sensor; but the point might not
+actually be visible due to occlusion or “gap” between beams</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor.shoot_beam">
+<span class="sig-name descname"><span class="pre">shoot_beam</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">point</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Laser2DSensor.shoot_beam"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.shoot_beam" title="Link to this definition">¶</a></dt>
+<dd><p>Shoots a beam from robot_pose at point. Returns the distance and bearing
+of the beame (i.e. the length and orientation of the beame)</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor.valid_beam">
+<span class="sig-name descname"><span class="pre">valid_beam</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dist</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bearing</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Laser2DSensor.valid_beam"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.valid_beam" title="Link to this definition">¶</a></dt>
+<dd><p>Returns true beam length (i.e. <cite>dist</cite>) is within range and its angle
+<cite>bearing</cite> is valid, that is, it is within the fov range and in
+accordance with the angle increment.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor.observe">
+<span class="sig-name descname"><span class="pre">observe</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">env_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#Laser2DSensor.observe"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.observe" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a MosObservation with this sensor model.</p>
+</dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.Laser2DSensor.sensing_region_size">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">sensing_region_size</span></span><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor.sensing_region_size" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.components.sensor.ProximitySensor">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.components.sensor.</span></span><span class="sig-name descname"><span class="pre">ProximitySensor</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">radius</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">occlusion_enabled</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/components/sensor.html#ProximitySensor"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.components.sensor.ProximitySensor" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.multi_object_search.models.components.sensor.Laser2DSensor" title="problems.multi_object_search.models.components.sensor.Laser2DSensor"><code class="xref py py-class docutils literal notranslate"><span class="pre">Laser2DSensor</span></code></a></p>
+<p>This is a simple sensor; Observes a region centered
+at the robot.</p>
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.models.components">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.multi_object_search.models.components" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.multi_object_search.models.components.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.multi_object_search.models.html b/docs/html/problems/problems.multi_object_search.models.html
new file mode 100644
index 00000000..c4988545
--- /dev/null
+++ b/docs/html/problems/problems.multi_object_search.models.html
@@ -0,0 +1,621 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.multi_object_search.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.multi_object_search.models.components package" href="problems.multi_object_search.models.components.html" />
+    <link rel="prev" title="problems.multi_object_search.env package" href="problems.multi_object_search.env.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.multi_object_search.models package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.observation_model">problems.multi_object_search.models.observation_model module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.MosObservationModel"><code class="docutils literal notranslate"><span class="pre">MosObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.MosObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">MosObservationModel.sample()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">ObjectObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.observation_model.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.policy_model">problems.multi_object_search.models.policy_model module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.policy_model.PolicyModel"><code class="docutils literal notranslate"><span class="pre">PolicyModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.policy_model.PolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">PolicyModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.policy_model.PolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">PolicyModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.policy_model.PolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">PolicyModel.argmax()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.policy_model.PolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">PolicyModel.get_all_actions()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.policy_model.PolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">PolicyModel.rollout()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.reward_model">problems.multi_object_search.models.reward_model module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.reward_model.MosRewardModel"><code class="docutils literal notranslate"><span class="pre">MosRewardModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.reward_model.MosRewardModel.probability"><code class="docutils literal notranslate"><span class="pre">MosRewardModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.reward_model.MosRewardModel.sample"><code class="docutils literal notranslate"><span class="pre">MosRewardModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.reward_model.MosRewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">MosRewardModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.reward_model.GoalRewardModel"><code class="docutils literal notranslate"><span class="pre">GoalRewardModel</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models.transition_model">problems.multi_object_search.models.transition_model module</a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.MosTransitionModel"><code class="docutils literal notranslate"><span class="pre">MosTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.MosTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">MosTransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.MosTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">MosTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">StaticObjectTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.if_move_by"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.if_move_by()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.argmax()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">RobotTransitionModel.sample()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.valid_pose"><code class="docutils literal notranslate"><span class="pre">valid_pose()</span></code></a></li>
+<li><a class="reference internal" href="#problems.multi_object_search.models.transition_model.in_boundary"><code class="docutils literal notranslate"><span class="pre">in_boundary()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.multi_object_search.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.multi_object_search.html">problems.multi_object_search package</a><ul>
+      <li>Previous: <a href="problems.multi_object_search.env.html" title="previous chapter">problems.multi_object_search.env package</a></li>
+      <li>Next: <a href="problems.multi_object_search.models.components.html" title="next chapter">problems.multi_object_search.models.components package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-multi-object-search-models-package">
+<h1>problems.multi_object_search.models package<a class="headerlink" href="#problems-multi-object-search-models-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.multi_object_search.models.components.html">problems.multi_object_search.models.components package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.components.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.components.html#module-problems.multi_object_search.models.components.grid_map">problems.multi_object_search.models.components.grid_map module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.grid_map.GridMap"><code class="docutils literal notranslate"><span class="pre">GridMap</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.grid_map.GridMap.valid_motions"><code class="docutils literal notranslate"><span class="pre">GridMap.valid_motions()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.components.html#module-problems.multi_object_search.models.components.sensor">problems.multi_object_search.models.components.sensor module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.euclidean_dist"><code class="docutils literal notranslate"><span class="pre">euclidean_dist()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.to_rad"><code class="docutils literal notranslate"><span class="pre">to_rad()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.in_range"><code class="docutils literal notranslate"><span class="pre">in_range()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor"><code class="docutils literal notranslate"><span class="pre">Sensor</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.LASER"><code class="docutils literal notranslate"><span class="pre">Sensor.LASER</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.PROXIMITY"><code class="docutils literal notranslate"><span class="pre">Sensor.PROXIMITY</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.observe"><code class="docutils literal notranslate"><span class="pre">Sensor.observe()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.within_range"><code class="docutils literal notranslate"><span class="pre">Sensor.within_range()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.sensing_region_size"><code class="docutils literal notranslate"><span class="pre">Sensor.sensing_region_size</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Sensor.robot_id"><code class="docutils literal notranslate"><span class="pre">Sensor.robot_id</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.in_field_of_view"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.in_field_of_view()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.within_range"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.within_range()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.shoot_beam"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.shoot_beam()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.valid_beam"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.valid_beam()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.observe"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.observe()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.Laser2DSensor.sensing_region_size"><code class="docutils literal notranslate"><span class="pre">Laser2DSensor.sensing_region_size</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.multi_object_search.models.components.html#problems.multi_object_search.models.components.sensor.ProximitySensor"><code class="docutils literal notranslate"><span class="pre">ProximitySensor</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.multi_object_search.models.components.html#module-problems.multi_object_search.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.multi_object_search.models.observation_model">
+<span id="problems-multi-object-search-models-observation-model-module"></span><h2>problems.multi_object_search.models.observation_model module<a class="headerlink" href="#module-problems.multi_object_search.models.observation_model" title="Link to this heading">¶</a></h2>
+<p>Defines the ObservationModel for the 2D Multi-Object Search domain.</p>
+<p>Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)
+(extensions: action space changes, different sensor model, gridworld instead of
+topological graph)</p>
+<dl class="simple">
+<dt>Observation: {objid<span class="classifier">pose(x,y) or NULL}. The sensor model could vary;</span></dt><dd><p>it could be a fan-shaped model as the original paper, or
+it could be something else. But the resulting observation
+should be a map from object id to observed pose or NULL (not observed).</p>
+</dd>
+</dl>
+<p>Observation Model</p>
+<blockquote>
+<div><p>The agent can observe its own state, as well as object poses
+that are within its sensor range. We only need to model object
+observation.</p>
+</div></blockquote>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.MosObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.observation_model.</span></span><span class="sig-name descname"><span class="pre">MosObservationModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">object_ids</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sigma</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.01</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#MosObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.MosObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOObservationModel" title="pomdp_py.framework.oopomdp.OOObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOObservationModel</span></code></a></p>
+<p>Object-oriented transition model</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.MosObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">argmax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#MosObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.MosObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns random observation</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.ObjectObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.observation_model.</span></span><span class="sig-name descname"><span class="pre">ObjectObservationModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sigma</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#ObjectObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel" title="pomdp_py.framework.basics.ObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObservationModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.ObjectObservationModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#ObjectObservationModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of Pr (observation | next_state, action).</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="../api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.observation.ObjectObservation" title="pomdp_py.problems.multi_object_search.domain.observation.ObjectObservation"><em>ObjectObservation</em></a>) – </p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – </p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – </p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.ObjectObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#ObjectObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns observation</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.ObjectObservationModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#ObjectObservationModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.ObjectObservationModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely observation</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.observation_model.unittest">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.observation_model.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/observation_model.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.observation_model.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.models.policy_model">
+<span id="problems-multi-object-search-models-policy-model-module"></span><h2>problems.multi_object_search.models.policy_model module<a class="headerlink" href="#module-problems.multi_object_search.models.policy_model" title="Link to this heading">¶</a></h2>
+<p>Policy model for 2D Multi-Object Search domain.
+It is optional for the agent to be equipped with an occupancy
+grid map of the environment.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.policy_model.PolicyModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.policy_model.</span></span><span class="sig-name descname"><span class="pre">PolicyModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/policy_model.html#PolicyModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.policy_model.PolicyModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RolloutPolicy" title="pomdp_py.algorithms.po_uct.RolloutPolicy"><code class="xref py py-class docutils literal notranslate"><span class="pre">RolloutPolicy</span></code></a></p>
+<p>Simple policy model. All actions are possible at any state.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.policy_model.PolicyModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/policy_model.html#PolicyModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.policy_model.PolicyModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns action randomly sampled according to the
+distribution of this policy model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the action <span class="math notranslate nohighlight">\(a\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action">Action</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.policy_model.PolicyModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/policy_model.html#PolicyModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.policy_model.PolicyModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\pi(a|s)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\pi(a|s)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.policy_model.PolicyModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/policy_model.html#PolicyModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.policy_model.PolicyModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely action</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.policy_model.PolicyModel.get_all_actions">
+<span class="sig-name descname"><span class="pre">get_all_actions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">history</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/policy_model.html#PolicyModel.get_all_actions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.policy_model.PolicyModel.get_all_actions" title="Link to this definition">¶</a></dt>
+<dd><p>note: find can only happen after look.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.policy_model.PolicyModel.rollout">
+<span class="sig-name descname"><span class="pre">rollout</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">State</span> <span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tuple</span> <span class="pre">history=None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/policy_model.html#PolicyModel.rollout"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.policy_model.PolicyModel.rollout" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.models.reward_model">
+<span id="problems-multi-object-search-models-reward-model-module"></span><h2>problems.multi_object_search.models.reward_model module<a class="headerlink" href="#module-problems.multi_object_search.models.reward_model" title="Link to this heading">¶</a></h2>
+<p>Reward model for 2D Multi-object Search domain</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.reward_model.MosRewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.reward_model.</span></span><span class="sig-name descname"><span class="pre">MosRewardModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">target_objects</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_id</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/reward_model.html#MosRewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.reward_model.MosRewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.reward_model.MosRewardModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/reward_model.html#MosRewardModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.reward_model.MosRewardModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>reward</strong> (<em>float</em>) – the reward <span class="math notranslate nohighlight">\(r\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.reward_model.MosRewardModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/reward_model.html#MosRewardModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.reward_model.MosRewardModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns reward randomly sampled according to the
+distribution of this reward model. This is required,
+i.e. assumed to be implemented for a reward model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the reward <span class="math notranslate nohighlight">\(r\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.reward_model.MosRewardModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_id</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/reward_model.html#MosRewardModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.reward_model.MosRewardModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.reward_model.GoalRewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.reward_model.</span></span><span class="sig-name descname"><span class="pre">GoalRewardModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">target_objects</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_id</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/reward_model.html#GoalRewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.reward_model.GoalRewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.multi_object_search.models.reward_model.MosRewardModel" title="problems.multi_object_search.models.reward_model.MosRewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">MosRewardModel</span></code></a></p>
+<p>This is a reward where the agent gets reward only for detect-related actions.</p>
+</dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.models.transition_model">
+<span id="problems-multi-object-search-models-transition-model-module"></span><h2>problems.multi_object_search.models.transition_model module<a class="headerlink" href="#module-problems.multi_object_search.models.transition_model" title="Link to this heading">¶</a></h2>
+<p>Defines the TransitionModel for the 2D Multi-Object Search domain.</p>
+<p>Origin: Multi-Object Search using Object-Oriented POMDPs (ICRA 2019)
+(extensions: action space changes, different sensor model, gridworld instead of
+topological graph)</p>
+<p>Description: Multi-Object Search in a 2D grid world.</p>
+<p>Transition: deterministic</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.MosTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.transition_model.</span></span><span class="sig-name descname"><span class="pre">MosTransitionModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sensors</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">object_ids</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1e-09</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#MosTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.MosTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.oopomdp.OOTransitionModel" title="pomdp_py.framework.oopomdp.OOTransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">OOTransitionModel</span></code></a></p>
+<p>Object-oriented transition model; The transition model supports the
+multi-robot case, where each robot is equipped with a sensor; The
+multi-robot transition model should be used by the Environment, but
+not necessarily by each robot for planning.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.MosTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">argmax</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#MosTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.MosTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns random next_state</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.MosTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#MosTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.MosTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.StaticObjectTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.transition_model.</span></span><span class="sig-name descname"><span class="pre">StaticObjectTransitionModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">objid</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1e-09</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#StaticObjectTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<p>This model assumes the object is static.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#StaticObjectTransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#StaticObjectTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next_object_state</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#StaticObjectTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.StaticObjectTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next object_state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.RobotTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.transition_model.</span></span><span class="sig-name descname"><span class="pre">RobotTransitionModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">sensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">epsilon</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1e-09</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#RobotTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<p>We assume that the robot control is perfect and transitions are deterministic.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.RobotTransitionModel.if_move_by">
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">if_move_by</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_id</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dim</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">check_collision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#RobotTransitionModel.if_move_by"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.if_move_by" title="Link to this definition">¶</a></dt>
+<dd><p>Defines the dynamics of robot motion;
+dim (tuple): the width, length of the search world.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.RobotTransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#RobotTransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.RobotTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#RobotTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next robot_state</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.RobotTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#RobotTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.RobotTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next_robot_state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.valid_pose">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.transition_model.</span></span><span class="sig-name descname"><span class="pre">valid_pose</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">width</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">length</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">check_collision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pose_objid</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#valid_pose"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.valid_pose" title="Link to this definition">¶</a></dt>
+<dd><p>Returns True if the given <cite>pose</cite> (x,y) is a valid pose;
+If <cite>check_collision</cite> is True, then the pose is only valid
+if it is not overlapping with any object pose in the environment state.</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.multi_object_search.models.transition_model.in_boundary">
+<span class="sig-prename descclassname"><span class="pre">problems.multi_object_search.models.transition_model.</span></span><span class="sig-name descname"><span class="pre">in_boundary</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">pose</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">width</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">length</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/multi_object_search/models/transition_model.html#in_boundary"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.multi_object_search.models.transition_model.in_boundary" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.multi_object_search.models">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.multi_object_search.models" title="Link to this heading">¶</a></h2>
+<p><strong>Defines models, including transition, observation, reward, policy; Also
+includes additional components such as the sensor model and grid map.</strong></p>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.multi_object_search.models.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.rocksample.cythonize.html b/docs/html/problems/problems.rocksample.cythonize.html
new file mode 100644
index 00000000..6f1d0e0a
--- /dev/null
+++ b/docs/html/problems/problems.rocksample.cythonize.html
@@ -0,0 +1,249 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.rocksample.cythonize package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tag package" href="problems.tag.html" />
+    <link rel="prev" title="problems.rocksample package" href="problems.rocksample.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.rocksample.cythonize package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.rocksample.cythonize.rocksample_problem">problems.rocksample.cythonize.rocksample_problem module</a></li>
+<li><a class="reference internal" href="#id1">problems.rocksample.cythonize.rocksample_problem module</a></li>
+<li><a class="reference internal" href="#problems-rocksample-cythonize-run-rocksample-module">problems.rocksample.cythonize.run_rocksample module</a></li>
+<li><a class="reference internal" href="#module-problems.rocksample.cythonize">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.rocksample.html">problems.rocksample package</a><ul>
+      <li>Previous: <a href="problems.rocksample.html" title="previous chapter">problems.rocksample package</a></li>
+      <li>Next: <a href="problems.tag.html" title="next chapter">problems.tag package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-rocksample-cythonize-package">
+<h1>problems.rocksample.cythonize package<a class="headerlink" href="#problems-rocksample-cythonize-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.rocksample.cythonize.rocksample_problem">
+<span id="problems-rocksample-cythonize-rocksample-problem-module"></span><h2>problems.rocksample.cythonize.rocksample_problem module<a class="headerlink" href="#module-problems.rocksample.cythonize.rocksample_problem" title="Link to this heading">¶</a></h2>
+<p>RockSample(n,k) problem</p>
+<p>Origin: Heuristic Search Value Iteration for POMDPs (UAI 2004)</p>
+<p>Description:</p>
+<p>State space:</p>
+<blockquote>
+<div><p>Position {(1,1),(1,2),…(n,n)}
+<span class="math notranslate nohighlight">\(\times\)</span> RockType_1 <span class="math notranslate nohighlight">\(\times\)</span> RockType_2, …, <span class="math notranslate nohighlight">\(\times\)</span> RockType_k
+where RockType_i = {Good, Bad}
+<span class="math notranslate nohighlight">\(\times\)</span> TerminalState</p>
+<dl class="simple">
+<dt>(basically, the positions of rocks are known to the robot,</dt><dd><p>but not represented explicitly in the state space. Check_i
+will smartly check the rock i at its location.)</p>
+</dd>
+</dl>
+</div></blockquote>
+<p>Action space:</p>
+<blockquote>
+<div><p>North, South, East, West, Sample, Check_1, …, Check_k
+The first four moves the agent deterministically
+Sample: samples the rock at agent’s current location
+Check_i: receives a noisy observation about RockType_i
+(noise determined by eta (<span class="math notranslate nohighlight">\(\eta\)</span>). eta=1 -&gt; perfect sensor; eta=0 -&gt; uniform)</p>
+</div></blockquote>
+<p>Observation: observes the property of rock i when taking Check_i.</p>
+<dl class="simple">
+<dt>Reward: +10 for Sample a good rock. -10 for Sampling a bad rock.</dt><dd><p>Move to exit area +10. Other actions have no cost or reward.</p>
+</dd>
+</dl>
+<p>Initial belief: every rock has equal probability of being Good or Bad.</p>
+</section>
+<section id="id1">
+<h2>problems.rocksample.cythonize.rocksample_problem module<a class="headerlink" href="#id1" title="Link to this heading">¶</a></h2>
+<p id="module-0">RockSample(n,k) problem</p>
+<p>Origin: Heuristic Search Value Iteration for POMDPs (UAI 2004)</p>
+<p>Description:</p>
+<p>State space:</p>
+<blockquote>
+<div><p>Position {(1,1),(1,2),…(n,n)}
+<span class="math notranslate nohighlight">\(\times\)</span> RockType_1 <span class="math notranslate nohighlight">\(\times\)</span> RockType_2, …, <span class="math notranslate nohighlight">\(\times\)</span> RockType_k
+where RockType_i = {Good, Bad}
+<span class="math notranslate nohighlight">\(\times\)</span> TerminalState</p>
+<dl class="simple">
+<dt>(basically, the positions of rocks are known to the robot,</dt><dd><p>but not represented explicitly in the state space. Check_i
+will smartly check the rock i at its location.)</p>
+</dd>
+</dl>
+</div></blockquote>
+<p>Action space:</p>
+<blockquote>
+<div><p>North, South, East, West, Sample, Check_1, …, Check_k
+The first four moves the agent deterministically
+Sample: samples the rock at agent’s current location
+Check_i: receives a noisy observation about RockType_i
+(noise determined by eta (<span class="math notranslate nohighlight">\(\eta\)</span>). eta=1 -&gt; perfect sensor; eta=0 -&gt; uniform)</p>
+</div></blockquote>
+<p>Observation: observes the property of rock i when taking Check_i.</p>
+<dl class="simple">
+<dt>Reward: +10 for Sample a good rock. -10 for Sampling a bad rock.</dt><dd><p>Move to exit area +10. Other actions have no cost or reward.</p>
+</dd>
+</dl>
+<p>Initial belief: every rock has equal probability of being Good or Bad.</p>
+</section>
+<section id="problems-rocksample-cythonize-run-rocksample-module">
+<h2>problems.rocksample.cythonize.run_rocksample module<a class="headerlink" href="#problems-rocksample-cythonize-run-rocksample-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.rocksample.cythonize">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.rocksample.cythonize" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.rocksample.cythonize.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.rocksample.html b/docs/html/problems/problems.rocksample.html
new file mode 100644
index 00000000..7a4bcdec
--- /dev/null
+++ b/docs/html/problems/problems.rocksample.html
@@ -0,0 +1,657 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.rocksample package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.rocksample.cythonize package" href="problems.rocksample.cythonize.html" />
+    <link rel="prev" title="problems.multi_object_search.models.components package" href="problems.multi_object_search.models.components.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.rocksample package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.rocksample.rocksample_problem">problems.rocksample.rocksample_problem module</a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.euclidean_dist"><code class="docutils literal notranslate"><span class="pre">euclidean_dist()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockType"><code class="docutils literal notranslate"><span class="pre">RockType</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockType.GOOD"><code class="docutils literal notranslate"><span class="pre">RockType.GOOD</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockType.BAD"><code class="docutils literal notranslate"><span class="pre">RockType.BAD</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockType.invert"><code class="docutils literal notranslate"><span class="pre">RockType.invert()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockType.random"><code class="docutils literal notranslate"><span class="pre">RockType.random()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.State"><code class="docutils literal notranslate"><span class="pre">State</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.Action"><code class="docutils literal notranslate"><span class="pre">Action</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.MoveAction"><code class="docutils literal notranslate"><span class="pre">MoveAction</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.MoveAction.EAST"><code class="docutils literal notranslate"><span class="pre">MoveAction.EAST</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.MoveAction.WEST"><code class="docutils literal notranslate"><span class="pre">MoveAction.WEST</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.MoveAction.NORTH"><code class="docutils literal notranslate"><span class="pre">MoveAction.NORTH</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.MoveAction.SOUTH"><code class="docutils literal notranslate"><span class="pre">MoveAction.SOUTH</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.SampleAction"><code class="docutils literal notranslate"><span class="pre">SampleAction</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.CheckAction"><code class="docutils literal notranslate"><span class="pre">CheckAction</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.Observation"><code class="docutils literal notranslate"><span class="pre">Observation</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSTransitionModel"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSObservationModel"><code class="docutils literal notranslate"><span class="pre">RSObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">RSObservationModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">RSObservationModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSRewardModel"><code class="docutils literal notranslate"><span class="pre">RSRewardModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSRewardModel.sample"><code class="docutils literal notranslate"><span class="pre">RSRewardModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSRewardModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSRewardModel.argmax()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSRewardModel.probability"><code class="docutils literal notranslate"><span class="pre">RSRewardModel.probability()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSPolicyModel"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSPolicyModel.probability"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSPolicyModel.argmax"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.argmax()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.get_all_actions()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RSPolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">RSPolicyModel.rollout()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockSampleProblem"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem</span></code></a><ul>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.random_free_location()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.in_exit_area()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.generate_instance()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.RockSampleProblem.print_state"><code class="docutils literal notranslate"><span class="pre">RockSampleProblem.print_state()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.init_particles_belief"><code class="docutils literal notranslate"><span class="pre">init_particles_belief()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.minimal_instance"><code class="docutils literal notranslate"><span class="pre">minimal_instance()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.create_instance"><code class="docutils literal notranslate"><span class="pre">create_instance()</span></code></a></li>
+<li><a class="reference internal" href="#problems.rocksample.rocksample_problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.rocksample">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.multi_object_search.models.components.html" title="previous chapter">problems.multi_object_search.models.components package</a></li>
+      <li>Next: <a href="problems.rocksample.cythonize.html" title="next chapter">problems.rocksample.cythonize package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-rocksample-package">
+<h1>problems.rocksample package<a class="headerlink" href="#problems-rocksample-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.rocksample.cythonize.html">problems.rocksample.cythonize package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.cythonize.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.cythonize.html#module-problems.rocksample.cythonize.rocksample_problem">problems.rocksample.cythonize.rocksample_problem module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.cythonize.html#id1">problems.rocksample.cythonize.rocksample_problem module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.cythonize.html#problems-rocksample-cythonize-run-rocksample-module">problems.rocksample.cythonize.run_rocksample module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.rocksample.cythonize.html#module-problems.rocksample.cythonize">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.rocksample.rocksample_problem">
+<span id="problems-rocksample-rocksample-problem-module"></span><h2>problems.rocksample.rocksample_problem module<a class="headerlink" href="#module-problems.rocksample.rocksample_problem" title="Link to this heading">¶</a></h2>
+<p>RockSample(n,k) problem</p>
+<p>Origin: Heuristic Search Value Iteration for POMDPs (UAI 2004)</p>
+<p>Description:</p>
+<p>State space:</p>
+<blockquote>
+<div><p>Position {(1,1),(1,2),…(n,n)}
+<span class="math notranslate nohighlight">\(\times\)</span> RockType_1 <span class="math notranslate nohighlight">\(\times\)</span> RockType_2, …, <span class="math notranslate nohighlight">\(\times\)</span> RockType_k
+where RockType_i = {Good, Bad}
+<span class="math notranslate nohighlight">\(\times\)</span> TerminalState</p>
+<dl class="simple">
+<dt>(basically, the positions of rocks are known to the robot,</dt><dd><p>but not represented explicitly in the state space. Check_i
+will smartly check the rock i at its location.)</p>
+</dd>
+</dl>
+</div></blockquote>
+<p>Action space:</p>
+<blockquote>
+<div><p>North, South, East, West, Sample, Check_1, …, Check_k
+The first four moves the agent deterministically
+Sample: samples the rock at agent’s current location
+Check_i: receives a noisy observation about RockType_i
+(noise determined by eta (<span class="math notranslate nohighlight">\(\eta\)</span>). eta=1 -&gt; perfect sensor; eta=0 -&gt; uniform)</p>
+</div></blockquote>
+<dl class="simple">
+<dt>Observation: observes the property of rock i when taking Check_i.  The</dt><dd><p>observation may be noisy, depending on an efficiency parameter which
+decreases exponentially as the distance increases between the rover and
+rock i. ‘half_efficiency_dist’ influences this parameter (larger, more robust)</p>
+</dd>
+<dt>Reward: +10 for Sample a good rock. -10 for Sampling a bad rock.</dt><dd><p>Move to exit area +10. Other actions have no cost or reward.</p>
+</dd>
+</dl>
+<p>Initial belief: every rock has equal probability of being Good or Bad.</p>
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.euclidean_dist">
+<span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">euclidean_dist</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">p1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">p2</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#euclidean_dist"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.euclidean_dist" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockType">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RockType</span></span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockType"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockType" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockType.GOOD">
+<span class="sig-name descname"><span class="pre">GOOD</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'good'</span></em><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockType.GOOD" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockType.BAD">
+<span class="sig-name descname"><span class="pre">BAD</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">'bad'</span></em><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockType.BAD" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockType.invert">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">invert</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">rocktype</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockType.invert"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockType.invert" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockType.random">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">random</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">p</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockType.random"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockType.random" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.State">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">State</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rocktypes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">terminal</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#State"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.State" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><code class="xref py py-class docutils literal notranslate"><span class="pre">State</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.Action">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">Action</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#Action"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.Action" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.MoveAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">MoveAction</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">motion</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#MoveAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.MoveAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.rocksample.rocksample_problem.Action" title="problems.rocksample.rocksample_problem.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.MoveAction.EAST">
+<span class="sig-name descname"><span class="pre">EAST</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(1,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.rocksample.rocksample_problem.MoveAction.EAST" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.MoveAction.WEST">
+<span class="sig-name descname"><span class="pre">WEST</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(-1,</span> <span class="pre">0)</span></em><a class="headerlink" href="#problems.rocksample.rocksample_problem.MoveAction.WEST" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.MoveAction.NORTH">
+<span class="sig-name descname"><span class="pre">NORTH</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">-1)</span></em><a class="headerlink" href="#problems.rocksample.rocksample_problem.MoveAction.NORTH" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.MoveAction.SOUTH">
+<span class="sig-name descname"><span class="pre">SOUTH</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">(0,</span> <span class="pre">1)</span></em><a class="headerlink" href="#problems.rocksample.rocksample_problem.MoveAction.SOUTH" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.SampleAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">SampleAction</span></span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#SampleAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.SampleAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.rocksample.rocksample_problem.Action" title="problems.rocksample.rocksample_problem.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.CheckAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">CheckAction</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">rock_id</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#CheckAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.CheckAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="#problems.rocksample.rocksample_problem.Action" title="problems.rocksample.rocksample_problem.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.Observation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">Observation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">quality</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#Observation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.Observation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RSTransitionModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rock_locs</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">in_exit_area</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<p>The model is deterministic</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSTransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSTransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSTransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next state randomly sampled according to the
+distribution of this transition model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the next state <span class="math notranslate nohighlight">\(s'\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="#problems.rocksample.rocksample_problem.State" title="problems.rocksample.rocksample_problem.State">State</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next state</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RSObservationModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">rock_locs</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">half_efficiency_dist</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel" title="pomdp_py.framework.basics.ObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObservationModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSObservationModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSObservationModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSObservationModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><em>Observation</em></a>) – the observation <span class="math notranslate nohighlight">\(o\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns observation randomly sampled according to the
+distribution of this observation model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the observation <span class="math notranslate nohighlight">\(o\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="#problems.rocksample.rocksample_problem.Observation" title="problems.rocksample.rocksample_problem.Observation">Observation</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSObservationModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSObservationModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSObservationModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely observation</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSRewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RSRewardModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">rock_locs</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">in_exit_area</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSRewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSRewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSRewardModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSRewardModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSRewardModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns reward randomly sampled according to the
+distribution of this reward model. This is required,
+i.e. assumed to be implemented for a reward model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="#problems.rocksample.rocksample_problem.State" title="problems.rocksample.rocksample_problem.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the reward <span class="math notranslate nohighlight">\(r\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSRewardModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSRewardModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSRewardModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward. This is optional.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSRewardModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSRewardModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSRewardModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>reward</strong> (<em>float</em>) – the reward <span class="math notranslate nohighlight">\(r\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="#problems.rocksample.rocksample_problem.State" title="problems.rocksample.rocksample_problem.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSPolicyModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RSPolicyModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSPolicyModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSPolicyModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RolloutPolicy" title="pomdp_py.algorithms.po_uct.RolloutPolicy"><code class="xref py py-class docutils literal notranslate"><span class="pre">RolloutPolicy</span></code></a></p>
+<p>Simple policy model according to problem description.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSPolicyModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSPolicyModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSPolicyModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns action randomly sampled according to the
+distribution of this policy model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the action <span class="math notranslate nohighlight">\(a\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="#problems.rocksample.rocksample_problem.Action" title="problems.rocksample.rocksample_problem.Action">Action</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSPolicyModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSPolicyModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSPolicyModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\pi(a|s)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\pi(a|s)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSPolicyModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalized</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSPolicyModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSPolicyModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely reward</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions">
+<span class="sig-name descname"><span class="pre">get_all_actions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSPolicyModel.get_all_actions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a set of all possible actions, if feasible.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RSPolicyModel.rollout">
+<span class="sig-name descname"><span class="pre">rollout</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">State</span> <span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tuple</span> <span class="pre">history=None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RSPolicyModel.rollout"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RSPolicyModel.rollout" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockSampleProblem">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">RockSampleProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rock_locs</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">half_efficiency_dist</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">20</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockSampleProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockSampleProblem" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">random_free_location</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">not_free_locs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockSampleProblem.random_free_location"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location" title="Link to this definition">¶</a></dt>
+<dd><p>returns a random (x,y) location in nxn grid that is free.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area">
+<span class="sig-name descname"><span class="pre">in_exit_area</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">pos</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockSampleProblem.in_exit_area"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">generate_instance</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockSampleProblem.generate_instance"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance" title="Link to this definition">¶</a></dt>
+<dd><p>Returns init_state and rock locations for an instance of RockSample(n,k)</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.RockSampleProblem.print_state">
+<span class="sig-name descname"><span class="pre">print_state</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#RockSampleProblem.print_state"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.RockSampleProblem.print_state" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.test_planner">
+<span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">test_planner</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">rocksample</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">nsteps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.95</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#test_planner"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.test_planner" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.init_particles_belief">
+<span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">init_particles_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'uniform'</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#init_particles_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.init_particles_belief" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.minimal_instance">
+<span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">minimal_instance</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#minimal_instance"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.minimal_instance" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.create_instance">
+<span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">create_instance</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">k</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#create_instance"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.create_instance" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.rocksample.rocksample_problem.main">
+<span class="sig-prename descclassname"><span class="pre">problems.rocksample.rocksample_problem.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/rocksample/rocksample_problem.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.rocksample.rocksample_problem.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.rocksample">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.rocksample" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.rocksample.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tag.agent.html b/docs/html/problems/problems.tag.agent.html
new file mode 100644
index 00000000..cf4b3b05
--- /dev/null
+++ b/docs/html/problems/problems.tag.agent.html
@@ -0,0 +1,238 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tag.agent package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tag.domain package" href="problems.tag.domain.html" />
+    <link rel="prev" title="problems.tag package" href="problems.tag.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tag.agent package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tag.agent.agent">problems.tag.agent.agent module</a><ul>
+<li><a class="reference internal" href="#problems.tag.agent.agent.initialize_belief"><code class="docutils literal notranslate"><span class="pre">initialize_belief()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.agent.agent.initialize_particles_belief"><code class="docutils literal notranslate"><span class="pre">initialize_particles_belief()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.agent.agent.belief_update"><code class="docutils literal notranslate"><span class="pre">belief_update()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.agent.agent.TagAgent"><code class="docutils literal notranslate"><span class="pre">TagAgent</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.agent.agent.TagAgent.clear_history"><code class="docutils literal notranslate"><span class="pre">TagAgent.clear_history()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.agent">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.tag.html">problems.tag package</a><ul>
+      <li>Previous: <a href="problems.tag.html" title="previous chapter">problems.tag package</a></li>
+      <li>Next: <a href="problems.tag.domain.html" title="next chapter">problems.tag.domain package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tag-agent-package">
+<h1>problems.tag.agent package<a class="headerlink" href="#problems-tag-agent-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.agent.agent">
+<span id="problems-tag-agent-agent-module"></span><h2>problems.tag.agent.agent module<a class="headerlink" href="#module-problems.tag.agent.agent" title="Link to this heading">¶</a></h2>
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.agent.agent.initialize_belief">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.agent.agent.</span></span><span class="sig-name descname"><span class="pre">initialize_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/agent/agent.html#initialize_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.agent.agent.initialize_belief" title="Link to this definition">¶</a></dt>
+<dd><p>Initialize belief.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>grid_map</strong> (<a class="reference internal" href="../api/pomdp_py.problems.multi_object_search.models.components.html#pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap" title="pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap"><em>GridMap</em></a>) – Holds information of the map occupancy</p></li>
+<li><p><strong>prior</strong> (<em>dict</em>) – A map from (x,y)-&gt;[0,1]. If empty, the belief
+will be uniform.</p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.agent.agent.initialize_particles_belief">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.agent.agent.</span></span><span class="sig-name descname"><span class="pre">initialize_particles_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">100</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/agent/agent.html#initialize_particles_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.agent.agent.initialize_particles_belief" title="Link to this definition">¶</a></dt>
+<dd><p>Initialize belief.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>grid_map</strong> (<a class="reference internal" href="../api/pomdp_py.problems.multi_object_search.models.components.html#pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap" title="pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap"><em>GridMap</em></a>) – Holds information of the map occupancy</p></li>
+<li><p><strong>prior</strong> (<em>dict</em>) – A map from (x,y)-&gt;[0,1]. If empty, the belief
+will be uniform.</p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.agent.agent.belief_update">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.agent.agent.</span></span><span class="sig-name descname"><span class="pre">belief_update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">agent</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">real_observation</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/agent/agent.html#belief_update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.agent.agent.belief_update" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.agent.agent.TagAgent">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.agent.agent.</span></span><span class="sig-name descname"><span class="pre">TagAgent</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pr_stay</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/agent/agent.html#TagAgent"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.agent.agent.TagAgent" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Agent" title="pomdp_py.framework.basics.Agent"><code class="xref py py-class docutils literal notranslate"><span class="pre">Agent</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.agent.agent.TagAgent.clear_history">
+<span class="sig-name descname"><span class="pre">clear_history</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/agent/agent.html#TagAgent.clear_history"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.agent.agent.TagAgent.clear_history" title="Link to this definition">¶</a></dt>
+<dd><p>Custum function; clear history</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.agent">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tag.agent" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tag.agent.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tag.domain.html b/docs/html/problems/problems.tag.domain.html
new file mode 100644
index 00000000..6670d154
--- /dev/null
+++ b/docs/html/problems/problems.tag.domain.html
@@ -0,0 +1,229 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tag.domain package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tag.env package" href="problems.tag.env.html" />
+    <link rel="prev" title="problems.tag.agent package" href="problems.tag.agent.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tag.domain package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tag.domain.action">problems.tag.domain.action module</a><ul>
+<li><a class="reference internal" href="#problems.tag.domain.action.TagAction"><code class="docutils literal notranslate"><span class="pre">TagAction</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.domain.observation">problems.tag.domain.observation module</a><ul>
+<li><a class="reference internal" href="#problems.tag.domain.observation.TagObservation"><code class="docutils literal notranslate"><span class="pre">TagObservation</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.domain.state">problems.tag.domain.state module</a><ul>
+<li><a class="reference internal" href="#problems.tag.domain.state.TagState"><code class="docutils literal notranslate"><span class="pre">TagState</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.domain">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.tag.html">problems.tag package</a><ul>
+      <li>Previous: <a href="problems.tag.agent.html" title="previous chapter">problems.tag.agent package</a></li>
+      <li>Next: <a href="problems.tag.env.html" title="next chapter">problems.tag.env package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tag-domain-package">
+<h1>problems.tag.domain package<a class="headerlink" href="#problems-tag-domain-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.domain.action">
+<span id="problems-tag-domain-action-module"></span><h2>problems.tag.domain.action module<a class="headerlink" href="#module-problems.tag.domain.action" title="Link to this heading">¶</a></h2>
+<p>The Tag problem. Implemented according to the paper <a class="reference external" href="https://arxiv.org/pdf/1110.0027.pdf">Anytime Point-Based
+Approximations for Large POMDPs</a>.</p>
+<p>Action space: The agent can take motion action and a tag action.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.domain.action.TagAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.domain.action.</span></span><span class="sig-name descname"><span class="pre">TagAction</span></span><a class="reference internal" href="../_modules/problems/tag/domain/action.html#TagAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.domain.action.TagAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.problems.multi_object_search.domain.html#pomdp_py.problems.multi_object_search.domain.action.Action" title="pomdp_py.problems.multi_object_search.domain.action.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.domain.observation">
+<span id="problems-tag-domain-observation-module"></span><h2>problems.tag.domain.observation module<a class="headerlink" href="#module-problems.tag.domain.observation" title="Link to this heading">¶</a></h2>
+<p>The Tag problem. Implemented according to the paper <a class="reference external" href="https://arxiv.org/pdf/1110.0027.pdf">Anytime Point-Based
+Approximations for Large POMDPs</a>.</p>
+<dl class="simple">
+<dt>Observation space: the agent observes the target’s location when the agent and</dt><dd><p>the target are in the same cell.</p>
+</dd>
+</dl>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.domain.observation.TagObservation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.domain.observation.</span></span><span class="sig-name descname"><span class="pre">TagObservation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">target_position</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/domain/observation.html#TagObservation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.domain.observation.TagObservation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.domain.state">
+<span id="problems-tag-domain-state-module"></span><h2>problems.tag.domain.state module<a class="headerlink" href="#module-problems.tag.domain.state" title="Link to this heading">¶</a></h2>
+<p>The Tag problem. Implemented according to the paper <a class="reference external" href="https://arxiv.org/pdf/1110.0027.pdf">Anytime Point-Based
+Approximations for Large POMDPs</a>.</p>
+<p>State space: state of the robot (x,y), state of the person (x,y), person found.</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.domain.state.TagState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.domain.state.</span></span><span class="sig-name descname"><span class="pre">TagState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_found</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/domain/state.html#TagState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.domain.state.TagState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><code class="xref py py-class docutils literal notranslate"><span class="pre">State</span></code></a></p>
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.domain">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tag.domain" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tag.domain.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tag.env.html b/docs/html/problems/problems.tag.env.html
new file mode 100644
index 00000000..08dcafa9
--- /dev/null
+++ b/docs/html/problems/problems.tag.env.html
@@ -0,0 +1,327 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tag.env package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tag.models package" href="problems.tag.models.html" />
+    <link rel="prev" title="problems.tag.domain package" href="problems.tag.domain.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tag.env package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tag.env.env">problems.tag.env.env module</a><ul>
+<li><a class="reference internal" href="#problems.tag.env.env.TagEnvironment"><code class="docutils literal notranslate"><span class="pre">TagEnvironment</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.env.env.TagEnvironment.width"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.width</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.env.TagEnvironment.length"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.length</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.env.TagEnvironment.grid_map"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.grid_map</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.env.TagEnvironment.from_str"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.from_str()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.env.visual">problems.tag.env.visual module</a><ul>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz"><code class="docutils literal notranslate"><span class="pre">TagViz</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.img_width"><code class="docutils literal notranslate"><span class="pre">TagViz.img_width</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.img_height"><code class="docutils literal notranslate"><span class="pre">TagViz.img_height</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.last_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.last_observation</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.update"><code class="docutils literal notranslate"><span class="pre">TagViz.update()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_robot()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_observation()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_belief()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.on_init"><code class="docutils literal notranslate"><span class="pre">TagViz.on_init()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.on_event"><code class="docutils literal notranslate"><span class="pre">TagViz.on_event()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.on_loop"><code class="docutils literal notranslate"><span class="pre">TagViz.on_loop()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.on_render"><code class="docutils literal notranslate"><span class="pre">TagViz.on_render()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">TagViz.on_cleanup()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.on_execute"><code class="docutils literal notranslate"><span class="pre">TagViz.on_execute()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.env.visual.TagViz.render_env"><code class="docutils literal notranslate"><span class="pre">TagViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tag.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.env">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.tag.html">problems.tag package</a><ul>
+      <li>Previous: <a href="problems.tag.domain.html" title="previous chapter">problems.tag.domain package</a></li>
+      <li>Next: <a href="problems.tag.models.html" title="next chapter">problems.tag.models package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tag-env-package">
+<h1>problems.tag.env package<a class="headerlink" href="#problems-tag-env-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.env.env">
+<span id="problems-tag-env-env-module"></span><h2>problems.tag.env.env module<a class="headerlink" href="#module-problems.tag.env.env" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.env.env.TagEnvironment">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.env.env.</span></span><span class="sig-name descname"><span class="pre">TagEnvironment</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pr_stay</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/env.html#TagEnvironment"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.env.TagEnvironment" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Environment" title="pomdp_py.framework.basics.Environment"><code class="xref py py-class docutils literal notranslate"><span class="pre">Environment</span></code></a></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.tag.env.env.TagEnvironment.width">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">width</span></span><a class="headerlink" href="#problems.tag.env.env.TagEnvironment.width" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.tag.env.env.TagEnvironment.length">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">length</span></span><a class="headerlink" href="#problems.tag.env.env.TagEnvironment.length" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.tag.env.env.TagEnvironment.grid_map">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">grid_map</span></span><a class="headerlink" href="#problems.tag.env.env.TagEnvironment.grid_map" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.env.TagEnvironment.from_str">
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">from_str</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldstr</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/env.html#TagEnvironment.from_str"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.env.TagEnvironment.from_str" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.env.visual">
+<span id="problems-tag-env-visual-module"></span><h2>problems.tag.env.visual module<a class="headerlink" href="#module-problems.tag.env.visual" title="Link to this heading">¶</a></h2>
+<p>Largely based on MosViz, except this is not an OO-POMDP</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.env.visual.</span></span><span class="sig-name descname"><span class="pre">TagViz</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">env</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">res</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">30</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">controllable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation_model</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.img_width">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_width</span></span><a class="headerlink" href="#problems.tag.env.visual.TagViz.img_width" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.img_height">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">img_height</span></span><a class="headerlink" href="#problems.tag.env.visual.TagViz.img_height" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py property">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.last_observation">
+<em class="property"><span class="pre">property</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">last_observation</span></span><a class="headerlink" href="#problems.tag.env.visual.TagViz.last_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.update">
+<span class="sig-name descname"><span class="pre">update</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.update"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.update" title="Link to this definition">¶</a></dt>
+<dd><p>Update the visualization after there is new real action and observation
+and updated belief.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.draw_robot">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_robot</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">y</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">th</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(255,</span> <span class="pre">12,</span> <span class="pre">12)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.draw_robot"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.draw_robot" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.draw_observation">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_observation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">z</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rx</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">ry</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rth</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">color</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">(12,</span> <span class="pre">12,</span> <span class="pre">255)</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.draw_observation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.draw_observation" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.draw_belief">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">draw_belief</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">img</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">r</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_color</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.draw_belief"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.draw_belief" title="Link to this definition">¶</a></dt>
+<dd><p>belief (OOBelief)</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.on_init">
+<span class="sig-name descname"><span class="pre">on_init</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.on_init"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.on_init" title="Link to this definition">¶</a></dt>
+<dd><p>pygame init</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.on_event">
+<span class="sig-name descname"><span class="pre">on_event</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">event</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.on_event"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.on_event" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.on_loop">
+<span class="sig-name descname"><span class="pre">on_loop</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.on_loop"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.on_loop" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.on_render">
+<span class="sig-name descname"><span class="pre">on_render</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.on_render"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.on_render" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.on_cleanup">
+<span class="sig-name descname"><span class="pre">on_cleanup</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.on_cleanup"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.on_cleanup" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.on_execute">
+<span class="sig-name descname"><span class="pre">on_execute</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.on_execute"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.on_execute" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.env.visual.TagViz.render_env">
+<span class="sig-name descname"><span class="pre">render_env</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">display_surf</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#TagViz.render_env"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.TagViz.render_env" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.env.visual.unittest">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.env.visual.</span></span><span class="sig-name descname"><span class="pre">unittest</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/env/visual.html#unittest"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.env.visual.unittest" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.tag.env">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tag.env" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tag.env.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tag.html b/docs/html/problems/problems.tag.html
new file mode 100644
index 00000000..6e83ca07
--- /dev/null
+++ b/docs/html/problems/problems.tag.html
@@ -0,0 +1,355 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tag package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tag.agent package" href="problems.tag.agent.html" />
+    <link rel="prev" title="problems.rocksample.cythonize package" href="problems.rocksample.cythonize.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tag package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tag.constants">problems.tag.constants module</a></li>
+<li><a class="reference internal" href="#module-problems.tag.example_worlds">problems.tag.example_worlds module</a></li>
+<li><a class="reference internal" href="#module-problems.tag.experiment">problems.tag.experiment module</a><ul>
+<li><a class="reference internal" href="#problems.tag.experiment.trial"><code class="docutils literal notranslate"><span class="pre">trial()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.experiment.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.problem">problems.tag.problem module</a><ul>
+<li><a class="reference internal" href="#problems.tag.problem.TagProblem"><code class="docutils literal notranslate"><span class="pre">TagProblem</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.problem.solve"><code class="docutils literal notranslate"><span class="pre">solve()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.rocksample.cythonize.html" title="previous chapter">problems.rocksample.cythonize package</a></li>
+      <li>Next: <a href="problems.tag.agent.html" title="next chapter">problems.tag.agent package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tag-package">
+<h1>problems.tag package<a class="headerlink" href="#problems-tag-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.tag.agent.html">problems.tag.agent package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.agent.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.agent.html#module-problems.tag.agent.agent">problems.tag.agent.agent module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.agent.html#problems.tag.agent.agent.initialize_belief"><code class="docutils literal notranslate"><span class="pre">initialize_belief()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.agent.html#problems.tag.agent.agent.initialize_particles_belief"><code class="docutils literal notranslate"><span class="pre">initialize_particles_belief()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.agent.html#problems.tag.agent.agent.belief_update"><code class="docutils literal notranslate"><span class="pre">belief_update()</span></code></a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.agent.html#problems.tag.agent.agent.TagAgent"><code class="docutils literal notranslate"><span class="pre">TagAgent</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.agent.html#problems.tag.agent.agent.TagAgent.clear_history"><code class="docutils literal notranslate"><span class="pre">TagAgent.clear_history()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.agent.html#module-problems.tag.agent">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.tag.domain.html">problems.tag.domain package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.domain.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain.action">problems.tag.domain.action module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.domain.html#problems.tag.domain.action.TagAction"><code class="docutils literal notranslate"><span class="pre">TagAction</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain.observation">problems.tag.domain.observation module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.domain.html#problems.tag.domain.observation.TagObservation"><code class="docutils literal notranslate"><span class="pre">TagObservation</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain.state">problems.tag.domain.state module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.domain.html#problems.tag.domain.state.TagState"><code class="docutils literal notranslate"><span class="pre">TagState</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.domain.html#module-problems.tag.domain">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.tag.env.html">problems.tag.env package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.env.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.env.html#module-problems.tag.env.env">problems.tag.env.env module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.env.TagEnvironment"><code class="docutils literal notranslate"><span class="pre">TagEnvironment</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.env.TagEnvironment.width"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.width</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.env.TagEnvironment.length"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.length</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.env.TagEnvironment.grid_map"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.grid_map</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.env.TagEnvironment.from_str"><code class="docutils literal notranslate"><span class="pre">TagEnvironment.from_str()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.env.html#module-problems.tag.env.visual">problems.tag.env.visual module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz"><code class="docutils literal notranslate"><span class="pre">TagViz</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.img_width"><code class="docutils literal notranslate"><span class="pre">TagViz.img_width</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.img_height"><code class="docutils literal notranslate"><span class="pre">TagViz.img_height</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.last_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.last_observation</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.update"><code class="docutils literal notranslate"><span class="pre">TagViz.update()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.draw_robot"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_robot()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.draw_observation"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_observation()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.draw_belief"><code class="docutils literal notranslate"><span class="pre">TagViz.draw_belief()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.on_init"><code class="docutils literal notranslate"><span class="pre">TagViz.on_init()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.on_event"><code class="docutils literal notranslate"><span class="pre">TagViz.on_event()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.on_loop"><code class="docutils literal notranslate"><span class="pre">TagViz.on_loop()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.on_render"><code class="docutils literal notranslate"><span class="pre">TagViz.on_render()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.on_cleanup"><code class="docutils literal notranslate"><span class="pre">TagViz.on_cleanup()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.on_execute"><code class="docutils literal notranslate"><span class="pre">TagViz.on_execute()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.TagViz.render_env"><code class="docutils literal notranslate"><span class="pre">TagViz.render_env()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.env.html#problems.tag.env.visual.unittest"><code class="docutils literal notranslate"><span class="pre">unittest()</span></code></a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.env.html#module-problems.tag.env">Module contents</a></li>
+</ul>
+</li>
+<li class="toctree-l1"><a class="reference internal" href="problems.tag.models.html">problems.tag.models package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#subpackages">Subpackages</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.components.html">problems.tag.models.components package</a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#submodules">Submodules</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#module-problems.tag.models.components.grid_map">problems.tag.models.components.grid_map module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#module-problems.tag.models.components.motion_policy">problems.tag.models.components.motion_policy module</a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#module-problems.tag.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.observation_model">problems.tag.models.observation_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel"><code class="docutils literal notranslate"><span class="pre">TagObservationModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">TagObservationModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">TagObservationModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.observation_model.TagObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">TagObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.policy_model">problems.tag.models.policy_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel.get_all_actions()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.policy_model.TagPolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel.rollout()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.reward_model">problems.tag.models.reward_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.reward_model.TagRewardModel"><code class="docutils literal notranslate"><span class="pre">TagRewardModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.reward_model.TagRewardModel.probability"><code class="docutils literal notranslate"><span class="pre">TagRewardModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.reward_model.TagRewardModel.sample"><code class="docutils literal notranslate"><span class="pre">TagRewardModel.sample()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models.transition_model">problems.tag.models.transition_model module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.if_move_by"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.if_move_by()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.sample()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.html#problems.tag.models.transition_model.TagTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.html#module-problems.tag.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.constants">
+<span id="problems-tag-constants-module"></span><h2>problems.tag.constants module<a class="headerlink" href="#module-problems.tag.constants" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.example_worlds">
+<span id="problems-tag-example-worlds-module"></span><h2>problems.tag.example_worlds module<a class="headerlink" href="#module-problems.tag.example_worlds" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.experiment">
+<span id="problems-tag-experiment-module"></span><h2>problems.tag.experiment module<a class="headerlink" href="#module-problems.tag.experiment" title="Link to this heading">¶</a></h2>
+<p>Simple experiment to get mean</p>
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.experiment.trial">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.experiment.</span></span><span class="sig-name descname"><span class="pre">trial</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldstr</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/experiment.html#trial"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.experiment.trial" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.experiment.main">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.experiment.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/experiment.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.experiment.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.tag.problem">
+<span id="problems-tag-problem-module"></span><h2>problems.tag.problem module<a class="headerlink" href="#module-problems.tag.problem" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.problem.TagProblem">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.problem.</span></span><span class="sig-name descname"><span class="pre">TagProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">init_robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_target_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pr_stay</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">prior</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'uniform'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'hist'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">num_particles</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">6</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/problem.html#TagProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.problem.TagProblem" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.problem.solve">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.problem.</span></span><span class="sig-name descname"><span class="pre">solve</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner_type</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'pouct'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_depth</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">discount_factor</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.99</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planning_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">exploration_const</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">visualize</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_time</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">120</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_steps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">500</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/problem.html#solve"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.problem.solve" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tag.problem.main">
+<span class="sig-prename descclassname"><span class="pre">problems.tag.problem.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/problem.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.problem.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.tag">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tag" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tag.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tag.models.components.html b/docs/html/problems/problems.tag.models.components.html
new file mode 100644
index 00000000..1e8ba826
--- /dev/null
+++ b/docs/html/problems/problems.tag.models.components.html
@@ -0,0 +1,253 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tag.models.components package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tiger package" href="problems.tiger.html" />
+    <link rel="prev" title="problems.tag.models package" href="problems.tag.models.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tag.models.components package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tag.models.components.grid_map">problems.tag.models.components.grid_map module</a><ul>
+<li><a class="reference internal" href="#problems.tag.models.components.grid_map.GridMap"><code class="docutils literal notranslate"><span class="pre">GridMap</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.models.components.grid_map.GridMap.valid_pose"><code class="docutils literal notranslate"><span class="pre">GridMap.valid_pose()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.components.grid_map.GridMap.valid_motions"><code class="docutils literal notranslate"><span class="pre">GridMap.valid_motions()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.components.grid_map.GridMap.from_str"><code class="docutils literal notranslate"><span class="pre">GridMap.from_str()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.components.grid_map.GridMap.free_cells"><code class="docutils literal notranslate"><span class="pre">GridMap.free_cells()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.models.components.motion_policy">problems.tag.models.components.motion_policy module</a><ul>
+<li><a class="reference internal" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.probability"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.random"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy.random()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.mpe"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy.mpe()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.tag.html">problems.tag package</a><ul>
+  <li><a href="problems.tag.models.html">problems.tag.models package</a><ul>
+      <li>Previous: <a href="problems.tag.models.html" title="previous chapter">problems.tag.models package</a></li>
+      <li>Next: <a href="problems.tiger.html" title="next chapter">problems.tiger package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tag-models-components-package">
+<h1>problems.tag.models.components package<a class="headerlink" href="#problems-tag-models-components-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.models.components.grid_map">
+<span id="problems-tag-models-components-grid-map-module"></span><h2>problems.tag.models.components.grid_map module<a class="headerlink" href="#module-problems.tag.models.components.grid_map" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.models.components.grid_map.GridMap">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.models.components.grid_map.</span></span><span class="sig-name descname"><span class="pre">GridMap</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">width</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">length</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obstacle_poses</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/grid_map.html#GridMap"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.grid_map.GridMap" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">object</span></code></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.grid_map.GridMap.valid_pose">
+<span class="sig-name descname"><span class="pre">valid_pose</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">position</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/grid_map.html#GridMap.valid_pose"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.grid_map.GridMap.valid_pose" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.grid_map.GridMap.valid_motions">
+<span class="sig-name descname"><span class="pre">valid_motions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">all_motions</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{Action(move</span> <span class="pre">-</span> <span class="pre">xy</span> <span class="pre">-</span> <span class="pre">East2D),</span> <span class="pre">Action(move</span> <span class="pre">-</span> <span class="pre">xy</span> <span class="pre">-</span> <span class="pre">North2D),</span> <span class="pre">Action(move</span> <span class="pre">-</span> <span class="pre">xy</span> <span class="pre">-</span> <span class="pre">South2D),</span> <span class="pre">Action(move</span> <span class="pre">-</span> <span class="pre">xy</span> <span class="pre">-</span> <span class="pre">West2D)}</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/grid_map.html#GridMap.valid_motions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.grid_map.GridMap.valid_motions" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.grid_map.GridMap.from_str">
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">from_str</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">worldstr</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/grid_map.html#GridMap.from_str"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.grid_map.GridMap.from_str" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.grid_map.GridMap.free_cells">
+<span class="sig-name descname"><span class="pre">free_cells</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/grid_map.html#GridMap.free_cells"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.grid_map.GridMap.free_cells" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.models.components.motion_policy">
+<span id="problems-tag-models-components-motion-policy-module"></span><h2>problems.tag.models.components.motion_policy module<a class="headerlink" href="#module-problems.tag.models.components.motion_policy" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.models.components.motion_policy.TagTargetMotionPolicy">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.models.components.motion_policy.</span></span><span class="sig-name descname"><span class="pre">TagTargetMotionPolicy</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">pr_stay</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.2</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/motion_policy.html#TagTargetMotionPolicy"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.GenerativeDistribution" title="pomdp_py.framework.basics.GenerativeDistribution"><code class="xref py py-class docutils literal notranslate"><span class="pre">GenerativeDistribution</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.motion_policy.TagTargetMotionPolicy.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_target_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">valid_target_motion_actions</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/motion_policy.html#TagTargetMotionPolicy.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.probability" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.motion_policy.TagTargetMotionPolicy.random">
+<span class="sig-name descname"><span class="pre">random</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">robot_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">valid_target_motion_actions</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">mpe</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/motion_policy.html#TagTargetMotionPolicy.random"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.random" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.components.motion_policy.TagTargetMotionPolicy.mpe">
+<span class="sig-name descname"><span class="pre">mpe</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/components/motion_policy.html#TagTargetMotionPolicy.mpe"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.mpe" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the value of the variable that has the highest probability.</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.models.components">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tag.models.components" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tag.models.components.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tag.models.html b/docs/html/problems/problems.tag.models.html
new file mode 100644
index 00000000..d54775d3
--- /dev/null
+++ b/docs/html/problems/problems.tag.models.html
@@ -0,0 +1,454 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tag.models package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tag.models.components package" href="problems.tag.models.components.html" />
+    <link rel="prev" title="problems.tag.env package" href="problems.tag.env.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tag.models package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tag.models.observation_model">problems.tag.models.observation_model module</a><ul>
+<li><a class="reference internal" href="#problems.tag.models.observation_model.TagObservationModel"><code class="docutils literal notranslate"><span class="pre">TagObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.models.observation_model.TagObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">TagObservationModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.observation_model.TagObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">TagObservationModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.observation_model.TagObservationModel.argmax"><code class="docutils literal notranslate"><span class="pre">TagObservationModel.argmax()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.models.policy_model">problems.tag.models.policy_model module</a><ul>
+<li><a class="reference internal" href="#problems.tag.models.policy_model.TagPolicyModel"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.models.policy_model.TagPolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.policy_model.TagPolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel.get_all_actions()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.policy_model.TagPolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">TagPolicyModel.rollout()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.models.reward_model">problems.tag.models.reward_model module</a><ul>
+<li><a class="reference internal" href="#problems.tag.models.reward_model.TagRewardModel"><code class="docutils literal notranslate"><span class="pre">TagRewardModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.models.reward_model.TagRewardModel.probability"><code class="docutils literal notranslate"><span class="pre">TagRewardModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.reward_model.TagRewardModel.sample"><code class="docutils literal notranslate"><span class="pre">TagRewardModel.sample()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.models.transition_model">problems.tag.models.transition_model module</a><ul>
+<li><a class="reference internal" href="#problems.tag.models.transition_model.TagTransitionModel"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tag.models.transition_model.TagTransitionModel.if_move_by"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.if_move_by()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.transition_model.TagTransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.transition_model.TagTransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tag.models.transition_model.TagTransitionModel.argmax"><code class="docutils literal notranslate"><span class="pre">TagTransitionModel.argmax()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tag.models">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.tag.html">problems.tag package</a><ul>
+      <li>Previous: <a href="problems.tag.env.html" title="previous chapter">problems.tag.env package</a></li>
+      <li>Next: <a href="problems.tag.models.components.html" title="next chapter">problems.tag.models.components package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tag-models-package">
+<h1>problems.tag.models package<a class="headerlink" href="#problems-tag-models-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.tag.models.components.html">problems.tag.models.components package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.components.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.components.html#module-problems.tag.models.components.grid_map">problems.tag.models.components.grid_map module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap"><code class="docutils literal notranslate"><span class="pre">GridMap</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.valid_pose"><code class="docutils literal notranslate"><span class="pre">GridMap.valid_pose()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.valid_motions"><code class="docutils literal notranslate"><span class="pre">GridMap.valid_motions()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.from_str"><code class="docutils literal notranslate"><span class="pre">GridMap.from_str()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.grid_map.GridMap.free_cells"><code class="docutils literal notranslate"><span class="pre">GridMap.free_cells()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.components.html#module-problems.tag.models.components.motion_policy">problems.tag.models.components.motion_policy module</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy</span></code></a><ul>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.probability"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy.probability()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.random"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy.random()</span></code></a></li>
+<li class="toctree-l4"><a class="reference internal" href="problems.tag.models.components.html#problems.tag.models.components.motion_policy.TagTargetMotionPolicy.mpe"><code class="docutils literal notranslate"><span class="pre">TagTargetMotionPolicy.mpe()</span></code></a></li>
+</ul>
+</li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tag.models.components.html#module-problems.tag.models.components">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tag.models.observation_model">
+<span id="problems-tag-models-observation-model-module"></span><h2>problems.tag.models.observation_model module<a class="headerlink" href="#module-problems.tag.models.observation_model" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.models.observation_model.TagObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.models.observation_model.</span></span><span class="sig-name descname"><span class="pre">TagObservationModel</span></span><a class="reference internal" href="../_modules/problems/tag/models/observation_model.html#TagObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.observation_model.TagObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel" title="pomdp_py.framework.basics.ObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObservationModel</span></code></a></p>
+<p>In this observation model, the robot deterministically
+observes the target location when it is in the same grid cell
+as the target. Ohterwise the robot does not observe anything.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.observation_model.TagObservationModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/observation_model.html#TagObservationModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.observation_model.TagObservationModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><em>Observation</em></a>) – the observation <span class="math notranslate nohighlight">\(o\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.observation_model.TagObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/observation_model.html#TagObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.observation_model.TagObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>There is no stochaisticity in the observation model</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.observation_model.TagObservationModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/observation_model.html#TagObservationModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.observation_model.TagObservationModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely observation</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.models.policy_model">
+<span id="problems-tag-models-policy-model-module"></span><h2>problems.tag.models.policy_model module<a class="headerlink" href="#module-problems.tag.models.policy_model" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.models.policy_model.TagPolicyModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.models.policy_model.</span></span><span class="sig-name descname"><span class="pre">TagPolicyModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_map</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/policy_model.html#TagPolicyModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.policy_model.TagPolicyModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RolloutPolicy" title="pomdp_py.algorithms.po_uct.RolloutPolicy"><code class="xref py py-class docutils literal notranslate"><span class="pre">RolloutPolicy</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.policy_model.TagPolicyModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/policy_model.html#TagPolicyModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.policy_model.TagPolicyModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns action randomly sampled according to the
+distribution of this policy model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the action <span class="math notranslate nohighlight">\(a\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action">Action</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.policy_model.TagPolicyModel.get_all_actions">
+<span class="sig-name descname"><span class="pre">get_all_actions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/policy_model.html#TagPolicyModel.get_all_actions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.policy_model.TagPolicyModel.get_all_actions" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a set of all possible actions, if feasible.</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.policy_model.TagPolicyModel.rollout">
+<span class="sig-name descname"><span class="pre">rollout</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">State</span> <span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">tuple</span> <span class="pre">history=None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/policy_model.html#TagPolicyModel.rollout"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.policy_model.TagPolicyModel.rollout" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.models.reward_model">
+<span id="problems-tag-models-reward-model-module"></span><h2>problems.tag.models.reward_model module<a class="headerlink" href="#module-problems.tag.models.reward_model" title="Link to this heading">¶</a></h2>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.models.reward_model.TagRewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.models.reward_model.</span></span><span class="sig-name descname"><span class="pre">TagRewardModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">small</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">big</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/reward_model.html#TagRewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.reward_model.TagRewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.reward_model.TagRewardModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">reward</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/reward_model.html#TagRewardModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.reward_model.TagRewardModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>reward</strong> (<em>float</em>) – the reward <span class="math notranslate nohighlight">\(r\)</span></p></li>
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(r|s,a,s')\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.reward_model.TagRewardModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/reward_model.html#TagRewardModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.reward_model.TagRewardModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns reward randomly sampled according to the
+distribution of this reward model. This is required,
+i.e. assumed to be implemented for a reward model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the reward <span class="math notranslate nohighlight">\(r\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.models.transition_model">
+<span id="problems-tag-models-transition-model-module"></span><h2>problems.tag.models.transition_model module<a class="headerlink" href="#module-problems.tag.models.transition_model" title="Link to this heading">¶</a></h2>
+<p>The Tag problem. Implemented according to the paper <a class="reference external" href="https://arxiv.org/pdf/1110.0027.pdf">Anytime Point-Based
+Approximations for Large POMDPs</a>.</p>
+<dl class="simple">
+<dt>Transition model: the robot moves deterministically. The target’s movement</dt><dd><p>depends on the robot; With Pr=0.8 the target moves away from the robot,
+and with Pr=0.2, the target stays at the same place. The target never
+moves closer to the robot.</p>
+</dd>
+</dl>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tag.models.transition_model.TagTransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tag.models.transition_model.</span></span><span class="sig-name descname"><span class="pre">TagTransitionModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">target_motion_policy</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/transition_model.html#TagTransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.transition_model.TagTransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.transition_model.TagTransitionModel.if_move_by">
+<em class="property"><span class="pre">classmethod</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">if_move_by</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_map</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">position</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/transition_model.html#TagTransitionModel.if_move_by"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.transition_model.TagTransitionModel.if_move_by" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.transition_model.TagTransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/transition_model.html#TagTransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.transition_model.TagTransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(s'|s,a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.transition_model.TagTransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/transition_model.html#TagTransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.transition_model.TagTransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next state randomly sampled according to the
+distribution of this transition model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the next state <span class="math notranslate nohighlight">\(s'\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State">State</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tag.models.transition_model.TagTransitionModel.argmax">
+<span class="sig-name descname"><span class="pre">argmax</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tag/models/transition_model.html#TagTransitionModel.argmax"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tag.models.transition_model.TagTransitionModel.argmax" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the most likely next state</p>
+</dd></dl>
+
+</dd></dl>
+
+</section>
+<section id="module-problems.tag.models">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tag.models" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tag.models.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tiger.cythonize.html b/docs/html/problems/problems.tiger.cythonize.html
new file mode 100644
index 00000000..25ca7867
--- /dev/null
+++ b/docs/html/problems/problems.tiger.cythonize.html
@@ -0,0 +1,248 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tiger.cythonize package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="prev" title="problems.tiger package" href="problems.tiger.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tiger.cythonize package</a><ul>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#problems-tiger-cythonize-run-tiger-module">problems.tiger.cythonize.run_tiger module</a></li>
+<li><a class="reference internal" href="#module-problems.tiger.cythonize.tiger_problem">problems.tiger.cythonize.tiger_problem module</a></li>
+<li><a class="reference internal" href="#id1">problems.tiger.cythonize.tiger_problem module</a></li>
+<li><a class="reference internal" href="#module-problems.tiger.cythonize">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+  <li><a href="problems.tiger.html">problems.tiger package</a><ul>
+      <li>Previous: <a href="problems.tiger.html" title="previous chapter">problems.tiger package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tiger-cythonize-package">
+<h1>problems.tiger.cythonize package<a class="headerlink" href="#problems-tiger-cythonize-package" title="Link to this heading">¶</a></h1>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="problems-tiger-cythonize-run-tiger-module">
+<h2>problems.tiger.cythonize.run_tiger module<a class="headerlink" href="#problems-tiger-cythonize-run-tiger-module" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tiger.cythonize.tiger_problem">
+<span id="problems-tiger-cythonize-tiger-problem-module"></span><h2>problems.tiger.cythonize.tiger_problem module<a class="headerlink" href="#module-problems.tiger.cythonize.tiger_problem" title="Link to this heading">¶</a></h2>
+<p>The classic Tiger problem.</p>
+<p>This is a POMDP problem; Namely, it specifies both
+the POMDP (i.e. state, action, observation space)
+and the T/O/R for the agent as well as the environment.</p>
+<p>The description of the tiger problem is as follows: (Quote from <a class="reference external" href="https://cran.r-project.org/web/packages/pomdp/vignettes/POMDP.pdf">POMDP:
+Introduction to Partially Observable Markov Decision Processes</a> by
+Kamalzadeh and Hahsler )</p>
+<p>A tiger is put with equal probability behind one
+of two doors, while treasure is put behind the other one.
+You are standing in front of the two closed doors and
+need to decide which one to open. If you open the door
+with the tiger, you will get hurt (negative reward).
+But if you open the door with treasure, you receive
+a positive reward. Instead of opening a door right away,
+you also have the option to wait and listen for tiger noises. But
+listening is neither free nor entirely accurate. You might hear the
+tiger behind the left door while it is actually behind the right
+door and vice versa.</p>
+<p>States: tiger-left, tiger-right
+Actions: open-left, open-right, listen
+Rewards:</p>
+<blockquote>
+<div><p>+10 for opening treasure door. -100 for opening tiger door.
+-1 for listening.</p>
+</div></blockquote>
+<p>Observations: You can hear either “tiger-left”, or “tiger-right”.</p>
+<p>Note that in this example, the TigerProblem is a POMDP that
+also contains the agent and the environment as its fields. In
+general this doesn’t need to be the case. (Refer to more complicated
+examples.)</p>
+</section>
+<section id="id1">
+<h2>problems.tiger.cythonize.tiger_problem module<a class="headerlink" href="#id1" title="Link to this heading">¶</a></h2>
+<p id="module-0">The classic Tiger problem.</p>
+<p>This is a POMDP problem; Namely, it specifies both
+the POMDP (i.e. state, action, observation space)
+and the T/O/R for the agent as well as the environment.</p>
+<p>The description of the tiger problem is as follows: (Quote from <a class="reference external" href="https://cran.r-project.org/web/packages/pomdp/vignettes/POMDP.pdf">POMDP:
+Introduction to Partially Observable Markov Decision Processes</a> by
+Kamalzadeh and Hahsler )</p>
+<p>A tiger is put with equal probability behind one
+of two doors, while treasure is put behind the other one.
+You are standing in front of the two closed doors and
+need to decide which one to open. If you open the door
+with the tiger, you will get hurt (negative reward).
+But if you open the door with treasure, you receive
+a positive reward. Instead of opening a door right away,
+you also have the option to wait and listen for tiger noises. But
+listening is neither free nor entirely accurate. You might hear the
+tiger behind the left door while it is actually behind the right
+door and vice versa.</p>
+<p>States: tiger-left, tiger-right
+Actions: open-left, open-right, listen
+Rewards:</p>
+<blockquote>
+<div><p>+10 for opening treasure door. -100 for opening tiger door.
+-1 for listening.</p>
+</div></blockquote>
+<p>Observations: You can hear either “tiger-left”, or “tiger-right”.</p>
+<p>Note that in this example, the TigerProblem is a POMDP that
+also contains the agent and the environment as its fields. In
+general this doesn’t need to be the case. (Refer to more complicated
+examples.)</p>
+</section>
+<section id="module-problems.tiger.cythonize">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tiger.cythonize" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tiger.cythonize.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/problems/problems.tiger.html b/docs/html/problems/problems.tiger.html
new file mode 100644
index 00000000..1f8fd3cb
--- /dev/null
+++ b/docs/html/problems/problems.tiger.html
@@ -0,0 +1,512 @@
+<!DOCTYPE html>
+
+<html lang="en" data-content_root="../">
+  <head>
+    <meta charset="utf-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
+
+    <title>problems.tiger package &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=61cd365c" />
+    <link rel="stylesheet" type="text/css" href="../_static/alabaster.css?v=51d35e29" />
+    <script src="../_static/documentation_options.js?v=4720776d"></script>
+    <script src="../_static/doctools.js?v=888ff710"></script>
+    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
+    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+    <link rel="icon" href="../_static/favicon.ico"/>
+    <link rel="index" title="Index" href="../genindex.html" />
+    <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="problems.tiger.cythonize package" href="problems.tiger.cythonize.html" />
+    <link rel="prev" title="problems.tag.models.components package" href="problems.tag.models.components.html" />
+   
+  <link rel="stylesheet" href="../_static/custom.css" type="text/css" />
+  
+
+  
+  
+
+  </head><body>
+  <div class="document">
+    
+      <div class="sphinxsidebar" role="navigation" aria-label="main navigation">
+        <div class="sphinxsidebarwrapper">
+<p class="logo">
+  <a href="../index.html">
+    <img class="logo" src="../_static/logo.png" alt="Logo" />
+    
+  </a>
+</p>
+
+
+
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
+
+
+
+
+<p>
+<iframe src="https://ghbtns.com/github-btn.html?user=h2r&repo=pomdp-py&type=star&count=true&size=large&v=2"
+  allowtransparency="true" frameborder="0" scrolling="0" width="200px" height="35px"></iframe>
+</p>
+
+
+
+
+
+
+  <div>
+    <h3><a href="../index.html">Table of Contents</a></h3>
+    <ul>
+<li><a class="reference internal" href="#">problems.tiger package</a><ul>
+<li><a class="reference internal" href="#subpackages">Subpackages</a></li>
+<li><a class="reference internal" href="#submodules">Submodules</a></li>
+<li><a class="reference internal" href="#module-problems.tiger.tiger_problem">problems.tiger.tiger_problem module</a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TigerState"><code class="docutils literal notranslate"><span class="pre">TigerState</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TigerState.other"><code class="docutils literal notranslate"><span class="pre">TigerState.other()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TigerAction"><code class="docutils literal notranslate"><span class="pre">TigerAction</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TigerObservation"><code class="docutils literal notranslate"><span class="pre">TigerObservation</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.ObservationModel"><code class="docutils literal notranslate"><span class="pre">ObservationModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.ObservationModel.probability"><code class="docutils literal notranslate"><span class="pre">ObservationModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.ObservationModel.sample"><code class="docutils literal notranslate"><span class="pre">ObservationModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.ObservationModel.get_all_observations"><code class="docutils literal notranslate"><span class="pre">ObservationModel.get_all_observations()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TransitionModel"><code class="docutils literal notranslate"><span class="pre">TransitionModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TransitionModel.probability"><code class="docutils literal notranslate"><span class="pre">TransitionModel.probability()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TransitionModel.sample"><code class="docutils literal notranslate"><span class="pre">TransitionModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TransitionModel.get_all_states"><code class="docutils literal notranslate"><span class="pre">TransitionModel.get_all_states()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.RewardModel"><code class="docutils literal notranslate"><span class="pre">RewardModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.RewardModel.sample"><code class="docutils literal notranslate"><span class="pre">RewardModel.sample()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.PolicyModel"><code class="docutils literal notranslate"><span class="pre">PolicyModel</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.PolicyModel.ACTIONS"><code class="docutils literal notranslate"><span class="pre">PolicyModel.ACTIONS</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.PolicyModel.sample"><code class="docutils literal notranslate"><span class="pre">PolicyModel.sample()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.PolicyModel.rollout"><code class="docutils literal notranslate"><span class="pre">PolicyModel.rollout()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.PolicyModel.get_all_actions"><code class="docutils literal notranslate"><span class="pre">PolicyModel.get_all_actions()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TigerProblem"><code class="docutils literal notranslate"><span class="pre">TigerProblem</span></code></a><ul>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.TigerProblem.create"><code class="docutils literal notranslate"><span class="pre">TigerProblem.create()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.test_planner"><code class="docutils literal notranslate"><span class="pre">test_planner()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.make_tiger"><code class="docutils literal notranslate"><span class="pre">make_tiger()</span></code></a></li>
+<li><a class="reference internal" href="#problems.tiger.tiger_problem.main"><code class="docutils literal notranslate"><span class="pre">main()</span></code></a></li>
+</ul>
+</li>
+<li><a class="reference internal" href="#module-problems.tiger">Module contents</a></li>
+</ul>
+</li>
+</ul>
+
+  </div><h3>Navigation</h3>
+<p class="caption" role="heading"><span class="caption-text">Overview</span></p>
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="../installation.html">Installation</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../design_principles.html">Design Principles</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../existing_solvers.html">Existing POMDP Solvers</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../changelog.html">What's New?</a></li>
+</ul>
+<p class="caption" role="heading"><span class="caption-text">API References</span></p>
+<ul class="current">
+<li class="toctree-l1"><a class="reference internal" href="../api/modules.html">pomdp_py</a></li>
+<li class="toctree-l1 current"><a class="reference internal" href="modules.html">problems</a><ul class="current">
+<li class="toctree-l2 current"><a class="reference internal" href="problems.html">problems package</a><ul class="current">
+<li class="toctree-l3 current"><a class="reference internal" href="problems.html#subpackages">Subpackages</a></li>
+<li class="toctree-l3"><a class="reference internal" href="problems.html#module-problems">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</li>
+</ul>
+
+
+<hr />
+<ul>
+    
+    <li class="toctree-l1"><a href="https://h2r.cs.brown.edu/">H2R lab</a></li>
+    
+    <li class="toctree-l1"><a href="http://kaiyuzh.me">Kaiyu's homepage</a></li>
+    
+</ul>
+<div class="relations">
+<h3>Related Topics</h3>
+<ul>
+  <li><a href="../index.html">Documentation overview</a><ul>
+  <li><a href="modules.html">problems</a><ul>
+  <li><a href="problems.html">problems package</a><ul>
+      <li>Previous: <a href="problems.tag.models.components.html" title="previous chapter">problems.tag.models.components package</a></li>
+      <li>Next: <a href="problems.tiger.cythonize.html" title="next chapter">problems.tiger.cythonize package</a></li>
+  </ul></li>
+  </ul></li>
+  </ul></li>
+</ul>
+</div>
+<div id="searchbox" style="display: none" role="search">
+  <h3 id="searchlabel">Quick search</h3>
+    <div class="searchformwrapper">
+    <form class="search" action="../search.html" method="get">
+      <input type="text" name="q" aria-labelledby="searchlabel" autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
+      <input type="submit" value="Go" />
+    </form>
+    </div>
+</div>
+<script>document.getElementById('searchbox').style.display = "block"</script>
+
+
+<h3 class="donation">Donate/support</h3>
+
+
+
+<p>
+<a class="badge" href="paypal.me/zkytony/10">
+<img src="https://img.shields.io/badge/donate-%E2%9D%A4%C2%A0-ff69b4.svg?style=flat" alt="Donate">
+</a>
+</p>
+
+
+
+
+
+        </div>
+      </div>
+      <div class="documentwrapper">
+        <div class="bodywrapper">
+          
+
+          <div class="body" role="main">
+            
+  <section id="problems-tiger-package">
+<h1>problems.tiger package<a class="headerlink" href="#problems-tiger-package" title="Link to this heading">¶</a></h1>
+<section id="subpackages">
+<h2>Subpackages<a class="headerlink" href="#subpackages" title="Link to this heading">¶</a></h2>
+<div class="toctree-wrapper compound">
+<ul>
+<li class="toctree-l1"><a class="reference internal" href="problems.tiger.cythonize.html">problems.tiger.cythonize package</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.cythonize.html#submodules">Submodules</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.cythonize.html#problems-tiger-cythonize-run-tiger-module">problems.tiger.cythonize.run_tiger module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.cythonize.html#module-problems.tiger.cythonize.tiger_problem">problems.tiger.cythonize.tiger_problem module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.cythonize.html#id1">problems.tiger.cythonize.tiger_problem module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="problems.tiger.cythonize.html#module-problems.tiger.cythonize">Module contents</a></li>
+</ul>
+</li>
+</ul>
+</div>
+</section>
+<section id="submodules">
+<h2>Submodules<a class="headerlink" href="#submodules" title="Link to this heading">¶</a></h2>
+</section>
+<section id="module-problems.tiger.tiger_problem">
+<span id="problems-tiger-tiger-problem-module"></span><h2>problems.tiger.tiger_problem module<a class="headerlink" href="#module-problems.tiger.tiger_problem" title="Link to this heading">¶</a></h2>
+<p>The classic Tiger problem.</p>
+<p>This is a POMDP problem; Namely, it specifies both
+the POMDP (i.e. state, action, observation space)
+and the T/O/R for the agent as well as the environment.</p>
+<p>The description of the tiger problem is as follows: (Quote from
+<a class="reference external" href="https://cran.r-project.org/web/packages/pomdp/vignettes/POMDP.pdf">POMDP: Introduction to Partially Observable Markov Decision Processes</a> by
+Kamalzadeh and Hahsler )</p>
+<p>A tiger is put with equal probability behind one
+of two doors, while treasure is put behind the other one.
+You are standing in front of the two closed doors and
+need to decide which one to open. If you open the door
+with the tiger, you will get hurt (negative reward).
+But if you open the door with treasure, you receive
+a positive reward. Instead of opening a door right away,
+you also have the option to wait and listen for tiger noises. But
+listening is neither free nor entirely accurate. You might hear the
+tiger behind the left door while it is actually behind the right
+door and vice versa.</p>
+<p>States: tiger-left, tiger-right
+Actions: open-left, open-right, listen
+Rewards:</p>
+<blockquote>
+<div><p>+10 for opening treasure door. -100 for opening tiger door.
+-1 for listening.</p>
+</div></blockquote>
+<p>Observations: You can hear either “tiger-left”, or “tiger-right”.</p>
+<p>Note that in this example, the TigerProblem is a POMDP that
+also contains the agent and the environment as its fields. In
+general this doesn’t need to be the case. (Refer to more
+complicated examples.)</p>
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TigerState">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">TigerState</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TigerState"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TigerState" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><code class="xref py py-class docutils literal notranslate"><span class="pre">State</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TigerState.other">
+<span class="sig-name descname"><span class="pre">other</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TigerState.other"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TigerState.other" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TigerAction">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">TigerAction</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TigerAction"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TigerAction" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><code class="xref py py-class docutils literal notranslate"><span class="pre">Action</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TigerObservation">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">TigerObservation</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">name</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TigerObservation"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TigerObservation" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><code class="xref py py-class docutils literal notranslate"><span class="pre">Observation</span></code></a></p>
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.ObservationModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">ObservationModel</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">noise</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.15</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#ObservationModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.ObservationModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.ObservationModel" title="pomdp_py.framework.basics.ObservationModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">ObservationModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.ObservationModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">observation</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#ObservationModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.ObservationModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>Returns the probability of <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span>.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>observation</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation"><em>Observation</em></a>) – the observation <span class="math notranslate nohighlight">\(o\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the probability <span class="math notranslate nohighlight">\(\Pr(o|s',a)\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.ObservationModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#ObservationModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.ObservationModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns observation randomly sampled according to the
+distribution of this observation model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the observation <span class="math notranslate nohighlight">\(o\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Observation" title="pomdp_py.framework.basics.Observation">Observation</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.ObservationModel.get_all_observations">
+<span class="sig-name descname"><span class="pre">get_all_observations</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#ObservationModel.get_all_observations"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.ObservationModel.get_all_observations" title="Link to this definition">¶</a></dt>
+<dd><p>Only need to implement this if you’re using
+a solver that needs to enumerate over the observation space
+(e.g. value iteration)</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TransitionModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">TransitionModel</span></span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TransitionModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TransitionModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.TransitionModel" title="pomdp_py.framework.basics.TransitionModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">TransitionModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TransitionModel.probability">
+<span class="sig-name descname"><span class="pre">probability</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TransitionModel.probability"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TransitionModel.probability" title="Link to this definition">¶</a></dt>
+<dd><p>According to problem spec, the world resets once
+action is open-left/open-right. Otherwise, stays the same</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TransitionModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TransitionModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TransitionModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns next state randomly sampled according to the
+distribution of this transition model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the next state <span class="math notranslate nohighlight">\(s'\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State">State</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TransitionModel.get_all_states">
+<span class="sig-name descname"><span class="pre">get_all_states</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TransitionModel.get_all_states"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TransitionModel.get_all_states" title="Link to this definition">¶</a></dt>
+<dd><p>Only need to implement this if you’re using
+a solver that needs to enumerate over the observation space (e.g. value iteration)</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.RewardModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">RewardModel</span></span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#RewardModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.RewardModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.RewardModel" title="pomdp_py.framework.basics.RewardModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">RewardModel</span></code></a></p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.RewardModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">action</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">next_state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#RewardModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.RewardModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns reward randomly sampled according to the
+distribution of this reward model. This is required,
+i.e. assumed to be implemented for a reward model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p></li>
+<li><p><strong>action</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action"><em>Action</em></a>) – the action <span class="math notranslate nohighlight">\(a\)</span></p></li>
+<li><p><strong>next_state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s'\)</span></p></li>
+</ul>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the reward <span class="math notranslate nohighlight">\(r\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p>float</p>
+</dd>
+</dl>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.PolicyModel">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">PolicyModel</span></span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#PolicyModel"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.PolicyModel" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.algorithms.html#pomdp_py.algorithms.po_uct.RolloutPolicy" title="pomdp_py.algorithms.po_uct.RolloutPolicy"><code class="xref py py-class docutils literal notranslate"><span class="pre">RolloutPolicy</span></code></a></p>
+<p>A simple policy model with uniform prior over a
+small, finite action space</p>
+<dl class="py attribute">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.PolicyModel.ACTIONS">
+<span class="sig-name descname"><span class="pre">ACTIONS</span></span><em class="property"><span class="w"> </span><span class="p"><span class="pre">=</span></span><span class="w"> </span><span class="pre">[TigerAction(listen),</span> <span class="pre">TigerAction(open-left),</span> <span class="pre">TigerAction(open-right)]</span></em><a class="headerlink" href="#problems.tiger.tiger_problem.PolicyModel.ACTIONS" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.PolicyModel.sample">
+<span class="sig-name descname"><span class="pre">sample</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">state</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#PolicyModel.sample"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.PolicyModel.sample" title="Link to this definition">¶</a></dt>
+<dd><p>Returns action randomly sampled according to the
+distribution of this policy model.</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><p><strong>state</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.State" title="pomdp_py.framework.basics.State"><em>State</em></a>) – the next state <span class="math notranslate nohighlight">\(s\)</span></p>
+</dd>
+<dt class="field-even">Returns<span class="colon">:</span></dt>
+<dd class="field-even"><p>the action <span class="math notranslate nohighlight">\(a\)</span></p>
+</dd>
+<dt class="field-odd">Return type<span class="colon">:</span></dt>
+<dd class="field-odd"><p><a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.Action" title="pomdp_py.framework.basics.Action">Action</a></p>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.PolicyModel.rollout">
+<span class="sig-name descname"><span class="pre">rollout</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">history</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#PolicyModel.rollout"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.PolicyModel.rollout" title="Link to this definition">¶</a></dt>
+<dd><p>Treating this PolicyModel as a rollout policy</p>
+</dd></dl>
+
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.PolicyModel.get_all_actions">
+<span class="sig-name descname"><span class="pre">get_all_actions</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">self</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#PolicyModel.get_all_actions"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.PolicyModel.get_all_actions" title="Link to this definition">¶</a></dt>
+<dd><p>Returns a set of all possible actions, if feasible.</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py class">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TigerProblem">
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">TigerProblem</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">obs_noise</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_true_state</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TigerProblem"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TigerProblem" title="Link to this definition">¶</a></dt>
+<dd><p>Bases: <a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.basics.POMDP" title="pomdp_py.framework.basics.POMDP"><code class="xref py py-class docutils literal notranslate"><span class="pre">POMDP</span></code></a></p>
+<p>In fact, creating a TigerProblem class is entirely optional
+to simulate and solve POMDPs. But this is just an example
+of how such a class can be created.</p>
+<dl class="py method">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.TigerProblem.create">
+<em class="property"><span class="pre">static</span><span class="w"> </span></em><span class="sig-name descname"><span class="pre">create</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">state</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'tiger-left'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">belief</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">obs_noise</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.15</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#TigerProblem.create"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.TigerProblem.create" title="Link to this definition">¶</a></dt>
+<dd><dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>state</strong> (<em>str</em>) – could be ‘tiger-left’ or ‘tiger-right’;
+True state of the environment</p></li>
+<li><p><strong>belief</strong> (<em>float</em>) – Initial belief that the target is
+on the left; Between 0-1.</p></li>
+<li><p><strong>obs_noise</strong> (<em>float</em>) – Noise for the observation
+model (default 0.15)</p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.test_planner">
+<span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">test_planner</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">tiger_problem</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">planner</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">nsteps</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">3</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">debug_tree</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#test_planner"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.test_planner" title="Link to this definition">¶</a></dt>
+<dd><p>Runs the action-feedback loop of Tiger problem POMDP</p>
+<dl class="field-list simple">
+<dt class="field-odd">Parameters<span class="colon">:</span></dt>
+<dd class="field-odd"><ul class="simple">
+<li><p><strong>tiger_problem</strong> (<a class="reference internal" href="#problems.tiger.tiger_problem.TigerProblem" title="problems.tiger.tiger_problem.TigerProblem"><em>TigerProblem</em></a>) – a problem instance</p></li>
+<li><p><strong>planner</strong> (<a class="reference internal" href="../api/pomdp_py.framework.html#pomdp_py.framework.planner.Planner" title="pomdp_py.framework.planner.Planner"><em>Planner</em></a>) – a planner</p></li>
+<li><p><strong>nsteps</strong> (<em>int</em>) – Maximum number of steps to run this loop.</p></li>
+<li><p><strong>debug_tree</strong> (<em>bool</em>) – True if get into the pdb with a
+TreeDebugger created as ‘dd’ variable.</p></li>
+</ul>
+</dd>
+</dl>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.make_tiger">
+<span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">make_tiger</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">noise</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.15</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_state</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'tiger-left'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_belief</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">[0.5,</span> <span class="pre">0.5]</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#make_tiger"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.make_tiger" title="Link to this definition">¶</a></dt>
+<dd><p>Convenient function to quickly build a tiger domain.
+Useful for testing</p>
+</dd></dl>
+
+<dl class="py function">
+<dt class="sig sig-object py" id="problems.tiger.tiger_problem.main">
+<span class="sig-prename descclassname"><span class="pre">problems.tiger.tiger_problem.</span></span><span class="sig-name descname"><span class="pre">main</span></span><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="../_modules/problems/tiger/tiger_problem.html#main"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#problems.tiger.tiger_problem.main" title="Link to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</section>
+<section id="module-problems.tiger">
+<span id="module-contents"></span><h2>Module contents<a class="headerlink" href="#module-problems.tiger" title="Link to this heading">¶</a></h2>
+</section>
+</section>
+
+
+          </div>
+          
+        </div>
+      </div>
+    <div class="clearer"></div>
+  </div>
+    <div class="footer">
+      &#169;2020-2021, H2R@Brown.
+      
+      |
+      Powered by <a href="https://www.sphinx-doc.org/">Sphinx 7.2.6</a>
+      &amp; <a href="https://alabaster.readthedocs.io">Alabaster 0.7.16</a>
+      
+      |
+      <a href="../_sources/problems/problems.tiger.rst.txt"
+          rel="nofollow">Page source</a>
+    </div>
+
+    
+
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/docs/html/py-modindex.html b/docs/html/py-modindex.html
index bcd2ea46..be282323 100644
--- a/docs/html/py-modindex.html
+++ b/docs/html/py-modindex.html
@@ -4,10 +4,10 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>Python Module Index &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Python Module Index &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <link rel="icon" href="_static/favicon.ico"/>
@@ -37,7 +37,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
@@ -185,23 +185,28 @@ <h1>Python Module Index</h1>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
-       <a href="api/pomdp_py.problems.lasertag.html#module-pomdp_py.problems.lasertag"><code class="xref">pomdp_py.problems.lasertag</code></a></td><td>
+       <a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env"><code class="xref">pomdp_py.problems.light_dark.env</code></a></td><td>
        <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
-       <a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env"><code class="xref">pomdp_py.problems.light_dark.env</code></a></td><td>
+       <a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.env"><code class="xref">pomdp_py.problems.light_dark.env.env</code></a></td><td>
        <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
-       <a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.env"><code class="xref">pomdp_py.problems.light_dark.env.env</code></a></td><td>
+       <a href="api/pomdp_py.problems.light_dark.env.html#module-pomdp_py.problems.light_dark.env.plotting"><code class="xref">pomdp_py.problems.light_dark.env.plotting</code></a></td><td>
        <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
        <a href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload"><code class="xref">pomdp_py.problems.load_unload</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.load_unload.html#module-pomdp_py.problems.load_unload.load_unload"><code class="xref">pomdp_py.problems.load_unload.load_unload</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
@@ -297,6 +302,11 @@ <h1>Python Module Index</h1>
        <td>&#160;&#160;&#160;
        <a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.env"><code class="xref">pomdp_py.problems.multi_object_search.env.env</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.multi_object_search.env.html#module-pomdp_py.problems.multi_object_search.env.visual"><code class="xref">pomdp_py.problems.multi_object_search.env.visual</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
@@ -342,6 +352,11 @@ <h1>Python Module Index</h1>
        <td>&#160;&#160;&#160;
        <a href="api/pomdp_py.problems.multi_object_search.models.html#module-pomdp_py.problems.multi_object_search.models.transition_model"><code class="xref">pomdp_py.problems.multi_object_search.models.transition_model</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.multi_object_search.html#module-pomdp_py.problems.multi_object_search.problem"><code class="xref">pomdp_py.problems.multi_object_search.problem</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
@@ -407,11 +422,26 @@ <h1>Python Module Index</h1>
        <td>&#160;&#160;&#160;
        <a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env"><code class="xref">pomdp_py.problems.tag.env</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.env"><code class="xref">pomdp_py.problems.tag.env.env</code></a></td><td>
+       <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.tag.env.html#module-pomdp_py.problems.tag.env.visual"><code class="xref">pomdp_py.problems.tag.env.visual</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
        <a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.example_worlds"><code class="xref">pomdp_py.problems.tag.example_worlds</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.experiment"><code class="xref">pomdp_py.problems.tag.experiment</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
@@ -452,6 +482,11 @@ <h1>Python Module Index</h1>
        <td>&#160;&#160;&#160;
        <a href="api/pomdp_py.problems.tag.models.html#module-pomdp_py.problems.tag.models.transition_model"><code class="xref">pomdp_py.problems.tag.models.transition_model</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="api/pomdp_py.problems.tag.html#module-pomdp_py.problems.tag.problem"><code class="xref">pomdp_py.problems.tag.problem</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
diff --git a/docs/html/search.html b/docs/html/search.html
index 0cbb4c06..8ab5b211 100644
--- a/docs/html/search.html
+++ b/docs/html/search.html
@@ -4,11 +4,11 @@
   <head>
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>Search &#8212; pomdp_py 1.3.4 documentation</title>
-    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=d1102ebc" />
+    <title>Search &#8212; pomdp_py 1.3.5 documentation</title>
+    <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=61cd365c" />
     <link rel="stylesheet" type="text/css" href="_static/alabaster.css?v=51d35e29" />
     
-    <script src="_static/documentation_options.js?v=e358f374"></script>
+    <script src="_static/documentation_options.js?v=4720776d"></script>
     <script src="_static/doctools.js?v=888ff710"></script>
     <script src="_static/sphinx_highlight.js?v=dc90522c"></script>
     <script src="_static/searchtools.js"></script>
@@ -40,7 +40,7 @@
 
 
 
-<p class="blurb">A framework to build and solve POMDP problems (v1.3.4).</p>
+<p class="blurb">A framework to build and solve POMDP problems (v1.3.5).</p>
 
 
 
diff --git a/docs/html/searchindex.js b/docs/html/searchindex.js
index 76c3d911..202e3563 100644
--- a/docs/html/searchindex.js
+++ b/docs/html/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"docnames": ["api/modules", "api/pomdp_py", "api/pomdp_py.algorithms", "api/pomdp_py.algorithms.bsp", "api/pomdp_py.algorithms.visual", "api/pomdp_py.framework", "api/pomdp_py.problems", "api/pomdp_py.problems.lasertag", "api/pomdp_py.problems.light_dark", "api/pomdp_py.problems.light_dark.agent", "api/pomdp_py.problems.light_dark.domain", "api/pomdp_py.problems.light_dark.env", "api/pomdp_py.problems.light_dark.models", "api/pomdp_py.problems.load_unload", "api/pomdp_py.problems.maze", "api/pomdp_py.problems.maze.domain", "api/pomdp_py.problems.maze.env", "api/pomdp_py.problems.maze.models", "api/pomdp_py.problems.maze.models.components", "api/pomdp_py.problems.multi_object_search", "api/pomdp_py.problems.multi_object_search.agent", "api/pomdp_py.problems.multi_object_search.domain", "api/pomdp_py.problems.multi_object_search.env", "api/pomdp_py.problems.multi_object_search.models", "api/pomdp_py.problems.multi_object_search.models.components", "api/pomdp_py.problems.rocksample", "api/pomdp_py.problems.rocksample.cythonize", "api/pomdp_py.problems.tag", "api/pomdp_py.problems.tag.agent", "api/pomdp_py.problems.tag.domain", "api/pomdp_py.problems.tag.env", "api/pomdp_py.problems.tag.models", "api/pomdp_py.problems.tag.models.components", "api/pomdp_py.problems.tiger", "api/pomdp_py.problems.tiger.cythonize", "api/pomdp_py.representations", "api/pomdp_py.representations.belief", "api/pomdp_py.representations.distribution", "api/pomdp_py.utils", "api/pomdp_py.utils.debugging", "api/pomdp_py.utils.interfaces", "api/pomdp_py.visual", "building_docs", "changelog", "design_principles", "examples", "examples.action_prior", "examples.external_solvers", "examples.mos", "examples.tiger", "existing_domains", "existing_solvers", "extensions", "index", "installation", "modules", "other_libraries", "simple_rl_integration"], "filenames": ["api/modules.rst", "api/pomdp_py.rst", "api/pomdp_py.algorithms.rst", "api/pomdp_py.algorithms.bsp.rst", "api/pomdp_py.algorithms.visual.rst", "api/pomdp_py.framework.rst", "api/pomdp_py.problems.rst", "api/pomdp_py.problems.lasertag.rst", "api/pomdp_py.problems.light_dark.rst", "api/pomdp_py.problems.light_dark.agent.rst", "api/pomdp_py.problems.light_dark.domain.rst", "api/pomdp_py.problems.light_dark.env.rst", "api/pomdp_py.problems.light_dark.models.rst", "api/pomdp_py.problems.load_unload.rst", "api/pomdp_py.problems.maze.rst", "api/pomdp_py.problems.maze.domain.rst", "api/pomdp_py.problems.maze.env.rst", "api/pomdp_py.problems.maze.models.rst", "api/pomdp_py.problems.maze.models.components.rst", "api/pomdp_py.problems.multi_object_search.rst", "api/pomdp_py.problems.multi_object_search.agent.rst", "api/pomdp_py.problems.multi_object_search.domain.rst", "api/pomdp_py.problems.multi_object_search.env.rst", "api/pomdp_py.problems.multi_object_search.models.rst", "api/pomdp_py.problems.multi_object_search.models.components.rst", "api/pomdp_py.problems.rocksample.rst", "api/pomdp_py.problems.rocksample.cythonize.rst", "api/pomdp_py.problems.tag.rst", "api/pomdp_py.problems.tag.agent.rst", "api/pomdp_py.problems.tag.domain.rst", "api/pomdp_py.problems.tag.env.rst", "api/pomdp_py.problems.tag.models.rst", "api/pomdp_py.problems.tag.models.components.rst", "api/pomdp_py.problems.tiger.rst", "api/pomdp_py.problems.tiger.cythonize.rst", "api/pomdp_py.representations.rst", "api/pomdp_py.representations.belief.rst", "api/pomdp_py.representations.distribution.rst", "api/pomdp_py.utils.rst", "api/pomdp_py.utils.debugging.rst", "api/pomdp_py.utils.interfaces.rst", "api/pomdp_py.visual.rst", "building_docs.rst", "changelog.rst", "design_principles.rst", "examples.rst", "examples.action_prior.rst", "examples.external_solvers.rst", "examples.mos.rst", "examples.tiger.rst", "existing_domains.rst", "existing_solvers.rst", "extensions.rst", "index.rst", "installation.rst", "modules.rst", "other_libraries.rst", "simple_rl_integration.rst"], "titles": ["pomdp_py", "pomdp_py package", "pomdp_py.algorithms package", "pomdp_py.algorithms.bsp package", "pomdp_py.algorithms.visual package", "pomdp_py.framework package", "pomdp_py.problems package", "pomdp_py.problems.lasertag package", "pomdp_py.problems.light_dark package", "pomdp_py.problems.light_dark.agent package", "pomdp_py.problems.light_dark.domain package", "pomdp_py.problems.light_dark.env package", "pomdp_py.problems.light_dark.models package", "pomdp_py.problems.load_unload package", "pomdp_py.problems.maze package", "pomdp_py.problems.maze.domain package", "pomdp_py.problems.maze.env package", "pomdp_py.problems.maze.models package", "pomdp_py.problems.maze.models.components package", "pomdp_py.problems.multi_object_search package", "pomdp_py.problems.multi_object_search.agent package", "pomdp_py.problems.multi_object_search.domain package", "pomdp_py.problems.multi_object_search.env package", "pomdp_py.problems.multi_object_search.models package", "pomdp_py.problems.multi_object_search.models.components package", "pomdp_py.problems.rocksample package", "pomdp_py.problems.rocksample.cythonize package", "pomdp_py.problems.tag package", "pomdp_py.problems.tag.agent package", "pomdp_py.problems.tag.domain package", "pomdp_py.problems.tag.env package", "pomdp_py.problems.tag.models package", "pomdp_py.problems.tag.models.components package", "pomdp_py.problems.tiger package", "pomdp_py.problems.tiger.cythonize package", "pomdp_py.representations package", "pomdp_py.representations.belief package", "pomdp_py.representations.distribution package", "pomdp_py.utils package", "pomdp_py.utils.debugging module", "pomdp_py.utils.interfaces package", "pomdp_py.visual package", "Building Documentations", "Changelog", "Design Principles", "Examples", "Preference-based Action Prior", "Using External Solvers", "Multi-Object Search (MOS)", "Tiger", "Existing POMDP Domains", "Existing POMDP Solvers", "Use Case Extensions", "pomdp_py Documentation", "Installation", "docs", "Other POMDP Libraries", "Integration with <cite>simple_rl</cite>"], "terms": {"packag": [0, 42, 48, 53, 54], "algorithm": [0, 1, 5, 43, 47, 52, 53, 56], "po_rollout": [0, 1], "modul": [0, 1, 35, 42, 43, 48, 49, 53], "porollout": [0, 1, 2], "po_uct": [0, 1], "actionprior": [0, 1, 2, 43, 46, 49], "pouct": [0, 1, 2, 38, 39, 43, 46, 48, 49, 51, 52], "qnode": [0, 1, 2, 38, 39], "randomrollout": [0, 1, 2, 34], "rolloutpolici": [0, 1, 2, 23, 25, 26, 31, 33, 38, 46, 49], "rootvnod": [0, 1, 2], "treenod": [0, 1, 2], "vnode": [0, 1, 2, 38, 39, 43], "pomcp": [0, 1, 36, 38, 39, 43, 46, 49, 51, 52, 54, 56], "rootvnodeparticl": [0, 1, 2], "vnodeparticl": [0, 1, 2], "value_iter": [0, 1], "valueiter": [0, 1, 2, 43, 49, 51], "bsp": [0, 1], "blqr": [0, 1, 43], "visual": [0, 1, 6, 8, 19, 27, 48], "framework": [0, 1, 34, 43, 44, 48, 49, 53], "basic": [0, 1, 2, 25, 26, 36, 44, 47, 49, 51], "action": [0, 1, 2, 5, 6, 8, 14, 19, 22, 23, 24, 25, 26, 27, 31, 32, 33, 34, 36, 38, 39, 43, 44, 47, 48, 49, 51, 54], "agent": [0, 1, 2, 5, 6, 8, 14, 15, 19, 23, 24, 25, 26, 27, 29, 33, 34, 36, 38, 39, 44, 48, 49, 50, 51, 52, 53, 54], "blackboxmodel": [0, 1, 5, 36, 43, 49], "distribut": [0, 1, 2, 5, 20, 23, 25, 26, 31, 33, 34, 35, 36, 38, 44, 46, 49], "environ": [0, 1, 5, 11, 16, 22, 23, 33, 34, 43, 44, 48, 49], "generativedistribut": [0, 1, 5, 20, 32, 37], "observ": [0, 1, 2, 3, 5, 6, 8, 11, 14, 19, 23, 24, 25, 26, 27, 31, 33, 34, 36, 38, 39, 43, 44, 47, 48, 49, 51, 53, 54], "observationmodel": [0, 1, 5, 6, 23, 25, 26, 31, 33, 34, 36, 38, 44, 49, 52], "option": [0, 1, 2, 5, 21, 23, 24, 25, 26, 33, 34, 38, 39, 43, 47, 49, 54], "pomdp": [0, 1, 2, 5, 14, 21, 23, 25, 26, 29, 31, 33, 34, 38, 39, 42, 43, 44, 45, 46, 52, 53], "policymodel": [0, 1, 2, 5, 6, 19, 23, 33, 43, 46, 49, 52], "rewardmodel": [0, 1, 5, 6, 23, 25, 26, 31, 33, 34, 38, 43, 44, 49], "state": [0, 1, 2, 3, 5, 6, 8, 14, 19, 20, 22, 23, 25, 26, 27, 31, 33, 34, 36, 37, 38, 43, 44, 46, 47, 48, 49, 51, 54, 56], "transitionmodel": [0, 1, 5, 6, 23, 25, 26, 31, 33, 34, 36, 38, 44, 49, 52], "sample_explict_model": [0, 1, 5], "sample_generative_model": [0, 1, 5], "oopomdp": [0, 1, 43, 48, 52], "oobelief": [0, 1, 5, 20, 43], "ooobserv": [0, 1, 5, 21], "ooobservationmodel": [0, 1, 5, 23], "oostat": [0, 1, 5, 21, 43], "ootransitionmodel": [0, 1, 5, 23], "objectst": [0, 1, 5, 19, 21], "planner": [0, 1, 2, 3, 25, 26, 33, 34, 47, 49], "represent": [0, 1, 2, 5, 20, 22, 43, 53], "belief": [0, 1, 2, 3, 5, 6, 8, 11, 19, 25, 26, 28, 33, 35, 37, 43, 47, 48, 49, 54], "histogram": [0, 1, 20, 34, 35, 43, 47, 49], "particl": [0, 1, 2, 20, 35, 43, 54], "gaussian": [0, 1, 2, 3, 35], "util": [0, 1, 43, 47, 53], "subpackag": [0, 1], "interfac": [0, 1, 5, 38, 43, 44, 47, 48, 49, 50, 51, 52, 53, 56], "submodul": [0, 1, 6, 14, 17], "color": [0, 1, 39], "lighter": [0, 1, 38], "rgb_to_hex": [0, 1, 38], "hex_to_rgb": [0, 1, 38], "inverse_color_rgb": [0, 1, 38], "inverse_color_hex": [0, 1, 38], "random_unique_color": [0, 1, 38], "cython_util": [0, 1], "cpython": [0, 1], "37m": [0, 1], "x86_64": [0, 1], "linux": [0, 1, 54], "gnu": [0, 1], "det_dict_hash": [0, 1, 38], "debug": [0, 1, 43, 53], "treedebugg": [0, 1, 33, 43], "sorted_by_str": [0, 1, 38, 39], "interpret_color": [0, 1, 38, 39], "math": [0, 1, 2, 5, 43], "vec": [0, 1, 38], "proj": [0, 1, 38], "r_x": [0, 1, 38], "r_y": [0, 1, 38], "r_z": [0, 1, 38], "t": [0, 1, 2, 3, 5, 20, 22, 33, 34, 36, 37, 38, 44, 47, 49, 51, 56], "to_radian": [0, 1, 38], "r_between": [0, 1, 38], "approx_equ": [0, 1, 38], "euclidean_dist": [0, 1, 6, 23, 24, 25, 26, 38], "misc": [0, 1], "remap": [0, 1, 38], "json_saf": [0, 1, 38], "safe_slic": [0, 1, 38], "similar": [0, 1, 38, 47, 49], "special_char": [0, 1, 38], "plot": [0, 1, 6, 8, 54], "templat": [0, 1, 43], "simplest": [0, 1, 38], "simpleact": [0, 1, 38], "simpleobserv": [0, 1, 38], "dettransitionmodel": [0, 1, 38], "detobservationmodel": [0, 1, 38], "detrewardmodel": [0, 1, 38], "uniformpolicymodel": [0, 1, 38], "tabulartransitionmodel": [0, 1, 38, 43], "tabularobservationmodel": [0, 1, 38, 43], "tabularrewardmodel": [0, 1, 38, 43], "test_util": [0, 1], "typ": [0, 1], "bcolor": [0, 1, 38], "info": [0, 1, 38], "note": [0, 1, 2, 5, 23, 33, 34, 36, 37, 38, 39, 46, 47, 49, 53, 54], "error": [0, 1, 38, 43], "warn": [0, 1, 2, 38, 39, 47], "success": [0, 1, 2, 38], "bold": [0, 1, 38], "cyan": [0, 1, 38], "magenta": [0, 1, 38], "blue": [0, 1, 38, 39], "green": [0, 1, 38, 54], "yellow": [0, 1, 38], "red": [0, 1, 38, 48], "white": [0, 1, 38], "content": [0, 1, 42, 53], "clear_ag": [1, 2], "last_best_reward": [1, 2], "plan": [1, 2, 3, 5, 11, 23, 24, 38, 39, 43, 46, 47, 49, 52, 53, 56], "set_rollout_polici": [1, 2], "updat": [1, 2, 3, 5, 36, 38, 39, 43, 47, 48, 49], "update_agent_belief": [1, 2, 5], "get_preferred_act": [1, 2, 46], "last_num_sim": [1, 2, 49], "last_planning_tim": [1, 2], "updates_agent_belief": [1, 2, 5], "rollout": [1, 2, 6, 19, 23, 25, 26, 27, 31, 33, 38, 43, 46, 49], "from_vnod": [1, 2], "histori": [1, 2, 5, 20, 23, 25, 26, 28, 31, 33, 38, 39, 46, 49], "children": [1, 2, 38, 39, 43], "num_visit": [1, 2], "valu": [1, 2, 5, 25, 26, 32, 33, 35, 37, 38, 39, 43, 46, 47, 49, 54, 56], "argmax": [1, 2, 5, 6, 19, 23, 25, 26, 27, 31, 33, 34, 38, 43, 49], "print_children_valu": [1, 2], "ekf_update_mlo": [1, 2, 3], "integrate_belief_seg": [1, 2, 3], "segmented_cost_funct": [1, 2, 3], "create_plan": [1, 2, 3], "interpret_sqp_plan": [1, 2, 3], "add_attr": [1, 5], "all_act": [1, 5], "all_observ": [1, 5], "all_stat": [1, 5], "init_belief": [1, 5, 25, 28, 33, 34, 49], "sample_belief": [1, 5], "set_belief": [1, 5, 47, 49], "update_histori": [1, 5, 49], "sampl": [1, 2, 5, 6, 19, 20, 23, 25, 26, 27, 31, 33, 34, 37, 38, 43, 46, 47, 49, 54], "__getitem__": [1, 5, 35, 37, 38, 39], "__setitem__": [1, 5, 35, 37], "apply_transit": [1, 5], "blackbox_model": [1, 5, 36], "cur_stat": [1, 5], "provide_observ": [1, 5], "reward_model": [1, 5, 6, 11, 19, 27, 48, 49], "state_transit": [1, 5, 19, 22, 47, 49], "transition_model": [1, 5, 6, 8, 19, 27, 36, 47, 48, 49], "get_histogram": [1, 5, 35, 37], "mpe": [1, 5, 19, 20, 31, 32, 35, 37, 43], "get_all_observ": [1, 5, 6, 33, 34, 38, 49], "get_distribut": [1, 5, 33, 34], "probabl": [1, 5, 6, 14, 19, 20, 23, 25, 26, 27, 31, 32, 33, 34, 37, 38, 43, 44, 47, 49, 51], "initi": [1, 5, 20, 22, 25, 26, 28, 33, 43, 46, 47, 48, 49], "polici": [1, 2, 5, 14, 23, 25, 26, 31, 33, 34, 38, 43, 46, 47, 49], "termin": [1, 2, 5, 25, 26, 38, 39, 47, 49], "get_all_act": [1, 5, 6, 19, 23, 25, 26, 27, 31, 33, 34, 38, 46, 49], "get_all_st": [1, 5, 6, 33, 34, 38, 49], "b": [1, 2, 3, 5, 36, 38, 39, 47], "object_belief": [1, 5, 20], "random": [1, 2, 5, 6, 19, 20, 23, 25, 26, 31, 32, 35, 37, 38, 43, 46, 49], "set_object_belief": [1, 5], "factor": [1, 5, 19, 21, 47], "merg": [1, 5, 19, 21], "observation_model": [1, 5, 6, 8, 19, 27, 36, 47, 48, 49], "copi": [1, 5, 54], "get_object_attribut": [1, 5], "get_object_class": [1, 5], "get_object_st": [1, 5], "": [1, 2, 3, 5, 14, 21, 22, 23, 24, 25, 26, 29, 31, 33, 34, 36, 38, 39, 42, 43, 44, 47, 49, 51, 53], "set_object_st": [1, 5], "situat": [1, 5, 48], "abstraction_over_histogram": [1, 35, 36], "update_histogram_belief": [1, 35, 36, 47, 49], "abstraction_over_particl": [1, 35, 36], "particle_reinvigor": [1, 35, 36], "update_particles_belief": [1, 35, 36], "is_norm": [1, 35, 37], "add": [1, 2, 20, 35, 37, 43], "from_histogram": [1, 35, 37], "get_abstract": [1, 35, 37], "weightedparticl": [1, 35, 37, 43], "condens": [1, 35, 37], "weight": [1, 2, 35, 37, 38], "cov": [1, 35, 37], "covari": [1, 2, 3, 35, 37], "mean": [1, 2, 22, 24, 35, 36, 37, 47], "sigma": [1, 20, 23, 35, 37], "simple_rl": [1, 38, 53, 56], "num_nod": [1, 38, 39], "depth": [1, 2, 38, 39], "d": [1, 2, 3, 38, 39, 49, 53], "num_lay": [1, 38, 39], "nl": [1, 38, 39], "nn": [1, 38, 39], "nq": [1, 38, 39], "nv": [1, 38, 39], "l": [1, 2, 3, 38, 39, 48, 49, 53], "layer": [1, 38, 39], "leaf": [1, 38, 39], "step": [1, 2, 33, 34, 38, 39, 42, 43, 47, 49, 54], "back": [1, 38, 39], "root": [1, 38, 39, 42, 54], "r": [1, 2, 3, 5, 19, 22, 23, 25, 26, 31, 33, 34, 38, 39, 43, 44, 47, 49, 51, 53, 54], "c": [1, 2, 38, 39, 56], "p": [1, 25, 26, 38, 39, 53], "pp": [1, 38, 39], "mbp": [1, 38, 39], "pm": [1, 38, 39], "mark_sequ": [1, 38, 39], "mark": [1, 14, 21, 38, 39, 48], "mark_path": [1, 38, 39], "markp": [1, 38, 39], "clear": [1, 2, 20, 28, 38, 39, 48], "bestseq": [1, 38, 39], "bestseqd": [1, 38, 39], "single_node_str": [1, 38, 39], "preferred_act": [1, 38, 39], "path": [1, 38, 39, 42, 47], "path_to": [1, 38, 39], "tree_stat": [1, 38, 39], "left": [1, 19, 21, 33, 34, 38, 39, 47, 49, 54], "up": [1, 5, 38, 39], "right": [1, 19, 20, 21, 33, 34, 38, 39, 47, 49, 54], "down": [1, 38, 49], "longleft": [1, 38], "longright": [1, 38], "hline": [1, 38], "vline": [1, 38], "bottomleft": [1, 38], "longbottomleft": [1, 38], "topleft": [1, 38], "longtopleft": [1, 38], "topright": [1, 38], "longtopright": [1, 38], "bottomright": [1, 38], "longbottomright": [1, 38], "intersect": [1, 38], "topt": [1, 38], "leftt": [1, 38], "rightt": [1, 38], "bottomt": [1, 38], "shadebar": [1, 38], "subscript": [1, 38], "reward_func": [1, 38], "endc": [1, 38], "disabl": [1, 38], "exist": [2, 38, 39, 45, 47, 49, 52, 53], "solver": [2, 33, 43, 45, 48, 49, 53], "under": [2, 24, 42, 47, 49, 56], "develop": [2, 5, 47, 51, 53, 54, 56], "contribut": [2, 50, 53, 54], "want": [2, 20, 42, 48], "po": [2, 25, 26, 53], "baselin": 2, "paper": [2, 3, 14, 21, 23, 29, 31, 46, 48, 49, 53], "2": [2, 21, 25, 26, 28, 31, 32, 38, 39, 46, 47, 49, 53, 54, 56], "quot": [2, 14, 33, 34, 49], "from": [2, 5, 14, 20, 21, 22, 23, 24, 28, 31, 33, 34, 37, 38, 39, 42, 43, 46, 47, 48, 49, 54], "To": [2, 34, 38, 39, 42, 46, 48, 49], "provid": [2, 47, 48, 49, 52, 53, 56], "perform": [2, 3, 5, 47, 49, 56], "benchmark": 2, "case": [2, 22, 23, 33, 34, 36, 47, 49, 50, 53, 56], "we": [2, 20, 23, 24, 42, 45, 47, 48, 49, 50, 53, 54, 56], "evalu": [2, 37], "simpl": [2, 21, 23, 24, 25, 26, 33, 45, 48, 49, 53], "mont": [2, 49], "carlo": [2, 49], "simul": [2, 5, 22, 33, 43, 47, 49], "without": [2, 43, 47, 48, 49], "ani": [2, 14, 22, 23, 37, 47], "tree": [2, 38, 39, 43, 48, 49], "The": [2, 3, 5, 14, 15, 21, 22, 23, 24, 25, 26, 29, 31, 33, 34, 37, 38, 39, 42, 43, 44, 45, 46, 47, 48, 49, 51, 52, 53, 56], "us": [2, 3, 5, 20, 21, 22, 23, 24, 33, 36, 37, 38, 39, 42, 43, 44, 45, 46, 48, 49, 50, 51, 53, 54, 56], "describ": [2, 3, 5, 22, 42, 44, 45, 46, 48, 49, 53], "section": [2, 48, 49], "3": [2, 21, 22, 25, 26, 33, 34, 38, 39, 47, 49, 54, 56], "It": [2, 3, 5, 21, 23, 37, 38, 39, 43, 46, 47, 48, 49, 53, 56], "n": [2, 21, 25, 26, 36, 37, 38, 39, 47, 48], "A": [2, 3, 5, 14, 20, 22, 28, 33, 34, 38, 39, 43, 44, 47, 48, 49, 51, 53, 56], "each": [2, 3, 5, 14, 22, 23, 37, 38, 39, 47], "legal": 2, "select": 2, "highest": [2, 5, 32, 37, 38, 39], "averag": [2, 37], "return": [2, 3, 5, 20, 22, 23, 24, 25, 26, 31, 32, 33, 34, 36, 37, 38, 39, 43, 46, 47, 49], "don": [2, 5, 36, 49], "requir": [2, 5, 23, 25, 26, 31, 33, 34, 36, 38, 43, 44, 54], "an": [2, 3, 5, 14, 20, 21, 23, 24, 25, 26, 33, 34, 37, 38, 43, 44, 46, 47, 48, 49, 51, 53, 56], "But": [2, 5, 21, 23, 33, 34, 36, 42, 43, 49], "do": [2, 5, 42, 48, 49], "class": [2, 3, 5, 11, 15, 16, 20, 21, 22, 23, 24, 25, 26, 28, 29, 31, 32, 33, 34, 37, 38, 39, 43, 44, 46, 47, 48, 49, 52], "base": [2, 3, 5, 11, 15, 16, 20, 21, 22, 23, 24, 25, 26, 28, 29, 31, 32, 33, 34, 36, 37, 38, 39, 42, 47, 48, 49, 52, 53, 56], "self": [2, 5, 20, 22, 23, 25, 26, 31, 32, 33, 34, 37, 38, 39, 46, 48, 49], "carri": [2, 5], "inform": [2, 3, 5, 24, 28, 42, 44, 49], "bt": [2, 3, 5], "ht": [2, 5], "o": [2, 5, 25, 26, 31, 33, 34, 36, 38, 42, 44, 47, 49, 51, 53], "g": [2, 3, 5, 14, 22, 33, 43, 49, 50], "pi": [2, 5, 23, 25, 26, 34, 44, 49], "necessari": [2, 5, 48], "rollout_polici": [2, 38, 39, 49], "given": [2, 5, 22, 23, 34, 36, 37, 38, 39, 44, 46, 47, 49], "one": [2, 5, 20, 22, 33, 34, 38, 39, 45, 49, 53, 56], "real_act": [2, 5, 28, 36], "real_observ": [2, 5, 28, 36, 49], "real": [2, 5, 36, 47, 49], "accordingli": [2, 5], "If": [2, 3, 5, 20, 22, 23, 28, 33, 34, 36, 37, 38, 39, 47, 49, 53], "i": [2, 3, 5, 14, 15, 20, 21, 22, 23, 24, 25, 26, 31, 33, 34, 36, 37, 38, 39, 42, 43, 44, 46, 47, 48, 49, 50, 53, 54, 56], "also": [2, 5, 23, 33, 34, 38, 39, 48, 49, 51, 53, 56], "here": [2, 5, 38, 39, 42, 46, 47, 49, 50, 54], "attribut": [2, 5, 21], "should": [2, 3, 5, 21, 23, 36, 42, 43, 44, 47, 48, 49, 52, 54], "set": [2, 5, 20, 21, 22, 24, 25, 26, 31, 33, 34, 36, 37, 38, 43, 46, 47, 48, 49, 56], "true": [2, 5, 14, 22, 23, 24, 33, 36, 37, 38, 39, 43, 47, 49, 54], "By": [2, 5, 24, 47], "default": [2, 5, 33, 36, 43, 47], "doe": [2, 5, 14, 24, 31, 37, 38, 39, 43, 44, 47, 49, 56], "noth": [2, 5], "function": [2, 3, 5, 20, 22, 28, 33, 36, 37, 38, 39, 43, 46, 47, 49, 51], "thi": [2, 3, 5, 19, 20, 21, 22, 23, 24, 25, 26, 31, 33, 34, 36, 37, 38, 39, 42, 43, 44, 45, 46, 47, 49, 53, 54, 56], "uct": 2, "partial": [2, 14, 33, 34, 49, 53], "present": [2, 37], "extens": [2, 21, 23, 43, 49, 50, 53, 56], "combin": [2, 38], "mct": 2, "ucb1": [2, 43], "In": [2, 31, 33, 34, 45, 46, 47, 48, 49, 50], "other": [2, 6, 25, 26, 33, 34, 49, 53], "word": 2, "just": [2, 15, 20, 33, 34, 37, 38, 47, 49, 54], "arbitrari": 2, "strategi": 2, "mai": [2, 5, 36, 42, 44, 45, 48, 53, 54], "refer": [2, 3, 33, 34, 42, 43, 46], "spars": 2, "poss": 2, "introduc": [2, 14, 43, 48, 49], "recent": 2, "5": [2, 3, 22, 24, 25, 26, 33, 38, 39, 47, 49, 54], "mdp": [2, 5, 53, 56], "6": [2, 38, 39, 47, 49, 54], "propos": 2, "call": [2, 5, 36, 47, 49], "powss": 2, "howev": [2, 49], "line": [2, 47, 48], "work": [2, 38, 39, 43, 47, 49, 53, 54, 56], "sole": 2, "still": [2, 36, 49], "compar": [2, 37], "exactli": 2, "while": [2, 33, 34, 43, 49], "depend": [2, 3, 5, 31, 38, 43, 54], "explor": [2, 38, 39], "constant": [2, 6, 38], "7": [2, 38, 39, 43, 47], "reflect": 2, "prior": [2, 5, 20, 28, 33, 43, 49], "knowledg": [2, 49], "regard": [2, 5, 43, 49], "amount": 2, "thei": [2, 20, 24, 36, 47], "follow": [2, 3, 5, 33, 34, 38, 39, 46, 47, 48, 49, 53, 54], "wa": [2, 43, 48], "r_": 2, "hi": 2, "lo": 2, "where": [2, 3, 5, 21, 22, 23, 25, 26, 36, 48, 49, 54], "rhi": 2, "achiev": 2, "dure": [2, 24, 38, 39, 43, 46, 47, 49], "run": [2, 24, 33, 34, 42, 43, 47, 48, 49, 54], "0": [2, 5, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 33, 37, 38, 39, 46, 47, 49, 54], "rlo": 2, "lowest": 2, "inde": [2, 49], "differ": [2, 21, 23, 42, 43, 44, 48, 56], "between": [2, 5, 22, 24, 33, 38, 43, 44, 48, 56], "certainli": 2, "onli": [2, 5, 14, 23, 33, 38, 39, 43, 44, 49], "wai": [2, 47, 49, 56], "obtainx1": 2, "object": [2, 5, 20, 21, 22, 23, 24, 25, 26, 32, 38, 39, 43, 46, 49, 52, 53, 54], "problem": [2, 3, 5, 36, 43, 45, 47, 49, 50, 53, 54, 56], "specif": [2, 5, 37, 38, 39, 43, 49, 56], "cl": [2, 5], "kwarg": [2, 5, 20, 21, 22, 23, 25, 26, 32, 34, 37, 38, 39, 43], "intend": 2, "classmethod": [2, 5, 21, 23, 31, 32, 37, 47], "mimic": 2, "behavior": [2, 21, 43, 49], "generateleg": 2, "generatepref": 2, "david": [2, 49], "silver": [2, 49], "code": [2, 5, 38, 43, 46, 47, 48, 49, 53, 56], "tupl": [2, 3, 5, 20, 22, 23, 25, 26, 31, 37, 38], "form": [2, 36], "num_visits_init": 2, "value_init": 2, "repres": [2, 3, 5, 20, 25, 26, 36, 37, 38, 39, 45, 47, 48], "prefer": [2, 38, 39, 43, 49], "act": [2, 5, 49, 53, 54], "despot": [2, 56], "For": [2, 5, 22, 24, 37, 43, 49, 54], "exampl": [2, 5, 19, 22, 24, 33, 34, 38, 39, 43, 46, 48, 49, 50, 51, 53], "certain": [2, 5], "possibl": [2, 5, 21, 23, 25, 26, 31, 33, 34, 38, 49, 56], "subset": [2, 38, 39], "all": [2, 5, 20, 23, 25, 26, 31, 33, 34, 37, 38, 39, 43, 49, 56], "when": [2, 5, 25, 26, 29, 31, 37, 38, 39, 42, 43, 45, 46, 47, 48, 49, 53, 54, 56], "domain": [2, 6, 8, 11, 14, 19, 23, 27, 33, 43, 45, 48, 53], "can": [2, 5, 15, 21, 22, 23, 29, 33, 34, 38, 39, 43, 47, 48, 49, 51, 54, 56], "heurist": [2, 25, 26, 49], "space": [2, 3, 5, 11, 14, 20, 21, 23, 25, 26, 29, 33, 34, 36, 43, 47, 48, 49, 51], "enumer": [2, 33, 38, 39, 43, 44, 47, 49, 51], "__init__": [2, 5, 37, 42, 43, 46, 48, 49], "max_depth": [2, 38, 39, 49], "planning_tim": [2, 43, 49], "1": [2, 3, 5, 20, 21, 22, 23, 24, 25, 26, 28, 31, 33, 34, 37, 38, 39, 46, 47, 48, 49, 53, 54], "num_sim": [2, 38, 39, 43], "discount_factor": [2, 5, 38, 39, 47, 49], "9": [2, 38, 43, 47, 49, 54], "exploration_const": [2, 38, 39, 49], "sqrt": 2, "action_prior": [2, 46], "none": [2, 3, 5, 11, 20, 21, 23, 25, 26, 31, 33, 36, 37, 38, 39, 46, 47, 49, 54], "show_progress": 2, "fals": [2, 5, 20, 22, 23, 24, 25, 26, 32, 33, 34, 36, 38, 47, 54], "pbar_update_interv": 2, "paramet": [2, 3, 5, 20, 22, 23, 25, 26, 28, 31, 33, 34, 36, 37, 38, 39, 43, 47, 49], "int": [2, 20, 22, 33, 34, 38, 39, 47], "float": [2, 5, 22, 23, 25, 26, 31, 33, 34, 37, 38, 47], "time": [2, 21, 25, 26, 36, 47, 48], "second": [2, 36, 38, 39, 42, 47, 48], "neg": [2, 33, 34, 43, 49], "number": [2, 5, 20, 33, 34, 36, 37, 38, 39, 43, 47, 56], "reach": [2, 5, 47, 49], "both": [2, 33, 34, 38, 39, 47, 48], "ar": [2, 5, 20, 23, 24, 25, 26, 29, 33, 34, 36, 37, 38, 39, 42, 43, 44, 47, 48, 49, 50, 54, 56], "over": [2, 20, 33, 36, 37, 44, 45, 46, 49], "bool": [2, 5, 22, 33, 36, 38, 39, 47], "print": [2, 38, 39, 43, 47, 49], "progress": [2, 43], "bar": [2, 43], "after": [2, 5, 21, 22, 23, 43, 47, 49], "you": [2, 5, 33, 34, 36, 38, 39, 42, 43, 46, 47, 48, 49, 53, 54], "even": [2, 50], "your": [2, 43, 48, 53], "stop": 2, "criteria": 2, "ran": 2, "last": [2, 14, 21], "assum": [2, 3, 5, 11, 20, 23, 24, 25, 26, 31, 33, 34, 37, 38, 43, 47, 54], "ha": [2, 5, 19, 24, 25, 26, 32, 37, 42, 47, 48, 52, 56], "been": [2, 49, 50], "take": [2, 5, 15, 25, 26, 29, 37, 43, 46, 47, 48, 49], "receiv": [2, 5, 25, 26, 33, 34, 48, 49], "choos": [2, 46, 49], "uniformli": [2, 49], "child": 2, "implement": [2, 3, 5, 14, 23, 25, 26, 29, 31, 33, 34, 37, 38, 43, 45, 46, 49, 50, 51, 52, 53, 56], "origin": [2, 11, 14, 21, 23, 25, 26, 46, 48, 49, 53], "larg": [2, 5, 29, 31, 49], "http": [2, 3, 47, 53, 54], "nip": 2, "cc": 2, "4031": 2, "One": [2, 20, 49], "thing": 2, "happen": [2, 23], "new": [2, 5, 22, 36, 37, 43, 53], "store": [2, 5, 38, 47, 49], "level": [2, 48], "execut": [2, 5, 22, 24, 38, 39, 47, 49], "next": [2, 5, 23, 25, 26, 31, 33, 34, 38, 49], "These": 2, "reinvigor": [2, 36, 54], "enough": [2, 34, 50], "separ": [2, 42, 43, 48], "complet": [2, 38, 47], "node": [2, 38, 39, 43, 47], "longer": 2, "keep": [2, 34, 36, 38], "track": [2, 36], "reinvogr": 2, "onc": [2, 5, 33, 49], "have": [2, 3, 5, 20, 22, 25, 26, 33, 34, 36, 37, 38, 39, 43, 44, 47, 48, 49, 50, 56], "previous": [2, 43, 48], "version": [2, 47, 54], "basicpomcp": 2, "jl": [2, 47, 56], "github": [2, 42, 43, 47, 53, 54], "com": [2, 47, 54], "juliapomdp": 2, "two": [2, 33, 34, 37, 38, 42, 45, 47, 49, 56], "equival": [2, 49], "gener": [2, 5, 33, 34, 37, 42, 44, 46, 47, 48, 49, 50, 53], "doesn": [2, 20, 33, 34, 56], "hurt": [2, 33, 34, 49], "featur": [2, 38, 39, 43, 53, 56], "state_transform_func": [2, 36], "artifici": [2, 49, 53], "transform": 2, "signatur": [2, 43], "s_transform": 2, "maintain": [2, 5, 36, 47], "iter": [2, 25, 26, 33, 36, 43, 47, 49, 54, 56], "explain": [2, 42], "4": [2, 3, 21, 38, 39, 47, 49, 54], "stochast": [2, 14, 49, 53], "No": [2, 47], "prune": [2, 47], "explod": 2, "veri": [2, 5, 49], "fast": 2, "feasibl": [2, 5, 25, 26, 31, 33, 34, 38], "small": [2, 23, 28, 31, 33, 34, 43, 49], "explicitli": [2, 25, 26, 36, 44, 46, 47, 49, 51], "horizon": [2, 43, 47, 49], "inf": [2, 47], "epsilon": [2, 20, 23, 37, 38], "1e": [2, 23, 37, 38, 49], "lqr": [2, 3], "maximum": [2, 3, 11, 20, 33, 34, 43, 47], "likelihood": [2, 3, 11, 37], "func_sysd": [2, 3], "func_ob": [2, 3], "jac_sysd": [2, 3], "jac_ob": [2, 3], "jac_sysd_u": [2, 3], "noise_ob": [2, 3], "noise_sysd": [2, 3], "qlarg": [2, 3], "q": [2, 3, 38, 39, 43], "planning_horizon": [2, 3], "15": [2, 3, 33, 38, 39, 47, 49], "sourc": [2, 3, 11, 15, 16, 19, 20, 21, 22, 23, 24, 25, 28, 29, 31, 32, 33, 36, 38, 39, 42, 47, 48, 49, 54], "ut": [2, 3], "ekf": [2, 3], "equat": [2, 3, 36], "12": [2, 3, 38, 47, 54], "13": [2, 3, 43], "f": [2, 3], "point": [2, 3, 24, 29, 31, 47], "mt": [2, 3], "cov_t": [2, 3], "np": [2, 3], "arrai": [2, 3, 37], "shape": [2, 3, 21, 23, 24, 48], "cost": [2, 3, 20, 25, 26, 36], "need": [2, 3, 20, 23, 33, 34, 36, 43, 46, 47, 49, 54], "turn": [2, 3], "long": [2, 3], "vector": [2, 3, 37, 38, 47], "consist": [2, 3, 34], "column": [2, 3], "stich": [2, 3], "togeth": [2, 3], "control": [2, 3, 23, 49], "noise_t": [2, 3], "nois": [2, 3, 25, 26, 33, 34, 49], "possibli": [2, 3], "matrix": [2, 3], "wt": [2, 3], "term": [2, 3], "e": [2, 3, 5, 21, 22, 23, 24, 25, 26, 31, 33, 34, 38, 39, 43, 48, 49, 50, 54], "ad": [2, 3, 5, 43], "system": [2, 3, 47, 49, 56], "dynam": [2, 3, 23, 24], "v": [2, 3, 38, 39, 43, 47], "eq": [2, 3], "sam": [2, 3], "dimension": [2, 3], "noise_obs_cov": [2, 3], "correspond": [2, 3, 22, 46, 47], "b_i": [2, 3], "u_i": [2, 3], "num_seg": [2, 3], "18": [2, 3, 38, 39, 47], "phi": [2, 3], "sum": [2, 3], "b_": [2, 3, 36, 49], "b_t": [2, 3, 49], "seg": [2, 3], "essenti": [2, 3, 44], "bu_traj": [2, 3], "b_de": [2, 3], "u_d": [2, 3], "17": [2, 3], "desir": [2, 3, 42], "covt": [2, 3], "comput": [2, 3, 20, 36, 43, 47], "list": [2, 3, 37, 38, 39, 43, 47], "begin": [2, 3, 38, 49], "segment": [2, 3], "avail": [2, 3, 5, 43, 53], "pass": [2, 3, 5, 47, 49], "empti": [2, 3, 28], "b_0": [2, 3], "u_init": [2, 3], "control_bound": [2, 3], "opt_opt": [2, 3], "opt_callback": [2, 3], "solv": [2, 3, 14, 33, 43, 45, 48, 51, 53, 54], "sqp": [2, 3], "direct": [2, 3, 52], "transcript": [2, 3], "produc": [2, 3], "doc": [2, 3, 43], "scipi": [2, 3], "org": [2, 3, 43, 47, 53, 54], "tutori": [2, 3, 43, 46], "optim": [2, 3, 49], "html": [2, 3, 42, 47, 54], "opt_r": [2, 3], "lesli": [2, 49, 53], "pack": [2, 49, 53], "kaelbl": [2, 49, 53], "michael": [2, 48, 49, 53], "littman": [2, 49, 53], "anthoni": [2, 47, 49, 51, 53], "cassandra": [2, 47, 49, 51, 53], "intellig": [2, 49, 53], "101": [2, 49, 53], "99": [2, 47, 49, 53], "134": [2, 49, 53], "1998": [2, 49, 53], "joel": [2, 49], "veness": [2, 49], "advanc": [2, 49, 56], "neural": [2, 49], "process": [2, 33, 34, 49], "2164": [2, 49], "2172": [2, 49], "2010": [2, 49], "levent": 2, "kocsi": 2, "csaba": 2, "szepesv": 2, "\u00e1": 2, "ri": 2, "bandit": 2, "european": 2, "confer": [2, 48, 49, 53], "machin": [2, 47], "learn": [2, 5, 44, 49, 50, 52, 53, 56], "282": 2, "293": 2, "springer": 2, "2006": 2, "platt": 2, "tedrak": 2, "lozano": 2, "perez": 2, "proceed": [2, 49], "robot": [2, 15, 20, 21, 22, 23, 24, 25, 26, 29, 31, 48, 49, 53, 56], "scienc": 2, "zaragoza": 2, "spain": 2, "june": 2, "doi": 2, "10": [2, 22, 25, 26, 28, 31, 33, 34, 38, 39, 43, 47, 49, 53], "15607": 2, "rss": 2, "vi": [2, 49], "037": 2, "h": [2, 49], "lim": 2, "clair": 2, "j": 2, "tomlin": 2, "zachari": 2, "sunberg": 2, "search": [2, 14, 20, 21, 23, 25, 26, 38, 39, 43, 49, 53, 54], "guarante": 2, "continu": [2, 43, 49], "arxiv": [2, 53], "preprint": 2, "1910": 2, "04332": 2, "2019": [2, 21, 23, 48, 49], "kearn": 2, "yishai": 2, "mansour": 2, "andrew": 2, "y": [2, 20, 21, 23, 25, 26, 28, 29], "ng": 2, "markov": [2, 33, 34, 49], "decis": [2, 33, 34, 49], "49": [2, 38], "193": 2, "208": 2, "2002": 2, "ant": 2, "\u00f3": 2, "nio": 2, "gusmao": 2, "tapani": 2, "raiko": 2, "toward": 2, "beyond": [2, 53], "game": 2, "go": [2, 14, 42, 45, 54], "ecai": 2, "384": 2, "389": 2, "2012": 2, "import": [5, 38, 39, 44, 46, 47, 49, 54], "must": [5, 14, 47, 49], "hashabl": [5, 38], "oper": 5, "its": [5, 14, 15, 22, 23, 24, 25, 26, 33, 34, 43, 44, 47, 49, 51, 52, 56], "job": [5, 44, 49], "taken": [5, 37], "care": [5, 20], "suppli": [5, 46], "OR": 5, "policy_model": [5, 6, 19, 27, 38, 39, 48, 49], "attr_nam": 5, "attr_valu": 5, "allow": [5, 43, 48, 49, 53], "sometim": [5, 49], "model": [5, 6, 8, 14, 19, 20, 21, 25, 26, 27, 33, 34, 38, 43, 47, 48, 51, 52, 53], "transit": [5, 22, 23, 25, 26, 31, 33, 34, 36, 38, 47, 48, 49], "current": [5, 14, 22, 25, 26, 36, 38, 39, 47, 51], "which": [5, 15, 22, 33, 34, 36, 37, 38, 39, 43, 46, 47, 49, 56], "most": [5, 20, 23, 25, 26, 31, 34, 37, 38], "like": [5, 20, 23, 25, 26, 31, 34, 37, 38, 39, 42, 43, 44, 48, 49, 54], "map": [5, 14, 17, 20, 21, 22, 23, 24, 28, 37, 38, 47], "variabl": [5, 32, 33, 37, 47], "pr": [5, 23, 25, 26, 31, 33, 34, 36, 37, 38], "x": [5, 20, 21, 22, 23, 25, 26, 28, 29, 37, 54], "varval": 5, "evaul": 5, "world": [5, 19, 21, 22, 23, 33, 49, 54], "2d": [5, 21, 23, 24, 43], "gridworld": [5, 20, 21, 23, 48], "render": 5, "pygam": [5, 54], "Or": [5, 37, 49, 54], "could": [5, 21, 22, 23, 33, 37, 45, 46, 49, 53, 56], "3d": 5, "opengl": 5, "therefor": [5, 36], "mind": 5, "how": [5, 33, 45, 48, 53], "so": [5, 14, 38, 39, 42, 43, 49, 54, 56], "passiv": 5, "never": [5, 31], "nor": [5, 33, 34, 49], "init_st": [5, 11, 16, 22, 25, 26, 33, 47], "next_stat": [5, 21, 22, 23, 25, 26, 31, 33, 34, 38, 49], "appli": [5, 43], "assign": [5, 37], "underli": [5, 34, 37], "accord": [5, 23, 24, 25, 26, 29, 31, 33, 34, 38, 48, 49], "type": [5, 20, 22, 23, 25, 26, 31, 33, 34, 36, 37, 38, 43, 46, 47], "synonym": 5, "result": [5, 21, 22, 23, 36, 49], "trigger": [5, 22], "becom": [5, 22, 49], "discount": [5, 25, 26, 47, 54], "until": [5, 47], "condit": [5, 49], "reward": [5, 22, 23, 25, 26, 31, 33, 34, 38, 47, 48, 49, 54], "addition": [5, 54], "exhibit": 5, "properti": [5, 11, 21, 22, 24, 25, 26, 38, 39, 43], "That": [5, 47], "support": [5, 23, 37, 44, 46, 52, 53, 56], "dictionari": [5, 20, 37, 38, 49], "randomli": [5, 23, 25, 26, 31, 33, 34, 37, 38, 48], "tempor": 5, "abstract": [5, 37], "defin": [5, 11, 14, 15, 21, 23, 37, 38, 43, 45, 46, 47, 48, 51, 52], "semi": 5, "reinforc": [5, 52, 56], "satisfi": 5, "conveni": [5, 33, 38, 43], "overriden": 5, "feel": [5, 56], "write": [5, 47], "boolean": 5, "whether": [5, 44, 47], "technic": 5, "instanc": [5, 22, 25, 26, 33, 34, 47, 48], "env": [5, 6, 8, 14, 19, 27, 47, 48, 49], "name": [5, 21, 25, 33, 34, 38, 47, 49], "treat": [5, 20, 33, 49], "h_t": [5, 49], "reason": 5, "accommod": 5, "vari": [5, 21, 23], "probabilti": 5, "arg": [5, 25, 26, 31, 33, 34, 38, 39, 43, 49], "pair": 5, "mathbb": 5, "denot": 5, "sim": [5, 49], "black": 5, "box": 5, "creat": [5, 6, 33, 38, 39, 42, 47, 48, 49], "n_step": 5, "compon": [5, 14, 17, 19, 23, 27, 31, 47, 48, 49], "oo": [5, 21, 43, 48, 52], "As": [5, 46, 48], "main": [5, 6, 25, 26, 33, 34, 47, 49], "benefit": 5, "reduc": [5, 21, 36], "scale": 5, "exponenti": 5, "linear": 5, "increas": 5, "see": [5, 37, 43, 44, 47, 48, 49, 50, 51, 53, 54], "alwai": [5, 14, 50], "objid": [5, 19, 20, 21, 23], "alia": [5, 38, 39], "return_oost": [5, 20, 43], "z": [5, 22, 36], "mapsto": 5, "z_1": 5, "cdot": [5, 47], "z_n": 5, "id": [5, 20, 21, 22, 23], "dict": [5, 20, 21, 22, 28, 36, 37, 43], "object_observ": [5, 21], "singl": [5, 21, 38, 39, 48], "prod_i": 5, "z_i": 5, "param": [5, 21], "again": 5, "chang": [5, 21, 23, 37, 43, 44, 49, 54], "directli": [5, 34, 36, 49, 51], "object_st": [5, 21, 23], "becaus": [5, 14, 20, 42, 44, 47, 49], "caus": 5, "hashcod": 5, "incorrect": [5, 38], "kei": [5, 38, 39], "attr": 5, "request": 5, "frozenset": 5, "identifi": 5, "sinc": [5, 36, 49], "hash": [5, 38, 43], "s_i": [5, 21], "made": [5, 36, 54], "str": [5, 22, 33, 37, 47], "onlin": [5, 49], "pure": 5, "underneath": 5, "hood": 5, "Its": 5, "output": [5, 42, 47, 54], "expect": [5, 47, 54], "same": [5, 29, 31, 33, 36, 37, 43, 47, 49], "lasertag": 6, "light_dark": [6, 50], "problem_discret": 6, "test": [6, 33, 36, 43, 47], "load_unload": 6, "maze": [6, 50], "multi_object_search": [6, 48, 54], "example_world": [6, 48], "random_world": [6, 19], "rocksampl": [6, 43, 54], "cython": [6, 38, 43, 53, 54, 56], "rocksample_problem": 6, "run_rocksampl": [6, 25], "rocktyp": [6, 25, 26], "good": [6, 25, 26, 48, 54], "bad": [6, 25, 26, 54], "invert": [6, 25, 26], "moveact": [6, 25, 26], "east": [6, 19, 21, 25, 26], "west": [6, 19, 21, 25, 26], "north": [6, 19, 21, 25, 26, 54], "south": [6, 19, 21, 25, 26], "sampleact": [6, 25, 26], "checkact": [6, 25, 26], "rstransitionmodel": [6, 25, 26], "rsobservationmodel": [6, 25, 26], "rsrewardmodel": [6, 25, 26], "rspolicymodel": [6, 25, 26], "rocksampleproblem": [6, 25, 26], "random_free_loc": [6, 25, 26], "in_exit_area": [6, 25, 26], "generate_inst": [6, 25, 26], "print_stat": [6, 25, 26], "test_plann": [6, 25, 26, 33, 34, 49], "init_particles_belief": [6, 25, 26], "tag": [6, 43], "experi": 6, "tiger": [6, 38, 39, 43, 46, 47, 48, 53, 54], "run_tig": [6, 33], "tiger_problem": [6, 38, 39, 43, 47, 49], "tigerst": [6, 33, 34, 47], "tigeract": [6, 33, 34], "tigerobserv": [6, 33, 34], "tigerproblem": [6, 33, 34, 38, 39, 47, 49], "make_tig": [6, 33], "lightdarkenviron": [8, 11], "light": [8, 11, 43], "const": [8, 11], "dark": [11, 43], "mazeenviron": [14, 16], "finit": [14, 33, 47, 49], "descript": [14, 21, 22, 23, 25, 26, 33, 34, 49], "start": [14, 22, 38, 39, 49, 54], "goal": [14, 49], "cannot": [14, 42], "perceiv": 14, "locat": [14, 20, 24, 25, 26, 29, 31, 54], "orient": [14, 15, 20, 21, 23, 24, 48, 52], "presenc": 14, "absenc": 14, "wall": [14, 15], "side": [14, 49], "squar": 14, "non": 14, "zero": [14, 43], "slip": 14, "know": [14, 36], "attempt": [14, 43], "make": [14, 20, 38, 39, 42, 43, 44, 48, 53, 54, 56], "move": [14, 25, 26, 31, 32, 38, 39, 48, 54], "had": 14, "consequ": 14, "actual": [14, 24, 33, 34, 49], "posit": [14, 15, 25, 26, 31, 32, 33, 34, 49], "Not": [14, 37], "yet": [14, 43, 48], "motion": [15, 21, 23, 25, 26, 29, 48], "look": [15, 21, 23, 48, 54], "positit": 15, "mosag": [19, 20], "clear_histori": [19, 20, 27, 28], "mosoobelief": [19, 20], "initialize_belief": [19, 20, 27, 28], "motionact": [19, 21, 24], "scheme_xyth": [19, 21], "scheme_vw": [19, 21], "forward": [19, 21], "backward": [19, 21, 43], "scheme_xi": [19, 21], "east2d": [19, 21, 32], "west2d": [19, 21, 32], "north2d": [19, 21, 32], "south2d": [19, 21, 32], "scheme": [19, 21], "lookact": [19, 21], "findact": [19, 21], "objectobserv": [19, 21, 23], "null": [19, 21, 23], "mosooobserv": [19, 21, 54], "for_obj": [19, 21], "pose": [19, 21, 23, 24, 48], "robotst": [19, 21], "robot_pos": [19, 21, 24], "objects_found": [19, 21], "mosoost": [19, 21], "object_pos": [19, 21], "mosenviron": [19, 22], "robot_id": [19, 20, 21, 22, 23, 24], "interpret": [19, 21, 22, 37, 48], "interpret_robot_id": [19, 22], "equip_sensor": [19, 22, 48], "make_laser_sensor": [19, 22, 48], "make_proximity_sensor": [19, 22, 48], "grid_map": [19, 20, 23, 27, 28, 31, 48], "sensor": [19, 20, 21, 22, 23, 25, 26, 48, 49], "mosobservationmodel": [19, 23], "objectobservationmodel": [19, 23], "unittest": [19, 23], "mosrewardmodel": [19, 23], "goalrewardmodel": [19, 23], "mostransitionmodel": [19, 23], "staticobjecttransitionmodel": [19, 23], "robottransitionmodel": [19, 23], "if_move_bi": [19, 23, 27, 31], "valid_pos": [19, 23, 31, 32], "in_boundari": [19, 23], "file": [19, 42, 43, 48, 49, 54, 56], "some": [19, 38, 43, 45, 47, 49, 50, 54, 56], "string": [19, 22, 34, 38, 39, 47], "width": [19, 20, 23, 24, 32], "length": [19, 20, 23, 24, 32], "num_obj": 19, "num_obstacl": 19, "robot_char": 19, "init_robot_st": 20, "object_id": [20, 23], "dim": [20, 22, 23], "01": [20, 23, 47], "belief_rep": 20, "num_particl": [20, 25, 26, 28, 36, 37], "100": [20, 28, 33, 34, 47, 49], "custum": [20, 28], "sure": [20, 49], "robot_orient": 20, "multi": [20, 21, 23, 43, 50, 52, 53, 54], "target": [20, 22, 29, 31, 33, 47, 48, 49], "obstacl": [20, 22, 24, 48], "realli": [20, 49], "about": [20, 24, 25, 26, 38, 39, 43, 48], "them": [20, 38, 45, 49, 54, 56], "includ": [20, 23, 42, 43, 44], "unspecifi": 20, "uniform": [20, 25, 26, 28, 33, 49], "radian": 20, "cup": [21, 49], "find": [21, 23, 43, 48, 53, 54], "45deg": 21, "input": [21, 22, 47, 51], "forc": 21, "everi": [21, 25, 26], "w": [21, 48], "drop": 21, "mo": [21, 43, 53, 54], "xy": [21, 32], "distance_cost": 21, "motion_nam": 21, "xyth": [21, 54], "141592653589793": 21, "71238898038469": 21, "5707963267948966": 21, "vw": 21, "7853981633974483": 21, "icra": [21, 23, 48], "instead": [21, 23, 33, 34, 43, 44, 49], "topolog": [21, 23, 48], "graph": [21, 23, 47, 48], "fan": [21, 23, 24, 48], "someth": [21, 23, 54], "els": [21, 23, 46, 47, 49], "objpos": 21, "thu": [21, 36, 48], "grid": [21, 23, 24, 25, 26, 31, 48], "s_1": 21, "s_2": 21, "s_n": 21, "s_r": 21, "leq": 21, "sr": 21, "objclass": 21, "camera_direct": 21, "overrid": 22, "parent": [22, 38, 39], "worldstr": [22, 32], "rx": 22, "xt": 22, "laser": [22, 23, 24, 48], "fov": [22, 24], "90": [22, 24], "min_rang": [22, 24], "max_rang": [22, 24], "indic": [22, 36], "obsticl": 22, "replac": 22, "upper": 22, "letter": 22, "serv": 22, "lower": 22, "except": [22, 38, 39], "signal": 22, "laser2dsensor": [22, 23, 24], "robot_nam": 22, "worldmap": 22, "charact": 22, "angle_incr": [22, 24], "dist_rang": 22, "occlus": [22, 24, 48], "scanner": [22, 24, 48], "configur": 22, "angl": [22, 24, 48], "end": [22, 38], "beam": [22, 24, 48], "scan": [22, 24, 48], "degre": [22, 24, 48], "angular": 22, "distanc": [22, 24], "measur": 22, "rad": 22, "consid": [22, 36, 48], "radiu": [22, 24], "proxim": [22, 23, 24], "occlusion_en": [22, 24], "gridmap": [23, 24, 28, 31, 32], "valid_mot": [23, 24, 31, 32], "to_rad": [23, 24], "in_rang": [23, 24], "within_rang": [23, 24], "sensing_region_s": [23, 24], "in_field_of_view": [23, 24], "shoot_beam": [23, 24], "valid_beam": [23, 24], "proximitysensor": [23, 24], "own": [23, 43, 44], "well": [23, 33, 34, 48, 49], "within": [23, 24, 48], "rang": [23, 24, 47, 48, 49], "equip": [23, 48], "occup": [23, 28], "target_object": 23, "big": [23, 28, 31], "1000": [23, 37], "normal": [23, 25, 26, 34, 36, 37], "get": [23, 33, 34, 49, 54], "detect": 23, "relat": [23, 53], "determinist": [23, 24, 25, 26, 31, 36, 38, 49], "09": [23, 37], "necessarili": 23, "static": [23, 25, 26, 33, 38, 39], "next_object_st": 23, "perfect": [23, 25, 26, 48], "check_collis": 23, "robot_st": 23, "next_robot_st": 23, "pose_objid": 23, "valid": [23, 24, 44], "overlap": 23, "addit": [23, 36, 47, 50, 53, 54], "assist": 24, "collis": 24, "avoid": [24, 36, 43, 44], "invalid": [24, 49], "contain": [24, 33, 34, 36, 38, 39, 42, 43, 47, 49, 51, 56], "all_motion_act": 24, "bump": [24, 43], "determin": [24, 25, 26, 49], "assumpt": 24, "p1": [24, 25, 26, 38], "p2": [24, 25, 26, 38], "deg": 24, "val": 24, "env_stat": 24, "might": [24, 33, 34, 48, 49], "visibl": [24, 43], "due": [24, 43, 48], "gap": 24, "view_angl": 24, "th": [24, 38], "field": [24, 33, 34, 43], "view": [24, 43], "size": [24, 43, 47], "180": 24, "front": [24, 33, 34, 49], "our": [24, 48, 49, 56], "convent": [24, 45, 53], "270": 24, "360": [24, 48], "shoot": 24, "bear": 24, "dist": 24, "increment": 24, "mosobserv": 24, "region": [24, 48], "center": 24, "rock_id": [25, 26], "rsaction": [25, 26], "rsobserv": [25, 26], "qualiti": [25, 26], "rsstate": [25, 26], "k": [25, 26], "uai": [25, 26], "2004": [25, 26, 53], "rocktype_1": [25, 26], "rocktype_2": [25, 26], "rocktype_k": [25, 26], "rocktype_i": [25, 26], "terminalst": [25, 26], "rock": [25, 26], "known": [25, 26, 56], "check_i": [25, 26], "smartli": [25, 26], "check": [25, 26, 43, 47, 48, 49, 56], "check_1": [25, 26], "check_k": [25, 26], "first": [25, 26, 38, 39, 42, 47, 48, 49, 54], "four": [25, 26], "noisi": [25, 26], "eta": [25, 26], "exit": [25, 26], "area": [25, 26], "equal": [25, 26, 33, 34, 38, 39, 49], "being": [25, 26], "rock_loc": 25, "half_efficiency_dist": 25, "20": [25, 38, 39, 43, 47], "not_free_loc": [25, 26], "nxn": [25, 26], "free": [25, 26, 33, 34, 48, 49, 52, 53, 56], "nstep": [25, 26, 33, 34, 49], "95": [25, 26, 38, 39, 47, 49], "initialize_particles_belief": [27, 28], "belief_upd": [27, 28], "tagag": [27, 28], "tagact": [27, 29], "tagobserv": [27, 29], "tagstat": [27, 29], "motion_polici": [27, 31], "tagobservationmodel": [27, 31], "tagpolicymodel": [27, 31], "tagrewardmodel": [27, 31], "tagtransitionmodel": [27, 31], "init_robot_posit": 28, "hold": [28, 44], "pr_stai": [28, 32], "anytim": [29, 31, 47], "approxim": [29, 31, 37, 56], "cell": [29, 31, 48], "target_posit": [29, 32], "person": 29, "found": [29, 47, 48, 54], "robot_posit": [29, 32], "target_found": 29, "from_str": [31, 32], "free_cel": [31, 32], "tagtargetmotionpolici": [31, 32], "ohterwis": 31, "anyth": 31, "There": [31, 42, 47, 49, 50, 56], "stochaist": 31, "movement": 31, "With": [31, 49], "8": [31, 38, 39, 43, 47, 54], "awai": [31, 33, 34, 49], "stai": [31, 33, 43, 49], "place": [31, 48, 49], "closer": 31, "target_motion_polici": 31, "obstacle_pos": 32, "all_mot": 32, "next_target_posit": 32, "valid_target_motion_act": 32, "tigerobservationmodel": [33, 34], "tigerpolicymodel": [33, 34], "tigerrewardmodel": [33, 34], "tigertransitionmodel": [33, 34], "build_act": [33, 34], "build_observ": [33, 34], "build_set": [33, 34], "build_stat": [33, 34], "classic": [33, 34, 49], "specifi": [33, 34, 38, 42, 43, 46, 47, 49], "introduct": [33, 34, 49], "kamalzadeh": [33, 34, 49], "hahsler": [33, 34, 49], "put": [33, 34, 49], "behind": [33, 34, 49], "door": [33, 34, 49], "treasur": [33, 34, 49], "stand": [33, 34, 38, 39, 49, 53], "close": [33, 34, 49], "decid": [33, 34, 49], "open": [33, 34, 38, 39, 47, 49], "wait": [33, 34, 49], "listen": [33, 34, 38, 39, 43, 47, 49, 54], "neither": [33, 34, 49], "entir": [33, 34, 38, 39, 49], "accur": [33, 34, 49], "hear": [33, 34, 49], "vice": [33, 34, 49], "versa": [33, 34, 49], "either": [33, 34, 36, 43, 47, 48, 49], "more": [33, 34, 36, 38, 39, 42, 45, 46, 47, 48, 49, 50, 52, 53, 56], "complic": [33, 34, 45, 48, 49, 53], "re": [33, 42, 49], "spec": [33, 47, 49], "reset": [33, 49], "otherwis": [33, 49], "obs_nois": [33, 49], "init_true_st": [33, 34, 49], "fact": 33, "debug_tre": 33, "feedback": [33, 34, 48, 49], "loop": [33, 34, 48, 49], "pdb": [33, 38, 39], "dd": [33, 38, 39], "quickli": [33, 45, 53], "build": [33, 43, 44, 47, 48, 53, 54], "extern": [34, 43, 49, 51, 53, 54], "extrem": 34, "dumb": 34, "obs_prob": 34, "trans_prob": 34, "current_histogram": 36, "state_mapp": [36, 37], "oarg": 36, "targ": 36, "static_transit": 36, "next_state_spac": 36, "sum_": 36, "help": [36, 38, 39, 47, 48, 53], "nest": 36, "alreadi": [36, 52], "prohibit": 36, "effici": 36, "part": [36, 47], "simpli": [36, 49], "At": 36, "least": 36, "ok": 36, "current_particl": 36, "todo": [36, 43], "prob": 37, "unweight": 37, "inherit": [37, 43, 49], "feed": 37, "through": [37, 38, 39, 46, 49], "multipl": [37, 52], "those": [37, 49, 54], "approx_method": 37, "distance_func": 37, "drawn": 37, "nearest": 37, "queri": 37, "match": [37, 43], "closest": 37, "exact": [37, 43, 49], "uniqu": 37, "aggreg": 37, "numer": [37, 47, 56], "densiti": 37, "multivari": 37, "isn": 37, "arbitrarili": 37, "deal": 38, "percent": 38, "rgb": 38, "255": 38, "hx": 38, "len": [38, 46], "ctype": 38, "dct": 38, "easier": [38, 39, 43], "core": [38, 39, 43, 44], "incorpor": [38, 39], "design": [38, 39, 53], "eas": [38, 39], "ipdb": [38, 39], "session": [38, 39], "minim": [38, 39, 43], "usag": [38, 39], "pomdp_problem": [38, 39, 43], "suppos": [38, 39], "too": [38, 39], "4096": [38, 39], "200": [38, 39], "set_trac": [38, 39], "program": [38, 39, 47, 51], "enter": [38, 39], "debugg": [38, 39], "_vnodepp": [38, 39], "4095": [38, 39], "19": [38, 39, 47], "529": [38, 39], "\u2080listen": [38, 39], "_qnodepp": [38, 39], "4059": [38, 39], "\u2080tiger": [38, 39], "2013": [38, 39], "16": [38, 39], "586": [38, 39], "1883": [38, 39], "1441": [38, 39], "300": [38, 39], "out": [38, 39, 47, 48, 56], "\u2081open": [38, 39], "139": [38, 39], "847": [38, 39], "\u2082open": [38, 39], "112": [38, 39, 47], "57": [38, 39], "191": [38, 39], "text": [38, 39, 47], "retriev": [38, 39], "subtre": [38, 39], "index": [38, 39, 47, 53], "2044": [38, 39], "160": [38, 39], "148": [38, 39], "634": [38, 39], "237": [38, 39], "500": [38, 39], "obtain": [38, 39], "sequenc": [38, 39, 43, 49], "\u2081tiger": [38, 39], "1955": [38, 39], "947": [38, 39], "768": [38, 39], "022": [38, 39], "462": [38, 39], "395": [38, 39], "000": [38, 39], "247": [38, 39], "best": [38, 39, 43], "brows": [38, 39], "method": [38, 39, 43], "document": [38, 39, 43, 45, 47, 56], "futur": [38, 39], "organ": [38, 39, 48, 49], "kind": [38, 39], "total": [38, 39, 47], "largest": [38, 39], "edg": [38, 39, 47], "as_debugg": [38, 39], "Will": [38, 39], "high": [38, 39, 48, 56], "huge": [38, 39], "interact": [38, 39, 44], "along": [38, 39], "preset": [38, 39], "seq": [38, 39], "understand": [38, 39, 44], "_nodepp": [38, 39], "dest": [38, 39], "Such": [38, 39], "parent_edg": [38, 39], "indent": [38, 39], "include_children": [38, 39], "df": [38, 39], "gether": [38, 39], "statist": [38, 39], "colorstr": [38, 39], "assort": 38, "vec1": 38, "vec2": 38, "scalar": 38, "dx": 38, "dy": 38, "dz": 38, "v1": 38, "v2": 38, "06": [38, 47], "python": [38, 43, 47, 48, 49, 53, 54, 56], "oldvalu": 38, "oldmin": 38, "oldmax": 38, "newmin": 38, "newmax": 38, "obj": 38, "arr": 38, "48": 38, "8320": 38, "8321": 38, "50": [38, 47], "8322": 38, "51": [38, 47], "8323": 38, "52": [38, 47], "8324": 38, "53": 38, "8325": 38, "54": 38, "8326": 38, "55": 38, "8327": 38, "56": 38, "8328": 38, "8329": 38, "particular": 38, "data": 38, "piec": 38, "correct": [38, 44, 49], "typic": [38, 49], "tabular": [38, 43], "built": [38, 42, 43, 44], "nextstat": 38, "emit": 38, "utilti": 38, "typographi": 38, "purpos": [38, 48, 53], "displai": 38, "x1b": 38, "97m": 38, "96m": 38, "95m": 38, "94m": 38, "92m": 38, "93m": 38, "91m": 38, "1m": 38, "0m": 38, "shown": [38, 48], "sphinx": [42, 43], "web": 42, "page": [42, 53, 54], "Their": 42, "directori": [42, 54], "cd": 42, "py": [42, 43, 48, 49], "_sphinx_src": 42, "apidoc": 42, "api": 42, "rst": 42, "argument": [42, 43, 46], "readm": 42, "read": [42, 49], "me": 42, "Then": [42, 49], "top": [42, 43], "repositori": [42, 54], "websit": [42, 43, 54], "construct": [42, 47, 49], "symbol": 42, "link": [42, 43, 47, 48, 53], "ln": 42, "access": [42, 49, 53], "remov": [42, 43, 47], "site": 42, "deploi": 42, "fundament": 44, "block": [44, 48], "formal": 44, "encapsul": 44, "few": 44, "pomdp_pi": [43, 44, 45, 46, 48, 49, 50, 51, 52, 54, 56], "around": [44, 56], "convei": 44, "idea": [44, 49], "abov": [44, 47, 48, 49, 51, 54], "gist": [43, 44], "captur": 44, "versu": 44, "much": [43, 44], "sens": [44, 48], "verifi": [43, 44, 54], "diagram": 44, "langl": 44, "omega": [44, 47, 51], "rangl": 44, "discuss": 45, "simpler": [43, 45, 56], "interest": 45, "former": 45, "latter": 45, "structur": [45, 48, 53], "project": [45, 48, 52, 53, 56], "below": [46, 48, 50, 54], "minimum": [43, 46], "def": [46, 49], "rais": [46, 49], "notimplementederror": 46, "notion": 46, "narrow": 46, "express": 46, "detail": [46, 47, 48, 49, 51], "paragraph": 46, "visit": [43, 46], "count": [46, 54], "account": 46, "nu": [47, 51], "hope": [47, 50], "u": 47, "mani": [47, 56], "librari": [43, 47, 51, 53, 54], "written": [47, 49, 53, 56], "format": [43, 47, 49, 56], "pomdpx": [43, 47, 56], "pomdpconvert": 47, "toolkit": 47, "to_pomdp_fil": [43, 47], "to_pomdpx_fil": 47, "convers": [43, 47], "output_path": 47, "float_precis": [43, 47], "www": [47, 54], "independ": 47, "blank": 47, "decim": 47, "order": [47, 49], "pomdpconvert_path": 47, "adacompnu": 47, "instruct": [47, 54], "download": [47, 54], "ubuntu": 47, "04": 47, "gcc": 47, "bigbird": 47, "comp": 47, "edu": 47, "sg": 47, "pmwiki": 47, "farm": 47, "appl": [47, 56], "php": 47, "pomdpxdocument": 47, "binari": [47, 51], "let": [47, 49], "filenam": [47, 48], "test_tig": 47, "softwar": [47, 54, 56], "src": 47, "vi_prun": 47, "pomdp_solve_path": 47, "pomdp_nam": 47, "temp": 47, "remove_generated_fil": 47, "return_policy_graph": 47, "definit": [47, 49], "pomdp_solv": [43, 47], "compil": 47, "command": [47, 48, 54], "stop_criteria": 47, "weak": 47, "time_limit": 47, "alpha": 47, "pg": 47, "instal": [43, 47, 53], "appear": [47, 56], "recommend": [47, 48, 54], "isinst": [47, 49], "cur_belief": [47, 49], "new_belief": [47, 49], "pid": 47, "8239": 47, "mcgs_prune_freq": 47, "verbos": 47, "context": 47, "done": [47, 49, 56], "epoch": 47, "00": 47, "sec": 47, "err": 47, "39": 47, "96": 47, "97": 47, "98": 47, "40": 47, "solut": 47, "user": [47, 49], "hr": 47, "min": 47, "lp_solv": 47, "report": 47, "lp": 47, "instabl": 47, "85": 47, "9697986575573173": 47, "03020134244268276": 47, "pomdpsol_path": 47, "timeout": 47, "30": 47, "memori": 47, "precis": 47, "logfil": 47, "pomdpsol": 47, "limit": 47, "mb": 47, "regret": 47, "less": 47, "than": [47, 56], "finish": 47, "log": [43, 47], "stdout": 47, "stderr": 47, "_": 47, "000001": 47, "load": [43, 47], "trial": 47, "backup": 47, "lbound": 47, "ubound": 47, "92": 47, "8205": 47, "821": 47, "2981": 47, "63": 47, "7547": 47, "70": 47, "0528": 47, "103": 47, "35722": 47, "3746": 47, "0174": 47, "155": 47, "44093": 47, "45": 47, "1431": 47, "38": 47, "7021": 47, "205": 47, "1184": 47, "36": 47, "4409": 47, "24": 47, "3225": 47, "1255": 47, "3714": 47, "13808e": 47, "21": 47, "41": 47, "1300": 47, "76277e": 47, "42": 47, "1350": 47, "75044e": 47, "43": 47, "1393": 47, "22729e": 47, "07": 47, "11": [47, 54], "extend": [43, 47, 48, 49, 50], "encod": 47, "alpha_path": 47, "pg_path": 47, "parse_pomdp_solve_output": 47, "pointer": 47, "incom": 47, "offlin": 47, "collect": 47, "associ": 47, "dot": 47, "product": 47, "lead": [47, 48], "domin": 47, "activ": [47, 56], "max_": 47, "gamma": 47, "policy_path": 47, "parse_appl_policy_fil": 47, "involv": 48, "whose": 48, "better": 48, "mainten": 48, "readabl": 48, "task": [48, 52, 53, 56], "rel": 48, "share": [48, 53], "wandzel": 48, "et": 48, "al": 48, "slightli": 48, "room": 48, "formul": 48, "three": [48, 49], "categori": 48, "adjust": 48, "disk": 48, "artifact": 48, "discret": 48, "figur": 48, "screenshot": 48, "frame": 48, "imag": [43, 48], "circl": [48, 54], "third": 48, "show": [43, 48, 53], "later": 48, "summari": 48, "procedur": [48, 49], "instanti": 48, "squeez": 48, "everyth": 48, "giant": 48, "reus": 48, "whatev": 48, "save": 48, "evid": 48, "role": 48, "mosoopomdp": 48, "logic": 48, "m": [43, 48, 53, 54], "custom": 48, "arthur": 48, "yoonseon": 48, "oh": 48, "fishman": 48, "nishanth": 48, "kumar": 48, "stefani": [48, 49, 53], "tellex": [48, 49, 53], "intern": [48, 49], "autom": [48, 49], "7194": 48, "7200": 48, "ieee": 48, "encourag": 49, "valueerror": 49, "__hash__": 49, "__eq__": 49, "boil": 49, "heard": 49, "growl": 49, "thresh": 49, "similarli": 49, "startswith": 49, "choic": 49, "easili": 49, "tabl": 49, "flexibl": 49, "intract": 49, "sever": [49, 50], "would": [43, 49, 56], "usual": 49, "human": 49, "engin": 49, "sort": 49, "guid": 49, "guidanc": 49, "caution": 49, "sai": 49, "inject": 49, "final": 49, "straightforward": 49, "commonli": 49, "_reward_func": 49, "elif": 49, "abl": [43, 49], "mostli": 49, "super": 49, "notic": 49, "constructor": 49, "now": [43, 49], "standard": 49, "a_t": 49, "s_t": 49, "rightarrow": 49, "s_": 49, "r_t": 49, "o_t": 49, "h_": 49, "unless": 49, "repeat": 49, "110": 49, "ennviron": 49, "skip": [43, 49], "estim": 49, "percept": 49, "stack": 49, "saniti": 49, "come": 49, "automat": 49, "num": 49, "short": 49, "abel": 49, "elli": 49, "hershkowitz": 49, "gabriel": 49, "barth": 49, "maron": 49, "stephen": 49, "brawner": 49, "kevin": 49, "farrel": 49, "jame": 49, "macglashan": 49, "twenti": 49, "fifth": 49, "schedul": 49, "2015": 49, "yuchen": 49, "xiao": 49, "sammi": 49, "katt": 49, "andrea": 49, "ten": 49, "pa": 49, "shengjian": 49, "chen": 49, "christoph": 49, "amato": 49, "clutter": 49, "welcom": [50, 53], "sarsop": [43, 51, 54, 56], "rl": 52, "transfer": [52, 53], "research": [52, 53, 56], "baslin": 52, "comprehens": 53, "why": 53, "clean": 53, "intuit": 53, "peopl": 53, "commun": [53, 54, 56], "artial": 53, "bservabl": 53, "arkov": 53, "ecis": 53, "rocess": 53, "major": 53, "languag": 53, "what": 53, "changelog": 53, "principl": 53, "integr": [43, 53], "pleas": 53, "cite": 53, "inproceed": 53, "zheng2020pomdp_pi": 53, "titl": 53, "_py": 53, "author": 53, "zheng": 53, "kaiyu": 53, "booktitl": 53, "icap": 53, "2020": 53, "workshop": 53, "planrob": 53, "year": 53, "url": 53, "icaps20subpag": 53, "wp": 53, "upload": 53, "14": [53, 54], "planrob_2020_paper_3": 53, "pdf": 53, "10099": 53, "virtualenv": 54, "pip": [43, 54], "manag": 54, "offici": 54, "maco": 54, "On": 54, "window": [43, 54], "wiki": 54, "latest": 54, "releas": [43, 54], "clone": 54, "git": 54, "h2r": 54, "setup": [43, 54], "pyx": [43, 54], "pyd": 54, "rebuild": 54, "messi": [], "66": 54, "cumul": 54, "__num_sims__": 54, "1217": 54, "______id______": 54, "210": 54, "_____g": 54, "b_____": 54, "hello": 54, "542": 54, "506": 54, "test_al": 54, "via": [54, 56], "hub": 54, "credit": 54, "romain": 54, "egel": 54, "think": 56, "peer": 56, "easi": 56, "ro": 56, "acceler": 56, "pomdpi": 56, "suffici": 56, "convolut": 56, "potenti": [43, 56], "connect": 56, "clearer": 56, "pars": 56, "art": 56, "great": 56, "julia": 56, "suit": 56, "analysi": 56, "besid": 56, "librai": 56, "port": 56, "ai": 56, "toolbox": 56, "bind": 56, "focus": 56, "lear": 56, "beliefmdp": 56, "modern": 43, "repo": 43, "migrat": 43, "pyproject": 43, "toml": 43, "ci": 43, "pre": 43, "commit": 43, "eol": 43, "fix": 43, "cpdef": 43, "cdef": 43, "failur": 43, "29": 43, "comment": 43, "sp": 43, "wheel": 43, "properli": 43, "tame": 43, "minor": 43, "bug": 43, "__str__": 43, "confus": 43, "improv": 43, "clarifi": 43, "gave": 43, "cryingbabi": 43, "pygraphviz": 43, "inspect": 43, "refactor": 43, "cli": 43, "simplifi": 43, "__ne__": 43, "reorgan": 43, "break": 43, "unnecessari": 43, "compat": 43, "pickl": 43, "edit": 43, "cimport": 43, "ed": 43, "pypi": 43, "value_funct": 43, "18fc58e0": 43, "cfc88e8d8": 43, "719c2edf5": 43, "docker": 43, "issu": 43, "citat": 43, "resolv": 43, "max": 43, "among": 43, "infin": 43, "thank": 43, "jason": 43, "clarif": 43, "convert": 43, "were": 43, "calcul": 43, "divid": 43, "thrown": 43, "infinit": 43, "anoth": 43, "differenti": 43, "unload": 43, "per": 43, "faster": 43, "readi": 43, "changeabl": 43, "rewritten": 43, "cleaner": 43}, "objects": {"pomdp_py.algorithms": [[3, 0, 0, "-", "bsp"], [2, 0, 0, "-", "po_rollout"], [2, 0, 0, "-", "po_uct"], [2, 0, 0, "-", "pomcp"], [2, 0, 0, "-", "value_iteration"]], "pomdp_py.algorithms.bsp": [[2, 0, 0, "-", "blqr"]], "pomdp_py.algorithms.bsp.blqr": [[2, 1, 1, "", "BLQR"]], "pomdp_py.algorithms.bsp.blqr.BLQR": [[2, 2, 1, "", "create_plan"], [2, 2, 1, "", "ekf_update_mlo"], [2, 2, 1, "", "integrate_belief_segment"], [2, 2, 1, "", "interpret_sqp_plan"], [2, 2, 1, "", "segmented_cost_function"]], "pomdp_py.algorithms.po_rollout": [[2, 1, 1, "", "PORollout"]], "pomdp_py.algorithms.po_rollout.PORollout": [[2, 2, 1, "", "clear_agent"], [2, 3, 1, "", "last_best_reward"], [2, 2, 1, "", "plan"], [2, 2, 1, "", "set_rollout_policy"], [2, 2, 1, "", "update"], [2, 3, 1, "", "update_agent_belief"]], "pomdp_py.algorithms.po_uct": [[2, 1, 1, "", "ActionPrior"], [2, 1, 1, "", "POUCT"], [2, 1, 1, "", "QNode"], [2, 1, 1, "", "RandomRollout"], [2, 1, 1, "", "RolloutPolicy"], [2, 1, 1, "", "RootVNode"], [2, 1, 1, "", "TreeNode"], [2, 1, 1, "", "VNode"]], "pomdp_py.algorithms.po_uct.ActionPrior": [[2, 2, 1, "", "get_preferred_actions"]], "pomdp_py.algorithms.po_uct.POUCT": [[2, 2, 1, "", "clear_agent"], [2, 3, 1, "", "last_num_sims"], [2, 3, 1, "", "last_planning_time"], [2, 2, 1, "", "plan"], [2, 2, 1, "", "set_rollout_policy"], [2, 2, 1, "", "update"], [2, 3, 1, "", "updates_agent_belief"]], "pomdp_py.algorithms.po_uct.RandomRollout": [[2, 2, 1, "", "rollout"]], "pomdp_py.algorithms.po_uct.RolloutPolicy": [[2, 2, 1, "", "rollout"]], "pomdp_py.algorithms.po_uct.RootVNode": [[2, 2, 1, "", "from_vnode"], [2, 3, 1, "", "history"]], "pomdp_py.algorithms.po_uct.TreeNode": [[2, 3, 1, "", "children"], [2, 3, 1, "", "num_visits"], [2, 3, 1, "", "value"]], "pomdp_py.algorithms.po_uct.VNode": [[2, 2, 1, "", "argmax"], [2, 2, 1, "", "print_children_value"], [2, 3, 1, "", "value"]], "pomdp_py.algorithms.pomcp": [[2, 1, 1, "", "POMCP"], [2, 1, 1, "", "RootVNodeParticles"], [2, 1, 1, "", "VNodeParticles"]], "pomdp_py.algorithms.pomcp.POMCP": [[2, 2, 1, "", "plan"], [2, 2, 1, "", "update"], [2, 3, 1, "", "update_agent_belief"]], "pomdp_py.algorithms.pomcp.RootVNodeParticles": [[2, 3, 1, "", "belief"], [2, 2, 1, "", "from_vnode"]], "pomdp_py.algorithms.pomcp.VNodeParticles": [[2, 3, 1, "", "belief"]], "pomdp_py.algorithms.value_iteration": [[2, 1, 1, "", "ValueIteration"]], "pomdp_py.algorithms.value_iteration.ValueIteration": [[2, 2, 1, "", "plan"]], "pomdp_py.framework": [[5, 0, 0, "-", "basics"], [5, 0, 0, "-", "oopomdp"], [5, 0, 0, "-", "planner"]], "pomdp_py.framework.basics": [[5, 1, 1, "", "Action"], [5, 1, 1, "", "Agent"], [5, 1, 1, "", "BlackboxModel"], [5, 1, 1, "", "Distribution"], [5, 1, 1, "", "Environment"], [5, 1, 1, "", "GenerativeDistribution"], [5, 1, 1, "", "Observation"], [5, 1, 1, "", "ObservationModel"], [5, 1, 1, "", "Option"], [5, 1, 1, "", "POMDP"], [5, 1, 1, "", "PolicyModel"], [5, 1, 1, "", "RewardModel"], [5, 1, 1, "", "State"], [5, 1, 1, "", "TransitionModel"], [5, 4, 1, "", "sample_explict_models"], [5, 4, 1, "", "sample_generative_model"]], "pomdp_py.framework.basics.Agent": [[5, 2, 1, "", "add_attr"], [5, 3, 1, "", "all_actions"], [5, 3, 1, "", "all_observations"], [5, 3, 1, "", "all_states"], [5, 3, 1, "", "belief"], [5, 3, 1, "", "history"], [5, 3, 1, "", "init_belief"], [5, 2, 1, "", "sample_belief"], [5, 2, 1, "", "set_belief"], [5, 2, 1, "", "update"], [5, 2, 1, "", "update_history"]], "pomdp_py.framework.basics.BlackboxModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.basics.Distribution": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "__setitem__"]], "pomdp_py.framework.basics.Environment": [[5, 2, 1, "", "apply_transition"], [5, 3, 1, "", "blackbox_model"], [5, 3, 1, "", "cur_state"], [5, 2, 1, "", "provide_observation"], [5, 3, 1, "", "reward_model"], [5, 3, 1, "", "state"], [5, 2, 1, "", "state_transition"], [5, 3, 1, "", "transition_model"]], "pomdp_py.framework.basics.GenerativeDistribution": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_histogram"], [5, 2, 1, "", "mpe"]], "pomdp_py.framework.basics.ObservationModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_all_observations"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.basics.Option": [[5, 2, 1, "", "initiation"], [5, 3, 1, "", "policy"], [5, 2, 1, "", "sample"], [5, 2, 1, "", "termination"]], "pomdp_py.framework.basics.PolicyModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_all_actions"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"], [5, 2, 1, "", "update"]], "pomdp_py.framework.basics.RewardModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.basics.TransitionModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_all_states"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.oopomdp": [[5, 1, 1, "", "OOBelief"], [5, 1, 1, "", "OOObservation"], [5, 1, 1, "", "OOObservationModel"], [5, 1, 1, "", "OOPOMDP"], [5, 1, 1, "", "OOState"], [5, 1, 1, "", "OOTransitionModel"], [5, 1, 1, "", "ObjectState"]], "pomdp_py.framework.oopomdp.OOBelief": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "__setitem__"], [5, 2, 1, "", "b"], [5, 2, 1, "", "mpe"], [5, 2, 1, "", "object_belief"], [5, 3, 1, "", "object_beliefs"], [5, 2, 1, "", "random"], [5, 2, 1, "", "set_object_belief"]], "pomdp_py.framework.oopomdp.OOObservation": [[5, 2, 1, "", "factor"], [5, 2, 1, "", "merge"]], "pomdp_py.framework.oopomdp.OOObservationModel": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "argmax"], [5, 3, 1, "", "observation_models"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.oopomdp.OOState": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "copy"], [5, 2, 1, "", "get_object_attribute"], [5, 2, 1, "", "get_object_class"], [5, 2, 1, "", "get_object_state"], [5, 2, 1, "", "s"], [5, 2, 1, "", "set_object_state"], [5, 3, 1, "", "situation"]], "pomdp_py.framework.oopomdp.OOTransitionModel": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "argmax"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"], [5, 3, 1, "", "transition_models"]], "pomdp_py.framework.oopomdp.ObjectState": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "__setitem__"], [5, 2, 1, "", "copy"]], "pomdp_py.framework.planner": [[5, 1, 1, "", "Planner"]], "pomdp_py.framework.planner.Planner": [[5, 2, 1, "", "plan"], [5, 2, 1, "", "update"], [5, 2, 1, "", "updates_agent_belief"]], "pomdp_py": [[6, 0, 0, "-", "problems"], [38, 0, 0, "-", "utils"]], "pomdp_py.problems": [[7, 0, 0, "-", "lasertag"], [13, 0, 0, "-", "load_unload"], [14, 0, 0, "-", "maze"], [19, 0, 0, "-", "multi_object_search"], [25, 0, 0, "-", "rocksample"], [27, 0, 0, "-", "tag"], [33, 0, 0, "-", "tiger"]], "pomdp_py.problems.light_dark": [[11, 0, 0, "-", "env"]], "pomdp_py.problems.light_dark.env": [[11, 0, 0, "-", "env"]], "pomdp_py.problems.light_dark.env.env": [[11, 1, 1, "", "LightDarkEnvironment"]], "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment": [[11, 5, 1, "", "const"], [11, 5, 1, "", "light"]], "pomdp_py.problems.maze": [[15, 0, 0, "-", "domain"], [16, 0, 0, "-", "env"], [17, 0, 0, "-", "models"]], "pomdp_py.problems.maze.domain": [[15, 0, 0, "-", "action"], [15, 0, 0, "-", "observation"], [15, 0, 0, "-", "state"]], "pomdp_py.problems.maze.domain.observation": [[15, 1, 1, "", "Observation"]], "pomdp_py.problems.maze.domain.state": [[15, 1, 1, "", "State"]], "pomdp_py.problems.maze.env": [[16, 0, 0, "-", "env"]], "pomdp_py.problems.maze.env.env": [[16, 1, 1, "", "MazeEnvironment"]], "pomdp_py.problems.maze.models": [[18, 0, 0, "-", "components"]], "pomdp_py.problems.multi_object_search": [[20, 0, 0, "-", "agent"], [21, 0, 0, "-", "domain"], [22, 0, 0, "-", "env"], [19, 0, 0, "-", "example_worlds"], [23, 0, 0, "-", "models"]], "pomdp_py.problems.multi_object_search.agent": [[20, 0, 0, "-", "agent"], [20, 0, 0, "-", "belief"]], "pomdp_py.problems.multi_object_search.agent.agent": [[20, 1, 1, "", "MosAgent"]], "pomdp_py.problems.multi_object_search.agent.agent.MosAgent": [[20, 2, 1, "", "clear_history"]], "pomdp_py.problems.multi_object_search.agent.belief": [[20, 1, 1, "", "MosOOBelief"], [20, 4, 1, "", "initialize_belief"]], "pomdp_py.problems.multi_object_search.agent.belief.MosOOBelief": [[20, 2, 1, "", "mpe"], [20, 2, 1, "", "random"]], "pomdp_py.problems.multi_object_search.domain": [[21, 0, 0, "-", "action"], [21, 0, 0, "-", "observation"], [21, 0, 0, "-", "state"]], "pomdp_py.problems.multi_object_search.domain.action": [[21, 1, 1, "", "Action"], [21, 1, 1, "", "FindAction"], [21, 1, 1, "", "LookAction"], [21, 1, 1, "", "MotionAction"]], "pomdp_py.problems.multi_object_search.domain.action.MotionAction": [[21, 3, 1, "", "BACKWARD"], [21, 3, 1, "", "EAST"], [21, 3, 1, "", "EAST2D"], [21, 3, 1, "", "FORWARD"], [21, 3, 1, "", "LEFT"], [21, 3, 1, "", "NORTH"], [21, 3, 1, "", "NORTH2D"], [21, 3, 1, "", "RIGHT"], [21, 3, 1, "", "SCHEMES"], [21, 3, 1, "", "SCHEME_VW"], [21, 3, 1, "", "SCHEME_XY"], [21, 3, 1, "", "SCHEME_XYTH"], [21, 3, 1, "", "SOUTH"], [21, 3, 1, "", "SOUTH2D"], [21, 3, 1, "", "WEST"], [21, 3, 1, "", "WEST2D"]], "pomdp_py.problems.multi_object_search.domain.observation": [[21, 1, 1, "", "MosOOObservation"], [21, 1, 1, "", "ObjectObservation"]], "pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation": [[21, 2, 1, "", "factor"], [21, 2, 1, "", "for_obj"], [21, 2, 1, "", "merge"]], "pomdp_py.problems.multi_object_search.domain.observation.ObjectObservation": [[21, 3, 1, "", "NULL"]], "pomdp_py.problems.multi_object_search.domain.state": [[21, 1, 1, "", "MosOOState"], [21, 1, 1, "", "ObjectState"], [21, 1, 1, "", "RobotState"]], "pomdp_py.problems.multi_object_search.domain.state.MosOOState": [[21, 2, 1, "", "object_pose"], [21, 5, 1, "", "object_poses"], [21, 2, 1, "", "pose"]], "pomdp_py.problems.multi_object_search.domain.state.ObjectState": [[21, 5, 1, "", "objid"], [21, 5, 1, "", "pose"]], "pomdp_py.problems.multi_object_search.domain.state.RobotState": [[21, 5, 1, "", "objects_found"], [21, 5, 1, "", "pose"], [21, 5, 1, "", "robot_pose"]], "pomdp_py.problems.multi_object_search.env": [[22, 0, 0, "-", "env"]], "pomdp_py.problems.multi_object_search.env.env": [[22, 1, 1, "", "MosEnvironment"], [22, 4, 1, "", "equip_sensors"], [22, 4, 1, "", "interpret"], [22, 4, 1, "", "interpret_robot_id"], [22, 4, 1, "", "make_laser_sensor"], [22, 4, 1, "", "make_proximity_sensor"]], "pomdp_py.problems.multi_object_search.env.env.MosEnvironment": [[22, 5, 1, "", "robot_ids"], [22, 2, 1, "", "state_transition"]], "pomdp_py.problems.multi_object_search.example_worlds": [[19, 4, 1, "", "random_world"]], "pomdp_py.problems.multi_object_search.models": [[24, 0, 0, "-", "components"], [23, 0, 0, "-", "observation_model"], [23, 0, 0, "-", "policy_model"], [23, 0, 0, "-", "reward_model"], [23, 0, 0, "-", "transition_model"]], "pomdp_py.problems.multi_object_search.models.components": [[24, 0, 0, "-", "grid_map"], [24, 0, 0, "-", "sensor"]], "pomdp_py.problems.multi_object_search.models.components.grid_map": [[24, 1, 1, "", "GridMap"]], "pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap": [[24, 2, 1, "", "valid_motions"]], "pomdp_py.problems.multi_object_search.models.components.sensor": [[24, 1, 1, "", "Laser2DSensor"], [24, 1, 1, "", "ProximitySensor"], [24, 1, 1, "", "Sensor"], [24, 4, 1, "", "euclidean_dist"], [24, 4, 1, "", "in_range"], [24, 4, 1, "", "to_rad"]], "pomdp_py.problems.multi_object_search.models.components.sensor.Laser2DSensor": [[24, 2, 1, "", "in_field_of_view"], [24, 2, 1, "", "observe"], [24, 5, 1, "", "sensing_region_size"], [24, 2, 1, "", "shoot_beam"], [24, 2, 1, "", "valid_beam"], [24, 2, 1, "", "within_range"]], "pomdp_py.problems.multi_object_search.models.components.sensor.Sensor": [[24, 3, 1, "", "LASER"], [24, 3, 1, "", "PROXIMITY"], [24, 2, 1, "", "observe"], [24, 5, 1, "", "robot_id"], [24, 5, 1, "", "sensing_region_size"], [24, 2, 1, "", "within_range"]], "pomdp_py.problems.multi_object_search.models.observation_model": [[23, 1, 1, "", "MosObservationModel"], [23, 1, 1, "", "ObjectObservationModel"], [23, 4, 1, "", "unittest"]], "pomdp_py.problems.multi_object_search.models.observation_model.MosObservationModel": [[23, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.observation_model.ObjectObservationModel": [[23, 2, 1, "", "argmax"], [23, 2, 1, "", "probability"], [23, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.policy_model": [[23, 1, 1, "", "PolicyModel"]], "pomdp_py.problems.multi_object_search.models.policy_model.PolicyModel": [[23, 2, 1, "", "argmax"], [23, 2, 1, "", "get_all_actions"], [23, 2, 1, "", "probability"], [23, 2, 1, "", "rollout"], [23, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.reward_model": [[23, 1, 1, "", "GoalRewardModel"], [23, 1, 1, "", "MosRewardModel"]], "pomdp_py.problems.multi_object_search.models.reward_model.MosRewardModel": [[23, 2, 1, "", "argmax"], [23, 2, 1, "", "probability"], [23, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.transition_model": [[23, 1, 1, "", "MosTransitionModel"], [23, 1, 1, "", "RobotTransitionModel"], [23, 1, 1, "", "StaticObjectTransitionModel"], [23, 4, 1, "", "in_boundary"], [23, 4, 1, "", "valid_pose"]], "pomdp_py.problems.multi_object_search.models.transition_model.MosTransitionModel": [[23, 2, 1, "", "argmax"], [23, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.transition_model.RobotTransitionModel": [[23, 2, 1, "", "argmax"], [23, 2, 1, "", "if_move_by"], [23, 2, 1, "", "probability"], [23, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.transition_model.StaticObjectTransitionModel": [[23, 2, 1, "", "argmax"], [23, 2, 1, "", "probability"], [23, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample": [[26, 0, 0, "-", "cythonize"], [25, 0, 0, "-", "rocksample_problem"]], "pomdp_py.problems.rocksample.cythonize": [[26, 0, 0, "module-2", "rocksample_problem"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem": [[26, 1, 1, "id99", "CheckAction"], [26, 1, 1, "id101", "MoveAction"], [26, 1, 1, "id107", "RSAction"], [26, 1, 1, "id108", "RSObservation"], [26, 1, 1, "id110", "RSObservationModel"], [26, 1, 1, "id114", "RSPolicyModel"], [26, 1, 1, "id120", "RSRewardModel"], [26, 1, 1, "id124", "RSState"], [26, 1, 1, "id128", "RSTransitionModel"], [26, 1, 1, "id132", "RockSampleProblem"], [26, 1, 1, "id137", "RockType"], [26, 1, 1, "id142", "SampleAction"], [26, 4, 1, "id143", "euclidean_dist"], [26, 4, 1, "id144", "init_particles_belief"], [26, 4, 1, "id145", "main"], [26, 4, 1, "id146", "test_planner"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.CheckAction": [[26, 3, 1, "id100", "rock_id"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction": [[26, 3, 1, "id102", "EAST"], [26, 3, 1, "id103", "NORTH"], [26, 3, 1, "id104", "SOUTH"], [26, 3, 1, "id105", "WEST"], [26, 3, 1, "id106", "motion"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservation": [[26, 3, 1, "id109", "quality"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel": [[26, 2, 1, "id111", "argmax"], [26, 2, 1, "id112", "probability"], [26, 2, 1, "id113", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel": [[26, 2, 1, "id115", "argmax"], [26, 2, 1, "id116", "get_all_actions"], [26, 2, 1, "id117", "probability"], [26, 2, 1, "id118", "rollout"], [26, 2, 1, "id119", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel": [[26, 2, 1, "id121", "argmax"], [26, 2, 1, "id122", "probability"], [26, 2, 1, "id123", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState": [[26, 3, 1, "id125", "position"], [26, 3, 1, "id126", "rocktypes"], [26, 3, 1, "id127", "terminal"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel": [[26, 2, 1, "id129", "argmax"], [26, 2, 1, "id130", "probability"], [26, 2, 1, "id131", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem": [[26, 2, 1, "id133", "generate_instance"], [26, 2, 1, "id134", "in_exit_area"], [26, 2, 1, "id135", "print_state"], [26, 2, 1, "id136", "random_free_location"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType": [[26, 3, 1, "id138", "BAD"], [26, 3, 1, "id139", "GOOD"], [26, 2, 1, "id140", "invert"], [26, 2, 1, "id141", "random"]], "pomdp_py.problems.rocksample.rocksample_problem": [[25, 1, 1, "", "Action"], [25, 1, 1, "", "CheckAction"], [25, 1, 1, "", "MoveAction"], [25, 1, 1, "", "Observation"], [25, 1, 1, "", "RSObservationModel"], [25, 1, 1, "", "RSPolicyModel"], [25, 1, 1, "", "RSRewardModel"], [25, 1, 1, "", "RSTransitionModel"], [25, 1, 1, "", "RockSampleProblem"], [25, 1, 1, "", "RockType"], [25, 1, 1, "", "SampleAction"], [25, 1, 1, "", "State"], [25, 4, 1, "", "euclidean_dist"], [25, 4, 1, "", "init_particles_belief"], [25, 4, 1, "", "main"], [25, 4, 1, "", "test_planner"]], "pomdp_py.problems.rocksample.rocksample_problem.MoveAction": [[25, 3, 1, "", "EAST"], [25, 3, 1, "", "NORTH"], [25, 3, 1, "", "SOUTH"], [25, 3, 1, "", "WEST"]], "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel": [[25, 2, 1, "", "argmax"], [25, 2, 1, "", "probability"], [25, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel": [[25, 2, 1, "", "argmax"], [25, 2, 1, "", "get_all_actions"], [25, 2, 1, "", "probability"], [25, 2, 1, "", "rollout"], [25, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel": [[25, 2, 1, "", "argmax"], [25, 2, 1, "", "probability"], [25, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel": [[25, 2, 1, "", "argmax"], [25, 2, 1, "", "probability"], [25, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem": [[25, 2, 1, "", "generate_instance"], [25, 2, 1, "", "in_exit_area"], [25, 2, 1, "", "print_state"], [25, 2, 1, "", "random_free_location"]], "pomdp_py.problems.rocksample.rocksample_problem.RockType": [[25, 3, 1, "", "BAD"], [25, 3, 1, "", "GOOD"], [25, 2, 1, "", "invert"], [25, 2, 1, "", "random"]], "pomdp_py.problems.tag": [[28, 0, 0, "-", "agent"], [27, 0, 0, "-", "constants"], [29, 0, 0, "-", "domain"], [30, 0, 0, "-", "env"], [27, 0, 0, "-", "example_worlds"], [31, 0, 0, "-", "models"]], "pomdp_py.problems.tag.agent": [[28, 0, 0, "-", "agent"]], "pomdp_py.problems.tag.agent.agent": [[28, 1, 1, "", "TagAgent"], [28, 4, 1, "", "belief_update"], [28, 4, 1, "", "initialize_belief"], [28, 4, 1, "", "initialize_particles_belief"]], "pomdp_py.problems.tag.agent.agent.TagAgent": [[28, 2, 1, "", "clear_history"]], "pomdp_py.problems.tag.domain": [[29, 0, 0, "-", "action"], [29, 0, 0, "-", "observation"], [29, 0, 0, "-", "state"]], "pomdp_py.problems.tag.domain.action": [[29, 1, 1, "", "TagAction"]], "pomdp_py.problems.tag.domain.observation": [[29, 1, 1, "", "TagObservation"]], "pomdp_py.problems.tag.domain.state": [[29, 1, 1, "", "TagState"]], "pomdp_py.problems.tag.models": [[32, 0, 0, "-", "components"], [31, 0, 0, "-", "observation_model"], [31, 0, 0, "-", "policy_model"], [31, 0, 0, "-", "reward_model"], [31, 0, 0, "-", "transition_model"]], "pomdp_py.problems.tag.models.components": [[32, 0, 0, "-", "grid_map"], [32, 0, 0, "-", "motion_policy"]], "pomdp_py.problems.tag.models.components.grid_map": [[32, 1, 1, "", "GridMap"]], "pomdp_py.problems.tag.models.components.grid_map.GridMap": [[32, 2, 1, "", "free_cells"], [32, 2, 1, "", "from_str"], [32, 2, 1, "", "valid_motions"], [32, 2, 1, "", "valid_pose"]], "pomdp_py.problems.tag.models.components.motion_policy": [[32, 1, 1, "", "TagTargetMotionPolicy"]], "pomdp_py.problems.tag.models.components.motion_policy.TagTargetMotionPolicy": [[32, 2, 1, "", "mpe"], [32, 2, 1, "", "probability"], [32, 2, 1, "", "random"]], "pomdp_py.problems.tag.models.observation_model": [[31, 1, 1, "", "TagObservationModel"]], "pomdp_py.problems.tag.models.observation_model.TagObservationModel": [[31, 2, 1, "", "argmax"], [31, 2, 1, "", "probability"], [31, 2, 1, "", "sample"]], "pomdp_py.problems.tag.models.policy_model": [[31, 1, 1, "", "TagPolicyModel"]], "pomdp_py.problems.tag.models.policy_model.TagPolicyModel": [[31, 2, 1, "", "get_all_actions"], [31, 2, 1, "", "rollout"], [31, 2, 1, "", "sample"]], "pomdp_py.problems.tag.models.reward_model": [[31, 1, 1, "", "TagRewardModel"]], "pomdp_py.problems.tag.models.reward_model.TagRewardModel": [[31, 2, 1, "", "probability"], [31, 2, 1, "", "sample"]], "pomdp_py.problems.tag.models.transition_model": [[31, 1, 1, "", "TagTransitionModel"]], "pomdp_py.problems.tag.models.transition_model.TagTransitionModel": [[31, 2, 1, "", "argmax"], [31, 2, 1, "", "if_move_by"], [31, 2, 1, "", "probability"], [31, 2, 1, "", "sample"]], "pomdp_py.problems.tiger": [[34, 0, 0, "-", "cythonize"], [33, 0, 0, "-", "tiger_problem"]], "pomdp_py.problems.tiger.cythonize": [[34, 0, 0, "module-2", "tiger_problem"]], "pomdp_py.problems.tiger.cythonize.tiger_problem": [[34, 1, 1, "id80", "TigerAction"], [34, 1, 1, "id81", "TigerObservation"], [34, 1, 1, "id83", "TigerObservationModel"], [34, 1, 1, "id89", "TigerPolicyModel"], [34, 1, 1, "id94", "TigerProblem"], [34, 1, 1, "id98", "TigerRewardModel"], [34, 1, 1, "id103", "TigerState"], [34, 1, 1, "id105", "TigerTransitionModel"], [34, 4, 1, "id111", "build_actions"], [34, 4, 1, "id112", "build_observations"], [34, 4, 1, "id113", "build_setting"], [34, 4, 1, "id114", "build_states"], [34, 4, 1, "id115", "main"], [34, 4, 1, "id116", "test_planner"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation": [[34, 3, 1, "id82", "name"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel": [[34, 2, 1, "id84", "argmax"], [34, 2, 1, "id85", "get_all_observations"], [34, 2, 1, "id86", "get_distribution"], [34, 2, 1, "id87", "probability"], [34, 2, 1, "id88", "sample"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel": [[34, 2, 1, "id90", "argmax"], [34, 2, 1, "id91", "get_all_actions"], [34, 2, 1, "id92", "probability"], [34, 2, 1, "id93", "sample"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem": [[34, 3, 1, "id95", "ACTIONS"], [34, 3, 1, "id96", "OBSERVATIONS"], [34, 3, 1, "id97", "STATES"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel": [[34, 2, 1, "id99", "argmax"], [34, 2, 1, "id100", "get_distribution"], [34, 2, 1, "id101", "probability"], [34, 2, 1, "id102", "sample"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerState": [[34, 3, 1, "id104", "name"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel": [[34, 2, 1, "id106", "argmax"], [34, 2, 1, "id107", "get_all_states"], [34, 2, 1, "id108", "get_distribution"], [34, 2, 1, "id109", "probability"], [34, 2, 1, "id110", "sample"]], "pomdp_py.problems.tiger.tiger_problem": [[33, 1, 1, "", "ObservationModel"], [33, 1, 1, "", "PolicyModel"], [33, 1, 1, "", "RewardModel"], [33, 1, 1, "", "TigerAction"], [33, 1, 1, "", "TigerObservation"], [33, 1, 1, "", "TigerProblem"], [33, 1, 1, "", "TigerState"], [33, 1, 1, "", "TransitionModel"], [33, 4, 1, "", "main"], [33, 4, 1, "", "make_tiger"], [33, 4, 1, "", "test_planner"]], "pomdp_py.problems.tiger.tiger_problem.ObservationModel": [[33, 2, 1, "", "get_all_observations"], [33, 2, 1, "", "probability"], [33, 2, 1, "", "sample"]], "pomdp_py.problems.tiger.tiger_problem.PolicyModel": [[33, 3, 1, "", "ACTIONS"], [33, 2, 1, "", "get_all_actions"], [33, 2, 1, "", "rollout"], [33, 2, 1, "", "sample"]], "pomdp_py.problems.tiger.tiger_problem.RewardModel": [[33, 2, 1, "", "sample"]], "pomdp_py.problems.tiger.tiger_problem.TigerProblem": [[33, 2, 1, "", "create"]], "pomdp_py.problems.tiger.tiger_problem.TigerState": [[33, 2, 1, "", "other"]], "pomdp_py.problems.tiger.tiger_problem.TransitionModel": [[33, 2, 1, "", "get_all_states"], [33, 2, 1, "", "probability"], [33, 2, 1, "", "sample"]], "pomdp_py.representations.belief": [[36, 0, 0, "-", "histogram"], [36, 0, 0, "-", "particles"]], "pomdp_py.representations.belief.histogram": [[36, 4, 1, "", "abstraction_over_histogram"], [36, 4, 1, "", "update_histogram_belief"]], "pomdp_py.representations.belief.particles": [[36, 4, 1, "", "abstraction_over_particles"], [36, 4, 1, "", "particle_reinvigoration"], [36, 4, 1, "", "update_particles_belief"]], "pomdp_py.representations.distribution": [[37, 0, 0, "-", "gaussian"], [37, 0, 0, "-", "histogram"], [37, 0, 0, "-", "particles"]], "pomdp_py.representations.distribution.gaussian": [[37, 1, 1, "", "Gaussian"]], "pomdp_py.representations.distribution.gaussian.Gaussian": [[37, 2, 1, "", "__getitem__"], [37, 2, 1, "", "__setitem__"], [37, 3, 1, "", "cov"], [37, 3, 1, "", "covariance"], [37, 3, 1, "", "mean"], [37, 2, 1, "", "mpe"], [37, 2, 1, "", "random"], [37, 3, 1, "", "sigma"]], "pomdp_py.representations.distribution.histogram": [[37, 1, 1, "", "Histogram"]], "pomdp_py.representations.distribution.histogram.Histogram": [[37, 2, 1, "", "__getitem__"], [37, 2, 1, "", "__setitem__"], [37, 2, 1, "", "get_histogram"], [37, 3, 1, "", "histogram"], [37, 2, 1, "", "is_normalized"], [37, 2, 1, "", "mpe"], [37, 2, 1, "", "random"]], "pomdp_py.representations.distribution.particles": [[37, 1, 1, "", "Particles"], [37, 1, 1, "", "WeightedParticles"]], "pomdp_py.representations.distribution.particles.Particles": [[37, 2, 1, "", "add"], [37, 2, 1, "", "from_histogram"], [37, 2, 1, "", "get_abstraction"], [37, 2, 1, "", "get_histogram"], [37, 3, 1, "", "particles"], [37, 2, 1, "", "random"]], "pomdp_py.representations.distribution.particles.WeightedParticles": [[37, 2, 1, "", "__getitem__"], [37, 2, 1, "", "__setitem__"], [37, 2, 1, "", "add"], [37, 2, 1, "", "condense"], [37, 2, 1, "", "from_histogram"], [37, 2, 1, "", "get_histogram"], [37, 2, 1, "", "mpe"], [37, 3, 1, "", "particles"], [37, 2, 1, "", "random"], [37, 3, 1, "", "values"], [37, 3, 1, "", "weights"]], "pomdp_py.utils": [[38, 0, 0, "-", "colors"], [38, 0, 0, "-", "cython_utils"], [38, 0, 0, "-", "debugging"], [38, 0, 0, "-", "math"], [38, 0, 0, "-", "misc"], [38, 0, 0, "-", "templates"], [38, 0, 0, "-", "typ"]], "pomdp_py.utils.colors": [[38, 4, 1, "", "hex_to_rgb"], [38, 4, 1, "", "inverse_color_hex"], [38, 4, 1, "", "inverse_color_rgb"], [38, 4, 1, "", "lighter"], [38, 4, 1, "", "random_unique_color"], [38, 4, 1, "", "rgb_to_hex"]], "pomdp_py.utils.cython_utils": [[38, 4, 1, "", "det_dict_hash"]], "pomdp_py.utils.debugging": [[38, 1, 1, "", "TreeDebugger"], [38, 4, 1, "", "interpret_color"], [38, 4, 1, "", "sorted_by_str"]], "pomdp_py.utils.debugging.TreeDebugger": [[38, 5, 1, "", "b"], [38, 2, 1, "", "back"], [38, 5, 1, "", "bestseq"], [38, 2, 1, "", "bestseqd"], [38, 5, 1, "", "c"], [38, 5, 1, "", "clear"], [38, 5, 1, "", "d"], [38, 5, 1, "", "depth"], [38, 2, 1, "", "l"], [38, 2, 1, "", "layer"], [38, 5, 1, "", "leaf"], [38, 2, 1, "", "mark"], [38, 2, 1, "", "mark_path"], [38, 2, 1, "", "mark_sequence"], [38, 2, 1, "", "markp"], [38, 5, 1, "", "mbp"], [38, 5, 1, "", "nl"], [38, 5, 1, "", "nn"], [38, 5, 1, "", "nq"], [38, 5, 1, "", "num_layers"], [38, 2, 1, "", "num_nodes"], [38, 5, 1, "", "nv"], [38, 2, 1, "", "p"], [38, 2, 1, "", "path"], [38, 2, 1, "", "path_to"], [38, 5, 1, "", "pm"], [38, 5, 1, "", "pp"], [38, 2, 1, "", "preferred_actions"], [38, 5, 1, "", "r"], [38, 5, 1, "", "root"], [38, 2, 1, "", "s"], [38, 2, 1, "", "single_node_str"], [38, 2, 1, "", "step"], [38, 2, 1, "", "tree_stats"]], "pomdp_py.utils.interfaces.conversion": [[47, 1, 1, "", "AlphaVectorPolicy"], [47, 1, 1, "", "PolicyGraph"], [47, 4, 1, "", "to_pomdp_file"], [47, 4, 1, "", "to_pomdpx_file"]], "pomdp_py.utils.interfaces.conversion.AlphaVectorPolicy": [[47, 2, 1, "", "construct"], [47, 2, 1, "", "plan"], [47, 2, 1, "", "value"]], "pomdp_py.utils.interfaces.conversion.PolicyGraph": [[47, 2, 1, "", "construct"], [47, 2, 1, "", "plan"], [47, 2, 1, "", "update"]], "pomdp_py.utils.interfaces": [[47, 0, 0, "-", "solvers"]], "pomdp_py.utils.interfaces.solvers": [[47, 4, 1, "", "sarsop"], [47, 4, 1, "", "vi_pruning"]], "pomdp_py.utils.math": [[38, 4, 1, "", "R_between"], [38, 4, 1, "", "R_x"], [38, 4, 1, "", "R_y"], [38, 4, 1, "", "R_z"], [38, 4, 1, "", "T"], [38, 4, 1, "", "approx_equal"], [38, 4, 1, "", "euclidean_dist"], [38, 4, 1, "", "proj"], [38, 4, 1, "", "to_radians"], [38, 4, 1, "", "vec"]], "pomdp_py.utils.misc": [[38, 4, 1, "", "json_safe"], [38, 4, 1, "", "remap"], [38, 4, 1, "", "safe_slice"], [38, 4, 1, "", "similar"], [38, 1, 1, "", "special_char"]], "pomdp_py.utils.misc.special_char": [[38, 3, 1, "", "SUBSCRIPT"], [38, 3, 1, "", "bottomleft"], [38, 3, 1, "", "bottomright"], [38, 3, 1, "", "bottomt"], [38, 3, 1, "", "down"], [38, 3, 1, "", "hline"], [38, 3, 1, "", "intersect"], [38, 3, 1, "", "left"], [38, 3, 1, "", "leftt"], [38, 3, 1, "", "longbottomleft"], [38, 3, 1, "", "longbottomright"], [38, 3, 1, "", "longleft"], [38, 3, 1, "", "longright"], [38, 3, 1, "", "longtopleft"], [38, 3, 1, "", "longtopright"], [38, 3, 1, "", "right"], [38, 3, 1, "", "rightt"], [38, 3, 1, "", "shadebar"], [38, 3, 1, "", "topleft"], [38, 3, 1, "", "topright"], [38, 3, 1, "", "topt"], [38, 3, 1, "", "up"], [38, 3, 1, "", "vline"]], "pomdp_py.utils.templates": [[38, 1, 1, "", "DetObservationModel"], [38, 1, 1, "", "DetRewardModel"], [38, 1, 1, "", "DetTransitionModel"], [38, 1, 1, "", "SimpleAction"], [38, 1, 1, "", "SimpleObservation"], [38, 1, 1, "", "SimpleState"], [38, 1, 1, "", "TabularObservationModel"], [38, 1, 1, "", "TabularRewardModel"], [38, 1, 1, "", "TabularTransitionModel"], [38, 1, 1, "", "UniformPolicyModel"]], "pomdp_py.utils.templates.DetObservationModel": [[38, 2, 1, "", "probability"], [38, 2, 1, "", "sample"]], "pomdp_py.utils.templates.DetRewardModel": [[38, 2, 1, "", "argmax"], [38, 2, 1, "", "reward_func"], [38, 2, 1, "", "sample"]], "pomdp_py.utils.templates.DetTransitionModel": [[38, 2, 1, "", "probability"], [38, 2, 1, "", "sample"]], "pomdp_py.utils.templates.TabularObservationModel": [[38, 2, 1, "", "get_all_observations"], [38, 2, 1, "", "probability"], [38, 2, 1, "", "sample"]], "pomdp_py.utils.templates.TabularRewardModel": [[38, 2, 1, "", "sample"]], "pomdp_py.utils.templates.TabularTransitionModel": [[38, 2, 1, "", "get_all_states"], [38, 2, 1, "", "probability"], [38, 2, 1, "", "sample"]], "pomdp_py.utils.templates.UniformPolicyModel": [[38, 2, 1, "", "get_all_actions"], [38, 2, 1, "", "rollout"], [38, 2, 1, "", "sample"]], "pomdp_py.utils.typ": [[38, 1, 1, "", "bcolors"], [38, 4, 1, "", "blue"], [38, 4, 1, "", "bold"], [38, 4, 1, "", "cyan"], [38, 4, 1, "", "error"], [38, 4, 1, "", "green"], [38, 4, 1, "", "info"], [38, 4, 1, "", "magenta"], [38, 4, 1, "", "note"], [38, 4, 1, "", "red"], [38, 4, 1, "", "success"], [38, 4, 1, "", "warning"], [38, 4, 1, "", "white"], [38, 4, 1, "", "yellow"]], "pomdp_py.utils.typ.bcolors": [[38, 3, 1, "", "BLUE"], [38, 3, 1, "", "BOLD"], [38, 3, 1, "", "CYAN"], [38, 3, 1, "", "ENDC"], [38, 3, 1, "", "GREEN"], [38, 3, 1, "", "MAGENTA"], [38, 3, 1, "", "RED"], [38, 3, 1, "", "WHITE"], [38, 3, 1, "", "YELLOW"], [38, 2, 1, "", "disable"], [38, 2, 1, "", "s"]]}, "objtypes": {"0": "py:module", "1": "py:class", "2": "py:method", "3": "py:attribute", "4": "py:function", "5": "py:property"}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "class", "Python class"], "2": ["py", "method", "Python method"], "3": ["py", "attribute", "Python attribute"], "4": ["py", "function", "Python function"], "5": ["py", "property", "Python property"]}, "titleterms": {"pomdp_pi": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 47, 53, 57], "packag": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 40, 41, 57], "algorithm": [2, 3, 4], "po_rollout": 2, "modul": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 38, 39, 40, 41, 57], "po_uct": 2, "pomcp": 2, "value_iter": 2, "bsp": [2, 3], "blqr": [2, 3], "visual": [2, 4, 11, 22, 30, 41], "submodul": [3, 4, 8, 9, 10, 11, 12, 13, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 38, 41], "content": [3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 38, 41, 47, 54], "framework": 5, "basic": 5, "oopomdp": 5, "planner": 5, "problem": [6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 42, 48], "subpackag": [6, 8, 14, 17, 19, 23, 25, 27, 31, 33, 38], "lasertag": 7, "light_dark": [8, 9, 10, 11, 12], "problem_discret": 8, "test": [8, 54], "agent": [9, 20, 28, 47], "belief": [9, 20, 36], "domain": [10, 15, 21, 29, 49, 50], "action": [10, 15, 21, 29, 46], "observ": [10, 15, 21, 29], "state": [10, 15, 21, 29], "env": [11, 16, 22, 30], "plot": [11, 38], "model": [12, 17, 18, 23, 24, 31, 32, 49], "observation_model": [12, 23, 31], "transition_model": [12, 23, 31], "load_unload": 13, "maze": [14, 15, 16, 17, 18], "compon": [18, 24, 32], "map": 18, "multi_object_search": [19, 20, 21, 22, 23, 24], "example_world": [19, 27], "policy_model": [23, 31], "reward_model": [23, 31], "grid_map": [24, 32], "sensor": 24, "rocksampl": [25, 26], "cython": [25, 26, 33, 34], "rocksample_problem": [25, 26], "run_rocksampl": 26, "tag": [27, 28, 29, 30, 31, 32], "constant": 27, "experi": 27, "motion_polici": 32, "tiger": [33, 34, 45, 49], "tiger_problem": [33, 34], "run_tig": 34, "represent": [35, 36, 37], "histogram": [36, 37], "particl": [36, 37], "distribut": 37, "gaussian": 37, "util": [38, 39, 40, 57], "color": 38, "cython_util": 38, "cpython": 38, "37m": 38, "x86_64": 38, "linux": 38, "gnu": 38, "debug": [38, 39], "treedebugg": [38, 39], "math": 38, "misc": 38, "templat": 38, "test_util": 38, "typ": 38, "interfac": [40, 57], "simple_rl": [40, 57], "search_tre": 41, "build": 42, "document": [42, 53], "doc": [42, 55], "pomdp_problem": [], "note": 42, "changelog": [42, 43], "design": 44, "principl": 44, "exampl": [45, 47], "multi": [45, 48], "object": [45, 48], "search": [45, 48], "mo": [45, 48], "prefer": 46, "base": 46, "prior": 46, "us": [47, 52], "extern": 47, "solver": [47, 51], "tabl": [47, 54], "convert": 47, "pomdp": [47, 48, 49, 50, 51, 54, 56], "file": 47, "solv": [47, 49], "sarsop": 47, "policygraph": 47, "alphavectorpolici": 47, "overview": [48, 53], "implement": 48, "thi": 48, "convent": 48, "try": 48, "defin": 49, "instanti": 49, "instanc": 49, "summari": 49, "exist": [50, 51], "case": 52, "extens": 52, "get": 53, "start": 53, "further": 53, "citat": 53, "api": 53, "refer": 53, "tool": 53, "instal": 54, "pre": 54, "py": 54, "thing": 54, "out": 54, "docker": 54, "imag": 54, "other": 56, "librari": 56, "integr": 57, "version": 43, "1": 43, "3": 43, "4": 43, "01": 43, "26": 43, "2024": 43, "07": 43, "25": 43, "2023": 43, "2": 43, "04": 43, "03": 43, "2022": 43, "11": 43, "2021": 43, "0": 43, "09": 43, "30": 43, "6": 43, "cancel": 43, "5": 43, "05": 43, "06": 43, "02": 43, "22": 43, "17": 43, "12": 43, "23": 43, "2020": 43, "pull": 43, "request": 43, "08": 43, "16": 43}, "envversion": {"sphinx.domains.c": 3, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 9, "sphinx.domains.index": 1, "sphinx.domains.javascript": 3, "sphinx.domains.math": 2, "sphinx.domains.python": 4, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.intersphinx": 1, "sphinxcontrib.bibtex": 9, "sphinx.ext.viewcode": 1, "sphinx": 60}, "alltitles": {"pomdp_py": [[0, "pomdp-py"]], "pomdp_py package": [[1, "pomdp-py-package"]], "pomdp_py.framework package": [[5, "pomdp-py-framework-package"]], "pomdp_py.framework.basics module": [[5, "module-pomdp_py.framework.basics"]], "pomdp_py.framework.oopomdp module": [[5, "module-pomdp_py.framework.oopomdp"]], "pomdp_py.framework.planner module": [[5, "module-pomdp_py.framework.planner"]], "pomdp_py.representations package": [[35, "pomdp-py-representations-package"]], "pomdp_py.representations.distribution package": [[37, "pomdp-py-representations-distribution-package"]], "pomdp_py.representations.distribution.histogram module": [[37, "module-pomdp_py.representations.distribution.histogram"]], "pomdp_py.representations.distribution.particles module": [[37, "module-pomdp_py.representations.distribution.particles"]], "pomdp_py.representations.distribution.gaussian module": [[37, "module-pomdp_py.representations.distribution.gaussian"]], "Design Principles": [[44, "design-principles"]], "Examples": [[45, "examples"]], "Tiger": [[45, "tiger"], [49, "tiger"]], "Multi-Object Search (MOS)": [[45, "multi-object-search-mos"], [48, "multi-object-search-mos"]], "Preference-based Action Prior": [[46, "preference-based-action-prior"]], "Existing POMDP Solvers": [[51, "existing-pomdp-solvers"]], "Use Case Extensions": [[52, "use-case-extensions"]], "docs": [[55, "docs"]], "Other POMDP Libraries": [[56, "other-pomdp-libraries"]], "pomdp_py.algorithms.bsp.blqr module": [[3, "module-pomdp_py.algorithms.bsp.blqr"], [2, "module-pomdp_py.algorithms.bsp.blqr"]], "pomdp_py.algorithms.bsp package": [[3, "pomdp-py-algorithms-bsp-package"]], "Submodules": [[3, "submodules"], [15, "submodules"], [16, "submodules"], [20, "submodules"], [21, "submodules"], [23, "submodules"], [24, "submodules"], [25, "submodules"], [28, "submodules"], [29, "submodules"], [31, "submodules"], [32, "submodules"], [33, "submodules"], [4, "submodules"], [8, "submodules"], [9, "submodules"], [10, "submodules"], [11, "submodules"], [12, "submodules"], [13, "submodules"], [18, "submodules"], [19, "submodules"], [22, "submodules"], [26, "submodules"], [27, "submodules"], [30, "submodules"], [34, "submodules"], [38, "submodules"], [41, "submodules"]], "Module contents": [[3, "module-pomdp_py.algorithms.bsp"], [6, "module-pomdp_py.problems"], [7, "module-pomdp_py.problems.lasertag"], [14, "module-pomdp_py.problems.maze"], [15, "module-pomdp_py.problems.maze.domain"], [16, "module-pomdp_py.problems.maze.env"], [17, "module-pomdp_py.problems.maze.models"], [20, "module-pomdp_py.problems.multi_object_search.agent"], [21, "module-pomdp_py.problems.multi_object_search.domain"], [23, "module-pomdp_py.problems.multi_object_search.models"], [24, "module-pomdp_py.problems.multi_object_search.models.components"], [25, "module-pomdp_py.problems.rocksample"], [28, "module-pomdp_py.problems.tag.agent"], [29, "module-pomdp_py.problems.tag.domain"], [31, "module-pomdp_py.problems.tag.models"], [32, "module-pomdp_py.problems.tag.models.components"], [33, "module-pomdp_py.problems.tiger"], [4, "module-contents"], [8, "module-contents"], [9, "module-contents"], [10, "module-contents"], [11, "module-pomdp_py.problems.light_dark.env"], [12, "module-contents"], [13, "module-pomdp_py.problems.load_unload"], [18, "module-pomdp_py.problems.maze.models.components"], [19, "module-pomdp_py.problems.multi_object_search"], [22, "module-pomdp_py.problems.multi_object_search.env"], [26, "module-pomdp_py.problems.rocksample.cythonize"], [27, "module-pomdp_py.problems.tag"], [30, "module-pomdp_py.problems.tag.env"], [34, "module-pomdp_py.problems.tiger.cythonize"], [38, "module-pomdp_py.utils"], [41, "module-contents"]], "pomdp_py.problems package": [[6, "pomdp-py-problems-package"]], "Subpackages": [[6, "subpackages"], [14, "subpackages"], [17, "subpackages"], [23, "subpackages"], [25, "subpackages"], [31, "subpackages"], [33, "subpackages"], [8, "subpackages"], [19, "subpackages"], [27, "subpackages"], [38, "subpackages"]], "pomdp_py.problems.lasertag package": [[7, "pomdp-py-problems-lasertag-package"]], "pomdp_py.problems.maze package": [[14, "pomdp-py-problems-maze-package"]], "Maze": [[14, "maze"]], "pomdp_py.problems.maze.domain package": [[15, "pomdp-py-problems-maze-domain-package"]], "pomdp_py.problems.maze.domain.action module": [[15, "module-pomdp_py.problems.maze.domain.action"]], "pomdp_py.problems.maze.domain.observation module": [[15, "module-pomdp_py.problems.maze.domain.observation"]], "pomdp_py.problems.maze.domain.state module": [[15, "module-pomdp_py.problems.maze.domain.state"]], "pomdp_py.problems.maze.env package": [[16, "pomdp-py-problems-maze-env-package"]], "pomdp_py.problems.maze.env.env module": [[16, "module-pomdp_py.problems.maze.env.env"]], "pomdp_py.problems.maze.models package": [[17, "pomdp-py-problems-maze-models-package"]], "pomdp_py.problems.multi_object_search.agent package": [[20, "pomdp-py-problems-multi-object-search-agent-package"]], "pomdp_py.problems.multi_object_search.agent.agent module": [[20, "module-pomdp_py.problems.multi_object_search.agent.agent"]], "pomdp_py.problems.multi_object_search.agent.belief module": [[20, "module-pomdp_py.problems.multi_object_search.agent.belief"]], "pomdp_py.problems.multi_object_search.domain package": [[21, "pomdp-py-problems-multi-object-search-domain-package"]], "pomdp_py.problems.multi_object_search.domain.action module": [[21, "module-pomdp_py.problems.multi_object_search.domain.action"]], "pomdp_py.problems.multi_object_search.domain.observation module": [[21, "module-pomdp_py.problems.multi_object_search.domain.observation"]], "pomdp_py.problems.multi_object_search.domain.state module": [[21, "module-pomdp_py.problems.multi_object_search.domain.state"]], "pomdp_py.problems.multi_object_search.models package": [[23, "pomdp-py-problems-multi-object-search-models-package"]], "pomdp_py.problems.multi_object_search.models.observation_model module": [[23, "module-pomdp_py.problems.multi_object_search.models.observation_model"]], "pomdp_py.problems.multi_object_search.models.policy_model module": [[23, "module-pomdp_py.problems.multi_object_search.models.policy_model"]], "pomdp_py.problems.multi_object_search.models.reward_model module": [[23, "module-pomdp_py.problems.multi_object_search.models.reward_model"]], "pomdp_py.problems.multi_object_search.models.transition_model module": [[23, "module-pomdp_py.problems.multi_object_search.models.transition_model"]], "pomdp_py.problems.multi_object_search.models.components package": [[24, "pomdp-py-problems-multi-object-search-models-components-package"]], "pomdp_py.problems.multi_object_search.models.components.grid_map module": [[24, "module-pomdp_py.problems.multi_object_search.models.components.grid_map"]], "pomdp_py.problems.multi_object_search.models.components.sensor module": [[24, "module-pomdp_py.problems.multi_object_search.models.components.sensor"]], "pomdp_py.problems.rocksample package": [[25, "pomdp-py-problems-rocksample-package"]], "pomdp_py.problems.rocksample.cythonize module": [[25, "module-pomdp_py.problems.rocksample.cythonize"]], "pomdp_py.problems.rocksample.rocksample_problem module": [[25, "module-pomdp_py.problems.rocksample.rocksample_problem"]], "pomdp_py.problems.tag.agent package": [[28, "pomdp-py-problems-tag-agent-package"]], "pomdp_py.problems.tag.agent.agent module": [[28, "module-pomdp_py.problems.tag.agent.agent"]], "pomdp_py.problems.tag.domain package": [[29, "pomdp-py-problems-tag-domain-package"]], "pomdp_py.problems.tag.domain.action module": [[29, "module-pomdp_py.problems.tag.domain.action"]], "pomdp_py.problems.tag.domain.observation module": [[29, "module-pomdp_py.problems.tag.domain.observation"]], "pomdp_py.problems.tag.domain.state module": [[29, "module-pomdp_py.problems.tag.domain.state"]], "pomdp_py.problems.tag.models package": [[31, "pomdp-py-problems-tag-models-package"]], "pomdp_py.problems.tag.models.observation_model module": [[31, "module-pomdp_py.problems.tag.models.observation_model"]], "pomdp_py.problems.tag.models.policy_model module": [[31, "module-pomdp_py.problems.tag.models.policy_model"]], "pomdp_py.problems.tag.models.reward_model module": [[31, "module-pomdp_py.problems.tag.models.reward_model"]], "pomdp_py.problems.tag.models.transition_model module": [[31, "module-pomdp_py.problems.tag.models.transition_model"]], "pomdp_py.problems.tag.models.components package": [[32, "pomdp-py-problems-tag-models-components-package"]], "pomdp_py.problems.tag.models.components.grid_map module": [[32, "module-pomdp_py.problems.tag.models.components.grid_map"]], "pomdp_py.problems.tag.models.components.motion_policy module": [[32, "module-pomdp_py.problems.tag.models.components.motion_policy"]], "pomdp_py.problems.tiger package": [[33, "pomdp-py-problems-tiger-package"]], "pomdp_py.problems.tiger.cythonize module": [[33, "module-pomdp_py.problems.tiger.cythonize"]], "pomdp_py.problems.tiger.tiger_problem module": [[33, "module-pomdp_py.problems.tiger.tiger_problem"]], "pomdp_py.representations.belief package": [[36, "pomdp-py-representations-belief-package"]], "pomdp_py.representations.belief.histogram module": [[36, "module-pomdp_py.representations.belief.histogram"]], "pomdp_py.representations.belief.particles module": [[36, "module-pomdp_py.representations.belief.particles"]], "pomdp_py.utils.debugging module": [[39, "module-pomdp_py.utils.debugging"], [38, "module-pomdp_py.utils.debugging"]], "TreeDebugger": [[39, "treedebugger"], [38, "treedebugger"]], "Building Documentations": [[42, "building-documentations"]], "Building docs for pomdp_py": [[42, "building-docs-for-pomdp-py"]], "Building docs for pomdp_py.problems": [[42, "building-docs-for-pomdp-py-problems"]], "Note on Changelog": [[42, "note-on-changelog"]], "Using External Solvers": [[47, "module-pomdp_py.utils.interfaces.solvers"]], "Table of Contents": [[47, "table-of-contents"], [54, "table-of-contents"]], "Converting a pomdp_py Agent to a POMDP File": [[47, "converting-a-pomdp-py-agent-to-a-pomdp-file"]], "Example": [[47, "example"], [47, "id2"], [47, "id4"]], "Using pomdp-solve": [[47, "using-pomdp-solve"]], "Using sarsop": [[47, "using-sarsop"]], "PolicyGraph and AlphaVectorPolicy": [[47, "policygraph-and-alphavectorpolicy"]], "Problem overview": [[48, "problem-overview"]], "Implementing this POMDP: Conventions": [[48, "implementing-this-pomdp-conventions"]], "Try it": [[48, "try-it"]], "Define the domain": [[49, "define-the-domain"]], "Define the models": [[49, "define-the-models"]], "Define the POMDP": [[49, "define-the-pomdp"]], "Instantiate the POMDP": [[49, "instantiate-the-pomdp"]], "Solve the POMDP instance": [[49, "solve-the-pomdp-instance"]], "Summary": [[49, "summary"]], "Existing POMDP Domains": [[50, "existing-pomdp-domains"]], "Installation": [[54, "installation"]], "Pre-installation": [[54, "pre-installation"]], "Install pomdp-py": [[54, "install-pomdp-py"]], "Test things out": [[54, "test-things-out"]], "Docker image": [[54, "docker-image"]], "pomdp_py.algorithms package": [[2, "pomdp-py-algorithms-package"]], "pomdp_py.algorithms.po_rollout module": [[2, "module-pomdp_py.algorithms.po_rollout"]], "pomdp_py.algorithms.po_uct module": [[2, "module-pomdp_py.algorithms.po_uct"]], "pomdp_py.algorithms.pomcp module": [[2, "module-pomdp_py.algorithms.pomcp"]], "pomdp_py.algorithms.value_iteration module": [[2, "module-pomdp_py.algorithms.value_iteration"]], "pomdp_py.algorithms.visual.visual module": [[2, "pomdp-py-algorithms-visual-visual-module"], [4, "pomdp-py-algorithms-visual-visual-module"]], "pomdp_py.algorithms.visual package": [[4, "pomdp-py-algorithms-visual-package"]], "pomdp_py.problems.light_dark package": [[8, "pomdp-py-problems-light-dark-package"]], "pomdp_py.problems.light_dark.problem_discrete module": [[8, "pomdp-py-problems-light-dark-problem-discrete-module"]], "pomdp_py.problems.light_dark.test module": [[8, "pomdp-py-problems-light-dark-test-module"]], "pomdp_py.problems.light_dark.agent package": [[9, "pomdp-py-problems-light-dark-agent-package"]], "pomdp_py.problems.light_dark.agent.belief module": [[9, "pomdp-py-problems-light-dark-agent-belief-module"]], "pomdp_py.problems.light_dark.domain package": [[10, "pomdp-py-problems-light-dark-domain-package"]], "pomdp_py.problems.light_dark.domain.action module": [[10, "pomdp-py-problems-light-dark-domain-action-module"]], "pomdp_py.problems.light_dark.domain.observation module": [[10, "pomdp-py-problems-light-dark-domain-observation-module"]], "pomdp_py.problems.light_dark.domain.state module": [[10, "pomdp-py-problems-light-dark-domain-state-module"]], "pomdp_py.problems.light_dark.env package": [[11, "pomdp-py-problems-light-dark-env-package"]], "pomdp_py.problems.light_dark.env.env module": [[11, "module-pomdp_py.problems.light_dark.env.env"]], "pomdp_py.problems.light_dark.env.plotting module": [[11, "pomdp-py-problems-light-dark-env-plotting-module"]], "pomdp_py.problems.light_dark.env.visual module": [[11, "pomdp-py-problems-light-dark-env-visual-module"]], "pomdp_py.problems.light_dark.models package": [[12, "pomdp-py-problems-light-dark-models-package"]], "pomdp_py.problems.light_dark.models.observation_model module": [[12, "pomdp-py-problems-light-dark-models-observation-model-module"]], "pomdp_py.problems.light_dark.models.transition_model module": [[12, "pomdp-py-problems-light-dark-models-transition-model-module"]], "pomdp_py.problems.load_unload package": [[13, "pomdp-py-problems-load-unload-package"]], "pomdp_py.problems.load_unload.load_unload module": [[13, "pomdp-py-problems-load-unload-load-unload-module"]], "pomdp_py.problems.maze.models.components package": [[18, "pomdp-py-problems-maze-models-components-package"]], "pomdp_py.problems.maze.models.components.map module": [[18, "pomdp-py-problems-maze-models-components-map-module"]], "pomdp_py.problems.multi_object_search package": [[19, "pomdp-py-problems-multi-object-search-package"]], "pomdp_py.problems.multi_object_search.example_worlds module": [[19, "module-pomdp_py.problems.multi_object_search.example_worlds"]], "pomdp_py.problems.multi_object_search.problem module": [[19, "pomdp-py-problems-multi-object-search-problem-module"]], "pomdp_py.problems.multi_object_search.env package": [[22, "pomdp-py-problems-multi-object-search-env-package"]], "pomdp_py.problems.multi_object_search.env.env module": [[22, "module-pomdp_py.problems.multi_object_search.env.env"]], "pomdp_py.problems.multi_object_search.env.visual module": [[22, "pomdp-py-problems-multi-object-search-env-visual-module"]], "pomdp_py.problems.rocksample.cythonize package": [[26, "pomdp-py-problems-rocksample-cythonize-package"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem module": [[26, "module-pomdp_py.problems.rocksample.cythonize.rocksample_problem"], [26, "id1"], [26, "id49"], [26, "id98"]], "pomdp_py.problems.rocksample.cythonize.run_rocksample module": [[26, "pomdp-py-problems-rocksample-cythonize-run-rocksample-module"]], "pomdp_py.problems.tag package": [[27, "pomdp-py-problems-tag-package"]], "pomdp_py.problems.tag.constants module": [[27, "module-pomdp_py.problems.tag.constants"]], "pomdp_py.problems.tag.example_worlds module": [[27, "module-pomdp_py.problems.tag.example_worlds"]], "pomdp_py.problems.tag.experiment module": [[27, "pomdp-py-problems-tag-experiment-module"]], "pomdp_py.problems.tag.problem module": [[27, "pomdp-py-problems-tag-problem-module"]], "pomdp_py.problems.tag.env package": [[30, "pomdp-py-problems-tag-env-package"]], "pomdp_py.problems.tag.env.env module": [[30, "pomdp-py-problems-tag-env-env-module"]], "pomdp_py.problems.tag.env.visual module": [[30, "pomdp-py-problems-tag-env-visual-module"]], "pomdp_py.problems.tiger.cythonize package": [[34, "pomdp-py-problems-tiger-cythonize-package"]], "pomdp_py.problems.tiger.cythonize.run_tiger module": [[34, "pomdp-py-problems-tiger-cythonize-run-tiger-module"]], "pomdp_py.problems.tiger.cythonize.tiger_problem module": [[34, "module-pomdp_py.problems.tiger.cythonize.tiger_problem"], [34, "id1"], [34, "id39"], [34, "id78"]], "pomdp_py.utils package": [[38, "pomdp-py-utils-package"]], "pomdp_py.utils.colors module": [[38, "module-pomdp_py.utils.colors"]], "pomdp_py.utils.cython_utils.cpython-37m-x86_64-linux-gnu module": [[38, "pomdp-py-utils-cython-utils-cpython-37m-x86-64-linux-gnu-module"]], "pomdp_py.utils.cython_utils module": [[38, "module-pomdp_py.utils.cython_utils"]], "pomdp_py.utils.math module": [[38, "module-pomdp_py.utils.math"]], "pomdp_py.utils.misc module": [[38, "module-pomdp_py.utils.misc"]], "pomdp_py.utils.plotting module": [[38, "pomdp-py-utils-plotting-module"]], "pomdp_py.utils.templates module": [[38, "module-pomdp_py.utils.templates"]], "pomdp_py.utils.test_utils module": [[38, "pomdp-py-utils-test-utils-module"]], "pomdp_py.utils.typ module": [[38, "module-pomdp_py.utils.typ"]], "pomdp_py.utils.interfaces package": [[40, "pomdp-py-utils-interfaces-package"], [57, "pomdp-py-utils-interfaces-package"]], "pomdp_py.utils.interfaces.simple_rl module": [[40, "pomdp-py-utils-interfaces-simple-rl-module"], [57, "pomdp-py-utils-interfaces-simple-rl-module"]], "pomdp_py.visual package": [[41, "pomdp-py-visual-package"]], "pomdp_py.visual.search_tree module": [[41, "pomdp-py-visual-search-tree-module"]], "Changelog": [[43, "changelog"]], "Version 1.3.4 (01/26/2024)": [[43, "version-1-3-4-01-26-2024"]], "Version 1.3.3 (07/25/2023)": [[43, "version-1-3-3-07-25-2023"]], "Version 1.3.2 (04/03/2022)": [[43, "version-1-3-2-04-03-2022"]], "Version 1.3.1 (11/03/2021)": [[43, "version-1-3-1-11-03-2021"]], "Version 1.3.0.1 (09/30/2021)": [[43, "version-1-3-0-1-09-30-2021"]], "Version 1.2.4.6 (canceled)": [[43, "version-1-2-4-6-canceled"]], "Version 1.2.4.5 (07/05/2021)": [[43, "version-1-2-4-5-07-05-2021"]], "Version 1.2.4.1 (06/02/2021)": [[43, "version-1-2-4-1-06-02-2021"]], "Version 1.2.4 (06/01/2021)": [[43, "version-1-2-4-06-01-2021"]], "Version 1.2.3 (03/22/2021)": [[43, "version-1-2-3-03-22-2021"]], "Version 1.2.2.1 (01/25/2021)": [[43, "version-1-2-2-1-01-25-2021"]], "Version 1.2.2 (01/17/2021)": [[43, "version-1-2-2-01-17-2021"]], "Version 1.2.1 (12/23/2020)": [[43, "version-1-2-1-12-23-2020"]], "Pull Request #3 (08/01/2020)": [[43, "pull-request-3-08-01-2020"]], "Pull Request #1 (06/02/2020)": [[43, "pull-request-1-06-02-2020"]], "Version 1.0 - 1.2 (02/08/2020 - 02/16/2020)": [[43, "version-1-0-1-2-02-08-2020-02-16-2020"]], "Version 0.0": [[43, "version-0-0"]], "pomdp_py Documentation": [[53, "pomdp-py-documentation"]], "Overview": [[53, "overview"]], "Getting Started": [[53, "getting-started"]], "Further": [[53, "further"]], "Citation": [[53, "citation"]], "API References": [[53, "api-references"], [53, null]], "Tools": [[53, "tools"]], "Integration with simple_rl": [[57, "integration-with-simple-rl"]]}, "indexentries": {"actionprior (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.ActionPrior"]], "blqr (class in pomdp_py.algorithms.bsp.blqr)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR"]], "pomcp (class in pomdp_py.algorithms.pomcp)": [[2, "pomdp_py.algorithms.pomcp.POMCP"]], "porollout (class in pomdp_py.algorithms.po_rollout)": [[2, "pomdp_py.algorithms.po_rollout.PORollout"]], "pouct (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.POUCT"]], "qnode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.QNode"]], "randomrollout (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.RandomRollout"]], "rolloutpolicy (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.RolloutPolicy"]], "rootvnode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.RootVNode"]], "rootvnodeparticles (class in pomdp_py.algorithms.pomcp)": [[2, "pomdp_py.algorithms.pomcp.RootVNodeParticles"]], "treenode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.TreeNode"]], "vnode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.VNode"]], "vnodeparticles (class in pomdp_py.algorithms.pomcp)": [[2, "pomdp_py.algorithms.pomcp.VNodeParticles"]], "valueiteration (class in pomdp_py.algorithms.value_iteration)": [[2, "pomdp_py.algorithms.value_iteration.ValueIteration"]], "argmax() (pomdp_py.algorithms.po_uct.vnode method)": [[2, "pomdp_py.algorithms.po_uct.VNode.argmax"]], "belief (pomdp_py.algorithms.pomcp.rootvnodeparticles attribute)": [[2, "pomdp_py.algorithms.pomcp.RootVNodeParticles.belief"]], "belief (pomdp_py.algorithms.pomcp.vnodeparticles attribute)": [[2, "pomdp_py.algorithms.pomcp.VNodeParticles.belief"]], "children (pomdp_py.algorithms.po_uct.treenode attribute)": [[2, "pomdp_py.algorithms.po_uct.TreeNode.children"]], "clear_agent() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.clear_agent"]], "clear_agent() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.clear_agent"]], "create_plan() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.create_plan"]], "ekf_update_mlo() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.ekf_update_mlo"]], "from_vnode() (pomdp_py.algorithms.po_uct.rootvnode class method)": [[2, "pomdp_py.algorithms.po_uct.RootVNode.from_vnode"]], "from_vnode() (pomdp_py.algorithms.pomcp.rootvnodeparticles class method)": [[2, "pomdp_py.algorithms.pomcp.RootVNodeParticles.from_vnode"]], "get_preferred_actions() (pomdp_py.algorithms.po_uct.actionprior method)": [[2, "pomdp_py.algorithms.po_uct.ActionPrior.get_preferred_actions"]], "history (pomdp_py.algorithms.po_uct.rootvnode attribute)": [[2, "pomdp_py.algorithms.po_uct.RootVNode.history"]], "integrate_belief_segment() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.integrate_belief_segment"]], "interpret_sqp_plan() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.interpret_sqp_plan"]], "last_best_reward (pomdp_py.algorithms.po_rollout.porollout attribute)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.last_best_reward"]], "last_num_sims (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.last_num_sims"]], "last_planning_time (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.last_planning_time"]], "module": [[2, "module-pomdp_py.algorithms.bsp.blqr"], [2, "module-pomdp_py.algorithms.po_rollout"], [2, "module-pomdp_py.algorithms.po_uct"], [2, "module-pomdp_py.algorithms.pomcp"], [2, "module-pomdp_py.algorithms.value_iteration"], [6, "module-pomdp_py.problems"], [11, "module-pomdp_py.problems.light_dark.env"], [11, "module-pomdp_py.problems.light_dark.env.env"], [13, "module-pomdp_py.problems.load_unload"], [17, "module-pomdp_py.problems.maze.models"], [18, "module-pomdp_py.problems.maze.models.components"], [19, "module-pomdp_py.problems.multi_object_search"], [19, "module-pomdp_py.problems.multi_object_search.example_worlds"], [22, "module-pomdp_py.problems.multi_object_search.env"], [22, "module-pomdp_py.problems.multi_object_search.env.env"], [25, "module-pomdp_py.problems.rocksample"], [25, "module-pomdp_py.problems.rocksample.cythonize"], [25, "module-pomdp_py.problems.rocksample.rocksample_problem"], [26, "module-0"], [26, "module-1"], [26, "module-2"], [26, "module-pomdp_py.problems.rocksample.cythonize"], [26, "module-pomdp_py.problems.rocksample.cythonize.rocksample_problem"], [27, "module-pomdp_py.problems.tag"], [27, "module-pomdp_py.problems.tag.constants"], [27, "module-pomdp_py.problems.tag.example_worlds"], [30, "module-pomdp_py.problems.tag.env"], [33, "module-pomdp_py.problems.tiger"], [33, "module-pomdp_py.problems.tiger.cythonize"], [33, "module-pomdp_py.problems.tiger.tiger_problem"], [34, "module-0"], [34, "module-1"], [34, "module-2"], [34, "module-pomdp_py.problems.tiger.cythonize"], [34, "module-pomdp_py.problems.tiger.cythonize.tiger_problem"], [38, "module-pomdp_py.utils"], [38, "module-pomdp_py.utils.colors"], [38, "module-pomdp_py.utils.cython_utils"], [38, "module-pomdp_py.utils.debugging"], [38, "module-pomdp_py.utils.math"], [38, "module-pomdp_py.utils.misc"], [38, "module-pomdp_py.utils.templates"], [38, "module-pomdp_py.utils.typ"]], "num_visits (pomdp_py.algorithms.po_uct.treenode attribute)": [[2, "pomdp_py.algorithms.po_uct.TreeNode.num_visits"]], "plan() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.plan"]], "plan() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.plan"]], "plan() (pomdp_py.algorithms.pomcp.pomcp method)": [[2, "pomdp_py.algorithms.pomcp.POMCP.plan"]], "plan() (pomdp_py.algorithms.value_iteration.valueiteration method)": [[2, "pomdp_py.algorithms.value_iteration.ValueIteration.plan"]], "pomdp_py.algorithms.bsp.blqr": [[2, "module-pomdp_py.algorithms.bsp.blqr"]], "pomdp_py.algorithms.po_rollout": [[2, "module-pomdp_py.algorithms.po_rollout"]], "pomdp_py.algorithms.po_uct": [[2, "module-pomdp_py.algorithms.po_uct"]], "pomdp_py.algorithms.pomcp": [[2, "module-pomdp_py.algorithms.pomcp"]], "pomdp_py.algorithms.value_iteration": [[2, "module-pomdp_py.algorithms.value_iteration"]], "print_children_value() (pomdp_py.algorithms.po_uct.vnode method)": [[2, "pomdp_py.algorithms.po_uct.VNode.print_children_value"]], "rollout() (pomdp_py.algorithms.po_uct.randomrollout method)": [[2, "pomdp_py.algorithms.po_uct.RandomRollout.rollout"]], "rollout() (pomdp_py.algorithms.po_uct.rolloutpolicy method)": [[2, "pomdp_py.algorithms.po_uct.RolloutPolicy.rollout"]], "segmented_cost_function() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.segmented_cost_function"]], "set_rollout_policy() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.set_rollout_policy"]], "set_rollout_policy() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.set_rollout_policy"]], "update() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.update"]], "update() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.update"]], "update() (pomdp_py.algorithms.pomcp.pomcp method)": [[2, "pomdp_py.algorithms.pomcp.POMCP.update"]], "update_agent_belief (pomdp_py.algorithms.po_rollout.porollout attribute)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.update_agent_belief"]], "update_agent_belief (pomdp_py.algorithms.pomcp.pomcp attribute)": [[2, "pomdp_py.algorithms.pomcp.POMCP.update_agent_belief"]], "updates_agent_belief (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.updates_agent_belief"]], "value (pomdp_py.algorithms.po_uct.treenode attribute)": [[2, "pomdp_py.algorithms.po_uct.TreeNode.value"]], "value (pomdp_py.algorithms.po_uct.vnode attribute)": [[2, "pomdp_py.algorithms.po_uct.VNode.value"]], "pomdp_py.problems": [[6, "module-pomdp_py.problems"]], "lightdarkenvironment (class in pomdp_py.problems.light_dark.env.env)": [[11, "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment"]], "const (pomdp_py.problems.light_dark.env.env.lightdarkenvironment property)": [[11, "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment.const"]], "light (pomdp_py.problems.light_dark.env.env.lightdarkenvironment property)": [[11, "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment.light"]], "pomdp_py.problems.light_dark.env": [[11, "module-pomdp_py.problems.light_dark.env"]], "pomdp_py.problems.light_dark.env.env": [[11, "module-pomdp_py.problems.light_dark.env.env"]], "pomdp_py.problems.load_unload": [[13, "module-pomdp_py.problems.load_unload"]], "pomdp_py.problems.maze.models": [[17, "module-pomdp_py.problems.maze.models"]], "pomdp_py.problems.maze.models.components": [[18, "module-pomdp_py.problems.maze.models.components"]], "pomdp_py.problems.multi_object_search": [[19, "module-pomdp_py.problems.multi_object_search"]], "pomdp_py.problems.multi_object_search.example_worlds": [[19, "module-pomdp_py.problems.multi_object_search.example_worlds"]], "random_world() (in module pomdp_py.problems.multi_object_search.example_worlds)": [[19, "pomdp_py.problems.multi_object_search.example_worlds.random_world"]], "mosenvironment (class in pomdp_py.problems.multi_object_search.env.env)": [[22, "pomdp_py.problems.multi_object_search.env.env.MosEnvironment"]], "equip_sensors() (in module pomdp_py.problems.multi_object_search.env.env)": [[22, "pomdp_py.problems.multi_object_search.env.env.equip_sensors"]], "interpret() (in module pomdp_py.problems.multi_object_search.env.env)": [[22, "pomdp_py.problems.multi_object_search.env.env.interpret"]], "interpret_robot_id() (in module pomdp_py.problems.multi_object_search.env.env)": [[22, "pomdp_py.problems.multi_object_search.env.env.interpret_robot_id"]], "make_laser_sensor() (in module pomdp_py.problems.multi_object_search.env.env)": [[22, "pomdp_py.problems.multi_object_search.env.env.make_laser_sensor"]], "make_proximity_sensor() (in module pomdp_py.problems.multi_object_search.env.env)": [[22, "pomdp_py.problems.multi_object_search.env.env.make_proximity_sensor"]], "pomdp_py.problems.multi_object_search.env": [[22, "module-pomdp_py.problems.multi_object_search.env"]], "pomdp_py.problems.multi_object_search.env.env": [[22, "module-pomdp_py.problems.multi_object_search.env.env"]], "robot_ids (pomdp_py.problems.multi_object_search.env.env.mosenvironment property)": [[22, "pomdp_py.problems.multi_object_search.env.env.MosEnvironment.robot_ids"]], "state_transition() (pomdp_py.problems.multi_object_search.env.env.mosenvironment method)": [[22, "pomdp_py.problems.multi_object_search.env.env.MosEnvironment.state_transition"]], "action (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.Action"]], "bad (pomdp_py.problems.rocksample.rocksample_problem.rocktype attribute)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockType.BAD"]], "checkaction (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.CheckAction"]], "east (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.EAST"]], "good (pomdp_py.problems.rocksample.rocksample_problem.rocktype attribute)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockType.GOOD"]], "moveaction (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction"]], "north (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.NORTH"]], "observation (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.Observation"]], "rsobservationmodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel"]], "rspolicymodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel"]], "rsrewardmodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel"]], "rstransitionmodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel"]], "rocksampleproblem (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem"]], "rocktype (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockType"]], "south (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.SOUTH"]], "sampleaction (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.SampleAction"]], "state (class in pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.State"]], "west (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.WEST"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rsobservationmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rsrewardmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rstransitionmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel.argmax"]], "euclidean_dist() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.euclidean_dist"]], "generate_instance() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem static method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance"]], "get_all_actions() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions"]], "in_exit_area() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area"]], "init_particles_belief() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.init_particles_belief"]], "invert() (pomdp_py.problems.rocksample.rocksample_problem.rocktype static method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockType.invert"]], "main() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.main"]], "pomdp_py.problems.rocksample": [[25, "module-pomdp_py.problems.rocksample"]], "pomdp_py.problems.rocksample.cythonize": [[25, "module-pomdp_py.problems.rocksample.cythonize"], [26, "module-pomdp_py.problems.rocksample.cythonize"]], "pomdp_py.problems.rocksample.rocksample_problem": [[25, "module-pomdp_py.problems.rocksample.rocksample_problem"]], "print_state() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.print_state"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rsobservationmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel.probability"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.probability"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rsrewardmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel.probability"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rstransitionmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel.probability"]], "random() (pomdp_py.problems.rocksample.rocksample_problem.rocktype static method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockType.random"]], "random_free_location() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem static method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location"]], "rollout() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.rollout"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rsobservationmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel.sample"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.sample"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rsrewardmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel.sample"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rstransitionmodel method)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[25, "pomdp_py.problems.rocksample.rocksample_problem.test_planner"]], "bad (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype attribute)": [[26, "id138"], [26, "id40"], [26, "id89"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.BAD"]], "checkaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id0"], [26, "id50"], [26, "id99"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.CheckAction"]], "east (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[26, "id102"], [26, "id4"], [26, "id53"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.EAST"]], "good (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype attribute)": [[26, "id139"], [26, "id41"], [26, "id90"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.GOOD"]], "moveaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id101"], [26, "id3"], [26, "id52"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction"]], "north (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[26, "id103"], [26, "id5"], [26, "id54"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.NORTH"]], "rsaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id107"], [26, "id58"], [26, "id9"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSAction"]], "rsobservation (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id10"], [26, "id108"], [26, "id59"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservation"]], "rsobservationmodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id110"], [26, "id12"], [26, "id61"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel"]], "rspolicymodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id114"], [26, "id16"], [26, "id65"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel"]], "rsrewardmodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id120"], [26, "id22"], [26, "id71"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel"]], "rsstate (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id124"], [26, "id26"], [26, "id75"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState"]], "rstransitionmodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id128"], [26, "id30"], [26, "id79"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel"]], "rocksampleproblem (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id132"], [26, "id34"], [26, "id83"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem"]], "rocktype (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id137"], [26, "id39"], [26, "id88"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType"]], "south (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[26, "id104"], [26, "id55"], [26, "id6"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.SOUTH"]], "sampleaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id142"], [26, "id44"], [26, "id93"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.SampleAction"]], "west (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[26, "id105"], [26, "id56"], [26, "id7"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.WEST"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservationmodel method)": [[26, "id111"], [26, "id13"], [26, "id62"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[26, "id115"], [26, "id17"], [26, "id66"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsrewardmodel method)": [[26, "id121"], [26, "id23"], [26, "id72"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rstransitionmodel method)": [[26, "id129"], [26, "id31"], [26, "id80"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel.argmax"]], "euclidean_dist() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id143"], [26, "id45"], [26, "id94"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.euclidean_dist"]], "generate_instance() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem static method)": [[26, "id133"], [26, "id35"], [26, "id84"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.generate_instance"]], "get_all_actions() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[26, "id116"], [26, "id18"], [26, "id67"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.get_all_actions"]], "in_exit_area() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem method)": [[26, "id134"], [26, "id36"], [26, "id85"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.in_exit_area"]], "init_particles_belief() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id144"], [26, "id46"], [26, "id95"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.init_particles_belief"]], "invert() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype static method)": [[26, "id140"], [26, "id42"], [26, "id91"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.invert"]], "main() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id145"], [26, "id47"], [26, "id96"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.main"]], "motion (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[26, "id106"], [26, "id57"], [26, "id8"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.motion"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem": [[26, "module-0"], [26, "module-1"], [26, "module-2"], [26, "module-pomdp_py.problems.rocksample.cythonize.rocksample_problem"]], "position (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsstate attribute)": [[26, "id125"], [26, "id27"], [26, "id76"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.position"]], "print_state() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem method)": [[26, "id135"], [26, "id37"], [26, "id86"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.print_state"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservationmodel method)": [[26, "id112"], [26, "id14"], [26, "id63"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel.probability"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[26, "id117"], [26, "id19"], [26, "id68"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.probability"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsrewardmodel method)": [[26, "id122"], [26, "id24"], [26, "id73"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel.probability"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rstransitionmodel method)": [[26, "id130"], [26, "id32"], [26, "id81"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel.probability"]], "quality (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservation attribute)": [[26, "id109"], [26, "id11"], [26, "id60"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservation.quality"]], "random() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype static method)": [[26, "id141"], [26, "id43"], [26, "id92"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.random"]], "random_free_location() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem static method)": [[26, "id136"], [26, "id38"], [26, "id87"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.random_free_location"]], "rock_id (pomdp_py.problems.rocksample.cythonize.rocksample_problem.checkaction attribute)": [[26, "id100"], [26, "id2"], [26, "id51"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.CheckAction.rock_id"]], "rocktypes (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsstate attribute)": [[26, "id126"], [26, "id28"], [26, "id77"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.rocktypes"]], "rollout() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[26, "id118"], [26, "id20"], [26, "id69"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.rollout"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservationmodel method)": [[26, "id113"], [26, "id15"], [26, "id64"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel.sample"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[26, "id119"], [26, "id21"], [26, "id70"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.sample"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsrewardmodel method)": [[26, "id123"], [26, "id25"], [26, "id74"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel.sample"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rstransitionmodel method)": [[26, "id131"], [26, "id33"], [26, "id82"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel.sample"]], "terminal (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsstate attribute)": [[26, "id127"], [26, "id29"], [26, "id78"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.terminal"]], "test_planner() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[26, "id146"], [26, "id48"], [26, "id97"], [26, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.test_planner"]], "pomdp_py.problems.tag": [[27, "module-pomdp_py.problems.tag"]], "pomdp_py.problems.tag.constants": [[27, "module-pomdp_py.problems.tag.constants"]], "pomdp_py.problems.tag.example_worlds": [[27, "module-pomdp_py.problems.tag.example_worlds"]], "pomdp_py.problems.tag.env": [[30, "module-pomdp_py.problems.tag.env"]], "actions (pomdp_py.problems.tiger.tiger_problem.policymodel attribute)": [[33, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.ACTIONS"]], "observationmodel (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.ObservationModel"]], "policymodel (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.PolicyModel"]], "rewardmodel (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.RewardModel"]], "tigeraction (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.TigerAction"]], "tigerobservation (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.TigerObservation"]], "tigerproblem (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.TigerProblem"]], "tigerstate (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.TigerState"]], "transitionmodel (class in pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.TransitionModel"]], "create() (pomdp_py.problems.tiger.tiger_problem.tigerproblem static method)": [[33, "pomdp_py.problems.tiger.tiger_problem.TigerProblem.create"]], "get_all_actions() (pomdp_py.problems.tiger.tiger_problem.policymodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.get_all_actions"]], "get_all_observations() (pomdp_py.problems.tiger.tiger_problem.observationmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.ObservationModel.get_all_observations"]], "get_all_states() (pomdp_py.problems.tiger.tiger_problem.transitionmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.TransitionModel.get_all_states"]], "main() (in module pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.main"]], "make_tiger() (in module pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.make_tiger"]], "other() (pomdp_py.problems.tiger.tiger_problem.tigerstate method)": [[33, "pomdp_py.problems.tiger.tiger_problem.TigerState.other"]], "pomdp_py.problems.tiger": [[33, "module-pomdp_py.problems.tiger"]], "pomdp_py.problems.tiger.cythonize": [[33, "module-pomdp_py.problems.tiger.cythonize"], [34, "module-pomdp_py.problems.tiger.cythonize"]], "pomdp_py.problems.tiger.tiger_problem": [[33, "module-pomdp_py.problems.tiger.tiger_problem"]], "probability() (pomdp_py.problems.tiger.tiger_problem.observationmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.ObservationModel.probability"]], "probability() (pomdp_py.problems.tiger.tiger_problem.transitionmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.TransitionModel.probability"]], "rollout() (pomdp_py.problems.tiger.tiger_problem.policymodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.rollout"]], "sample() (pomdp_py.problems.tiger.tiger_problem.observationmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.ObservationModel.sample"]], "sample() (pomdp_py.problems.tiger.tiger_problem.policymodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.sample"]], "sample() (pomdp_py.problems.tiger.tiger_problem.rewardmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.RewardModel.sample"]], "sample() (pomdp_py.problems.tiger.tiger_problem.transitionmodel method)": [[33, "pomdp_py.problems.tiger.tiger_problem.TransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.tiger.tiger_problem)": [[33, "pomdp_py.problems.tiger.tiger_problem.test_planner"]], "actions (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerproblem attribute)": [[34, "id17"], [34, "id56"], [34, "id95"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.ACTIONS"]], "observations (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerproblem attribute)": [[34, "id18"], [34, "id57"], [34, "id96"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.OBSERVATIONS"]], "states (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerproblem attribute)": [[34, "id19"], [34, "id58"], [34, "id97"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.STATES"]], "tigeraction (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id0"], [34, "id41"], [34, "id80"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerAction"]], "tigerobservation (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id3"], [34, "id42"], [34, "id81"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation"]], "tigerobservationmodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id44"], [34, "id5"], [34, "id83"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel"]], "tigerpolicymodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id11"], [34, "id50"], [34, "id89"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel"]], "tigerproblem (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id16"], [34, "id55"], [34, "id94"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem"]], "tigerrewardmodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id20"], [34, "id59"], [34, "id98"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel"]], "tigerstate (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id103"], [34, "id25"], [34, "id64"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerState"]], "tigertransitionmodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id105"], [34, "id27"], [34, "id66"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[34, "id45"], [34, "id6"], [34, "id84"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.argmax"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[34, "id12"], [34, "id51"], [34, "id90"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.argmax"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[34, "id21"], [34, "id60"], [34, "id99"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.argmax"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[34, "id106"], [34, "id28"], [34, "id67"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.argmax"]], "build_actions() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id111"], [34, "id33"], [34, "id72"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_actions"]], "build_observations() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id112"], [34, "id34"], [34, "id73"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_observations"]], "build_setting() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id113"], [34, "id35"], [34, "id74"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_setting"]], "build_states() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id114"], [34, "id36"], [34, "id75"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_states"]], "get_all_actions() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[34, "id13"], [34, "id52"], [34, "id91"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.get_all_actions"]], "get_all_observations() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[34, "id46"], [34, "id7"], [34, "id85"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.get_all_observations"]], "get_all_states() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[34, "id107"], [34, "id29"], [34, "id68"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.get_all_states"]], "get_distribution() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[34, "id47"], [34, "id8"], [34, "id86"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.get_distribution"]], "get_distribution() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[34, "id100"], [34, "id22"], [34, "id61"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.get_distribution"]], "get_distribution() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[34, "id108"], [34, "id30"], [34, "id69"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.get_distribution"]], "main() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id115"], [34, "id37"], [34, "id76"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.main"]], "name (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservation attribute)": [[34, "id4"], [34, "id43"], [34, "id82"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation.name"]], "name (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerstate attribute)": [[34, "id104"], [34, "id26"], [34, "id65"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerState.name"]], "pomdp_py.problems.tiger.cythonize.tiger_problem": [[34, "module-0"], [34, "module-1"], [34, "module-2"], [34, "module-pomdp_py.problems.tiger.cythonize.tiger_problem"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[34, "id48"], [34, "id87"], [34, "id9"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.probability"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[34, "id14"], [34, "id53"], [34, "id92"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.probability"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[34, "id101"], [34, "id23"], [34, "id62"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.probability"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[34, "id109"], [34, "id31"], [34, "id70"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.probability"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[34, "id10"], [34, "id49"], [34, "id88"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.sample"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[34, "id15"], [34, "id54"], [34, "id93"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.sample"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[34, "id102"], [34, "id24"], [34, "id63"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.sample"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[34, "id110"], [34, "id32"], [34, "id71"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[34, "id116"], [34, "id38"], [34, "id77"], [34, "pomdp_py.problems.tiger.cythonize.tiger_problem.test_planner"]], "blue (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.BLUE"]], "bold (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.BOLD"]], "cyan (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.CYAN"]], "detobservationmodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.DetObservationModel"]], "detrewardmodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.DetRewardModel"]], "dettransitionmodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.DetTransitionModel"]], "endc (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.ENDC"]], "green (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.GREEN"]], "magenta (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.MAGENTA"]], "red (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.RED"]], "r_between() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.R_between"]], "r_x() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.R_x"]], "r_y() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.R_y"]], "r_z() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.R_z"]], "subscript (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.SUBSCRIPT"]], "simpleaction (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.SimpleAction"]], "simpleobservation (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.SimpleObservation"]], "simplestate (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.SimpleState"]], "t() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.T"]], "tabularobservationmodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.TabularObservationModel"]], "tabularrewardmodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.TabularRewardModel"]], "tabulartransitionmodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.TabularTransitionModel"]], "treedebugger (class in pomdp_py.utils.debugging)": [[38, "pomdp_py.utils.debugging.TreeDebugger"]], "uniformpolicymodel (class in pomdp_py.utils.templates)": [[38, "pomdp_py.utils.templates.UniformPolicyModel"]], "white (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.WHITE"]], "yellow (pomdp_py.utils.typ.bcolors attribute)": [[38, "pomdp_py.utils.typ.bcolors.YELLOW"]], "approx_equal() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.approx_equal"]], "argmax() (pomdp_py.utils.templates.detrewardmodel method)": [[38, "pomdp_py.utils.templates.DetRewardModel.argmax"]], "b (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.b"]], "back() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.back"]], "bcolors (class in pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.bcolors"]], "bestseq (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.bestseq"]], "bestseqd() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.bestseqd"]], "blue() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.blue"]], "bold() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.bold"]], "bottomleft (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.bottomleft"]], "bottomright (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.bottomright"]], "bottomt (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.bottomt"]], "c (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.c"]], "clear (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.clear"]], "cyan() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.cyan"]], "d (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.d"]], "depth (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.depth"]], "det_dict_hash() (in module pomdp_py.utils.cython_utils)": [[38, "pomdp_py.utils.cython_utils.det_dict_hash"]], "disable() (pomdp_py.utils.typ.bcolors static method)": [[38, "pomdp_py.utils.typ.bcolors.disable"]], "down (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.down"]], "error() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.error"]], "euclidean_dist() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.euclidean_dist"]], "get_all_actions() (pomdp_py.utils.templates.uniformpolicymodel method)": [[38, "pomdp_py.utils.templates.UniformPolicyModel.get_all_actions"]], "get_all_observations() (pomdp_py.utils.templates.tabularobservationmodel method)": [[38, "pomdp_py.utils.templates.TabularObservationModel.get_all_observations"]], "get_all_states() (pomdp_py.utils.templates.tabulartransitionmodel method)": [[38, "pomdp_py.utils.templates.TabularTransitionModel.get_all_states"]], "green() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.green"]], "hex_to_rgb() (in module pomdp_py.utils.colors)": [[38, "pomdp_py.utils.colors.hex_to_rgb"]], "hline (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.hline"]], "info() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.info"]], "interpret_color() (in module pomdp_py.utils.debugging)": [[38, "pomdp_py.utils.debugging.interpret_color"]], "intersect (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.intersect"]], "inverse_color_hex() (in module pomdp_py.utils.colors)": [[38, "pomdp_py.utils.colors.inverse_color_hex"]], "inverse_color_rgb() (in module pomdp_py.utils.colors)": [[38, "pomdp_py.utils.colors.inverse_color_rgb"]], "json_safe() (in module pomdp_py.utils.misc)": [[38, "pomdp_py.utils.misc.json_safe"]], "l() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.l"]], "layer() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.layer"]], "leaf (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.leaf"]], "left (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.left"]], "leftt (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.leftt"]], "lighter() (in module pomdp_py.utils.colors)": [[38, "pomdp_py.utils.colors.lighter"]], "longbottomleft (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.longbottomleft"]], "longbottomright (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.longbottomright"]], "longleft (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.longleft"]], "longright (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.longright"]], "longtopleft (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.longtopleft"]], "longtopright (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.longtopright"]], "magenta() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.magenta"]], "mark() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.mark"]], "mark_path() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.mark_path"]], "mark_sequence() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.mark_sequence"]], "markp() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.markp"]], "mbp (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.mbp"]], "nl (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.nl"]], "nn (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.nn"]], "note() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.note"]], "nq (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.nq"]], "num_layers (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.num_layers"]], "num_nodes() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.num_nodes"]], "nv (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.nv"]], "p() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.p"]], "path() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.path"]], "path_to() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.path_to"]], "pm (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.pm"]], "pomdp_py.utils": [[38, "module-pomdp_py.utils"]], "pomdp_py.utils.colors": [[38, "module-pomdp_py.utils.colors"]], "pomdp_py.utils.cython_utils": [[38, "module-pomdp_py.utils.cython_utils"]], "pomdp_py.utils.debugging": [[38, "module-pomdp_py.utils.debugging"]], "pomdp_py.utils.math": [[38, "module-pomdp_py.utils.math"]], "pomdp_py.utils.misc": [[38, "module-pomdp_py.utils.misc"]], "pomdp_py.utils.templates": [[38, "module-pomdp_py.utils.templates"]], "pomdp_py.utils.typ": [[38, "module-pomdp_py.utils.typ"]], "pp (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.pp"]], "preferred_actions() (pomdp_py.utils.debugging.treedebugger static method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.preferred_actions"]], "probability() (pomdp_py.utils.templates.detobservationmodel method)": [[38, "pomdp_py.utils.templates.DetObservationModel.probability"]], "probability() (pomdp_py.utils.templates.dettransitionmodel method)": [[38, "pomdp_py.utils.templates.DetTransitionModel.probability"]], "probability() (pomdp_py.utils.templates.tabularobservationmodel method)": [[38, "pomdp_py.utils.templates.TabularObservationModel.probability"]], "probability() (pomdp_py.utils.templates.tabulartransitionmodel method)": [[38, "pomdp_py.utils.templates.TabularTransitionModel.probability"]], "proj() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.proj"]], "r (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.r"]], "random_unique_color() (in module pomdp_py.utils.colors)": [[38, "pomdp_py.utils.colors.random_unique_color"]], "red() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.red"]], "remap() (in module pomdp_py.utils.misc)": [[38, "pomdp_py.utils.misc.remap"]], "reward_func() (pomdp_py.utils.templates.detrewardmodel method)": [[38, "pomdp_py.utils.templates.DetRewardModel.reward_func"]], "rgb_to_hex() (in module pomdp_py.utils.colors)": [[38, "pomdp_py.utils.colors.rgb_to_hex"]], "right (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.right"]], "rightt (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.rightt"]], "rollout() (pomdp_py.utils.templates.uniformpolicymodel method)": [[38, "pomdp_py.utils.templates.UniformPolicyModel.rollout"]], "root (pomdp_py.utils.debugging.treedebugger property)": [[38, "pomdp_py.utils.debugging.TreeDebugger.root"]], "s() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.s"]], "s() (pomdp_py.utils.typ.bcolors static method)": [[38, "pomdp_py.utils.typ.bcolors.s"]], "safe_slice() (in module pomdp_py.utils.misc)": [[38, "pomdp_py.utils.misc.safe_slice"]], "sample() (pomdp_py.utils.templates.detobservationmodel method)": [[38, "pomdp_py.utils.templates.DetObservationModel.sample"]], "sample() (pomdp_py.utils.templates.detrewardmodel method)": [[38, "pomdp_py.utils.templates.DetRewardModel.sample"]], "sample() (pomdp_py.utils.templates.dettransitionmodel method)": [[38, "pomdp_py.utils.templates.DetTransitionModel.sample"]], "sample() (pomdp_py.utils.templates.tabularobservationmodel method)": [[38, "pomdp_py.utils.templates.TabularObservationModel.sample"]], "sample() (pomdp_py.utils.templates.tabularrewardmodel method)": [[38, "pomdp_py.utils.templates.TabularRewardModel.sample"]], "sample() (pomdp_py.utils.templates.tabulartransitionmodel method)": [[38, "pomdp_py.utils.templates.TabularTransitionModel.sample"]], "sample() (pomdp_py.utils.templates.uniformpolicymodel method)": [[38, "pomdp_py.utils.templates.UniformPolicyModel.sample"]], "shadebar (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.shadebar"]], "similar() (in module pomdp_py.utils.misc)": [[38, "pomdp_py.utils.misc.similar"]], "single_node_str() (pomdp_py.utils.debugging.treedebugger static method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.single_node_str"]], "sorted_by_str() (in module pomdp_py.utils.debugging)": [[38, "pomdp_py.utils.debugging.sorted_by_str"]], "special_char (class in pomdp_py.utils.misc)": [[38, "pomdp_py.utils.misc.special_char"]], "step() (pomdp_py.utils.debugging.treedebugger method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.step"]], "success() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.success"]], "to_radians() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.to_radians"]], "topleft (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.topleft"]], "topright (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.topright"]], "topt (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.topt"]], "tree_stats() (pomdp_py.utils.debugging.treedebugger static method)": [[38, "pomdp_py.utils.debugging.TreeDebugger.tree_stats"]], "up (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.up"]], "vec() (in module pomdp_py.utils.math)": [[38, "pomdp_py.utils.math.vec"]], "vline (pomdp_py.utils.misc.special_char attribute)": [[38, "pomdp_py.utils.misc.special_char.vline"]], "warning() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.warning"]], "white() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.white"]], "yellow() (in module pomdp_py.utils.typ)": [[38, "pomdp_py.utils.typ.yellow"]]}})
\ No newline at end of file
+Search.setIndex({"docnames": ["api/modules", "api/pomdp_py", "api/pomdp_py.algorithms", "api/pomdp_py.algorithms.bsp", "api/pomdp_py.algorithms.visual", "api/pomdp_py.framework", "api/pomdp_py.problems", "api/pomdp_py.problems.light_dark", "api/pomdp_py.problems.light_dark.agent", "api/pomdp_py.problems.light_dark.domain", "api/pomdp_py.problems.light_dark.env", "api/pomdp_py.problems.light_dark.models", "api/pomdp_py.problems.load_unload", "api/pomdp_py.problems.maze", "api/pomdp_py.problems.maze.domain", "api/pomdp_py.problems.maze.env", "api/pomdp_py.problems.maze.models", "api/pomdp_py.problems.maze.models.components", "api/pomdp_py.problems.multi_object_search", "api/pomdp_py.problems.multi_object_search.agent", "api/pomdp_py.problems.multi_object_search.domain", "api/pomdp_py.problems.multi_object_search.env", "api/pomdp_py.problems.multi_object_search.models", "api/pomdp_py.problems.multi_object_search.models.components", "api/pomdp_py.problems.rocksample", "api/pomdp_py.problems.rocksample.cythonize", "api/pomdp_py.problems.tag", "api/pomdp_py.problems.tag.agent", "api/pomdp_py.problems.tag.domain", "api/pomdp_py.problems.tag.env", "api/pomdp_py.problems.tag.models", "api/pomdp_py.problems.tag.models.components", "api/pomdp_py.problems.tiger", "api/pomdp_py.problems.tiger.cythonize", "api/pomdp_py.representations", "api/pomdp_py.representations.belief", "api/pomdp_py.representations.distribution", "api/pomdp_py.utils", "api/pomdp_py.utils.debugging", "api/pomdp_py.utils.interfaces", "api/pomdp_py.visual", "building_docs", "changelog", "design_principles", "examples", "examples.action_prior", "examples.external_solvers", "examples.mos", "examples.tiger", "existing_domains", "existing_solvers", "extensions", "index", "installation", "modules", "other_libraries"], "filenames": ["api/modules.rst", "api/pomdp_py.rst", "api/pomdp_py.algorithms.rst", "api/pomdp_py.algorithms.bsp.rst", "api/pomdp_py.algorithms.visual.rst", "api/pomdp_py.framework.rst", "api/pomdp_py.problems.rst", "api/pomdp_py.problems.light_dark.rst", "api/pomdp_py.problems.light_dark.agent.rst", "api/pomdp_py.problems.light_dark.domain.rst", "api/pomdp_py.problems.light_dark.env.rst", "api/pomdp_py.problems.light_dark.models.rst", "api/pomdp_py.problems.load_unload.rst", "api/pomdp_py.problems.maze.rst", "api/pomdp_py.problems.maze.domain.rst", "api/pomdp_py.problems.maze.env.rst", "api/pomdp_py.problems.maze.models.rst", "api/pomdp_py.problems.maze.models.components.rst", "api/pomdp_py.problems.multi_object_search.rst", "api/pomdp_py.problems.multi_object_search.agent.rst", "api/pomdp_py.problems.multi_object_search.domain.rst", "api/pomdp_py.problems.multi_object_search.env.rst", "api/pomdp_py.problems.multi_object_search.models.rst", "api/pomdp_py.problems.multi_object_search.models.components.rst", "api/pomdp_py.problems.rocksample.rst", "api/pomdp_py.problems.rocksample.cythonize.rst", "api/pomdp_py.problems.tag.rst", "api/pomdp_py.problems.tag.agent.rst", "api/pomdp_py.problems.tag.domain.rst", "api/pomdp_py.problems.tag.env.rst", "api/pomdp_py.problems.tag.models.rst", "api/pomdp_py.problems.tag.models.components.rst", "api/pomdp_py.problems.tiger.rst", "api/pomdp_py.problems.tiger.cythonize.rst", "api/pomdp_py.representations.rst", "api/pomdp_py.representations.belief.rst", "api/pomdp_py.representations.distribution.rst", "api/pomdp_py.utils.rst", "api/pomdp_py.utils.debugging.rst", "api/pomdp_py.utils.interfaces.rst", "api/pomdp_py.visual.rst", "building_docs.rst", "changelog.rst", "design_principles.rst", "examples.rst", "examples.action_prior.rst", "examples.external_solvers.rst", "examples.mos.rst", "examples.tiger.rst", "existing_domains.rst", "existing_solvers.rst", "extensions.rst", "index.rst", "installation.rst", "modules.rst", "other_libraries.rst"], "titles": ["pomdp_py", "pomdp_py package", "pomdp_py.algorithms package", "pomdp_py.algorithms.bsp package", "pomdp_py.algorithms.visual package", "pomdp_py.framework package", "pomdp_py.problems package", "pomdp_py.problems.light_dark package", "pomdp_py.problems.light_dark.agent package", "pomdp_py.problems.light_dark.domain package", "pomdp_py.problems.light_dark.env package", "pomdp_py.problems.light_dark.models package", "pomdp_py.problems.load_unload package", "pomdp_py.problems.maze package", "pomdp_py.problems.maze.domain package", "pomdp_py.problems.maze.env package", "pomdp_py.problems.maze.models package", "pomdp_py.problems.maze.models.components package", "pomdp_py.problems.multi_object_search package", "pomdp_py.problems.multi_object_search.agent package", "pomdp_py.problems.multi_object_search.domain package", "pomdp_py.problems.multi_object_search.env package", "pomdp_py.problems.multi_object_search.models package", "pomdp_py.problems.multi_object_search.models.components package", "pomdp_py.problems.rocksample package", "pomdp_py.problems.rocksample.cythonize package", "pomdp_py.problems.tag package", "pomdp_py.problems.tag.agent package", "pomdp_py.problems.tag.domain package", "pomdp_py.problems.tag.env package", "pomdp_py.problems.tag.models package", "pomdp_py.problems.tag.models.components package", "pomdp_py.problems.tiger package", "pomdp_py.problems.tiger.cythonize package", "pomdp_py.representations package", "pomdp_py.representations.belief package", "pomdp_py.representations.distribution package", "pomdp_py.utils package", "pomdp_py.utils.debugging module", "pomdp_py.utils.interfaces package", "pomdp_py.visual package", "Building Documentations", "Changelog", "Design Principles", "Examples", "Preference-based Action Prior", "Using External Solvers", "Multi-Object Search (MOS)", "Tiger", "Existing POMDP Domains", "Existing POMDP Solvers", "Use Case Extensions", "pomdp_py Documentation", "Installation", "docs", "Other POMDP Libraries"], "terms": {"packag": [0, 41, 47, 52, 53], "algorithm": [0, 1, 5, 7, 42, 46, 51, 52, 55], "po_rollout": [0, 1], "modul": [0, 1, 34, 41, 42, 47, 48, 52], "porollout": [0, 1, 2], "po_uct": [0, 1], "actionprior": [0, 1, 2, 42, 45, 48], "pouct": [0, 1, 2, 18, 26, 37, 38, 42, 45, 47, 48, 50, 51], "qnode": [0, 1, 2, 37, 38], "randomrollout": [0, 1, 2, 12, 33], "rolloutpolici": [0, 1, 2, 22, 24, 25, 30, 32, 37, 45, 48], "rootvnod": [0, 1, 2], "treenod": [0, 1, 2], "vnode": [0, 1, 2, 37, 38, 42], "pomcp": [0, 1, 18, 35, 37, 38, 42, 45, 48, 50, 51, 53, 55], "rootvnodeparticl": [0, 1, 2], "vnodeparticl": [0, 1, 2], "value_iter": [0, 1], "valueiter": [0, 1, 2, 42, 48, 50], "bsp": [0, 1], "blqr": [0, 1, 7, 42], "visual": [0, 1, 6, 7, 18, 26, 47], "framework": [0, 1, 12, 33, 42, 43, 47, 48, 52], "basic": [0, 1, 2, 24, 25, 35, 43, 46, 48, 50], "action": [0, 1, 2, 5, 6, 7, 12, 13, 18, 21, 22, 23, 24, 25, 26, 29, 30, 31, 32, 33, 35, 37, 38, 42, 43, 46, 47, 48, 50, 53], "agent": [0, 1, 2, 5, 6, 7, 12, 13, 14, 18, 22, 23, 24, 25, 26, 28, 32, 33, 35, 37, 38, 42, 43, 47, 48, 49, 50, 51, 52, 53], "blackboxmodel": [0, 1, 5, 35, 42, 48], "distribut": [0, 1, 2, 5, 12, 19, 22, 24, 25, 30, 32, 33, 34, 35, 37, 43, 45, 48], "environ": [0, 1, 5, 10, 15, 18, 21, 22, 29, 32, 33, 42, 43, 47, 48], "generativedistribut": [0, 1, 5, 19, 31, 36], "observ": [0, 1, 2, 3, 5, 6, 7, 10, 12, 13, 18, 21, 22, 23, 24, 25, 26, 29, 30, 32, 33, 35, 37, 38, 42, 43, 46, 47, 48, 50, 52, 53], "observationmodel": [0, 1, 5, 6, 12, 22, 24, 25, 30, 32, 33, 35, 37, 43, 48, 51], "option": [0, 1, 2, 5, 20, 22, 23, 24, 25, 32, 33, 37, 38, 42, 46, 48, 53], "pomdp": [0, 1, 2, 5, 7, 12, 13, 18, 20, 22, 24, 25, 26, 28, 29, 30, 32, 33, 37, 38, 41, 42, 43, 44, 45, 51, 52], "policymodel": [0, 1, 2, 5, 6, 18, 22, 32, 42, 45, 48, 51], "rewardmodel": [0, 1, 5, 6, 12, 22, 24, 25, 30, 32, 33, 37, 42, 43, 48], "state": [0, 1, 2, 3, 5, 6, 7, 12, 13, 18, 19, 21, 22, 24, 25, 26, 30, 32, 33, 35, 36, 37, 42, 43, 45, 46, 47, 48, 50, 53, 55], "transitionmodel": [0, 1, 5, 6, 12, 22, 24, 25, 30, 32, 33, 35, 37, 43, 48, 51], "sample_explict_model": [0, 1, 5], "sample_generative_model": [0, 1, 5], "oopomdp": [0, 1, 18, 42, 47, 51], "oobelief": [0, 1, 5, 19, 21, 29, 42], "ooobserv": [0, 1, 5, 20], "ooobservationmodel": [0, 1, 5, 22], "oostat": [0, 1, 5, 20, 42], "ootransitionmodel": [0, 1, 5, 22], "objectst": [0, 1, 5, 18, 20], "planner": [0, 1, 2, 3, 12, 18, 24, 25, 32, 33, 46, 48], "represent": [0, 1, 2, 5, 19, 21, 42, 52], "belief": [0, 1, 2, 3, 5, 6, 7, 10, 12, 18, 21, 24, 25, 27, 29, 32, 34, 36, 42, 46, 47, 48, 53], "histogram": [0, 1, 18, 19, 33, 34, 42, 46, 48], "particl": [0, 1, 2, 19, 34, 42, 53], "gaussian": [0, 1, 2, 3, 34], "util": [0, 1, 42, 46, 52], "subpackag": [0, 1, 52], "interfac": [0, 1, 5, 37, 42, 43, 46, 47, 48, 49, 50, 51, 52, 55], "submodul": [0, 1, 6, 13, 16], "color": [0, 1, 10, 21, 29, 38], "lighter": [0, 1, 37], "rgb_to_hex": [0, 1, 37], "hex_to_rgb": [0, 1, 37], "inverse_color_rgb": [0, 1, 37], "inverse_color_hex": [0, 1, 37], "random_unique_color": [0, 1, 37], "cython_util": [0, 1], "cpython": [0, 1], "37m": [0, 1], "x86_64": [0, 1], "linux": [0, 1, 53], "gnu": [0, 1], "det_dict_hash": [0, 1, 37, 42], "debug": [0, 1, 42, 52], "treedebugg": [0, 1, 32, 42], "sorted_by_str": [0, 1, 37, 38], "interpret_color": [0, 1, 37, 38], "math": [0, 1, 2, 5, 42], "vec": [0, 1, 37], "proj": [0, 1, 37], "r_x": [0, 1, 37], "r_y": [0, 1, 37], "r_z": [0, 1, 37], "t": [0, 1, 2, 3, 5, 18, 19, 21, 32, 33, 35, 36, 37, 43, 46, 48, 50, 55], "to_radian": [0, 1, 37], "r_between": [0, 1, 37], "approx_equ": [0, 1, 37], "euclidean_dist": [0, 1, 6, 22, 23, 24, 25, 37], "misc": [0, 1], "remap": [0, 1, 37], "json_saf": [0, 1, 37], "safe_slic": [0, 1, 37], "similar": [0, 1, 37, 46, 48], "special_char": [0, 1, 37], "plot": [0, 1, 6, 7, 53], "templat": [0, 1, 42], "simplest": [0, 1, 37], "simpleact": [0, 1, 37], "simpleobserv": [0, 1, 37], "dettransitionmodel": [0, 1, 37], "detobservationmodel": [0, 1, 37], "detrewardmodel": [0, 1, 37], "uniformpolicymodel": [0, 1, 37], "tabulartransitionmodel": [0, 1, 37, 42], "tabularobservationmodel": [0, 1, 37, 42], "tabularrewardmodel": [0, 1, 37, 42], "test_util": [0, 1], "typ": [0, 1], "bcolor": [0, 1, 37], "info": [0, 1, 37], "note": [0, 1, 2, 5, 7, 18, 22, 32, 33, 35, 36, 37, 38, 45, 46, 48, 52, 53], "error": [0, 1, 37, 42], "warn": [0, 1, 2, 37, 38, 46], "success": [0, 1, 2, 37], "bold": [0, 1, 37], "cyan": [0, 1, 37], "magenta": [0, 1, 37], "blue": [0, 1, 10, 37, 38], "green": [0, 1, 37, 53], "yellow": [0, 1, 37], "red": [0, 1, 37, 47], "white": [0, 1, 10, 37], "content": [0, 1, 41, 52], "clear_ag": [1, 2], "last_best_reward": [1, 2], "plan": [1, 2, 3, 5, 7, 10, 18, 22, 23, 32, 37, 38, 42, 45, 46, 48, 51, 52, 55], "set_rollout_polici": [1, 2], "updat": [1, 2, 3, 5, 18, 21, 26, 29, 35, 37, 38, 42, 46, 47, 48], "update_agent_belief": [1, 2, 5], "get_preferred_act": [1, 2, 45], "last_num_sim": [1, 2, 48], "last_planning_tim": [1, 2], "updates_agent_belief": [1, 2, 5], "rollout": [1, 2, 6, 18, 22, 24, 25, 26, 30, 32, 37, 42, 45, 48], "from_vnod": [1, 2], "histori": [1, 2, 5, 19, 22, 24, 25, 27, 30, 32, 37, 38, 45, 48], "children": [1, 2, 37, 38, 42], "num_visit": [1, 2], "valu": [1, 2, 5, 24, 25, 31, 32, 34, 36, 37, 38, 42, 45, 46, 48, 53, 55], "argmax": [1, 2, 5, 6, 12, 18, 22, 24, 25, 26, 30, 32, 33, 37, 42, 48], "print_children_valu": [1, 2], "ekf_update_mlo": [1, 2, 3], "integrate_belief_seg": [1, 2, 3], "segmented_cost_funct": [1, 2, 3], "create_plan": [1, 2, 3], "interpret_sqp_plan": [1, 2, 3], "add_attr": [1, 5], "all_act": [1, 5], "all_observ": [1, 5], "all_stat": [1, 5], "init_belief": [1, 5, 12, 24, 27, 32, 33, 48], "sample_belief": [1, 5], "set_belief": [1, 5, 46, 48], "update_histori": [1, 5, 48], "sampl": [1, 2, 5, 6, 12, 18, 19, 22, 24, 25, 26, 30, 32, 33, 36, 37, 42, 45, 46, 48, 53], "__getitem__": [1, 5, 34, 36, 37, 38], "__setitem__": [1, 5, 34, 36], "apply_transit": [1, 5], "blackbox_model": [1, 5, 35], "cur_stat": [1, 5], "provide_observ": [1, 5], "reward_model": [1, 5, 6, 10, 18, 26, 47, 48], "state_transit": [1, 5, 18, 21, 46, 48], "transition_model": [1, 5, 6, 7, 18, 26, 35, 46, 47, 48], "get_histogram": [1, 5, 34, 36], "mpe": [1, 5, 18, 19, 30, 31, 34, 36, 42], "get_all_observ": [1, 5, 6, 32, 33, 37, 48], "get_distribut": [1, 5, 32, 33], "probabl": [1, 5, 6, 12, 13, 18, 19, 22, 24, 25, 26, 30, 31, 32, 33, 36, 37, 42, 43, 46, 48, 50], "initi": [1, 5, 7, 19, 21, 24, 25, 27, 32, 42, 45, 46, 47, 48], "polici": [1, 2, 5, 12, 13, 22, 24, 25, 30, 32, 33, 37, 42, 45, 46, 48], "termin": [1, 2, 5, 18, 24, 25, 37, 38, 46, 48], "get_all_act": [1, 5, 6, 12, 18, 22, 24, 25, 26, 30, 32, 33, 37, 45, 48], "get_all_st": [1, 5, 6, 32, 33, 37, 48], "b": [1, 2, 3, 5, 35, 37, 38, 46], "object_belief": [1, 5, 19], "random": [1, 2, 5, 6, 18, 19, 22, 24, 25, 30, 31, 34, 36, 37, 42, 45, 48], "set_object_belief": [1, 5], "factor": [1, 5, 18, 20, 46], "merg": [1, 5, 18, 20], "observation_model": [1, 5, 6, 7, 18, 26, 29, 35, 46, 47, 48], "copi": [1, 5, 53], "get_object_attribut": [1, 5], "get_object_class": [1, 5], "get_object_st": [1, 5], "": [1, 2, 3, 5, 7, 12, 13, 18, 20, 21, 22, 23, 24, 25, 28, 30, 32, 33, 35, 37, 38, 41, 42, 43, 46, 48, 50, 52], "set_object_st": [1, 5], "situat": [1, 5, 47], "abstraction_over_histogram": [1, 34, 35], "update_histogram_belief": [1, 34, 35, 46, 48], "abstraction_over_particl": [1, 34, 35], "particle_reinvigor": [1, 34, 35], "update_particles_belief": [1, 34, 35], "is_norm": [1, 34, 36], "add": [1, 2, 19, 34, 36, 42], "from_histogram": [1, 34, 36], "get_abstract": [1, 34, 36], "weightedparticl": [1, 34, 36, 42], "condens": [1, 34, 36], "weight": [1, 2, 34, 36, 37], "cov": [1, 34, 36], "covari": [1, 2, 3, 34, 36], "mean": [1, 2, 21, 23, 26, 34, 35, 36, 46], "sigma": [1, 18, 19, 22, 34, 36], "simple_rl": [1, 37, 55], "num_nod": [1, 37, 38], "depth": [1, 2, 37, 38], "d": [1, 2, 3, 37, 38, 48, 52], "num_lay": [1, 37, 38], "nl": [1, 37, 38], "nn": [1, 37, 38], "nq": [1, 37, 38], "nv": [1, 10, 37, 38], "l": [1, 2, 3, 12, 37, 38, 47, 48, 52], "layer": [1, 37, 38], "leaf": [1, 37, 38], "step": [1, 2, 18, 32, 33, 37, 38, 41, 42, 46, 48, 53], "back": [1, 37, 38], "root": [1, 37, 38, 41, 53], "r": [1, 2, 3, 5, 12, 18, 21, 22, 24, 25, 29, 30, 32, 33, 37, 38, 42, 43, 46, 48, 50, 52, 53], "c": [1, 2, 10, 37, 38, 55], "p": [1, 24, 25, 37, 38, 52], "pp": [1, 37, 38], "mbp": [1, 37, 38], "pm": [1, 37, 38], "mark_sequ": [1, 37, 38], "mark": [1, 7, 13, 20, 37, 38, 47], "mark_path": [1, 37, 38], "markp": [1, 37, 38], "clear": [1, 2, 19, 27, 37, 38, 47], "bestseq": [1, 37, 38], "bestseqd": [1, 37, 38], "single_node_str": [1, 37, 38], "preferred_act": [1, 37, 38], "path": [1, 37, 38, 41, 46], "path_to": [1, 37, 38], "tree_stat": [1, 37, 38], "left": [1, 12, 18, 20, 32, 33, 37, 38, 46, 48, 53], "up": [1, 5, 12, 37, 38], "right": [1, 10, 12, 18, 19, 20, 32, 33, 37, 38, 46, 48, 53], "down": [1, 37, 48], "longleft": [1, 37], "longright": [1, 37], "hline": [1, 37], "vline": [1, 37], "bottomleft": [1, 37], "longbottomleft": [1, 37], "topleft": [1, 37], "longtopleft": [1, 37], "topright": [1, 37], "longtopright": [1, 37], "bottomright": [1, 37], "longbottomright": [1, 37], "intersect": [1, 37], "topt": [1, 37], "leftt": [1, 37], "rightt": [1, 37], "bottomt": [1, 37], "shadebar": [1, 37], "subscript": [1, 37], "reward_func": [1, 37], "endc": [1, 37], "disabl": [1, 37], "exist": [2, 37, 38, 44, 46, 48, 51, 52], "solver": [2, 32, 42, 44, 47, 48, 52], "under": [2, 23, 41, 46, 48, 55], "develop": [2, 5, 42, 46, 50, 52, 53, 55], "contribut": [2, 49, 52, 53], "want": [2, 19, 41, 47], "po": [2, 24, 25, 52], "baselin": 2, "paper": [2, 3, 7, 12, 13, 18, 20, 22, 28, 30, 45, 47, 48, 52], "2": [2, 10, 12, 20, 24, 25, 26, 27, 29, 30, 31, 37, 38, 45, 46, 48, 52, 53, 55], "quot": [2, 7, 12, 13, 32, 33, 48], "from": [2, 5, 7, 12, 13, 19, 20, 21, 22, 23, 27, 30, 32, 33, 36, 37, 38, 41, 42, 45, 46, 47, 48, 53], "To": [2, 12, 33, 37, 38, 41, 45, 47, 48], "provid": [2, 42, 46, 47, 48, 51, 52, 55], "perform": [2, 3, 5, 46, 48, 55], "benchmark": 2, "case": [2, 18, 21, 22, 32, 33, 35, 46, 48, 49, 52, 55], "we": [2, 7, 18, 19, 22, 23, 41, 44, 46, 47, 48, 49, 52, 53, 55], "evalu": [2, 36], "simpl": [2, 7, 20, 22, 23, 24, 25, 26, 32, 44, 47, 48, 52], "mont": [2, 48], "carlo": [2, 48], "simul": [2, 5, 18, 21, 32, 42, 46, 48], "without": [2, 37, 42, 46, 47, 48], "ani": [2, 13, 21, 22, 36, 46], "tree": [2, 37, 38, 42, 47, 48], "The": [2, 3, 5, 7, 12, 13, 14, 18, 20, 21, 22, 23, 24, 25, 28, 30, 32, 33, 36, 37, 38, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 55], "us": [2, 3, 5, 7, 18, 19, 20, 21, 22, 23, 32, 35, 36, 37, 38, 41, 42, 43, 44, 45, 47, 48, 49, 50, 52, 53, 55], "describ": [2, 3, 5, 18, 21, 41, 43, 44, 45, 47, 48, 52], "section": [2, 47, 48], "3": [2, 12, 20, 21, 24, 25, 32, 33, 37, 38, 46, 48, 53, 55], "It": [2, 3, 5, 20, 22, 36, 37, 38, 42, 45, 46, 47, 48, 52, 55], "n": [2, 18, 20, 24, 25, 35, 36, 37, 38, 46, 47], "A": [2, 3, 5, 7, 12, 13, 18, 19, 21, 27, 32, 33, 37, 38, 42, 43, 46, 47, 48, 50, 52, 55], "each": [2, 3, 5, 12, 13, 21, 22, 36, 37, 38, 46], "legal": 2, "select": 2, "highest": [2, 5, 31, 36, 37, 38], "averag": [2, 36], "return": [2, 3, 5, 12, 19, 21, 22, 23, 24, 25, 30, 31, 32, 33, 35, 36, 37, 38, 42, 45, 46, 48], "don": [2, 5, 18, 35, 48], "requir": [2, 5, 12, 22, 24, 25, 30, 32, 33, 35, 37, 42, 43, 53], "an": [2, 3, 5, 7, 10, 12, 13, 18, 19, 20, 21, 22, 23, 24, 25, 29, 32, 33, 36, 37, 42, 43, 45, 46, 47, 48, 50, 52, 55], "But": [2, 5, 18, 20, 22, 32, 33, 35, 41, 42, 48], "do": [2, 5, 7, 41, 47, 48], "class": [2, 3, 5, 10, 12, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 36, 37, 38, 42, 43, 45, 46, 47, 48, 51], "base": [2, 3, 5, 10, 12, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 41, 46, 47, 48, 51, 52, 55], "self": [2, 5, 12, 19, 21, 22, 24, 25, 30, 31, 32, 33, 36, 37, 38, 45, 47, 48], "carri": [2, 5], "inform": [2, 3, 5, 23, 27, 41, 43, 48], "bt": [2, 3, 5], "ht": [2, 5], "o": [2, 5, 12, 24, 25, 30, 32, 33, 35, 37, 41, 43, 46, 48, 50, 52], "g": [2, 3, 5, 13, 18, 21, 32, 42, 48, 49], "pi": [2, 5, 12, 22, 24, 25, 33, 43, 48], "necessari": [2, 5, 18, 47], "rollout_polici": [1, 2, 37, 38, 48], "given": [2, 5, 12, 18, 21, 22, 33, 35, 36, 37, 38, 43, 45, 46, 48], "one": [2, 5, 12, 19, 21, 32, 33, 37, 38, 44, 48, 52, 55], "real_act": [2, 5, 18, 27, 35], "real_observ": [2, 5, 18, 27, 35, 48], "real": [2, 5, 18, 21, 29, 35, 46, 48], "accordingli": [2, 5], "If": [2, 3, 5, 19, 21, 22, 27, 32, 33, 35, 36, 37, 38, 46, 48, 52], "i": [2, 3, 5, 7, 10, 12, 13, 14, 18, 19, 20, 21, 22, 23, 24, 25, 29, 30, 32, 33, 35, 36, 37, 38, 41, 42, 43, 45, 46, 47, 48, 49, 52, 53, 55], "also": [2, 5, 22, 32, 33, 37, 38, 47, 48, 50, 52, 55], "here": [2, 5, 7, 37, 38, 41, 45, 46, 48, 49, 53], "attribut": [2, 5, 20], "should": [2, 3, 5, 20, 22, 35, 41, 42, 43, 46, 47, 48, 51, 53], "set": [2, 5, 12, 19, 20, 21, 23, 24, 25, 30, 32, 33, 35, 36, 37, 42, 45, 46, 47, 48, 55], "true": [2, 5, 10, 13, 18, 21, 22, 23, 26, 32, 35, 36, 37, 38, 42, 46, 48, 53], "By": [2, 5, 23, 46], "default": [2, 5, 32, 35, 42, 46], "doe": [2, 5, 13, 23, 30, 36, 37, 38, 42, 43, 46, 48, 55], "noth": [2, 5], "function": [2, 3, 5, 7, 18, 19, 21, 27, 32, 35, 36, 37, 38, 42, 45, 46, 48, 50], "thi": [2, 3, 5, 7, 12, 18, 19, 20, 21, 22, 23, 24, 25, 29, 30, 32, 33, 35, 36, 37, 38, 41, 42, 43, 44, 45, 46, 48, 52, 53, 55], "uct": 2, "partial": [2, 12, 13, 32, 33, 48, 52], "present": [2, 7, 36], "extens": [2, 20, 22, 42, 48, 49, 52, 55], "combin": [2, 37], "mct": 2, "ucb1": [2, 42], "In": [2, 7, 18, 30, 32, 33, 44, 45, 46, 47, 48, 49], "other": [2, 6, 24, 25, 32, 33, 48, 52], "word": 2, "just": [2, 14, 19, 32, 33, 36, 37, 46, 48, 53], "arbitrari": 2, "strategi": 2, "mai": [2, 5, 7, 18, 24, 35, 41, 43, 44, 47, 52, 53], "refer": [2, 3, 7, 18, 24, 32, 33, 41, 42, 45], "spars": 2, "poss": 2, "introduc": [2, 12, 13, 42, 47, 48], "recent": 2, "5": [2, 3, 10, 21, 23, 24, 25, 32, 37, 38, 46, 48, 53], "mdp": [2, 5, 52, 55], "6": [2, 26, 37, 38, 46, 48, 53], "propos": 2, "call": [2, 5, 35, 46, 48], "powss": 2, "howev": [2, 48], "line": [2, 46, 47], "work": [2, 37, 38, 42, 46, 48, 52, 53, 55], "sole": 2, "still": [2, 35, 48], "compar": [2, 36], "exactli": 2, "while": [2, 12, 32, 33, 42, 48], "depend": [2, 3, 5, 7, 24, 30, 37, 42, 53], "explor": [2, 37, 38], "constant": [0, 2, 6, 37], "7": [2, 10, 37, 38, 42, 46], "reflect": 2, "prior": [2, 5, 18, 19, 26, 27, 32, 42, 48], "knowledg": [2, 48], "regard": [2, 5, 42, 48], "amount": [2, 7], "thei": [2, 19, 23, 35, 46], "follow": [2, 3, 5, 18, 32, 33, 37, 38, 45, 46, 47, 48, 52, 53], "wa": [2, 42, 47], "r_": 2, "hi": 2, "lo": 2, "where": [2, 3, 5, 7, 10, 18, 20, 21, 22, 24, 25, 35, 47, 48, 53], "rhi": 2, "achiev": 2, "dure": [2, 23, 37, 38, 42, 45, 46, 48], "run": [2, 23, 32, 33, 41, 42, 46, 47, 48, 53], "0": [2, 5, 10, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 32, 36, 37, 38, 45, 46, 48, 53], "rlo": 2, "lowest": 2, "inde": [2, 48], "differ": [2, 12, 18, 20, 22, 41, 42, 43, 47, 55], "between": [2, 5, 12, 21, 23, 24, 32, 37, 42, 43, 47, 55], "certainli": 2, "onli": [2, 5, 13, 22, 32, 37, 38, 42, 43, 48], "wai": [2, 46, 48, 55], "obtainx1": 2, "object": [2, 5, 6, 10, 19, 20, 21, 22, 23, 24, 25, 29, 31, 36, 37, 38, 42, 45, 48, 51, 52, 53], "problem": [0, 2, 3, 5, 35, 42, 44, 46, 48, 49, 52, 53, 55], "specif": [2, 5, 36, 37, 38, 42, 48, 55], "cl": [2, 5], "kwarg": [2, 5, 12, 19, 20, 21, 22, 24, 25, 26, 29, 31, 33, 36, 37, 38, 42], "intend": 2, "classmethod": [2, 5, 20, 22, 29, 30, 31, 36, 46], "mimic": 2, "behavior": [2, 20, 42, 48], "generateleg": 2, "generatepref": 2, "david": [2, 48], "silver": [2, 48], "code": [2, 5, 37, 42, 45, 46, 47, 48, 52, 55], "tupl": [2, 3, 5, 10, 19, 21, 22, 24, 25, 30, 36, 37], "form": [2, 35], "num_visits_init": [1, 2], "value_init": [1, 2], "repres": [2, 3, 5, 10, 19, 24, 25, 35, 36, 37, 38, 44, 46, 47], "prefer": [2, 37, 38, 42, 48], "act": [2, 5, 32, 48, 52, 53], "despot": [2, 55], "For": [2, 5, 21, 23, 36, 42, 48, 53], "exampl": [2, 5, 18, 21, 23, 32, 33, 37, 38, 42, 45, 47, 48, 49, 50, 52], "certain": [2, 5], "possibl": [2, 5, 12, 20, 22, 24, 25, 30, 32, 33, 37, 48, 55], "subset": [2, 37, 38], "all": [2, 5, 12, 19, 22, 24, 25, 30, 32, 33, 36, 37, 38, 42, 48, 55], "when": [2, 5, 18, 24, 25, 28, 30, 36, 37, 38, 41, 42, 44, 45, 46, 47, 48, 52, 53, 55], "domain": [2, 6, 7, 10, 13, 18, 22, 24, 26, 32, 42, 44, 47, 52], "can": [2, 5, 7, 12, 14, 18, 20, 21, 22, 28, 32, 33, 37, 38, 42, 46, 47, 48, 50, 53, 55], "heurist": [2, 24, 25, 48], "space": [2, 3, 5, 7, 10, 12, 13, 19, 20, 22, 24, 25, 28, 32, 33, 35, 42, 46, 47, 48, 50], "enumer": [2, 32, 37, 38, 42, 43, 46, 48, 50], "__init__": [2, 5, 36, 41, 42, 45, 47, 48], "max_depth": [1, 2, 18, 26, 37, 38, 48], "planning_tim": [2, 18, 26, 42, 48], "1": [2, 3, 5, 7, 10, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 32, 33, 36, 37, 38, 45, 46, 47, 48, 52, 53], "num_sim": [2, 37, 38, 42], "discount_factor": [1, 2, 5, 18, 26, 37, 38, 46, 48], "9": [2, 37, 42, 46, 48, 53], "exploration_const": [2, 18, 26, 37, 38, 48], "sqrt": 2, "action_prior": [1, 2, 45], "none": [2, 3, 5, 10, 18, 19, 20, 22, 24, 25, 29, 30, 32, 35, 36, 37, 38, 45, 46, 48, 53], "show_progress": 2, "fals": [2, 5, 10, 12, 18, 19, 21, 22, 23, 24, 25, 29, 31, 32, 33, 35, 36, 37, 46, 53], "pbar_update_interv": 2, "paramet": [2, 3, 5, 12, 18, 19, 21, 22, 24, 25, 27, 30, 32, 33, 35, 36, 37, 38, 42, 46, 48], "int": [2, 19, 21, 32, 33, 37, 38, 46], "float": [2, 5, 12, 21, 22, 24, 25, 30, 32, 33, 36, 37, 46], "time": [2, 12, 18, 20, 24, 25, 35, 46, 47], "second": [2, 35, 37, 38, 41, 46, 47], "neg": [2, 32, 33, 42, 48], "number": [2, 5, 18, 19, 32, 33, 35, 36, 37, 38, 42, 46, 55], "reach": [2, 5, 18, 46, 48], "both": [2, 32, 33, 37, 38, 46, 47], "ar": [2, 5, 7, 12, 18, 19, 22, 23, 24, 25, 28, 32, 33, 35, 36, 37, 38, 41, 42, 43, 46, 47, 48, 49, 53, 55], "over": [2, 7, 19, 32, 35, 36, 43, 44, 45, 48], "bool": [2, 5, 18, 21, 32, 35, 37, 38, 46], "print": [2, 37, 38, 42, 46, 48], "progress": [2, 42], "bar": [2, 42], "after": [2, 5, 12, 20, 21, 22, 29, 42, 46, 48], "you": [2, 5, 7, 18, 32, 33, 35, 37, 38, 41, 42, 45, 46, 47, 48, 52, 53], "even": [2, 49], "your": [2, 42, 47, 52], "stop": 2, "criteria": 2, "ran": 2, "last": [2, 13, 20], "assum": [2, 3, 5, 7, 10, 12, 19, 22, 23, 24, 25, 30, 32, 33, 36, 37, 42, 46, 53], "ha": [2, 5, 18, 23, 24, 25, 31, 36, 41, 46, 47, 51, 55], "been": [2, 48, 49], "take": [2, 5, 14, 24, 25, 28, 36, 42, 45, 46, 47, 48], "receiv": [2, 5, 12, 24, 25, 32, 33, 47, 48], "choos": [2, 45, 48], "uniformli": [2, 48], "child": 2, "implement": [2, 3, 5, 7, 12, 13, 18, 22, 24, 25, 28, 30, 32, 33, 36, 37, 42, 44, 45, 48, 49, 50, 51, 52, 55], "origin": [2, 7, 10, 12, 13, 20, 22, 24, 25, 45, 47, 48, 52], "larg": [2, 5, 28, 29, 30, 48], "http": [2, 3, 46, 52, 53], "nip": 2, "cc": 2, "4031": 2, "One": [2, 19, 48], "thing": 2, "happen": [2, 18, 22], "new": [2, 5, 21, 29, 35, 36, 42, 52], "store": [2, 5, 37, 46, 48], "level": [2, 47], "execut": [2, 5, 21, 23, 37, 38, 46, 48], "next": [2, 5, 12, 22, 24, 25, 30, 32, 33, 37, 48], "These": 2, "reinvigor": [2, 35, 53], "enough": [2, 12, 33, 49], "separ": [2, 41, 42, 47], "complet": [2, 7, 37, 46], "node": [2, 37, 38, 42, 46], "longer": 2, "keep": [2, 12, 33, 35, 37], "track": [2, 35], "reinvogr": 2, "onc": [2, 5, 32, 48], "have": [2, 3, 5, 18, 19, 21, 24, 25, 32, 33, 35, 36, 37, 38, 42, 43, 46, 47, 48, 49, 55], "previous": [2, 42, 47], "version": [2, 46, 53], "basicpomcp": 2, "jl": [2, 46, 55], "github": [2, 41, 42, 46, 52, 53], "com": [2, 46, 53], "juliapomdp": [2, 7], "two": [2, 32, 33, 36, 37, 41, 44, 46, 48, 55], "equival": [2, 10, 48], "gener": [2, 5, 18, 32, 33, 36, 41, 43, 45, 46, 47, 48, 49, 52], "doesn": [2, 19, 32, 33, 55], "hurt": [2, 32, 33, 48], "featur": [2, 37, 38, 42, 52, 55], "state_transform_func": [2, 35], "artifici": [2, 48, 52], "transform": 2, "signatur": [2, 42], "s_transform": 2, "maintain": [2, 5, 12, 35, 46], "iter": [2, 24, 25, 32, 35, 42, 46, 48, 53, 55], "explain": [2, 41], "4": [2, 3, 20, 37, 38, 46, 48, 53], "stochast": [2, 13, 32, 48, 52], "No": [2, 46], "prune": [2, 46], "explod": 2, "veri": [2, 5, 48], "fast": 2, "feasibl": [2, 5, 12, 24, 25, 30, 32, 33, 37], "small": [2, 12, 22, 26, 27, 29, 30, 32, 33, 42, 48], "explicitli": [2, 24, 25, 35, 43, 45, 46, 48, 50], "horizon": [2, 42, 46, 48], "inf": [2, 46], "epsilon": [2, 18, 19, 22, 36, 37], "1e": [2, 22, 36, 37, 48], "lqr": [2, 3], "maximum": [2, 3, 7, 10, 18, 19, 32, 33, 42, 46], "likelihood": [2, 3, 7, 10, 36], "func_sysd": [2, 3], "func_ob": [2, 3], "jac_sysd": [2, 3], "jac_ob": [2, 3], "jac_sysd_u": [2, 3], "noise_ob": [2, 3], "noise_sysd": [2, 3], "qlarg": [2, 3], "q": [2, 3, 37, 38, 42], "planning_horizon": [2, 3], "15": [2, 3, 32, 37, 38, 46, 48], "sourc": [2, 3, 10, 12, 14, 15, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 35, 37, 38, 41, 46, 47, 48, 53], "ut": [2, 3], "ekf": [2, 3], "equat": [2, 3, 35], "12": [2, 3, 21, 29, 37, 46, 53], "13": [2, 3, 42], "f": [2, 3, 10], "point": [2, 3, 23, 28, 30, 46], "mt": [2, 3], "cov_t": [2, 3], "np": [2, 3], "arrai": [2, 3, 10, 36], "shape": [2, 3, 10, 20, 22, 23, 47], "cost": [2, 3, 19, 24, 25, 35], "need": [2, 3, 7, 19, 22, 32, 33, 35, 42, 45, 46, 48, 53], "turn": [2, 3], "long": [2, 3], "vector": [2, 3, 36, 37, 46], "consist": [2, 3, 12, 33], "column": [2, 3], "stich": [2, 3], "togeth": [2, 3], "control": [2, 3, 21, 22, 29, 48], "noise_t": [2, 3], "nois": [2, 3, 24, 25, 32, 33, 48], "possibli": [2, 3], "matrix": [2, 3], "wt": [2, 3], "term": [2, 3], "e": [2, 3, 5, 12, 18, 20, 21, 22, 23, 24, 25, 30, 32, 33, 37, 38, 42, 47, 48, 49, 53], "ad": [2, 3, 5, 42], "system": [2, 3, 46, 48, 55], "dynam": [2, 3, 22, 23], "v": [2, 3, 37, 38, 42, 46], "eq": [2, 3], "sam": [2, 3], "dimension": [2, 3, 12], "noise_obs_cov": [2, 3], "correspond": [2, 3, 21, 45, 46], "b_i": [2, 3], "u_i": [2, 3], "num_seg": [2, 3], "18": [2, 3, 37, 38, 46], "phi": [2, 3], "sum": [2, 3], "b_": [2, 3, 35, 48], "b_t": [2, 3, 48], "seg": [2, 3], "essenti": [2, 3, 43], "bu_traj": [2, 3], "b_de": [2, 3], "u_d": [2, 3], "17": [2, 3], "desir": [2, 3, 41], "covt": [2, 3], "comput": [2, 3, 19, 35, 42, 46], "list": [2, 3, 36, 37, 38, 42, 46], "begin": [2, 3, 37, 48], "segment": [2, 3], "avail": [2, 3, 5, 42, 52], "pass": [2, 3, 5, 12, 46, 48], "empti": [2, 3, 27], "b_0": [2, 3], "u_init": [2, 3], "control_bound": [2, 3], "opt_opt": [2, 3], "opt_callback": [2, 3], "solv": [2, 3, 6, 12, 13, 18, 26, 32, 42, 44, 47, 50, 52, 53], "sqp": [2, 3], "direct": [2, 3, 51], "transcript": [2, 3], "produc": [2, 3], "doc": [2, 3, 42], "scipi": [2, 3], "org": [2, 3, 42, 46, 52, 53], "tutori": [2, 3, 42, 45], "optim": [2, 3, 48], "html": [2, 3, 41, 46, 53], "opt_r": [2, 3], "lesli": [2, 48, 52], "pack": [2, 48, 52], "kaelbl": [2, 48, 52], "michael": [2, 47, 48, 52], "littman": [2, 48, 52], "anthoni": [2, 46, 48, 50, 52], "cassandra": [2, 46, 48, 50, 52], "intellig": [2, 48, 52], "101": [2, 48, 52], "99": [2, 18, 26, 46, 48, 52], "134": [2, 48, 52], "1998": [2, 48, 52], "joel": [2, 48], "veness": [2, 48], "advanc": [2, 48, 55], "neural": [2, 48], "process": [2, 32, 33, 48], "2164": [2, 48], "2172": [2, 48], "2010": [2, 48], "levent": 2, "kocsi": 2, "csaba": 2, "szepesv": 2, "\u00e1": 2, "ri": 2, "bandit": 2, "european": 2, "confer": [2, 47, 48, 52], "machin": [2, 46], "learn": [2, 5, 43, 48, 49, 51, 52, 55], "282": 2, "293": 2, "springer": 2, "2006": 2, "platt": 2, "tedrak": 2, "lozano": 2, "perez": 2, "proceed": [2, 48], "robot": [2, 7, 14, 18, 19, 20, 21, 22, 23, 24, 25, 28, 30, 47, 48, 52, 55], "scienc": 2, "zaragoza": 2, "spain": 2, "june": 2, "doi": 2, "10": [2, 18, 21, 24, 25, 26, 27, 29, 30, 32, 33, 37, 38, 42, 46, 48, 52], "15607": 2, "rss": 2, "vi": [2, 48], "037": 2, "h": [2, 48], "lim": 2, "clair": 2, "j": 2, "tomlin": 2, "zachari": 2, "sunberg": 2, "search": [2, 6, 12, 13, 19, 20, 22, 24, 25, 37, 38, 42, 48, 52, 53], "guarante": 2, "continu": [2, 7, 42, 48], "arxiv": [2, 52], "preprint": 2, "1910": 2, "04332": 2, "2019": [2, 18, 20, 22, 47, 48], "kearn": 2, "yishai": 2, "mansour": 2, "andrew": 2, "y": [2, 19, 20, 21, 22, 24, 25, 27, 28, 29], "ng": 2, "markov": [2, 32, 33, 48], "decis": [2, 32, 33, 48], "49": [2, 37], "193": 2, "208": 2, "2002": 2, "ant": 2, "\u00f3": 2, "nio": 2, "gusmao": 2, "tapani": 2, "raiko": 2, "toward": 2, "beyond": [2, 52], "game": 2, "go": [2, 13, 41, 44, 53], "ecai": 2, "384": 2, "389": 2, "2012": 2, "import": [5, 37, 38, 43, 45, 46, 48, 53], "must": [5, 7, 12, 13, 46, 48], "hashabl": [5, 36, 37, 42], "oper": 5, "its": [5, 7, 12, 13, 14, 21, 22, 23, 24, 25, 32, 33, 42, 43, 46, 48, 50, 51, 55], "job": [5, 43, 48], "taken": [5, 18, 36], "care": [5, 19], "suppli": [5, 45], "OR": 5, "policy_model": [5, 6, 18, 26, 37, 38, 47, 48], "attr_nam": 5, "attr_valu": 5, "allow": [5, 42, 47, 48, 52], "sometim": [5, 48], "model": [5, 6, 7, 12, 13, 18, 19, 20, 24, 25, 26, 32, 33, 37, 42, 46, 47, 50, 51, 52], "transit": [5, 12, 21, 22, 24, 25, 30, 32, 33, 35, 37, 46, 47, 48], "current": [5, 13, 21, 24, 25, 35, 37, 38, 46, 50], "which": [5, 14, 21, 24, 32, 33, 35, 36, 37, 38, 42, 45, 46, 48, 55], "most": [5, 12, 19, 22, 24, 25, 30, 33, 36, 37], "like": [5, 12, 19, 22, 24, 25, 30, 33, 36, 37, 38, 41, 42, 43, 47, 48, 53], "map": [5, 13, 16, 19, 20, 21, 22, 23, 27, 36, 37, 46], "variabl": [5, 31, 32, 36, 46], "pr": [5, 12, 22, 24, 25, 30, 32, 33, 35, 36, 37], "x": [5, 7, 10, 12, 19, 20, 21, 22, 24, 25, 27, 28, 29, 36, 53], "varval": 5, "evaul": 5, "world": [5, 12, 18, 20, 21, 22, 32, 48, 53], "2d": [5, 18, 20, 22, 23, 42], "gridworld": [5, 19, 20, 22, 47], "render": 5, "pygam": [5, 21, 29, 53], "Or": [5, 36, 48, 53], "could": [5, 18, 20, 21, 22, 32, 36, 44, 45, 48, 52, 55], "3d": 5, "opengl": 5, "therefor": [5, 12, 35], "mind": 5, "how": [5, 32, 44, 47, 52], "so": [5, 13, 37, 38, 41, 42, 48, 53, 55], "passiv": 5, "never": [5, 30], "nor": [5, 32, 33, 48], "init_st": [5, 10, 12, 15, 21, 24, 25, 29, 32, 46], "next_stat": [5, 12, 20, 21, 22, 24, 25, 30, 32, 33, 37, 48], "appli": [5, 42], "assign": [5, 36], "underli": [5, 33, 36], "accord": [5, 12, 22, 23, 24, 25, 28, 30, 32, 33, 37, 47, 48], "type": [5, 12, 19, 21, 22, 24, 25, 30, 32, 33, 35, 36, 37, 42, 45, 46], "synonym": 5, "result": [5, 20, 21, 22, 35, 48], "trigger": [5, 21], "becom": [5, 21, 48], "discount": [5, 12, 24, 25, 46, 53], "until": [5, 46], "condit": [5, 48], "reward": [5, 12, 21, 22, 24, 25, 30, 32, 33, 37, 46, 47, 48, 53], "addition": [5, 53], "exhibit": 5, "properti": [5, 10, 20, 21, 23, 24, 25, 29, 37, 38, 42], "That": [5, 46], "support": [5, 22, 36, 43, 45, 51, 52, 55], "dictionari": [5, 19, 36, 37, 48], "randomli": [5, 12, 22, 24, 25, 30, 32, 33, 36, 37, 47], "tempor": 5, "abstract": [5, 36], "defin": [5, 10, 12, 13, 14, 18, 20, 22, 36, 37, 42, 44, 45, 46, 47, 50, 51], "semi": 5, "reinforc": [5, 51, 55], "satisfi": 5, "conveni": [5, 32, 37, 42], "overriden": 5, "feel": [5, 55], "write": [5, 46], "boolean": 5, "whether": [5, 12, 43, 46], "technic": 5, "instanc": [5, 21, 24, 25, 32, 33, 46, 47], "env": [5, 6, 7, 13, 18, 26, 46, 47, 48], "name": [5, 12, 20, 24, 32, 33, 37, 46, 48], "treat": [5, 19, 32, 48], "h_t": [5, 48], "reason": 5, "accommod": 5, "vari": [5, 7, 20, 22], "probabilti": 5, "arg": [5, 12, 24, 25, 30, 32, 33, 37, 38, 42, 48], "pair": 5, "mathbb": 5, "denot": 5, "sim": [5, 48], "black": [5, 10], "box": 5, "creat": [5, 6, 7, 10, 32, 37, 38, 41, 46, 47, 48], "n_step": 5, "compon": [5, 13, 16, 18, 22, 26, 30, 46, 47, 48], "oo": [5, 20, 29, 42, 47, 51], "As": [5, 45, 47], "main": [5, 6, 12, 24, 25, 26, 32, 33, 42, 46, 48], "benefit": 5, "reduc": [5, 20, 35], "scale": 5, "exponenti": [5, 24], "linear": 5, "increas": [5, 24], "see": [5, 36, 42, 43, 46, 47, 48, 49, 50, 52, 53], "alwai": [5, 13, 49], "objid": [5, 18, 19, 20, 21, 22], "alia": [5, 37, 38], "return_oost": [5, 19, 42], "z": [5, 21, 29, 35], "mapsto": 5, "z_1": 5, "cdot": [5, 46], "z_n": 5, "id": [5, 19, 20, 21, 22], "dict": [5, 19, 20, 21, 27, 35, 36, 42], "object_observ": [5, 20], "singl": [5, 20, 37, 38, 47], "prod_i": 5, "z_i": 5, "param": [5, 20], "again": 5, "chang": [5, 20, 22, 36, 42, 43, 48, 53], "directli": [5, 12, 33, 35, 48, 50], "object_st": [5, 20, 22], "becaus": [5, 12, 13, 19, 41, 43, 46, 48], "caus": 5, "hashcod": 5, "incorrect": [5, 37], "kei": [5, 37, 38], "attr": 5, "request": [5, 7], "frozenset": 5, "identifi": 5, "sinc": [5, 35, 48], "hash": [5, 37, 42], "s_i": [5, 20], "made": [5, 35, 42, 53], "str": [5, 21, 32, 36, 46], "onlin": [5, 7, 48], "pure": 5, "underneath": 5, "hood": 5, "Its": 5, "output": [5, 41, 46, 53], "expect": [5, 46, 53], "same": [5, 28, 30, 32, 35, 36, 42, 46, 48], "lasertag": 0, "light_dark": [0, 6, 49], "problem_discret": [0, 6], "test": [0, 6, 32, 35, 42, 46], "load_unload": [0, 6], "maze": [0, 6, 49], "multi_object_search": [0, 6, 47, 53], "example_world": [0, 6, 47], "random_world": [6, 18], "rocksampl": [0, 6, 42, 53], "cython": [0, 6, 37, 42, 52, 53, 55], "rocksample_problem": [0, 6], "run_rocksampl": [6, 24], "rocktyp": [6, 24, 25], "good": [6, 24, 25, 47, 53], "bad": [6, 24, 25, 53], "invert": [6, 24, 25], "moveact": [6, 24, 25], "east": [6, 18, 20, 24, 25], "west": [6, 18, 20, 24, 25], "north": [6, 18, 20, 24, 25, 53], "south": [6, 18, 20, 24, 25], "sampleact": [6, 24, 25], "checkact": [6, 24, 25], "rstransitionmodel": [6, 24, 25], "rsobservationmodel": [6, 24, 25], "rsrewardmodel": [6, 24, 25], "rspolicymodel": [6, 24, 25], "rocksampleproblem": [6, 24, 25], "random_free_loc": [6, 24, 25], "in_exit_area": [6, 24, 25], "generate_inst": [6, 24, 25], "print_stat": [6, 24, 25], "test_plann": [6, 12, 24, 25, 32, 33, 48], "init_particles_belief": [6, 24, 25], "tag": [0, 6, 42], "experi": [0, 6, 7], "tiger": [0, 6, 37, 38, 42, 45, 46, 47, 52, 53], "run_tig": [6, 32], "tiger_problem": [0, 6, 37, 38, 42, 46, 48], "tigerst": [6, 32, 33, 46], "tigeract": [6, 32, 33], "tigerobserv": [6, 32, 33], "tigerproblem": [6, 32, 33, 37, 38, 46, 48], "make_tig": [6, 32], "lightdarkenviron": [7, 10], "light": [6, 10, 42], "const": [7, 10], "dark": [6, 10, 42], "mazeenviron": [13, 15], "finit": [12, 13, 32, 46, 48], "descript": [7, 12, 13, 18, 20, 21, 22, 24, 25, 32, 33, 48], "start": [12, 13, 21, 37, 38, 48, 53], "goal": [7, 13, 48], "cannot": [12, 13, 36, 41], "perceiv": [12, 13], "locat": [12, 13, 19, 23, 24, 25, 28, 30, 53], "orient": [13, 14, 18, 19, 20, 22, 23, 47, 51], "presenc": 13, "absenc": 13, "wall": [13, 14], "side": [12, 13, 48], "squar": 13, "non": 13, "zero": [13, 42], "slip": 13, "know": [13, 18, 35], "attempt": [13, 42], "make": [13, 19, 36, 37, 38, 41, 42, 43, 47, 52, 53, 55], "move": [7, 12, 13, 24, 25, 30, 31, 37, 38, 47, 53], "had": 13, "consequ": 13, "actual": [7, 13, 18, 23, 32, 33, 48], "posit": [7, 13, 14, 24, 25, 30, 31, 32, 33, 48], "Not": [13, 36], "yet": [7, 13, 42, 47], "motion": [14, 18, 20, 22, 24, 25, 28, 47], "look": [14, 20, 22, 47, 53], "positit": 14, "mosag": [18, 19], "clear_histori": [18, 19, 26, 27], "mosoobelief": [18, 19], "initialize_belief": [18, 19, 26, 27], "motionact": [18, 20, 23], "scheme_xyth": [18, 20], "scheme_vw": [18, 20], "forward": [18, 20], "backward": [18, 20, 42], "scheme_xi": [18, 20], "east2d": [18, 20, 31], "west2d": [18, 20, 31], "north2d": [18, 20, 31], "south2d": [18, 20, 31], "scheme": [18, 20], "lookact": [18, 20], "findact": [18, 20], "objectobserv": [18, 20, 22], "null": [18, 20, 22], "mosooobserv": [18, 20, 21, 53], "for_obj": [18, 20], "pose": [18, 20, 22, 23, 47], "robotst": [18, 20], "robot_pos": [18, 20, 23], "objects_found": [18, 20], "mosoost": [18, 20], "object_pos": [18, 20], "mosenviron": [18, 21], "robot_id": [18, 19, 20, 21, 22, 23], "interpret": [18, 20, 21, 36, 47], "interpret_robot_id": [18, 21], "equip_sensor": [18, 21, 47], "make_laser_sensor": [18, 21, 47], "make_proximity_sensor": [18, 21, 47], "grid_map": [18, 19, 22, 26, 27, 29, 30, 47], "sensor": [18, 19, 20, 21, 22, 24, 25, 47, 48], "mosobservationmodel": [18, 22], "objectobservationmodel": [18, 22], "unittest": [6, 18, 21, 22, 26, 29], "mosrewardmodel": [18, 22], "goalrewardmodel": [18, 22], "mostransitionmodel": [18, 22], "staticobjecttransitionmodel": [18, 22], "robottransitionmodel": [18, 22], "if_move_bi": [18, 22, 26, 30], "valid_pos": [18, 22, 30, 31], "in_boundari": [18, 22], "file": [18, 41, 42, 47, 48, 53, 55], "some": [18, 37, 42, 44, 46, 48, 49, 53, 55], "string": [10, 18, 21, 33, 37, 38, 46], "width": [18, 19, 22, 23, 26, 29, 31], "length": [18, 19, 22, 23, 26, 29, 31], "num_obj": 18, "num_obstacl": 18, "robot_char": 18, "init_robot_st": 19, "object_id": [19, 22], "dim": [19, 21, 22], "01": [18, 19, 22, 46], "belief_rep": [18, 19], "num_particl": [12, 18, 19, 24, 25, 26, 27, 35, 36], "100": [12, 18, 19, 27, 32, 33, 46, 48], "custum": [19, 27], "sure": [19, 48], "robot_orient": 19, "multi": [6, 19, 20, 22, 42, 49, 51, 52, 53], "target": [18, 19, 21, 28, 30, 32, 46, 47, 48], "obstacl": [19, 21, 23, 47], "realli": [19, 48], "about": [12, 19, 23, 24, 25, 37, 38, 42, 47], "them": [19, 37, 42, 44, 48, 53, 55], "includ": [18, 19, 22, 41, 42, 43], "unspecifi": 19, "uniform": [19, 24, 25, 26, 27, 32, 48], "radian": 19, "cup": [20, 48], "find": [20, 22, 42, 47, 52, 53], "45deg": 20, "input": [20, 21, 46, 50], "forc": 20, "everi": [20, 24, 25], "w": [20, 47], "drop": 20, "mo": [6, 20, 42, 52, 53], "xy": [10, 20, 31], "distance_cost": 20, "motion_nam": 20, "xyth": [20, 53], "141592653589793": 20, "71238898038469": 20, "5707963267948966": 20, "vw": 20, "7853981633974483": 20, "icra": [18, 20, 22, 47], "instead": [18, 20, 22, 32, 33, 42, 43, 48], "topolog": [18, 20, 22, 47], "graph": [18, 20, 22, 46, 47], "fan": [20, 22, 23, 47], "someth": [20, 22, 53], "els": [20, 22, 45, 46, 48], "objpos": 20, "thu": [20, 35, 47], "grid": [12, 20, 22, 23, 24, 25, 30, 47], "s_1": 20, "s_2": 20, "s_n": 20, "s_r": 20, "leq": 20, "sr": 20, "objclass": 20, "camera_direct": 20, "overrid": 21, "parent": [21, 37, 38], "worldstr": [21, 26, 29, 31], "rx": [21, 29], "xt": 21, "laser": [21, 22, 23, 47], "fov": [21, 23], "90": [21, 23], "min_rang": [21, 23], "max_rang": [21, 23], "indic": [21, 35], "obsticl": 21, "replac": 21, "upper": 21, "letter": 21, "serv": 21, "lower": [10, 21], "except": [21, 29, 37, 38], "signal": 21, "laser2dsensor": [21, 22, 23], "robot_nam": 21, "worldmap": 21, "charact": [10, 21], "angle_incr": [21, 23], "dist_rang": 21, "occlus": [21, 23, 47], "scanner": [21, 23, 47], "configur": [7, 21], "angl": [21, 23, 47], "end": [21, 37], "beam": [21, 23, 47], "scan": [21, 23, 47], "degre": [21, 23, 47], "angular": 21, "distanc": [21, 23, 24], "measur": 21, "rad": 21, "consid": [18, 21, 35, 47], "radiu": [10, 21, 23], "proxim": [21, 22, 23], "occlusion_en": [21, 23], "gridmap": [22, 23, 27, 30, 31], "valid_mot": [22, 23, 30, 31], "to_rad": [22, 23], "in_rang": [22, 23], "within_rang": [22, 23], "sensing_region_s": [22, 23], "in_field_of_view": [22, 23], "shoot_beam": [22, 23], "valid_beam": [22, 23], "proximitysensor": [22, 23], "own": [22, 42, 43], "well": [22, 32, 33, 47, 48], "within": [22, 23, 47], "rang": [22, 23, 46, 47, 48], "equip": [22, 47], "occup": [22, 27], "target_object": 22, "big": [22, 26, 27, 29, 30], "1000": [18, 22, 26, 36], "normal": [12, 22, 24, 25, 33, 35, 36], "get": [22, 26, 32, 33, 48, 53], "detect": 22, "relat": [22, 52], "determinist": [22, 23, 24, 25, 30, 35, 37, 48], "09": [22, 36], "necessarili": 22, "static": [21, 22, 24, 25, 29, 32, 37, 38], "next_object_st": 22, "perfect": [22, 24, 25, 47], "check_collis": 22, "robot_st": 22, "next_robot_st": [18, 22], "pose_objid": 22, "valid": [22, 23, 43], "overlap": 22, "addit": [22, 35, 46, 49, 52, 53], "assist": 23, "collis": 23, "avoid": [23, 35, 42, 43], "invalid": [23, 48], "contain": [23, 32, 33, 35, 37, 38, 41, 42, 46, 48, 50, 55], "all_motion_act": 23, "bump": [23, 42], "determin": [23, 24, 25, 48], "assumpt": 23, "p1": [10, 23, 24, 25, 37], "p2": [10, 23, 24, 25, 37], "deg": 23, "val": 23, "env_stat": 23, "might": [23, 32, 33, 47, 48], "visibl": [23, 42], "due": [23, 42, 47], "gap": 23, "view_angl": 23, "th": [21, 23, 29, 37], "field": [23, 32, 33, 42], "view": [23, 42], "size": [10, 21, 23, 29, 42, 46], "180": 23, "front": [23, 32, 33, 48], "our": [7, 23, 47, 48, 55], "convent": [23, 42, 44, 52], "270": 23, "360": [23, 47], "shoot": 23, "bear": 23, "dist": 23, "increment": 23, "mosobserv": 23, "region": [21, 23, 47], "center": [10, 23], "rock_id": [24, 25], "rsaction": [24, 25], "rsobserv": [24, 25], "qualiti": [24, 25], "rsstate": [24, 25], "k": [24, 25], "uai": [24, 25], "2004": [24, 25, 52], "rocktype_1": [24, 25], "rocktype_2": [24, 25], "rocktype_k": [24, 25], "rocktype_i": [24, 25], "terminalst": [24, 25], "rock": [24, 25], "known": [24, 25, 55], "check_i": [24, 25], "smartli": [24, 25], "check": [24, 25, 42, 46, 47, 48, 55], "check_1": [24, 25], "check_k": [24, 25], "first": [24, 25, 37, 38, 41, 46, 47, 48, 53], "four": [24, 25], "noisi": [24, 25], "eta": [24, 25], "exit": [24, 25], "area": [24, 25], "equal": [24, 25, 32, 33, 37, 38, 48], "being": [5, 24, 25], "rock_loc": 24, "half_efficiency_dist": 24, "20": [24, 37, 38, 42, 46], "not_free_loc": [24, 25], "nxn": [24, 25], "free": [24, 25, 32, 33, 47, 48, 51, 52, 55], "nstep": [12, 24, 25, 32, 33, 48], "95": [12, 24, 25, 37, 38, 46, 48], "initialize_particles_belief": [26, 27], "belief_upd": [6, 18, 26, 27], "tagag": [26, 27], "tagact": [26, 28], "tagobserv": [26, 28], "tagstat": [26, 28], "motion_polici": [26, 30], "tagobservationmodel": [26, 30], "tagpolicymodel": [26, 30], "tagrewardmodel": [26, 30], "tagtransitionmodel": [26, 30], "init_robot_posit": [26, 27], "hold": [27, 43], "pr_stai": [26, 27, 29, 31], "anytim": [28, 30, 46], "approxim": [28, 30, 36, 55], "cell": [28, 30, 47], "target_posit": [28, 31], "person": 28, "found": [28, 46, 47, 53], "robot_posit": [28, 31], "target_found": 28, "from_str": [26, 29, 30, 31], "free_cel": [30, 31], "tagtargetmotionpolici": [30, 31], "ohterwis": 30, "anyth": 30, "There": [7, 30, 41, 46, 48, 49, 55], "stochaist": 30, "movement": 30, "With": [30, 48], "8": [12, 30, 37, 38, 42, 46, 53], "awai": [7, 30, 32, 33, 48], "stai": [30, 32, 42, 48], "place": [12, 30, 47, 48], "closer": 30, "target_motion_polici": 30, "obstacle_pos": 31, "all_mot": 31, "next_target_posit": 31, "valid_target_motion_act": 31, "tigerobservationmodel": [32, 33], "tigerpolicymodel": [32, 33], "tigerrewardmodel": [32, 33], "tigertransitionmodel": [32, 33], "build_act": [32, 33], "build_observ": [32, 33], "build_set": [32, 33], "build_stat": [32, 33], "classic": [24, 32, 33, 48], "specifi": [32, 33, 37, 41, 42, 45, 46, 48], "introduct": [32, 33, 48], "kamalzadeh": [32, 33, 48], "hahsler": [32, 33, 48], "put": [32, 33, 48], "behind": [32, 33, 48], "door": [32, 33, 48], "treasur": [32, 33, 48], "stand": [32, 33, 37, 38, 48, 52], "close": [32, 33, 48], "decid": [32, 33, 48], "open": [32, 33, 37, 38, 46, 48], "wait": [32, 33, 48], "listen": [32, 33, 37, 38, 42, 46, 48, 53], "neither": [32, 33, 48], "entir": [32, 33, 37, 38, 48], "accur": [32, 33, 48], "hear": [32, 33, 48], "vice": [32, 33, 48], "versa": [32, 33, 48], "either": [32, 33, 35, 42, 46, 47, 48], "more": [18, 24, 32, 33, 35, 37, 38, 41, 42, 44, 45, 46, 47, 48, 49, 51, 52, 55], "complic": [32, 33, 44, 47, 48, 52], "re": [5, 21, 29, 32, 41, 48], "spec": [32, 46, 48], "reset": [32, 48], "otherwis": [12, 32, 48], "obs_nois": [32, 48], "init_true_st": [32, 33, 48], "fact": 32, "debug_tre": 32, "feedback": [32, 33, 47, 48], "loop": [32, 33, 47, 48], "pdb": [32, 37, 38], "dd": [32, 37, 38], "quickli": [32, 44, 52], "build": [32, 42, 43, 46, 47, 52, 53], "extern": [12, 33, 42, 48, 50, 52, 53], "extrem": [12, 33], "dumb": [12, 33], "obs_prob": 33, "trans_prob": 33, "current_histogram": 35, "state_mapp": [35, 36], "oarg": 35, "targ": 35, "static_transit": 35, "next_state_spac": 35, "sum_": 35, "help": [35, 37, 38, 46, 47, 52], "nest": 35, "alreadi": [35, 51], "prohibit": 35, "effici": [24, 35], "part": [35, 46], "simpli": [35, 48], "At": 35, "least": 35, "ok": 35, "current_particl": 35, "todo": [13, 35, 42], "prob": 36, "unweight": 36, "inherit": [36, 42, 48], "feed": 36, "through": [12, 18, 36, 37, 38, 45, 48], "multipl": [36, 51], "those": [36, 42, 48, 53], "approx_method": 36, "distance_func": 36, "drawn": 36, "nearest": 36, "queri": 36, "match": [36, 42], "closest": 36, "exact": [12, 36, 42, 48], "uniqu": 36, "aggreg": 36, "numer": [36, 46, 55], "densiti": 36, "multivari": 36, "isn": 36, "arbitrarili": 36, "deal": 37, "percent": 37, "rgb": 37, "255": [21, 29, 37], "hx": 37, "len": [37, 45], "ctype": 37, "dct": 37, "easier": [37, 38, 42], "core": [37, 38, 42, 43], "incorpor": [37, 38], "design": [37, 38, 52], "eas": [37, 38], "ipdb": [37, 38], "session": [37, 38], "minim": [37, 38, 42], "usag": [37, 38], "pomdp_problem": [6, 37, 38, 42], "suppos": [37, 38], "too": [37, 38], "4096": [37, 38], "200": [37, 38], "set_trac": [37, 38], "program": [37, 38, 46, 50], "enter": [37, 38], "debugg": [37, 38], "_vnodepp": [37, 38], "4095": [37, 38], "19": [37, 38, 46], "529": [37, 38], "\u2080listen": [37, 38], "_qnodepp": [37, 38], "4059": [37, 38], "\u2080tiger": [37, 38], "2013": [37, 38], "16": [37, 38], "586": [37, 38], "1883": [37, 38], "1441": [37, 38], "300": [37, 38], "out": [37, 38, 46, 47, 55], "\u2081open": [37, 38], "139": [37, 38], "847": [37, 38], "\u2082open": [37, 38], "112": [37, 38, 46], "57": [37, 38], "191": [37, 38], "text": [37, 38, 46], "retriev": [37, 38], "subtre": [37, 38], "index": [37, 38, 46, 52], "2044": [37, 38], "160": [37, 38], "148": [37, 38], "634": [37, 38], "237": [37, 38], "500": [18, 26, 37, 38], "obtain": [37, 38], "sequenc": [10, 37, 38, 42, 48], "\u2081tiger": [37, 38], "1955": [37, 38], "947": [37, 38], "768": [37, 38], "022": [37, 38], "462": [37, 38], "395": [37, 38], "000": [37, 38], "247": [37, 38], "best": [37, 38, 42], "brows": [37, 38], "method": [37, 38, 42], "document": [37, 38, 42, 44, 46, 55], "futur": [37, 38], "organ": [37, 38, 47, 48], "kind": [37, 38], "total": [37, 38, 46], "largest": [37, 38], "edg": [37, 38, 46], "as_debugg": [37, 38], "Will": [37, 38], "high": [37, 38, 47, 55], "huge": [37, 38], "interact": [37, 38, 43], "along": [37, 38], "preset": [37, 38], "seq": [37, 38], "understand": [37, 38, 43], "_nodepp": [37, 38], "dest": [37, 38], "Such": [37, 38], "parent_edg": [37, 38], "indent": [37, 38], "include_children": [37, 38], "df": [37, 38], "gether": [37, 38], "statist": [37, 38], "colorstr": [37, 38], "assort": 37, "vec1": 37, "vec2": 37, "scalar": 37, "dx": 37, "dy": 37, "dz": 37, "v1": 37, "v2": 37, "06": [37, 46], "python": [12, 37, 42, 46, 47, 48, 52, 53, 55], "oldvalu": 37, "oldmin": 37, "oldmax": 37, "newmin": 37, "newmax": 37, "obj": 37, "arr": 37, "48": 37, "8320": 37, "8321": 37, "50": [37, 46], "8322": 37, "51": [37, 46], "8323": 37, "52": [37, 46], "8324": 37, "53": 37, "8325": 37, "54": 37, "8326": 37, "55": 37, "8327": 37, "56": 37, "8328": 37, "8329": 37, "particular": 37, "data": 37, "piec": 37, "correct": [37, 43, 48], "typic": [37, 48], "tabular": [37, 42], "built": [37, 41, 42, 43], "nextstat": 37, "emit": 37, "utilti": [10, 37], "typographi": 37, "purpos": [37, 47, 52], "displai": 37, "x1b": 37, "97m": 37, "96m": 37, "95m": 37, "94m": 37, "92m": 37, "93m": 37, "91m": 37, "1m": 37, "0m": 37, "shown": [37, 47], "sphinx": [41, 42], "web": 41, "page": [41, 52, 53], "Their": 41, "directori": [41, 53], "cd": 41, "py": [41, 42, 47, 48], "_sphinx_src": 41, "apidoc": 41, "api": 41, "rst": 41, "argument": [41, 42, 45], "readm": 41, "read": [41, 48], "me": 41, "Then": [18, 41, 48], "top": [41, 42], "repositori": [41, 53], "websit": [41, 42, 53], "construct": [18, 41, 46, 48], "symbol": 41, "link": [41, 42, 46, 47, 52], "ln": 41, "access": [41, 42, 48, 52], "remov": [41, 42, 46], "site": 41, "deploi": 41, "fundament": 43, "block": [12, 43, 47], "formal": 43, "encapsul": 43, "few": 43, "pomdp_pi": [42, 43, 44, 45, 47, 48, 49, 50, 51, 53, 55], "around": [43, 55], "convei": [5, 43], "idea": [43, 48], "abov": [43, 46, 47, 48, 50, 53], "gist": [42, 43], "captur": 43, "versu": 43, "much": [42, 43], "sens": [21, 43, 47], "verifi": [42, 43, 53], "diagram": 43, "langl": 43, "omega": [43, 46, 50], "rangl": 43, "discuss": 44, "simpler": [18, 42, 44, 55], "interest": 44, "former": 44, "latter": 44, "structur": [44, 47, 52], "project": [44, 47, 51, 52, 55], "below": [45, 47, 49, 53], "minimum": [42, 45], "def": [45, 48], "rais": [45, 48], "notimplementederror": 45, "notion": 45, "narrow": 45, "express": 45, "detail": [18, 32, 45, 46, 47, 48, 50], "paragraph": 45, "visit": [42, 45], "count": [21, 45, 53], "account": 45, "nu": [46, 50], "hope": [46, 49], "u": [12, 46], "mani": [46, 55], "librari": [42, 46, 50, 52, 53], "written": [46, 48, 52, 55], "format": [42, 46, 48, 55], "pomdpx": [42, 46, 55], "pomdpconvert": 46, "toolkit": 46, "to_pomdp_fil": [42, 46], "to_pomdpx_fil": 46, "convers": [42, 46], "output_path": 46, "float_precis": [42, 46], "www": [46, 53], "independ": 46, "blank": 46, "decim": 46, "order": [7, 46, 48], "pomdpconvert_path": 46, "adacompnu": 46, "instruct": [46, 53], "download": [46, 53], "ubuntu": 46, "04": 46, "gcc": 46, "bigbird": 46, "comp": 46, "edu": 46, "sg": 46, "pmwiki": 46, "farm": 46, "appl": [46, 55], "php": 46, "pomdpxdocument": 46, "binari": [46, 50], "let": [46, 48], "filenam": [46, 47], "test_tig": 46, "softwar": [46, 53, 55], "src": 46, "vi_prun": 46, "pomdp_solve_path": 46, "pomdp_nam": 46, "temp": 46, "remove_generated_fil": 46, "return_policy_graph": 46, "definit": [46, 48], "pomdp_solv": [42, 46], "compil": 46, "command": [46, 47, 53], "stop_criteria": 46, "weak": 46, "time_limit": 46, "alpha": [10, 46], "pg": 46, "instal": [42, 46, 52], "appear": [7, 46, 55], "recommend": [46, 47, 53], "isinst": [46, 48], "cur_belief": [46, 48], "new_belief": [46, 48], "pid": 46, "8239": 46, "mcgs_prune_freq": 46, "verbos": 46, "context": 46, "done": [18, 46, 48, 55], "epoch": 46, "00": 46, "sec": 46, "err": 46, "39": 46, "96": 46, "97": 46, "98": 46, "40": 46, "solut": 46, "user": [46, 48], "hr": 46, "min": 46, "lp_solv": 46, "report": 46, "lp": 46, "instabl": 46, "85": 46, "9697986575573173": 46, "03020134244268276": 46, "pomdpsol_path": 46, "timeout": 46, "30": [21, 29, 46], "memori": 46, "precis": 46, "logfil": 46, "pomdpsol": 46, "limit": 46, "mb": 46, "regret": 46, "less": 46, "than": [46, 55], "finish": 46, "log": [42, 46], "stdout": 46, "stderr": 46, "_": 46, "000001": 46, "load": [6, 42, 46], "trial": [6, 26, 46], "backup": 46, "lbound": 46, "ubound": 46, "92": 46, "8205": 46, "821": 46, "2981": 46, "63": 46, "7547": 46, "70": 46, "0528": 46, "103": 46, "35722": 46, "3746": 46, "0174": 46, "155": 46, "44093": 46, "45": 46, "1431": 46, "38": 46, "7021": 46, "205": 46, "1184": 46, "36": 46, "4409": 46, "24": 46, "3225": 46, "1255": 46, "3714": 46, "13808e": 46, "21": 46, "41": 46, "1300": 46, "76277e": 46, "42": 46, "1350": 46, "75044e": 46, "43": 46, "1393": 46, "22729e": 46, "07": 46, "11": [46, 53], "extend": [42, 46, 47, 48, 49], "encod": 46, "alpha_path": 46, "pg_path": 46, "parse_pomdp_solve_output": 46, "pointer": 46, "incom": 46, "offlin": 46, "collect": 46, "associ": 46, "dot": 46, "product": 46, "lead": [46, 47], "domin": 46, "activ": [46, 55], "max_": 46, "gamma": 46, "policy_path": 46, "parse_appl_policy_fil": 46, "involv": 47, "whose": 47, "better": 47, "mainten": 47, "readabl": 47, "task": [6, 12, 47, 51, 52, 55], "rel": 47, "share": [47, 52], "wandzel": 47, "et": 47, "al": 47, "slightli": 47, "room": [18, 47], "formul": 47, "three": [47, 48], "categori": 47, "adjust": 47, "disk": 47, "artifact": 47, "discret": [7, 47], "figur": [7, 12, 47], "screenshot": 47, "frame": 47, "imag": [42, 47], "circl": [47, 53], "third": 47, "show": [42, 47, 52], "later": [42, 47], "summari": 47, "procedur": [47, 48], "instanti": [18, 47], "squeez": 47, "everyth": 47, "giant": 47, "reus": 47, "whatev": 47, "save": 47, "evid": 47, "role": 47, "mosoopomdp": [6, 18, 47], "logic": 47, "m": [12, 42, 47, 52, 53], "custom": 47, "arthur": 47, "yoonseon": 47, "oh": 47, "fishman": 47, "nishanth": 47, "kumar": 47, "stefani": [47, 48, 52], "tellex": [47, 48, 52], "intern": [47, 48], "autom": [47, 48], "7194": 47, "7200": 47, "ieee": 47, "encourag": 48, "valueerror": 48, "__hash__": 48, "__eq__": 48, "boil": 48, "heard": 48, "growl": 48, "thresh": 48, "similarli": 48, "startswith": 48, "choic": 48, "easili": 48, "tabl": 48, "flexibl": 48, "intract": 48, "sever": [48, 49], "would": [42, 48, 55], "usual": 48, "human": 48, "engin": 48, "sort": [37, 42, 48], "guid": 48, "guidanc": 48, "caution": 48, "sai": 48, "inject": 48, "final": 48, "straightforward": 48, "commonli": 48, "_reward_func": 48, "elif": 48, "abl": [42, 48], "mostli": 48, "super": 48, "notic": 48, "constructor": 48, "now": [42, 48], "standard": 48, "a_t": 48, "s_t": 48, "rightarrow": 48, "s_": 48, "r_t": 48, "o_t": 48, "h_": 48, "unless": 48, "repeat": 48, "110": 48, "ennviron": 48, "skip": [42, 48], "estim": 48, "percept": 48, "stack": 48, "saniti": 48, "come": 48, "automat": [42, 48], "num": 48, "short": 48, "abel": 48, "elli": 48, "hershkowitz": 48, "gabriel": 48, "barth": 48, "maron": 48, "stephen": 48, "brawner": 48, "kevin": 48, "farrel": 48, "jame": 48, "macglashan": 48, "twenti": 48, "fifth": 48, "schedul": 48, "2015": 48, "yuchen": 48, "xiao": 48, "sammi": 48, "katt": 48, "andrea": 48, "ten": 48, "pa": 48, "shengjian": 48, "chen": 48, "christoph": 48, "amato": 48, "clutter": 48, "welcom": [49, 52], "sarsop": [42, 50, 53, 55], "rl": 51, "transfer": [51, 52], "research": [51, 52, 55], "baslin": 51, "comprehens": 52, "why": 52, "clean": 52, "intuit": 52, "peopl": 52, "commun": [52, 53, 55], "artial": 52, "bservabl": 52, "arkov": 52, "ecis": 52, "rocess": 52, "major": 52, "languag": 52, "what": 52, "changelog": 52, "principl": 52, "integr": 42, "pleas": 52, "cite": 52, "inproceed": 52, "zheng2020pomdp_pi": 52, "titl": 52, "_py": 52, "author": 52, "zheng": 52, "kaiyu": 52, "booktitl": 52, "icap": 52, "2020": 52, "workshop": 52, "planrob": 52, "year": 52, "url": 52, "icaps20subpag": 52, "wp": 52, "upload": [42, 52], "14": [12, 52, 53], "planrob_2020_paper_3": 52, "pdf": 52, "10099": 52, "virtualenv": 53, "pip": [42, 53], "manag": 53, "offici": 53, "maco": 53, "On": 53, "window": [42, 53], "wiki": 53, "latest": [42, 53], "releas": [42, 53], "clone": 53, "git": 53, "h2r": 53, "setup": [42, 53], "pyx": [42, 53], "pyd": 53, "rebuild": 53, "messi": [], "66": 53, "cumul": 53, "__num_sims__": 53, "1217": 53, "______id______": 53, "210": 53, "_____g": 53, "b_____": 53, "hello": 53, "542": 53, "506": 53, "test_al": 53, "via": [53, 55], "hub": 53, "credit": 53, "romain": 53, "egel": 53, "think": 55, "peer": 55, "easi": 55, "ro": 55, "acceler": 55, "pomdpi": 55, "suffici": 55, "convolut": 55, "potenti": [42, 55], "connect": [10, 18, 55], "clearer": 55, "pars": 55, "art": 55, "great": 55, "julia": 55, "suit": [7, 55], "analysi": 55, "besid": 55, "librai": 55, "port": 55, "ai": 55, "toolbox": 55, "bind": 55, "focus": 55, "lear": 55, "beliefmdp": 55, "modern": 42, "repo": [7, 42], "migrat": 42, "pyproject": 42, "toml": 42, "ci": 42, "pre": 42, "commit": 42, "eol": 42, "fix": 42, "cpdef": 42, "cdef": 42, "failur": 42, "29": 42, "comment": 42, "sp": 42, "wheel": 42, "properli": 42, "tame": 42, "minor": 42, "bug": 42, "__str__": 42, "confus": 42, "improv": 42, "clarifi": 42, "gave": 42, "cryingbabi": 42, "pygraphviz": 42, "inspect": 42, "refactor": 42, "cli": 42, "simplifi": 42, "__ne__": 42, "reorgan": 42, "break": 42, "unnecessari": 42, "compat": 42, "pickl": 42, "edit": 42, "cimport": 42, "ed": 42, "pypi": 42, "value_funct": 42, "18fc58e0": 42, "cfc88e8d8": 42, "719c2edf5": 42, "docker": 42, "issu": 42, "citat": 42, "resolv": 42, "max": 42, "among": 42, "infin": 42, "thank": 42, "jason": 42, "clarif": 42, "convert": 42, "were": 42, "calcul": 42, "divid": 42, "thrown": 42, "infinit": 42, "anoth": 42, "differenti": 42, "unload": [6, 42], "per": 42, "faster": 42, "readi": 42, "changeabl": 42, "rewritten": 42, "cleaner": 42, "dictstat": [0, 1, 5, 42], "set_model": [1, 5, 42], "frozen": [1, 34, 36, 42], "ones": 5, "lustat": [6, 12], "luaction": [6, 12], "luobserv": [6, 12], "luobservationmodel": [6, 12], "lutransitionmodel": [6, 12], "lurewardmodel": [6, 12], "lupolicymodel": [6, 12], "loadunloadproblem": [6, 12], "generate_random_st": [6, 12], "generate_init_belief": [6, 12], "minimal_inst": [6, 24], "create_inst": [6, 24], "tagproblem": [6, 26], "plot_point": [7, 10], "plot_polygon": [7, 10], "plot_lin": [7, 10], "plot_circl": [7, 10], "xval": 10, "yval": 10, "label": 10, "style": 10, "linewidth": 10, "xlabel": 10, "ylabel": 10, "loc": 10, "vert": 10, "ax": 10, "edgecolor": 10, "verts0": 10, "verts1": 10, "verts_i": 10, "vertic": 10, "numpi": 10, "color0": 10, "color1": 10, "color_i": 10, "hex": 10, "xxxxxx": 10, "polygoncollect": 10, "axi": 10, "zorder": 10, "linestyl": 10, "fill": 10, "label_text": 10, "text_color": 10, "itself": [7, 12], "tell": 12, "statu": 12, "ob": 12, "load_unload_problem": 12, "object_color": [18, 21], "mosviz": [18, 21, 29], "img_width": [18, 21, 26, 29], "img_height": [18, 21, 26, 29], "last_observ": [18, 21, 26, 29], "draw_robot": [18, 21, 26, 29], "draw_observ": [18, 21, 26, 29], "draw_belief": [18, 21, 26, 29], "on_init": [18, 21, 26, 29], "on_ev": [18, 21, 26, 29], "on_loop": [18, 21, 26, 29], "on_rend": [18, 21, 26, 29], "on_cleanup": [18, 21, 26, 29], "on_execut": [18, 21, 26, 29], "render_env": [18, 21, 26, 29], "agent_has_map": 18, "cours": 18, "scenario": 18, "past": 18, "give": 18, "max_tim": [18, 26], "120": [18, 26], "max_step": [18, 26], "fp": [21, 29], "viz_observ": 21, "img": [21, 29], "ry": [21, 29], "rth": [21, 29], "target_color": [21, 29], "init": [21, 29], "event": [21, 29], "display_surf": [21, 29], "decreas": 24, "rover": 24, "influenc": 24, "larger": 24, "robust": 24, "tagenviron": [26, 29], "tagviz": [26, 29], "init_target_posit": 26, "belief_typ": 26, "hist": 26, "planner_typ": 26, "modifi": 36, "_search": 42, "modular": 42, "renam": 42, "gha": 42, "workflow": 42, "branch": 42, "master": 42, "dev": 42, "local": 7, "plane": 7, "befor": 7, "approach": 7, "abil": 7, "upon": 7, "quadrat": 7, "horizont": 7, "coordin": 7, "ultim": 7, "illustr": 7, "intens": 7, "magnitud": 7, "unknown": 7, "variant": 7, "kept": 7, "pull": 7, "lightdarkdomain": 7, "distinguish": 12}, "objects": {"pomdp_py.algorithms": [[3, 0, 0, "-", "bsp"], [2, 0, 0, "-", "po_rollout"], [2, 0, 0, "-", "po_uct"], [2, 0, 0, "-", "pomcp"], [2, 0, 0, "-", "value_iteration"]], "pomdp_py.algorithms.bsp": [[2, 0, 0, "-", "blqr"]], "pomdp_py.algorithms.bsp.blqr": [[2, 1, 1, "", "BLQR"]], "pomdp_py.algorithms.bsp.blqr.BLQR": [[2, 2, 1, "", "create_plan"], [2, 2, 1, "", "ekf_update_mlo"], [2, 2, 1, "", "integrate_belief_segment"], [2, 2, 1, "", "interpret_sqp_plan"], [2, 2, 1, "", "segmented_cost_function"]], "pomdp_py.algorithms.po_rollout": [[2, 1, 1, "", "PORollout"]], "pomdp_py.algorithms.po_rollout.PORollout": [[2, 2, 1, "", "clear_agent"], [2, 3, 1, "", "last_best_reward"], [2, 2, 1, "", "plan"], [2, 2, 1, "", "set_rollout_policy"], [2, 2, 1, "", "update"], [2, 3, 1, "", "update_agent_belief"]], "pomdp_py.algorithms.po_uct": [[2, 1, 1, "", "ActionPrior"], [2, 1, 1, "", "POUCT"], [2, 1, 1, "", "QNode"], [2, 1, 1, "", "RandomRollout"], [2, 1, 1, "", "RolloutPolicy"], [2, 1, 1, "", "RootVNode"], [2, 1, 1, "", "TreeNode"], [2, 1, 1, "", "VNode"]], "pomdp_py.algorithms.po_uct.ActionPrior": [[2, 2, 1, "", "get_preferred_actions"]], "pomdp_py.algorithms.po_uct.POUCT": [[2, 3, 1, "", "action_prior"], [2, 2, 1, "", "clear_agent"], [2, 3, 1, "", "discount_factor"], [2, 3, 1, "", "last_num_sims"], [2, 3, 1, "", "last_planning_time"], [2, 3, 1, "", "max_depth"], [2, 3, 1, "", "num_visits_init"], [2, 2, 1, "", "plan"], [2, 3, 1, "", "rollout_policy"], [2, 2, 1, "", "set_rollout_policy"], [2, 2, 1, "", "update"], [2, 3, 1, "", "updates_agent_belief"], [2, 3, 1, "", "value_init"]], "pomdp_py.algorithms.po_uct.RandomRollout": [[2, 2, 1, "", "rollout"]], "pomdp_py.algorithms.po_uct.RolloutPolicy": [[2, 2, 1, "", "rollout"]], "pomdp_py.algorithms.po_uct.RootVNode": [[2, 2, 1, "", "from_vnode"], [2, 3, 1, "", "history"]], "pomdp_py.algorithms.po_uct.TreeNode": [[2, 3, 1, "", "children"], [2, 3, 1, "", "num_visits"], [2, 3, 1, "", "value"]], "pomdp_py.algorithms.po_uct.VNode": [[2, 2, 1, "", "argmax"], [2, 2, 1, "", "print_children_value"], [2, 3, 1, "", "value"]], "pomdp_py.algorithms.pomcp": [[2, 1, 1, "", "POMCP"], [2, 1, 1, "", "RootVNodeParticles"], [2, 1, 1, "", "VNodeParticles"]], "pomdp_py.algorithms.pomcp.POMCP": [[2, 2, 1, "", "plan"], [2, 2, 1, "", "update"], [2, 3, 1, "", "update_agent_belief"]], "pomdp_py.algorithms.pomcp.RootVNodeParticles": [[2, 3, 1, "", "belief"], [2, 2, 1, "", "from_vnode"]], "pomdp_py.algorithms.pomcp.VNodeParticles": [[2, 3, 1, "", "belief"]], "pomdp_py.algorithms.value_iteration": [[2, 1, 1, "", "ValueIteration"]], "pomdp_py.algorithms.value_iteration.ValueIteration": [[2, 2, 1, "", "plan"]], "pomdp_py.framework": [[5, 0, 0, "-", "basics"], [5, 0, 0, "-", "oopomdp"], [5, 0, 0, "-", "planner"]], "pomdp_py.framework.basics": [[5, 1, 1, "", "Action"], [5, 1, 1, "", "Agent"], [5, 1, 1, "", "BlackboxModel"], [5, 1, 1, "", "Distribution"], [5, 1, 1, "", "Environment"], [5, 1, 1, "", "GenerativeDistribution"], [5, 1, 1, "", "Observation"], [5, 1, 1, "", "ObservationModel"], [5, 1, 1, "", "Option"], [5, 1, 1, "", "POMDP"], [5, 1, 1, "", "PolicyModel"], [5, 1, 1, "", "RewardModel"], [5, 1, 1, "", "State"], [5, 1, 1, "", "TransitionModel"], [5, 4, 1, "", "sample_explict_models"], [5, 4, 1, "", "sample_generative_model"]], "pomdp_py.framework.basics.Agent": [[5, 2, 1, "", "add_attr"], [5, 3, 1, "", "all_actions"], [5, 3, 1, "", "all_observations"], [5, 3, 1, "", "all_states"], [5, 3, 1, "", "belief"], [5, 3, 1, "", "history"], [5, 3, 1, "", "init_belief"], [5, 2, 1, "", "sample_belief"], [5, 2, 1, "", "set_belief"], [5, 2, 1, "", "set_models"], [5, 2, 1, "", "update"], [5, 2, 1, "", "update_history"]], "pomdp_py.framework.basics.BlackboxModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.basics.Distribution": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "__setitem__"]], "pomdp_py.framework.basics.Environment": [[5, 2, 1, "", "apply_transition"], [5, 3, 1, "", "blackbox_model"], [5, 3, 1, "", "cur_state"], [5, 2, 1, "", "provide_observation"], [5, 3, 1, "", "reward_model"], [5, 2, 1, "", "set_models"], [5, 3, 1, "", "state"], [5, 2, 1, "", "state_transition"], [5, 3, 1, "", "transition_model"]], "pomdp_py.framework.basics.GenerativeDistribution": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_histogram"], [5, 2, 1, "", "mpe"]], "pomdp_py.framework.basics.ObservationModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_all_observations"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.basics.Option": [[5, 2, 1, "", "initiate"], [5, 3, 1, "", "policy"], [5, 2, 1, "", "sample"], [5, 2, 1, "", "terminate"]], "pomdp_py.framework.basics.PolicyModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_all_actions"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"], [5, 2, 1, "", "update"]], "pomdp_py.framework.basics.RewardModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.basics.TransitionModel": [[5, 2, 1, "", "argmax"], [5, 2, 1, "", "get_all_states"], [5, 2, 1, "", "get_distribution"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.oopomdp": [[5, 1, 1, "", "DictState"], [5, 1, 1, "", "OOBelief"], [5, 1, 1, "", "OOObservation"], [5, 1, 1, "", "OOObservationModel"], [5, 1, 1, "", "OOPOMDP"], [5, 1, 1, "", "OOState"], [5, 1, 1, "", "OOTransitionModel"], [5, 1, 1, "", "ObjectState"]], "pomdp_py.framework.oopomdp.OOBelief": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "__setitem__"], [5, 2, 1, "", "b"], [5, 2, 1, "", "mpe"], [5, 2, 1, "", "object_belief"], [5, 3, 1, "", "object_beliefs"], [5, 2, 1, "", "random"], [5, 2, 1, "", "set_object_belief"]], "pomdp_py.framework.oopomdp.OOObservation": [[5, 2, 1, "", "factor"], [5, 2, 1, "", "merge"]], "pomdp_py.framework.oopomdp.OOObservationModel": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "argmax"], [5, 3, 1, "", "observation_models"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"]], "pomdp_py.framework.oopomdp.OOState": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "copy"], [5, 2, 1, "", "get_object_attribute"], [5, 2, 1, "", "get_object_class"], [5, 2, 1, "", "get_object_state"], [5, 2, 1, "", "s"], [5, 2, 1, "", "set_object_state"], [5, 3, 1, "", "situation"]], "pomdp_py.framework.oopomdp.OOTransitionModel": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "argmax"], [5, 2, 1, "", "probability"], [5, 2, 1, "", "sample"], [5, 3, 1, "", "transition_models"]], "pomdp_py.framework.oopomdp.ObjectState": [[5, 2, 1, "", "__getitem__"], [5, 2, 1, "", "__setitem__"], [5, 2, 1, "", "copy"]], "pomdp_py.framework.planner": [[5, 1, 1, "", "Planner"]], "pomdp_py.framework.planner.Planner": [[5, 2, 1, "", "plan"], [5, 2, 1, "", "update"], [5, 2, 1, "", "updates_agent_belief"]], "pomdp_py": [[6, 0, 0, "-", "problems"], [37, 0, 0, "-", "utils"]], "pomdp_py.problems.light_dark": [[10, 0, 0, "-", "env"]], "pomdp_py.problems.light_dark.env": [[10, 0, 0, "-", "env"], [10, 0, 0, "-", "plotting"]], "pomdp_py.problems.light_dark.env.env": [[10, 1, 1, "", "LightDarkEnvironment"]], "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment": [[10, 5, 1, "", "const"], [10, 5, 1, "", "light"]], "pomdp_py.problems.light_dark.env.plotting": [[10, 4, 1, "", "plot_circle"], [10, 4, 1, "", "plot_line"], [10, 4, 1, "", "plot_points"], [10, 4, 1, "", "plot_polygons"]], "pomdp_py.problems": [[12, 0, 0, "-", "load_unload"], [13, 0, 0, "-", "maze"], [18, 0, 0, "-", "multi_object_search"], [24, 0, 0, "-", "rocksample"], [26, 0, 0, "-", "tag"], [32, 0, 0, "-", "tiger"]], "pomdp_py.problems.load_unload": [[12, 0, 0, "-", "load_unload"]], "pomdp_py.problems.load_unload.load_unload": [[12, 1, 1, "", "LUAction"], [12, 1, 1, "", "LUObservation"], [12, 1, 1, "", "LUObservationModel"], [12, 1, 1, "", "LUPolicyModel"], [12, 1, 1, "", "LURewardModel"], [12, 1, 1, "", "LUState"], [12, 1, 1, "", "LUTransitionModel"], [12, 1, 1, "", "LoadUnloadProblem"], [12, 4, 1, "", "generate_init_belief"], [12, 4, 1, "", "generate_random_state"], [12, 4, 1, "", "main"], [12, 4, 1, "", "test_planner"]], "pomdp_py.problems.load_unload.load_unload.LUObservationModel": [[12, 2, 1, "", "argmax"], [12, 2, 1, "", "probability"], [12, 2, 1, "", "sample"]], "pomdp_py.problems.load_unload.load_unload.LUPolicyModel": [[12, 2, 1, "", "argmax"], [12, 2, 1, "", "get_all_actions"], [12, 2, 1, "", "probability"], [12, 2, 1, "", "sample"]], "pomdp_py.problems.load_unload.load_unload.LURewardModel": [[12, 2, 1, "", "argmax"], [12, 2, 1, "", "probability"], [12, 2, 1, "", "sample"]], "pomdp_py.problems.load_unload.load_unload.LUTransitionModel": [[12, 2, 1, "", "argmax"], [12, 2, 1, "", "probability"], [12, 2, 1, "", "sample"]], "pomdp_py.problems.maze": [[14, 0, 0, "-", "domain"], [15, 0, 0, "-", "env"], [16, 0, 0, "-", "models"]], "pomdp_py.problems.maze.domain": [[14, 0, 0, "-", "action"], [14, 0, 0, "-", "observation"], [14, 0, 0, "-", "state"]], "pomdp_py.problems.maze.domain.observation": [[14, 1, 1, "", "Observation"]], "pomdp_py.problems.maze.domain.state": [[14, 1, 1, "", "State"]], "pomdp_py.problems.maze.env": [[15, 0, 0, "-", "env"]], "pomdp_py.problems.maze.env.env": [[15, 1, 1, "", "MazeEnvironment"]], "pomdp_py.problems.maze.models": [[17, 0, 0, "-", "components"]], "pomdp_py.problems.multi_object_search": [[19, 0, 0, "-", "agent"], [20, 0, 0, "-", "domain"], [21, 0, 0, "-", "env"], [18, 0, 0, "-", "example_worlds"], [22, 0, 0, "-", "models"], [18, 0, 0, "-", "problem"]], "pomdp_py.problems.multi_object_search.agent": [[19, 0, 0, "-", "agent"], [19, 0, 0, "-", "belief"]], "pomdp_py.problems.multi_object_search.agent.agent": [[19, 1, 1, "", "MosAgent"]], "pomdp_py.problems.multi_object_search.agent.agent.MosAgent": [[19, 2, 1, "", "clear_history"]], "pomdp_py.problems.multi_object_search.agent.belief": [[19, 1, 1, "", "MosOOBelief"], [19, 4, 1, "", "initialize_belief"]], "pomdp_py.problems.multi_object_search.agent.belief.MosOOBelief": [[19, 2, 1, "", "mpe"], [19, 2, 1, "", "random"]], "pomdp_py.problems.multi_object_search.domain": [[20, 0, 0, "-", "action"], [20, 0, 0, "-", "observation"], [20, 0, 0, "-", "state"]], "pomdp_py.problems.multi_object_search.domain.action": [[20, 1, 1, "", "Action"], [20, 1, 1, "", "FindAction"], [20, 1, 1, "", "LookAction"], [20, 1, 1, "", "MotionAction"]], "pomdp_py.problems.multi_object_search.domain.action.MotionAction": [[20, 3, 1, "", "BACKWARD"], [20, 3, 1, "", "EAST"], [20, 3, 1, "", "EAST2D"], [20, 3, 1, "", "FORWARD"], [20, 3, 1, "", "LEFT"], [20, 3, 1, "", "NORTH"], [20, 3, 1, "", "NORTH2D"], [20, 3, 1, "", "RIGHT"], [20, 3, 1, "", "SCHEMES"], [20, 3, 1, "", "SCHEME_VW"], [20, 3, 1, "", "SCHEME_XY"], [20, 3, 1, "", "SCHEME_XYTH"], [20, 3, 1, "", "SOUTH"], [20, 3, 1, "", "SOUTH2D"], [20, 3, 1, "", "WEST"], [20, 3, 1, "", "WEST2D"]], "pomdp_py.problems.multi_object_search.domain.observation": [[20, 1, 1, "", "MosOOObservation"], [20, 1, 1, "", "ObjectObservation"]], "pomdp_py.problems.multi_object_search.domain.observation.MosOOObservation": [[20, 2, 1, "", "factor"], [20, 2, 1, "", "for_obj"], [20, 2, 1, "", "merge"]], "pomdp_py.problems.multi_object_search.domain.observation.ObjectObservation": [[20, 3, 1, "", "NULL"]], "pomdp_py.problems.multi_object_search.domain.state": [[20, 1, 1, "", "MosOOState"], [20, 1, 1, "", "ObjectState"], [20, 1, 1, "", "RobotState"]], "pomdp_py.problems.multi_object_search.domain.state.MosOOState": [[20, 2, 1, "", "object_pose"], [20, 5, 1, "", "object_poses"], [20, 2, 1, "", "pose"]], "pomdp_py.problems.multi_object_search.domain.state.ObjectState": [[20, 5, 1, "", "objid"], [20, 5, 1, "", "pose"]], "pomdp_py.problems.multi_object_search.domain.state.RobotState": [[20, 5, 1, "", "objects_found"], [20, 5, 1, "", "pose"], [20, 5, 1, "", "robot_pose"]], "pomdp_py.problems.multi_object_search.env": [[21, 0, 0, "-", "env"], [21, 0, 0, "-", "visual"]], "pomdp_py.problems.multi_object_search.env.env": [[21, 1, 1, "", "MosEnvironment"], [21, 4, 1, "", "equip_sensors"], [21, 4, 1, "", "interpret"], [21, 4, 1, "", "interpret_robot_id"], [21, 4, 1, "", "make_laser_sensor"], [21, 4, 1, "", "make_proximity_sensor"]], "pomdp_py.problems.multi_object_search.env.env.MosEnvironment": [[21, 5, 1, "", "robot_ids"], [21, 2, 1, "", "state_transition"]], "pomdp_py.problems.multi_object_search.env.visual": [[21, 1, 1, "", "MosViz"], [21, 4, 1, "", "object_color"], [21, 4, 1, "", "unittest"]], "pomdp_py.problems.multi_object_search.env.visual.MosViz": [[21, 2, 1, "", "draw_belief"], [21, 2, 1, "", "draw_observation"], [21, 2, 1, "", "draw_robot"], [21, 5, 1, "", "img_height"], [21, 5, 1, "", "img_width"], [21, 5, 1, "", "last_observation"], [21, 2, 1, "", "on_cleanup"], [21, 2, 1, "", "on_event"], [21, 2, 1, "", "on_execute"], [21, 2, 1, "", "on_init"], [21, 2, 1, "", "on_loop"], [21, 2, 1, "", "on_render"], [21, 2, 1, "", "render_env"], [21, 2, 1, "", "update"]], "pomdp_py.problems.multi_object_search.example_worlds": [[18, 4, 1, "", "random_world"]], "pomdp_py.problems.multi_object_search.models": [[23, 0, 0, "-", "components"], [22, 0, 0, "-", "observation_model"], [22, 0, 0, "-", "policy_model"], [22, 0, 0, "-", "reward_model"], [22, 0, 0, "-", "transition_model"]], "pomdp_py.problems.multi_object_search.models.components": [[23, 0, 0, "-", "grid_map"], [23, 0, 0, "-", "sensor"]], "pomdp_py.problems.multi_object_search.models.components.grid_map": [[23, 1, 1, "", "GridMap"]], "pomdp_py.problems.multi_object_search.models.components.grid_map.GridMap": [[23, 2, 1, "", "valid_motions"]], "pomdp_py.problems.multi_object_search.models.components.sensor": [[23, 1, 1, "", "Laser2DSensor"], [23, 1, 1, "", "ProximitySensor"], [23, 1, 1, "", "Sensor"], [23, 4, 1, "", "euclidean_dist"], [23, 4, 1, "", "in_range"], [23, 4, 1, "", "to_rad"]], "pomdp_py.problems.multi_object_search.models.components.sensor.Laser2DSensor": [[23, 2, 1, "", "in_field_of_view"], [23, 2, 1, "", "observe"], [23, 5, 1, "", "sensing_region_size"], [23, 2, 1, "", "shoot_beam"], [23, 2, 1, "", "valid_beam"], [23, 2, 1, "", "within_range"]], "pomdp_py.problems.multi_object_search.models.components.sensor.Sensor": [[23, 3, 1, "", "LASER"], [23, 3, 1, "", "PROXIMITY"], [23, 2, 1, "", "observe"], [23, 5, 1, "", "robot_id"], [23, 5, 1, "", "sensing_region_size"], [23, 2, 1, "", "within_range"]], "pomdp_py.problems.multi_object_search.models.observation_model": [[22, 1, 1, "", "MosObservationModel"], [22, 1, 1, "", "ObjectObservationModel"], [22, 4, 1, "", "unittest"]], "pomdp_py.problems.multi_object_search.models.observation_model.MosObservationModel": [[22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.observation_model.ObjectObservationModel": [[22, 2, 1, "", "argmax"], [22, 2, 1, "", "probability"], [22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.policy_model": [[22, 1, 1, "", "PolicyModel"]], "pomdp_py.problems.multi_object_search.models.policy_model.PolicyModel": [[22, 2, 1, "", "argmax"], [22, 2, 1, "", "get_all_actions"], [22, 2, 1, "", "probability"], [22, 2, 1, "", "rollout"], [22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.reward_model": [[22, 1, 1, "", "GoalRewardModel"], [22, 1, 1, "", "MosRewardModel"]], "pomdp_py.problems.multi_object_search.models.reward_model.MosRewardModel": [[22, 2, 1, "", "argmax"], [22, 2, 1, "", "probability"], [22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.transition_model": [[22, 1, 1, "", "MosTransitionModel"], [22, 1, 1, "", "RobotTransitionModel"], [22, 1, 1, "", "StaticObjectTransitionModel"], [22, 4, 1, "", "in_boundary"], [22, 4, 1, "", "valid_pose"]], "pomdp_py.problems.multi_object_search.models.transition_model.MosTransitionModel": [[22, 2, 1, "", "argmax"], [22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.transition_model.RobotTransitionModel": [[22, 2, 1, "", "argmax"], [22, 2, 1, "", "if_move_by"], [22, 2, 1, "", "probability"], [22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.models.transition_model.StaticObjectTransitionModel": [[22, 2, 1, "", "argmax"], [22, 2, 1, "", "probability"], [22, 2, 1, "", "sample"]], "pomdp_py.problems.multi_object_search.problem": [[18, 1, 1, "", "MosOOPOMDP"], [18, 4, 1, "", "belief_update"], [18, 4, 1, "", "solve"], [18, 4, 1, "", "unittest"]], "pomdp_py.problems.rocksample": [[25, 0, 0, "-", "cythonize"], [24, 0, 0, "-", "rocksample_problem"]], "pomdp_py.problems.rocksample.cythonize": [[25, 0, 0, "module-2", "rocksample_problem"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem": [[25, 1, 1, "id99", "CheckAction"], [25, 1, 1, "id101", "MoveAction"], [25, 1, 1, "id107", "RSAction"], [25, 1, 1, "id108", "RSObservation"], [25, 1, 1, "id110", "RSObservationModel"], [25, 1, 1, "id114", "RSPolicyModel"], [25, 1, 1, "id120", "RSRewardModel"], [25, 1, 1, "id124", "RSState"], [25, 1, 1, "id128", "RSTransitionModel"], [25, 1, 1, "id132", "RockSampleProblem"], [25, 1, 1, "id137", "RockType"], [25, 1, 1, "id142", "SampleAction"], [25, 4, 1, "id143", "euclidean_dist"], [25, 4, 1, "id144", "init_particles_belief"], [25, 4, 1, "id145", "main"], [25, 4, 1, "id146", "test_planner"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.CheckAction": [[25, 3, 1, "id100", "rock_id"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction": [[25, 3, 1, "id102", "EAST"], [25, 3, 1, "id103", "NORTH"], [25, 3, 1, "id104", "SOUTH"], [25, 3, 1, "id105", "WEST"], [25, 3, 1, "id106", "motion"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservation": [[25, 3, 1, "id109", "quality"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel": [[25, 2, 1, "id111", "argmax"], [25, 2, 1, "id112", "probability"], [25, 2, 1, "id113", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel": [[25, 2, 1, "id115", "argmax"], [25, 2, 1, "id116", "get_all_actions"], [25, 2, 1, "id117", "probability"], [25, 2, 1, "id118", "rollout"], [25, 2, 1, "id119", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel": [[25, 2, 1, "id121", "argmax"], [25, 2, 1, "id122", "probability"], [25, 2, 1, "id123", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState": [[25, 3, 1, "id125", "position"], [25, 3, 1, "id126", "rocktypes"], [25, 3, 1, "id127", "terminal"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel": [[25, 2, 1, "id129", "argmax"], [25, 2, 1, "id130", "probability"], [25, 2, 1, "id131", "sample"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem": [[25, 2, 1, "id133", "generate_instance"], [25, 2, 1, "id134", "in_exit_area"], [25, 2, 1, "id135", "print_state"], [25, 2, 1, "id136", "random_free_location"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType": [[25, 3, 1, "id138", "BAD"], [25, 3, 1, "id139", "GOOD"], [25, 2, 1, "id140", "invert"], [25, 2, 1, "id141", "random"]], "pomdp_py.problems.rocksample.rocksample_problem": [[24, 1, 1, "", "Action"], [24, 1, 1, "", "CheckAction"], [24, 1, 1, "", "MoveAction"], [24, 1, 1, "", "Observation"], [24, 1, 1, "", "RSObservationModel"], [24, 1, 1, "", "RSPolicyModel"], [24, 1, 1, "", "RSRewardModel"], [24, 1, 1, "", "RSTransitionModel"], [24, 1, 1, "", "RockSampleProblem"], [24, 1, 1, "", "RockType"], [24, 1, 1, "", "SampleAction"], [24, 1, 1, "", "State"], [24, 4, 1, "", "create_instance"], [24, 4, 1, "", "euclidean_dist"], [24, 4, 1, "", "init_particles_belief"], [24, 4, 1, "", "main"], [24, 4, 1, "", "minimal_instance"], [24, 4, 1, "", "test_planner"]], "pomdp_py.problems.rocksample.rocksample_problem.MoveAction": [[24, 3, 1, "", "EAST"], [24, 3, 1, "", "NORTH"], [24, 3, 1, "", "SOUTH"], [24, 3, 1, "", "WEST"]], "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel": [[24, 2, 1, "", "argmax"], [24, 2, 1, "", "probability"], [24, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel": [[24, 2, 1, "", "argmax"], [24, 2, 1, "", "get_all_actions"], [24, 2, 1, "", "probability"], [24, 2, 1, "", "rollout"], [24, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel": [[24, 2, 1, "", "argmax"], [24, 2, 1, "", "probability"], [24, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel": [[24, 2, 1, "", "argmax"], [24, 2, 1, "", "probability"], [24, 2, 1, "", "sample"]], "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem": [[24, 2, 1, "", "generate_instance"], [24, 2, 1, "", "in_exit_area"], [24, 2, 1, "", "print_state"], [24, 2, 1, "", "random_free_location"]], "pomdp_py.problems.rocksample.rocksample_problem.RockType": [[24, 3, 1, "", "BAD"], [24, 3, 1, "", "GOOD"], [24, 2, 1, "", "invert"], [24, 2, 1, "", "random"]], "pomdp_py.problems.tag": [[27, 0, 0, "-", "agent"], [26, 0, 0, "-", "constants"], [28, 0, 0, "-", "domain"], [29, 0, 0, "-", "env"], [26, 0, 0, "-", "example_worlds"], [26, 0, 0, "-", "experiment"], [30, 0, 0, "-", "models"], [26, 0, 0, "-", "problem"]], "pomdp_py.problems.tag.agent": [[27, 0, 0, "-", "agent"]], "pomdp_py.problems.tag.agent.agent": [[27, 1, 1, "", "TagAgent"], [27, 4, 1, "", "belief_update"], [27, 4, 1, "", "initialize_belief"], [27, 4, 1, "", "initialize_particles_belief"]], "pomdp_py.problems.tag.agent.agent.TagAgent": [[27, 2, 1, "", "clear_history"]], "pomdp_py.problems.tag.domain": [[28, 0, 0, "-", "action"], [28, 0, 0, "-", "observation"], [28, 0, 0, "-", "state"]], "pomdp_py.problems.tag.domain.action": [[28, 1, 1, "", "TagAction"]], "pomdp_py.problems.tag.domain.observation": [[28, 1, 1, "", "TagObservation"]], "pomdp_py.problems.tag.domain.state": [[28, 1, 1, "", "TagState"]], "pomdp_py.problems.tag.env": [[29, 0, 0, "-", "env"], [29, 0, 0, "-", "visual"]], "pomdp_py.problems.tag.env.env": [[29, 1, 1, "", "TagEnvironment"]], "pomdp_py.problems.tag.env.env.TagEnvironment": [[29, 2, 1, "", "from_str"], [29, 5, 1, "", "grid_map"], [29, 5, 1, "", "length"], [29, 5, 1, "", "width"]], "pomdp_py.problems.tag.env.visual": [[29, 1, 1, "", "TagViz"], [29, 4, 1, "", "unittest"]], "pomdp_py.problems.tag.env.visual.TagViz": [[29, 2, 1, "", "draw_belief"], [29, 2, 1, "", "draw_observation"], [29, 2, 1, "", "draw_robot"], [29, 5, 1, "", "img_height"], [29, 5, 1, "", "img_width"], [29, 5, 1, "", "last_observation"], [29, 2, 1, "", "on_cleanup"], [29, 2, 1, "", "on_event"], [29, 2, 1, "", "on_execute"], [29, 2, 1, "", "on_init"], [29, 2, 1, "", "on_loop"], [29, 2, 1, "", "on_render"], [29, 2, 1, "", "render_env"], [29, 2, 1, "", "update"]], "pomdp_py.problems.tag.experiment": [[26, 4, 1, "", "main"], [26, 4, 1, "", "trial"]], "pomdp_py.problems.tag.models": [[31, 0, 0, "-", "components"], [30, 0, 0, "-", "observation_model"], [30, 0, 0, "-", "policy_model"], [30, 0, 0, "-", "reward_model"], [30, 0, 0, "-", "transition_model"]], "pomdp_py.problems.tag.models.components": [[31, 0, 0, "-", "grid_map"], [31, 0, 0, "-", "motion_policy"]], "pomdp_py.problems.tag.models.components.grid_map": [[31, 1, 1, "", "GridMap"]], "pomdp_py.problems.tag.models.components.grid_map.GridMap": [[31, 2, 1, "", "free_cells"], [31, 2, 1, "", "from_str"], [31, 2, 1, "", "valid_motions"], [31, 2, 1, "", "valid_pose"]], "pomdp_py.problems.tag.models.components.motion_policy": [[31, 1, 1, "", "TagTargetMotionPolicy"]], "pomdp_py.problems.tag.models.components.motion_policy.TagTargetMotionPolicy": [[31, 2, 1, "", "mpe"], [31, 2, 1, "", "probability"], [31, 2, 1, "", "random"]], "pomdp_py.problems.tag.models.observation_model": [[30, 1, 1, "", "TagObservationModel"]], "pomdp_py.problems.tag.models.observation_model.TagObservationModel": [[30, 2, 1, "", "argmax"], [30, 2, 1, "", "probability"], [30, 2, 1, "", "sample"]], "pomdp_py.problems.tag.models.policy_model": [[30, 1, 1, "", "TagPolicyModel"]], "pomdp_py.problems.tag.models.policy_model.TagPolicyModel": [[30, 2, 1, "", "get_all_actions"], [30, 2, 1, "", "rollout"], [30, 2, 1, "", "sample"]], "pomdp_py.problems.tag.models.reward_model": [[30, 1, 1, "", "TagRewardModel"]], "pomdp_py.problems.tag.models.reward_model.TagRewardModel": [[30, 2, 1, "", "probability"], [30, 2, 1, "", "sample"]], "pomdp_py.problems.tag.models.transition_model": [[30, 1, 1, "", "TagTransitionModel"]], "pomdp_py.problems.tag.models.transition_model.TagTransitionModel": [[30, 2, 1, "", "argmax"], [30, 2, 1, "", "if_move_by"], [30, 2, 1, "", "probability"], [30, 2, 1, "", "sample"]], "pomdp_py.problems.tag.problem": [[26, 1, 1, "", "TagProblem"], [26, 4, 1, "", "main"], [26, 4, 1, "", "solve"]], "pomdp_py.problems.tiger": [[33, 0, 0, "-", "cythonize"], [32, 0, 0, "-", "tiger_problem"]], "pomdp_py.problems.tiger.cythonize": [[33, 0, 0, "module-2", "tiger_problem"]], "pomdp_py.problems.tiger.cythonize.tiger_problem": [[33, 1, 1, "id80", "TigerAction"], [33, 1, 1, "id81", "TigerObservation"], [33, 1, 1, "id83", "TigerObservationModel"], [33, 1, 1, "id89", "TigerPolicyModel"], [33, 1, 1, "id94", "TigerProblem"], [33, 1, 1, "id98", "TigerRewardModel"], [33, 1, 1, "id103", "TigerState"], [33, 1, 1, "id105", "TigerTransitionModel"], [33, 4, 1, "id111", "build_actions"], [33, 4, 1, "id112", "build_observations"], [33, 4, 1, "id113", "build_setting"], [33, 4, 1, "id114", "build_states"], [33, 4, 1, "id115", "main"], [33, 4, 1, "id116", "test_planner"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation": [[33, 3, 1, "id82", "name"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel": [[33, 2, 1, "id84", "argmax"], [33, 2, 1, "id85", "get_all_observations"], [33, 2, 1, "id86", "get_distribution"], [33, 2, 1, "id87", "probability"], [33, 2, 1, "id88", "sample"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel": [[33, 2, 1, "id90", "argmax"], [33, 2, 1, "id91", "get_all_actions"], [33, 2, 1, "id92", "probability"], [33, 2, 1, "id93", "sample"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem": [[33, 3, 1, "id95", "ACTIONS"], [33, 3, 1, "id96", "OBSERVATIONS"], [33, 3, 1, "id97", "STATES"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel": [[33, 2, 1, "id99", "argmax"], [33, 2, 1, "id100", "get_distribution"], [33, 2, 1, "id101", "probability"], [33, 2, 1, "id102", "sample"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerState": [[33, 3, 1, "id104", "name"]], "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel": [[33, 2, 1, "id106", "argmax"], [33, 2, 1, "id107", "get_all_states"], [33, 2, 1, "id108", "get_distribution"], [33, 2, 1, "id109", "probability"], [33, 2, 1, "id110", "sample"]], "pomdp_py.problems.tiger.tiger_problem": [[32, 1, 1, "", "ObservationModel"], [32, 1, 1, "", "PolicyModel"], [32, 1, 1, "", "RewardModel"], [32, 1, 1, "", "TigerAction"], [32, 1, 1, "", "TigerObservation"], [32, 1, 1, "", "TigerProblem"], [32, 1, 1, "", "TigerState"], [32, 1, 1, "", "TransitionModel"], [32, 4, 1, "", "main"], [32, 4, 1, "", "make_tiger"], [32, 4, 1, "", "test_planner"]], "pomdp_py.problems.tiger.tiger_problem.ObservationModel": [[32, 2, 1, "", "get_all_observations"], [32, 2, 1, "", "probability"], [32, 2, 1, "", "sample"]], "pomdp_py.problems.tiger.tiger_problem.PolicyModel": [[32, 3, 1, "", "ACTIONS"], [32, 2, 1, "", "get_all_actions"], [32, 2, 1, "", "rollout"], [32, 2, 1, "", "sample"]], "pomdp_py.problems.tiger.tiger_problem.RewardModel": [[32, 2, 1, "", "sample"]], "pomdp_py.problems.tiger.tiger_problem.TigerProblem": [[32, 2, 1, "", "create"]], "pomdp_py.problems.tiger.tiger_problem.TigerState": [[32, 2, 1, "", "other"]], "pomdp_py.problems.tiger.tiger_problem.TransitionModel": [[32, 2, 1, "", "get_all_states"], [32, 2, 1, "", "probability"], [32, 2, 1, "", "sample"]], "pomdp_py.representations.belief": [[35, 0, 0, "-", "histogram"], [35, 0, 0, "-", "particles"]], "pomdp_py.representations.belief.histogram": [[35, 4, 1, "", "abstraction_over_histogram"], [35, 4, 1, "", "update_histogram_belief"]], "pomdp_py.representations.belief.particles": [[35, 4, 1, "", "abstraction_over_particles"], [35, 4, 1, "", "particle_reinvigoration"], [35, 4, 1, "", "update_particles_belief"]], "pomdp_py.representations.distribution": [[36, 0, 0, "-", "gaussian"], [36, 0, 0, "-", "histogram"], [36, 0, 0, "-", "particles"]], "pomdp_py.representations.distribution.gaussian": [[36, 1, 1, "", "Gaussian"]], "pomdp_py.representations.distribution.gaussian.Gaussian": [[36, 2, 1, "", "__getitem__"], [36, 2, 1, "", "__setitem__"], [36, 3, 1, "", "cov"], [36, 3, 1, "", "covariance"], [36, 3, 1, "", "mean"], [36, 2, 1, "", "mpe"], [36, 2, 1, "", "random"], [36, 3, 1, "", "sigma"]], "pomdp_py.representations.distribution.histogram": [[36, 1, 1, "", "Histogram"]], "pomdp_py.representations.distribution.histogram.Histogram": [[36, 2, 1, "", "__getitem__"], [36, 2, 1, "", "__setitem__"], [36, 2, 1, "", "get_histogram"], [36, 3, 1, "", "histogram"], [36, 2, 1, "", "is_normalized"], [36, 2, 1, "", "mpe"], [36, 2, 1, "", "random"]], "pomdp_py.representations.distribution.particles": [[36, 1, 1, "", "Particles"], [36, 1, 1, "", "WeightedParticles"]], "pomdp_py.representations.distribution.particles.Particles": [[36, 2, 1, "", "add"], [36, 2, 1, "", "from_histogram"], [36, 2, 1, "", "get_abstraction"], [36, 2, 1, "", "get_histogram"], [36, 3, 1, "", "particles"], [36, 2, 1, "", "random"]], "pomdp_py.representations.distribution.particles.WeightedParticles": [[36, 2, 1, "", "__getitem__"], [36, 2, 1, "", "__setitem__"], [36, 2, 1, "", "add"], [36, 2, 1, "", "condense"], [36, 2, 1, "", "from_histogram"], [36, 3, 1, "", "frozen"], [36, 2, 1, "", "get_histogram"], [36, 2, 1, "", "mpe"], [36, 3, 1, "", "particles"], [36, 2, 1, "", "random"], [36, 3, 1, "", "values"], [36, 3, 1, "", "weights"]], "pomdp_py.utils": [[37, 0, 0, "-", "colors"], [37, 0, 0, "-", "cython_utils"], [37, 0, 0, "-", "debugging"], [37, 0, 0, "-", "math"], [37, 0, 0, "-", "misc"], [37, 0, 0, "-", "templates"], [37, 0, 0, "-", "typ"]], "pomdp_py.utils.colors": [[37, 4, 1, "", "hex_to_rgb"], [37, 4, 1, "", "inverse_color_hex"], [37, 4, 1, "", "inverse_color_rgb"], [37, 4, 1, "", "lighter"], [37, 4, 1, "", "random_unique_color"], [37, 4, 1, "", "rgb_to_hex"]], "pomdp_py.utils.cython_utils": [[37, 4, 1, "", "det_dict_hash"]], "pomdp_py.utils.debugging": [[37, 1, 1, "", "TreeDebugger"], [37, 4, 1, "", "interpret_color"], [37, 4, 1, "", "sorted_by_str"]], "pomdp_py.utils.debugging.TreeDebugger": [[37, 5, 1, "", "b"], [37, 2, 1, "", "back"], [37, 5, 1, "", "bestseq"], [37, 2, 1, "", "bestseqd"], [37, 5, 1, "", "c"], [37, 5, 1, "", "clear"], [37, 5, 1, "", "d"], [37, 5, 1, "", "depth"], [37, 2, 1, "", "l"], [37, 2, 1, "", "layer"], [37, 5, 1, "", "leaf"], [37, 2, 1, "", "mark"], [37, 2, 1, "", "mark_path"], [37, 2, 1, "", "mark_sequence"], [37, 2, 1, "", "markp"], [37, 5, 1, "", "mbp"], [37, 5, 1, "", "nl"], [37, 5, 1, "", "nn"], [37, 5, 1, "", "nq"], [37, 5, 1, "", "num_layers"], [37, 2, 1, "", "num_nodes"], [37, 5, 1, "", "nv"], [37, 2, 1, "", "p"], [37, 2, 1, "", "path"], [37, 2, 1, "", "path_to"], [37, 5, 1, "", "pm"], [37, 5, 1, "", "pp"], [37, 2, 1, "", "preferred_actions"], [37, 5, 1, "", "r"], [37, 5, 1, "", "root"], [37, 2, 1, "", "s"], [37, 2, 1, "", "single_node_str"], [37, 2, 1, "", "step"], [37, 2, 1, "", "tree_stats"]], "pomdp_py.utils.interfaces.conversion": [[46, 1, 1, "", "AlphaVectorPolicy"], [46, 1, 1, "", "PolicyGraph"], [46, 4, 1, "", "to_pomdp_file"], [46, 4, 1, "", "to_pomdpx_file"]], "pomdp_py.utils.interfaces.conversion.AlphaVectorPolicy": [[46, 2, 1, "", "construct"], [46, 2, 1, "", "plan"], [46, 2, 1, "", "value"]], "pomdp_py.utils.interfaces.conversion.PolicyGraph": [[46, 2, 1, "", "construct"], [46, 2, 1, "", "plan"], [46, 2, 1, "", "update"]], "pomdp_py.utils.interfaces": [[46, 0, 0, "-", "solvers"]], "pomdp_py.utils.interfaces.solvers": [[46, 4, 1, "", "sarsop"], [46, 4, 1, "", "vi_pruning"]], "pomdp_py.utils.math": [[37, 4, 1, "", "R_between"], [37, 4, 1, "", "R_x"], [37, 4, 1, "", "R_y"], [37, 4, 1, "", "R_z"], [37, 4, 1, "", "T"], [37, 4, 1, "", "approx_equal"], [37, 4, 1, "", "euclidean_dist"], [37, 4, 1, "", "proj"], [37, 4, 1, "", "to_radians"], [37, 4, 1, "", "vec"]], "pomdp_py.utils.misc": [[37, 4, 1, "", "json_safe"], [37, 4, 1, "", "remap"], [37, 4, 1, "", "safe_slice"], [37, 4, 1, "", "similar"], [37, 1, 1, "", "special_char"]], "pomdp_py.utils.misc.special_char": [[37, 3, 1, "", "SUBSCRIPT"], [37, 3, 1, "", "bottomleft"], [37, 3, 1, "", "bottomright"], [37, 3, 1, "", "bottomt"], [37, 3, 1, "", "down"], [37, 3, 1, "", "hline"], [37, 3, 1, "", "intersect"], [37, 3, 1, "", "left"], [37, 3, 1, "", "leftt"], [37, 3, 1, "", "longbottomleft"], [37, 3, 1, "", "longbottomright"], [37, 3, 1, "", "longleft"], [37, 3, 1, "", "longright"], [37, 3, 1, "", "longtopleft"], [37, 3, 1, "", "longtopright"], [37, 3, 1, "", "right"], [37, 3, 1, "", "rightt"], [37, 3, 1, "", "shadebar"], [37, 3, 1, "", "topleft"], [37, 3, 1, "", "topright"], [37, 3, 1, "", "topt"], [37, 3, 1, "", "up"], [37, 3, 1, "", "vline"]], "pomdp_py.utils.templates": [[37, 1, 1, "", "DetObservationModel"], [37, 1, 1, "", "DetRewardModel"], [37, 1, 1, "", "DetTransitionModel"], [37, 1, 1, "", "SimpleAction"], [37, 1, 1, "", "SimpleObservation"], [37, 1, 1, "", "SimpleState"], [37, 1, 1, "", "TabularObservationModel"], [37, 1, 1, "", "TabularRewardModel"], [37, 1, 1, "", "TabularTransitionModel"], [37, 1, 1, "", "UniformPolicyModel"]], "pomdp_py.utils.templates.DetObservationModel": [[37, 2, 1, "", "probability"], [37, 2, 1, "", "sample"]], "pomdp_py.utils.templates.DetRewardModel": [[37, 2, 1, "", "argmax"], [37, 2, 1, "", "reward_func"], [37, 2, 1, "", "sample"]], "pomdp_py.utils.templates.DetTransitionModel": [[37, 2, 1, "", "probability"], [37, 2, 1, "", "sample"]], "pomdp_py.utils.templates.TabularObservationModel": [[37, 2, 1, "", "get_all_observations"], [37, 2, 1, "", "probability"], [37, 2, 1, "", "sample"]], "pomdp_py.utils.templates.TabularRewardModel": [[37, 2, 1, "", "sample"]], "pomdp_py.utils.templates.TabularTransitionModel": [[37, 2, 1, "", "get_all_states"], [37, 2, 1, "", "probability"], [37, 2, 1, "", "sample"]], "pomdp_py.utils.templates.UniformPolicyModel": [[37, 2, 1, "", "get_all_actions"], [37, 2, 1, "", "rollout"], [37, 2, 1, "", "sample"]], "pomdp_py.utils.typ": [[37, 1, 1, "", "bcolors"], [37, 4, 1, "", "blue"], [37, 4, 1, "", "bold"], [37, 4, 1, "", "cyan"], [37, 4, 1, "", "error"], [37, 4, 1, "", "green"], [37, 4, 1, "", "info"], [37, 4, 1, "", "magenta"], [37, 4, 1, "", "note"], [37, 4, 1, "", "red"], [37, 4, 1, "", "success"], [37, 4, 1, "", "warning"], [37, 4, 1, "", "white"], [37, 4, 1, "", "yellow"]], "pomdp_py.utils.typ.bcolors": [[37, 3, 1, "", "BLUE"], [37, 3, 1, "", "BOLD"], [37, 3, 1, "", "CYAN"], [37, 3, 1, "", "ENDC"], [37, 3, 1, "", "GREEN"], [37, 3, 1, "", "MAGENTA"], [37, 3, 1, "", "RED"], [37, 3, 1, "", "WHITE"], [37, 3, 1, "", "YELLOW"], [37, 2, 1, "", "disable"], [37, 2, 1, "", "s"]]}, "objtypes": {"0": "py:module", "1": "py:class", "2": "py:method", "3": "py:attribute", "4": "py:function", "5": "py:property"}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "class", "Python class"], "2": ["py", "method", "Python method"], "3": ["py", "attribute", "Python attribute"], "4": ["py", "function", "Python function"], "5": ["py", "property", "Python property"]}, "titleterms": {"pomdp_pi": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 46, 52], "packag": [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 39, 40], "algorithm": [2, 3, 4], "po_rollout": 2, "modul": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40], "po_uct": 2, "pomcp": 2, "value_iter": 2, "bsp": [2, 3], "blqr": [2, 3], "visual": [2, 4, 10, 21, 29, 40], "submodul": [3, 4, 7, 8, 9, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 37, 40], "content": [3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 37, 40, 46, 53], "framework": 5, "basic": 5, "oopomdp": 5, "planner": 5, "problem": [6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 41, 47], "subpackag": [6, 7, 13, 16, 18, 22, 24, 26, 30, 32, 37], "lasertag": [], "light_dark": [7, 8, 9, 10, 11], "problem_discret": 7, "test": [7, 53], "agent": [8, 19, 27, 46], "belief": [8, 19, 35], "domain": [9, 14, 20, 28, 48, 49], "action": [9, 14, 20, 28, 45], "observ": [9, 14, 20, 28], "state": [9, 14, 20, 28], "env": [10, 15, 21, 29], "plot": [10, 37], "model": [11, 16, 17, 22, 23, 30, 31, 48], "observation_model": [11, 22, 30], "transition_model": [11, 22, 30], "load_unload": 12, "maze": [13, 14, 15, 16, 17], "compon": [17, 23, 31], "map": 17, "multi_object_search": [18, 19, 20, 21, 22, 23], "example_world": [18, 26], "policy_model": [22, 30], "reward_model": [22, 30], "grid_map": [23, 31], "sensor": 23, "rocksampl": [24, 25], "cython": [24, 25, 32, 33], "rocksample_problem": [24, 25], "run_rocksampl": 25, "tag": [26, 27, 28, 29, 30, 31], "constant": 26, "experi": 26, "motion_polici": 31, "tiger": [32, 33, 44, 48], "tiger_problem": [32, 33], "run_tig": 33, "represent": [34, 35, 36], "histogram": [35, 36], "particl": [35, 36], "distribut": 36, "gaussian": 36, "util": [37, 38, 39], "color": 37, "cython_util": 37, "cpython": 37, "37m": 37, "x86_64": 37, "linux": 37, "gnu": 37, "debug": [37, 38], "treedebugg": [37, 38], "math": 37, "misc": 37, "templat": 37, "test_util": 37, "typ": 37, "interfac": 39, "simple_rl": 39, "search_tre": 40, "build": 41, "document": [41, 52], "doc": [41, 54], "pomdp_problem": 24, "note": 41, "changelog": [41, 42], "design": 43, "principl": 43, "exampl": [44, 46], "multi": [18, 44, 47], "object": [18, 44, 47], "search": [18, 44, 47], "mo": [18, 44, 47], "prefer": 45, "base": 45, "prior": 45, "us": [46, 51], "extern": 46, "solver": [46, 50], "tabl": [46, 53], "convert": 46, "pomdp": [46, 47, 48, 49, 50, 53, 55], "file": 46, "solv": [46, 48], "sarsop": 46, "policygraph": 46, "alphavectorpolici": 46, "overview": [47, 52], "implement": 47, "thi": 47, "convent": 47, "try": 47, "defin": 48, "instanti": 48, "instanc": 48, "summari": 48, "exist": [49, 50], "case": 51, "extens": 51, "get": 52, "start": 52, "further": 52, "citat": 52, "api": 52, "refer": 52, "tool": 52, "instal": 53, "pre": 53, "py": 53, "thing": 53, "out": 53, "docker": 53, "imag": 53, "other": 55, "librari": 55, "integr": [], "version": 42, "1": 42, "3": 42, "4": 42, "01": 42, "26": 42, "2024": 42, "07": 42, "25": 42, "2023": 42, "2": 42, "04": 42, "03": 42, "2022": 42, "11": 42, "2021": 42, "0": 42, "09": 42, "30": 42, "6": 42, "cancel": 42, "5": 42, "05": 42, "06": 42, "02": 42, "22": 42, "17": 42, "12": 42, "23": 42, "2020": 42, "pull": 42, "request": 42, "08": 42, "16": 42, "light": 7, "dark": 7, "load": 12, "unload": 12, "task": 18}, "envversion": {"sphinx.domains.c": 3, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 9, "sphinx.domains.index": 1, "sphinx.domains.javascript": 3, "sphinx.domains.math": 2, "sphinx.domains.python": 4, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.intersphinx": 1, "sphinxcontrib.bibtex": 9, "sphinx.ext.viewcode": 1, "sphinx": 60}, "alltitles": {"pomdp_py package": [[1, "pomdp-py-package"]], "pomdp_py.algorithms.bsp.blqr module": [[3, "module-pomdp_py.algorithms.bsp.blqr"], [2, "module-pomdp_py.algorithms.bsp.blqr"]], "pomdp_py.algorithms.bsp package": [[3, "pomdp-py-algorithms-bsp-package"]], "Submodules": [[3, "submodules"], [14, "submodules"], [15, "submodules"], [19, "submodules"], [20, "submodules"], [21, "submodules"], [22, "submodules"], [23, "submodules"], [26, "submodules"], [27, "submodules"], [28, "submodules"], [29, "submodules"], [30, "submodules"], [31, "submodules"], [4, "submodules"], [7, "submodules"], [8, "submodules"], [9, "submodules"], [10, "submodules"], [11, "submodules"], [12, "submodules"], [17, "submodules"], [18, "submodules"], [24, "submodules"], [25, "submodules"], [32, "submodules"], [33, "submodules"], [37, "submodules"], [40, "submodules"]], "Module contents": [[3, "module-pomdp_py.algorithms.bsp"], [6, "module-pomdp_py.problems"], [14, "module-pomdp_py.problems.maze.domain"], [15, "module-pomdp_py.problems.maze.env"], [16, "module-pomdp_py.problems.maze.models"], [19, "module-pomdp_py.problems.multi_object_search.agent"], [20, "module-pomdp_py.problems.multi_object_search.domain"], [21, "module-pomdp_py.problems.multi_object_search.env"], [22, "module-pomdp_py.problems.multi_object_search.models"], [23, "module-pomdp_py.problems.multi_object_search.models.components"], [26, "module-pomdp_py.problems.tag"], [27, "module-pomdp_py.problems.tag.agent"], [28, "module-pomdp_py.problems.tag.domain"], [29, "module-pomdp_py.problems.tag.env"], [30, "module-pomdp_py.problems.tag.models"], [31, "module-pomdp_py.problems.tag.models.components"], [4, "module-contents"], [7, "module-contents"], [8, "module-contents"], [9, "module-contents"], [10, "module-pomdp_py.problems.light_dark.env"], [11, "module-contents"], [12, "module-pomdp_py.problems.load_unload"], [13, "module-pomdp_py.problems.maze"], [17, "module-pomdp_py.problems.maze.models.components"], [18, "module-pomdp_py.problems.multi_object_search"], [24, "module-pomdp_py.problems.rocksample"], [25, "module-pomdp_py.problems.rocksample.cythonize"], [32, "module-pomdp_py.problems.tiger"], [33, "module-pomdp_py.problems.tiger.cythonize"], [37, "module-pomdp_py.utils"], [40, "module-contents"]], "pomdp_py.framework package": [[5, "pomdp-py-framework-package"]], "pomdp_py.framework.basics module": [[5, "module-pomdp_py.framework.basics"]], "pomdp_py.framework.oopomdp module": [[5, "module-pomdp_py.framework.oopomdp"]], "pomdp_py.framework.planner module": [[5, "module-pomdp_py.framework.planner"]], "pomdp_py.problems package": [[6, "pomdp-py-problems-package"]], "Subpackages": [[6, "subpackages"], [16, "subpackages"], [22, "subpackages"], [26, "subpackages"], [30, "subpackages"], [7, "subpackages"], [13, "subpackages"], [18, "subpackages"], [24, "subpackages"], [32, "subpackages"], [37, "subpackages"]], "pomdp_py.problems.maze.domain package": [[14, "pomdp-py-problems-maze-domain-package"]], "pomdp_py.problems.maze.domain.action module": [[14, "module-pomdp_py.problems.maze.domain.action"]], "pomdp_py.problems.maze.domain.observation module": [[14, "module-pomdp_py.problems.maze.domain.observation"]], "pomdp_py.problems.maze.domain.state module": [[14, "module-pomdp_py.problems.maze.domain.state"]], "pomdp_py.problems.maze.env package": [[15, "pomdp-py-problems-maze-env-package"]], "pomdp_py.problems.maze.env.env module": [[15, "module-pomdp_py.problems.maze.env.env"]], "pomdp_py.problems.maze.models package": [[16, "pomdp-py-problems-maze-models-package"]], "pomdp_py.problems.multi_object_search.agent package": [[19, "pomdp-py-problems-multi-object-search-agent-package"]], "pomdp_py.problems.multi_object_search.agent.agent module": [[19, "module-pomdp_py.problems.multi_object_search.agent.agent"]], "pomdp_py.problems.multi_object_search.agent.belief module": [[19, "module-pomdp_py.problems.multi_object_search.agent.belief"]], "pomdp_py.problems.multi_object_search.domain package": [[20, "pomdp-py-problems-multi-object-search-domain-package"]], "pomdp_py.problems.multi_object_search.domain.action module": [[20, "module-pomdp_py.problems.multi_object_search.domain.action"]], "pomdp_py.problems.multi_object_search.domain.observation module": [[20, "module-pomdp_py.problems.multi_object_search.domain.observation"]], "pomdp_py.problems.multi_object_search.domain.state module": [[20, "module-pomdp_py.problems.multi_object_search.domain.state"]], "pomdp_py.problems.multi_object_search.env package": [[21, "pomdp-py-problems-multi-object-search-env-package"]], "pomdp_py.problems.multi_object_search.env.env module": [[21, "module-pomdp_py.problems.multi_object_search.env.env"]], "pomdp_py.problems.multi_object_search.env.visual module": [[21, "module-pomdp_py.problems.multi_object_search.env.visual"]], "pomdp_py.problems.multi_object_search.models package": [[22, "pomdp-py-problems-multi-object-search-models-package"]], "pomdp_py.problems.multi_object_search.models.observation_model module": [[22, "module-pomdp_py.problems.multi_object_search.models.observation_model"]], "pomdp_py.problems.multi_object_search.models.policy_model module": [[22, "module-pomdp_py.problems.multi_object_search.models.policy_model"]], "pomdp_py.problems.multi_object_search.models.reward_model module": [[22, "module-pomdp_py.problems.multi_object_search.models.reward_model"]], "pomdp_py.problems.multi_object_search.models.transition_model module": [[22, "module-pomdp_py.problems.multi_object_search.models.transition_model"]], "pomdp_py.problems.multi_object_search.models.components package": [[23, "pomdp-py-problems-multi-object-search-models-components-package"]], "pomdp_py.problems.multi_object_search.models.components.grid_map module": [[23, "module-pomdp_py.problems.multi_object_search.models.components.grid_map"]], "pomdp_py.problems.multi_object_search.models.components.sensor module": [[23, "module-pomdp_py.problems.multi_object_search.models.components.sensor"]], "pomdp_py.problems.tag package": [[26, "pomdp-py-problems-tag-package"]], "pomdp_py.problems.tag.constants module": [[26, "module-pomdp_py.problems.tag.constants"]], "pomdp_py.problems.tag.example_worlds module": [[26, "module-pomdp_py.problems.tag.example_worlds"]], "pomdp_py.problems.tag.experiment module": [[26, "module-pomdp_py.problems.tag.experiment"]], "pomdp_py.problems.tag.problem module": [[26, "module-pomdp_py.problems.tag.problem"]], "pomdp_py.problems.tag.agent package": [[27, "pomdp-py-problems-tag-agent-package"]], "pomdp_py.problems.tag.agent.agent module": [[27, "module-pomdp_py.problems.tag.agent.agent"]], "pomdp_py.problems.tag.domain package": [[28, "pomdp-py-problems-tag-domain-package"]], "pomdp_py.problems.tag.domain.action module": [[28, "module-pomdp_py.problems.tag.domain.action"]], "pomdp_py.problems.tag.domain.observation module": [[28, "module-pomdp_py.problems.tag.domain.observation"]], "pomdp_py.problems.tag.domain.state module": [[28, "module-pomdp_py.problems.tag.domain.state"]], "pomdp_py.problems.tag.env package": [[29, "pomdp-py-problems-tag-env-package"]], "pomdp_py.problems.tag.env.env module": [[29, "module-pomdp_py.problems.tag.env.env"]], "pomdp_py.problems.tag.env.visual module": [[29, "module-pomdp_py.problems.tag.env.visual"]], "pomdp_py.problems.tag.models package": [[30, "pomdp-py-problems-tag-models-package"]], "pomdp_py.problems.tag.models.observation_model module": [[30, "module-pomdp_py.problems.tag.models.observation_model"]], "pomdp_py.problems.tag.models.policy_model module": [[30, "module-pomdp_py.problems.tag.models.policy_model"]], "pomdp_py.problems.tag.models.reward_model module": [[30, "module-pomdp_py.problems.tag.models.reward_model"]], "pomdp_py.problems.tag.models.transition_model module": [[30, "module-pomdp_py.problems.tag.models.transition_model"]], "pomdp_py.problems.tag.models.components package": [[31, "pomdp-py-problems-tag-models-components-package"]], "pomdp_py.problems.tag.models.components.grid_map module": [[31, "module-pomdp_py.problems.tag.models.components.grid_map"]], "pomdp_py.problems.tag.models.components.motion_policy module": [[31, "module-pomdp_py.problems.tag.models.components.motion_policy"]], "pomdp_py.representations package": [[34, "pomdp-py-representations-package"]], "pomdp_py.representations.belief package": [[35, "pomdp-py-representations-belief-package"]], "pomdp_py.representations.belief.histogram module": [[35, "module-pomdp_py.representations.belief.histogram"]], "pomdp_py.representations.belief.particles module": [[35, "module-pomdp_py.representations.belief.particles"]], "pomdp_py.representations.distribution package": [[36, "pomdp-py-representations-distribution-package"]], "pomdp_py.representations.distribution.histogram module": [[36, "module-pomdp_py.representations.distribution.histogram"]], "pomdp_py.representations.distribution.particles module": [[36, "module-pomdp_py.representations.distribution.particles"]], "pomdp_py.representations.distribution.gaussian module": [[36, "module-pomdp_py.representations.distribution.gaussian"]], "pomdp_py.utils.debugging module": [[38, "module-pomdp_py.utils.debugging"], [37, "module-pomdp_py.utils.debugging"]], "TreeDebugger": [[38, "treedebugger"], [37, "treedebugger"]], "Changelog": [[42, "changelog"]], "Version 1.3.5 (03/12/2024)": [[42, "version-1-3-5-03-12-2024"]], "Version 1.3.4 (01/26/2024)": [[42, "version-1-3-4-01-26-2024"]], "Version 1.3.3 (07/25/2023)": [[42, "version-1-3-3-07-25-2023"]], "Version 1.3.2 (04/03/2022)": [[42, "version-1-3-2-04-03-2022"]], "Version 1.3.1 (11/03/2021)": [[42, "version-1-3-1-11-03-2021"]], "Version 1.3.0.1 (09/30/2021)": [[42, "version-1-3-0-1-09-30-2021"]], "Version 1.2.4.6 (canceled)": [[42, "version-1-2-4-6-canceled"]], "Version 1.2.4.5 (07/05/2021)": [[42, "version-1-2-4-5-07-05-2021"]], "Version 1.2.4.1 (06/02/2021)": [[42, "version-1-2-4-1-06-02-2021"]], "Version 1.2.4 (06/01/2021)": [[42, "version-1-2-4-06-01-2021"]], "Version 1.2.3 (03/22/2021)": [[42, "version-1-2-3-03-22-2021"]], "Version 1.2.2.1 (01/25/2021)": [[42, "version-1-2-2-1-01-25-2021"]], "Version 1.2.2 (01/17/2021)": [[42, "version-1-2-2-01-17-2021"]], "Version 1.2.1 (12/23/2020)": [[42, "version-1-2-1-12-23-2020"]], "Pull Request #3 (08/01/2020)": [[42, "pull-request-3-08-01-2020"]], "Pull Request #1 (06/02/2020)": [[42, "pull-request-1-06-02-2020"]], "Version 1.0 - 1.2 (02/08/2020 - 02/16/2020)": [[42, "version-1-0-1-2-02-08-2020-02-16-2020"]], "Version 0.0": [[42, "version-0-0"]], "Design Principles": [[43, "design-principles"]], "Examples": [[44, "examples"]], "Tiger": [[44, "tiger"], [48, "tiger"], [32, "tiger"]], "Multi-Object Search (MOS)": [[44, "multi-object-search-mos"], [47, "multi-object-search-mos"]], "Preference-based Action Prior": [[45, "preference-based-action-prior"]], "Using External Solvers": [[46, "module-pomdp_py.utils.interfaces.solvers"]], "Table of Contents": [[46, "table-of-contents"], [53, "table-of-contents"]], "Converting a pomdp_py Agent to a POMDP File": [[46, "converting-a-pomdp-py-agent-to-a-pomdp-file"]], "Example": [[46, "example"], [46, "id2"], [46, "id4"]], "Using pomdp-solve": [[46, "using-pomdp-solve"]], "Using sarsop": [[46, "using-sarsop"]], "PolicyGraph and AlphaVectorPolicy": [[46, "policygraph-and-alphavectorpolicy"]], "Problem overview": [[47, "problem-overview"]], "Implementing this POMDP: Conventions": [[47, "implementing-this-pomdp-conventions"]], "Try it": [[47, "try-it"]], "Define the domain": [[48, "define-the-domain"]], "Define the models": [[48, "define-the-models"]], "Define the POMDP": [[48, "define-the-pomdp"]], "Instantiate the POMDP": [[48, "instantiate-the-pomdp"]], "Solve the POMDP instance": [[48, "solve-the-pomdp-instance"]], "Summary": [[48, "summary"]], "Existing POMDP Domains": [[49, "existing-pomdp-domains"]], "Existing POMDP Solvers": [[50, "existing-pomdp-solvers"]], "Use Case Extensions": [[51, "use-case-extensions"]], "Installation": [[53, "installation"]], "Pre-installation": [[53, "pre-installation"]], "Install pomdp-py": [[53, "install-pomdp-py"]], "Test things out": [[53, "test-things-out"]], "Docker image": [[53, "docker-image"]], "docs": [[54, "docs"]], "Other POMDP Libraries": [[55, "other-pomdp-libraries"]], "pomdp_py": [[0, "pomdp-py"]], "pomdp_py Documentation": [[52, "pomdp-py-documentation"]], "Overview": [[52, "overview"]], "Getting Started": [[52, "getting-started"]], "Further": [[52, "further"]], "Citation": [[52, "citation"]], "API References": [[52, "api-references"], [52, null]], "Tools": [[52, "tools"]], "Building Documentations": [[41, "building-documentations"]], "Building docs for pomdp_py": [[41, "building-docs-for-pomdp-py"]], "Building docs for pomdp_py.problems": [[41, "building-docs-for-pomdp-py-problems"]], "Note on Changelog": [[41, "note-on-changelog"]], "pomdp_py.algorithms package": [[2, "pomdp-py-algorithms-package"]], "pomdp_py.algorithms.po_rollout module": [[2, "module-pomdp_py.algorithms.po_rollout"]], "pomdp_py.algorithms.po_uct module": [[2, "module-pomdp_py.algorithms.po_uct"]], "pomdp_py.algorithms.pomcp module": [[2, "module-pomdp_py.algorithms.pomcp"]], "pomdp_py.algorithms.value_iteration module": [[2, "module-pomdp_py.algorithms.value_iteration"]], "pomdp_py.algorithms.visual.visual module": [[2, "pomdp-py-algorithms-visual-visual-module"], [4, "pomdp-py-algorithms-visual-visual-module"]], "pomdp_py.algorithms.visual package": [[4, "pomdp-py-algorithms-visual-package"]], "pomdp_py.problems.light_dark package": [[7, "pomdp-py-problems-light-dark-package"]], "Light-Dark": [[7, "light-dark"]], "pomdp_py.problems.light_dark.problem_discrete module": [[7, "pomdp-py-problems-light-dark-problem-discrete-module"]], "pomdp_py.problems.light_dark.test module": [[7, "pomdp-py-problems-light-dark-test-module"]], "pomdp_py.problems.light_dark.agent package": [[8, "pomdp-py-problems-light-dark-agent-package"]], "pomdp_py.problems.light_dark.agent.belief module": [[8, "pomdp-py-problems-light-dark-agent-belief-module"]], "pomdp_py.problems.light_dark.domain package": [[9, "pomdp-py-problems-light-dark-domain-package"]], "pomdp_py.problems.light_dark.domain.action module": [[9, "pomdp-py-problems-light-dark-domain-action-module"]], "pomdp_py.problems.light_dark.domain.observation module": [[9, "pomdp-py-problems-light-dark-domain-observation-module"]], "pomdp_py.problems.light_dark.domain.state module": [[9, "pomdp-py-problems-light-dark-domain-state-module"]], "pomdp_py.problems.light_dark.env package": [[10, "pomdp-py-problems-light-dark-env-package"]], "pomdp_py.problems.light_dark.env.env module": [[10, "module-pomdp_py.problems.light_dark.env.env"]], "pomdp_py.problems.light_dark.env.plotting module": [[10, "module-pomdp_py.problems.light_dark.env.plotting"]], "pomdp_py.problems.light_dark.env.visual module": [[10, "pomdp-py-problems-light-dark-env-visual-module"]], "pomdp_py.problems.light_dark.models package": [[11, "pomdp-py-problems-light-dark-models-package"]], "pomdp_py.problems.light_dark.models.observation_model module": [[11, "pomdp-py-problems-light-dark-models-observation-model-module"]], "pomdp_py.problems.light_dark.models.transition_model module": [[11, "pomdp-py-problems-light-dark-models-transition-model-module"]], "pomdp_py.problems.load_unload package": [[12, "pomdp-py-problems-load-unload-package"]], "Load/Unload": [[12, "load-unload"]], "pomdp_py.problems.load_unload.load_unload module": [[12, "module-pomdp_py.problems.load_unload.load_unload"]], "pomdp_py.problems.maze package": [[13, "pomdp-py-problems-maze-package"]], "Maze": [[13, "maze"], [13, "id1"]], "pomdp_py.problems.maze.models.components package": [[17, "pomdp-py-problems-maze-models-components-package"]], "pomdp_py.problems.maze.models.components.map module": [[17, "pomdp-py-problems-maze-models-components-map-module"]], "pomdp_py.problems.multi_object_search package": [[18, "pomdp-py-problems-multi-object-search-package"]], "Multi-Object Search (MOS) Task": [[18, "multi-object-search-mos-task"]], "pomdp_py.problems.multi_object_search.example_worlds module": [[18, "module-pomdp_py.problems.multi_object_search.example_worlds"]], "pomdp_py.problems.multi_object_search.problem module": [[18, "module-pomdp_py.problems.multi_object_search.problem"]], "pomdp_py.problems.rocksample package": [[24, "pomdp-py-problems-rocksample-package"]], "RockSample": [[24, "rocksample"]], "pomdp_problems.rocksample.rocksample_problem module": [[24, "pomdp-problems-rocksample-rocksample-problem-module"]], "pomdp_py.problems.rocksample.cythonize module": [[24, "module-pomdp_py.problems.rocksample.cythonize"]], "pomdp_py.problems.rocksample.rocksample_problem module": [[24, "module-pomdp_py.problems.rocksample.rocksample_problem"]], "pomdp_py.problems.rocksample.cythonize package": [[25, "pomdp-py-problems-rocksample-cythonize-package"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem module": [[25, "module-pomdp_py.problems.rocksample.cythonize.rocksample_problem"], [25, "id1"], [25, "id49"], [25, "id98"]], "pomdp_py.problems.rocksample.cythonize.run_rocksample module": [[25, "pomdp-py-problems-rocksample-cythonize-run-rocksample-module"]], "pomdp_py.problems.tiger package": [[32, "pomdp-py-problems-tiger-package"]], "pomdp_py.problems.tiger.cythonize module": [[32, "module-pomdp_py.problems.tiger.cythonize"]], "pomdp_py.problems.tiger.tiger_problem module": [[32, "module-pomdp_py.problems.tiger.tiger_problem"]], "pomdp_py.problems.tiger.cythonize package": [[33, "pomdp-py-problems-tiger-cythonize-package"]], "pomdp_py.problems.tiger.cythonize.run_tiger module": [[33, "pomdp-py-problems-tiger-cythonize-run-tiger-module"]], "pomdp_py.problems.tiger.cythonize.tiger_problem module": [[33, "module-pomdp_py.problems.tiger.cythonize.tiger_problem"], [33, "id1"], [33, "id39"], [33, "id78"]], "pomdp_py.utils package": [[37, "pomdp-py-utils-package"]], "pomdp_py.utils.colors module": [[37, "module-pomdp_py.utils.colors"]], "pomdp_py.utils.cython_utils.cpython-37m-x86_64-linux-gnu module": [[37, "pomdp-py-utils-cython-utils-cpython-37m-x86-64-linux-gnu-module"]], "pomdp_py.utils.cython_utils module": [[37, "module-pomdp_py.utils.cython_utils"]], "pomdp_py.utils.math module": [[37, "module-pomdp_py.utils.math"]], "pomdp_py.utils.misc module": [[37, "module-pomdp_py.utils.misc"]], "pomdp_py.utils.plotting module": [[37, "pomdp-py-utils-plotting-module"]], "pomdp_py.utils.templates module": [[37, "module-pomdp_py.utils.templates"]], "pomdp_py.utils.test_utils module": [[37, "pomdp-py-utils-test-utils-module"]], "pomdp_py.utils.typ module": [[37, "module-pomdp_py.utils.typ"]], "pomdp_py.utils.interfaces package": [[39, "pomdp-py-utils-interfaces-package"]], "pomdp_py.utils.interfaces.simple_rl module": [[39, "pomdp-py-utils-interfaces-simple-rl-module"]], "pomdp_py.visual package": [[40, "pomdp-py-visual-package"]], "pomdp_py.visual.search_tree module": [[40, "pomdp-py-visual-search-tree-module"]]}, "indexentries": {"actionprior (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.ActionPrior"]], "blqr (class in pomdp_py.algorithms.bsp.blqr)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR"]], "pomcp (class in pomdp_py.algorithms.pomcp)": [[2, "pomdp_py.algorithms.pomcp.POMCP"]], "porollout (class in pomdp_py.algorithms.po_rollout)": [[2, "pomdp_py.algorithms.po_rollout.PORollout"]], "pouct (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.POUCT"]], "qnode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.QNode"]], "randomrollout (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.RandomRollout"]], "rolloutpolicy (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.RolloutPolicy"]], "rootvnode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.RootVNode"]], "rootvnodeparticles (class in pomdp_py.algorithms.pomcp)": [[2, "pomdp_py.algorithms.pomcp.RootVNodeParticles"]], "treenode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.TreeNode"]], "vnode (class in pomdp_py.algorithms.po_uct)": [[2, "pomdp_py.algorithms.po_uct.VNode"]], "vnodeparticles (class in pomdp_py.algorithms.pomcp)": [[2, "pomdp_py.algorithms.pomcp.VNodeParticles"]], "valueiteration (class in pomdp_py.algorithms.value_iteration)": [[2, "pomdp_py.algorithms.value_iteration.ValueIteration"]], "action_prior (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.action_prior"]], "argmax() (pomdp_py.algorithms.po_uct.vnode method)": [[2, "pomdp_py.algorithms.po_uct.VNode.argmax"]], "belief (pomdp_py.algorithms.pomcp.rootvnodeparticles attribute)": [[2, "pomdp_py.algorithms.pomcp.RootVNodeParticles.belief"]], "belief (pomdp_py.algorithms.pomcp.vnodeparticles attribute)": [[2, "pomdp_py.algorithms.pomcp.VNodeParticles.belief"]], "children (pomdp_py.algorithms.po_uct.treenode attribute)": [[2, "pomdp_py.algorithms.po_uct.TreeNode.children"]], "clear_agent() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.clear_agent"]], "clear_agent() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.clear_agent"]], "create_plan() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.create_plan"]], "discount_factor (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.discount_factor"]], "ekf_update_mlo() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.ekf_update_mlo"]], "from_vnode() (pomdp_py.algorithms.po_uct.rootvnode class method)": [[2, "pomdp_py.algorithms.po_uct.RootVNode.from_vnode"]], "from_vnode() (pomdp_py.algorithms.pomcp.rootvnodeparticles class method)": [[2, "pomdp_py.algorithms.pomcp.RootVNodeParticles.from_vnode"]], "get_preferred_actions() (pomdp_py.algorithms.po_uct.actionprior method)": [[2, "pomdp_py.algorithms.po_uct.ActionPrior.get_preferred_actions"]], "history (pomdp_py.algorithms.po_uct.rootvnode attribute)": [[2, "pomdp_py.algorithms.po_uct.RootVNode.history"]], "integrate_belief_segment() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.integrate_belief_segment"]], "interpret_sqp_plan() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.interpret_sqp_plan"]], "last_best_reward (pomdp_py.algorithms.po_rollout.porollout attribute)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.last_best_reward"]], "last_num_sims (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.last_num_sims"]], "last_planning_time (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.last_planning_time"]], "max_depth (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.max_depth"]], "module": [[2, "module-pomdp_py.algorithms.bsp.blqr"], [2, "module-pomdp_py.algorithms.po_rollout"], [2, "module-pomdp_py.algorithms.po_uct"], [2, "module-pomdp_py.algorithms.pomcp"], [2, "module-pomdp_py.algorithms.value_iteration"], [6, "module-pomdp_py.problems"], [10, "module-pomdp_py.problems.light_dark.env"], [10, "module-pomdp_py.problems.light_dark.env.env"], [10, "module-pomdp_py.problems.light_dark.env.plotting"], [12, "module-pomdp_py.problems.load_unload"], [12, "module-pomdp_py.problems.load_unload.load_unload"], [13, "module-pomdp_py.problems.maze"], [16, "module-pomdp_py.problems.maze.models"], [17, "module-pomdp_py.problems.maze.models.components"], [18, "module-pomdp_py.problems.multi_object_search"], [18, "module-pomdp_py.problems.multi_object_search.example_worlds"], [18, "module-pomdp_py.problems.multi_object_search.problem"], [24, "module-pomdp_py.problems.rocksample"], [24, "module-pomdp_py.problems.rocksample.cythonize"], [24, "module-pomdp_py.problems.rocksample.rocksample_problem"], [25, "module-0"], [25, "module-1"], [25, "module-2"], [25, "module-pomdp_py.problems.rocksample.cythonize"], [25, "module-pomdp_py.problems.rocksample.cythonize.rocksample_problem"], [32, "module-pomdp_py.problems.tiger"], [32, "module-pomdp_py.problems.tiger.cythonize"], [32, "module-pomdp_py.problems.tiger.tiger_problem"], [33, "module-0"], [33, "module-1"], [33, "module-2"], [33, "module-pomdp_py.problems.tiger.cythonize"], [33, "module-pomdp_py.problems.tiger.cythonize.tiger_problem"], [37, "module-pomdp_py.utils"], [37, "module-pomdp_py.utils.colors"], [37, "module-pomdp_py.utils.cython_utils"], [37, "module-pomdp_py.utils.debugging"], [37, "module-pomdp_py.utils.math"], [37, "module-pomdp_py.utils.misc"], [37, "module-pomdp_py.utils.templates"], [37, "module-pomdp_py.utils.typ"]], "num_visits (pomdp_py.algorithms.po_uct.treenode attribute)": [[2, "pomdp_py.algorithms.po_uct.TreeNode.num_visits"]], "num_visits_init (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.num_visits_init"]], "plan() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.plan"]], "plan() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.plan"]], "plan() (pomdp_py.algorithms.pomcp.pomcp method)": [[2, "pomdp_py.algorithms.pomcp.POMCP.plan"]], "plan() (pomdp_py.algorithms.value_iteration.valueiteration method)": [[2, "pomdp_py.algorithms.value_iteration.ValueIteration.plan"]], "pomdp_py.algorithms.bsp.blqr": [[2, "module-pomdp_py.algorithms.bsp.blqr"]], "pomdp_py.algorithms.po_rollout": [[2, "module-pomdp_py.algorithms.po_rollout"]], "pomdp_py.algorithms.po_uct": [[2, "module-pomdp_py.algorithms.po_uct"]], "pomdp_py.algorithms.pomcp": [[2, "module-pomdp_py.algorithms.pomcp"]], "pomdp_py.algorithms.value_iteration": [[2, "module-pomdp_py.algorithms.value_iteration"]], "print_children_value() (pomdp_py.algorithms.po_uct.vnode method)": [[2, "pomdp_py.algorithms.po_uct.VNode.print_children_value"]], "rollout() (pomdp_py.algorithms.po_uct.randomrollout method)": [[2, "pomdp_py.algorithms.po_uct.RandomRollout.rollout"]], "rollout() (pomdp_py.algorithms.po_uct.rolloutpolicy method)": [[2, "pomdp_py.algorithms.po_uct.RolloutPolicy.rollout"]], "rollout_policy (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.rollout_policy"]], "segmented_cost_function() (pomdp_py.algorithms.bsp.blqr.blqr method)": [[2, "pomdp_py.algorithms.bsp.blqr.BLQR.segmented_cost_function"]], "set_rollout_policy() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.set_rollout_policy"]], "set_rollout_policy() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.set_rollout_policy"]], "update() (pomdp_py.algorithms.po_rollout.porollout method)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.update"]], "update() (pomdp_py.algorithms.po_uct.pouct method)": [[2, "pomdp_py.algorithms.po_uct.POUCT.update"]], "update() (pomdp_py.algorithms.pomcp.pomcp method)": [[2, "pomdp_py.algorithms.pomcp.POMCP.update"]], "update_agent_belief (pomdp_py.algorithms.po_rollout.porollout attribute)": [[2, "pomdp_py.algorithms.po_rollout.PORollout.update_agent_belief"]], "update_agent_belief (pomdp_py.algorithms.pomcp.pomcp attribute)": [[2, "pomdp_py.algorithms.pomcp.POMCP.update_agent_belief"]], "updates_agent_belief (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.updates_agent_belief"]], "value (pomdp_py.algorithms.po_uct.treenode attribute)": [[2, "pomdp_py.algorithms.po_uct.TreeNode.value"]], "value (pomdp_py.algorithms.po_uct.vnode attribute)": [[2, "pomdp_py.algorithms.po_uct.VNode.value"]], "value_init (pomdp_py.algorithms.po_uct.pouct attribute)": [[2, "pomdp_py.algorithms.po_uct.POUCT.value_init"]], "pomdp_py.problems": [[6, "module-pomdp_py.problems"]], "lightdarkenvironment (class in pomdp_py.problems.light_dark.env.env)": [[10, "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment"]], "const (pomdp_py.problems.light_dark.env.env.lightdarkenvironment property)": [[10, "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment.const"]], "light (pomdp_py.problems.light_dark.env.env.lightdarkenvironment property)": [[10, "pomdp_py.problems.light_dark.env.env.LightDarkEnvironment.light"]], "plot_circle() (in module pomdp_py.problems.light_dark.env.plotting)": [[10, "pomdp_py.problems.light_dark.env.plotting.plot_circle"]], "plot_line() (in module pomdp_py.problems.light_dark.env.plotting)": [[10, "pomdp_py.problems.light_dark.env.plotting.plot_line"]], "plot_points() (in module pomdp_py.problems.light_dark.env.plotting)": [[10, "pomdp_py.problems.light_dark.env.plotting.plot_points"]], "plot_polygons() (in module pomdp_py.problems.light_dark.env.plotting)": [[10, "pomdp_py.problems.light_dark.env.plotting.plot_polygons"]], "pomdp_py.problems.light_dark.env": [[10, "module-pomdp_py.problems.light_dark.env"]], "pomdp_py.problems.light_dark.env.env": [[10, "module-pomdp_py.problems.light_dark.env.env"]], "pomdp_py.problems.light_dark.env.plotting": [[10, "module-pomdp_py.problems.light_dark.env.plotting"]], "luaction (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LUAction"]], "luobservation (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LUObservation"]], "luobservationmodel (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LUObservationModel"]], "lupolicymodel (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LUPolicyModel"]], "lurewardmodel (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LURewardModel"]], "lustate (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LUState"]], "lutransitionmodel (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LUTransitionModel"]], "loadunloadproblem (class in pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.LoadUnloadProblem"]], "argmax() (pomdp_py.problems.load_unload.load_unload.luobservationmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUObservationModel.argmax"]], "argmax() (pomdp_py.problems.load_unload.load_unload.lupolicymodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUPolicyModel.argmax"]], "argmax() (pomdp_py.problems.load_unload.load_unload.lurewardmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LURewardModel.argmax"]], "argmax() (pomdp_py.problems.load_unload.load_unload.lutransitionmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUTransitionModel.argmax"]], "generate_init_belief() (in module pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.generate_init_belief"]], "generate_random_state() (in module pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.generate_random_state"]], "get_all_actions() (pomdp_py.problems.load_unload.load_unload.lupolicymodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUPolicyModel.get_all_actions"]], "main() (in module pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.main"]], "pomdp_py.problems.load_unload": [[12, "module-pomdp_py.problems.load_unload"]], "pomdp_py.problems.load_unload.load_unload": [[12, "module-pomdp_py.problems.load_unload.load_unload"]], "probability() (pomdp_py.problems.load_unload.load_unload.luobservationmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUObservationModel.probability"]], "probability() (pomdp_py.problems.load_unload.load_unload.lupolicymodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUPolicyModel.probability"]], "probability() (pomdp_py.problems.load_unload.load_unload.lurewardmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LURewardModel.probability"]], "probability() (pomdp_py.problems.load_unload.load_unload.lutransitionmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUTransitionModel.probability"]], "sample() (pomdp_py.problems.load_unload.load_unload.luobservationmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUObservationModel.sample"]], "sample() (pomdp_py.problems.load_unload.load_unload.lupolicymodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUPolicyModel.sample"]], "sample() (pomdp_py.problems.load_unload.load_unload.lurewardmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LURewardModel.sample"]], "sample() (pomdp_py.problems.load_unload.load_unload.lutransitionmodel method)": [[12, "pomdp_py.problems.load_unload.load_unload.LUTransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.load_unload.load_unload)": [[12, "pomdp_py.problems.load_unload.load_unload.test_planner"]], "pomdp_py.problems.maze": [[13, "module-pomdp_py.problems.maze"]], "pomdp_py.problems.maze.models": [[16, "module-pomdp_py.problems.maze.models"]], "pomdp_py.problems.maze.models.components": [[17, "module-pomdp_py.problems.maze.models.components"]], "mosoopomdp (class in pomdp_py.problems.multi_object_search.problem)": [[18, "pomdp_py.problems.multi_object_search.problem.MosOOPOMDP"]], "belief_update() (in module pomdp_py.problems.multi_object_search.problem)": [[18, "pomdp_py.problems.multi_object_search.problem.belief_update"]], "pomdp_py.problems.multi_object_search": [[18, "module-pomdp_py.problems.multi_object_search"]], "pomdp_py.problems.multi_object_search.example_worlds": [[18, "module-pomdp_py.problems.multi_object_search.example_worlds"]], "pomdp_py.problems.multi_object_search.problem": [[18, "module-pomdp_py.problems.multi_object_search.problem"]], "random_world() (in module pomdp_py.problems.multi_object_search.example_worlds)": [[18, "pomdp_py.problems.multi_object_search.example_worlds.random_world"]], "solve() (in module pomdp_py.problems.multi_object_search.problem)": [[18, "pomdp_py.problems.multi_object_search.problem.solve"]], "unittest() (in module pomdp_py.problems.multi_object_search.problem)": [[18, "pomdp_py.problems.multi_object_search.problem.unittest"]], "action (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.Action"]], "bad (pomdp_py.problems.rocksample.rocksample_problem.rocktype attribute)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockType.BAD"]], "checkaction (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.CheckAction"]], "east (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.EAST"]], "good (pomdp_py.problems.rocksample.rocksample_problem.rocktype attribute)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockType.GOOD"]], "moveaction (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction"]], "north (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.NORTH"]], "observation (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.Observation"]], "rsobservationmodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel"]], "rspolicymodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel"]], "rsrewardmodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel"]], "rstransitionmodel (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel"]], "rocksampleproblem (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem"]], "rocktype (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockType"]], "south (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.SOUTH"]], "sampleaction (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.SampleAction"]], "state (class in pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.State"]], "west (pomdp_py.problems.rocksample.rocksample_problem.moveaction attribute)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.MoveAction.WEST"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rsobservationmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rsrewardmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.rocksample_problem.rstransitionmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel.argmax"]], "create_instance() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.create_instance"]], "euclidean_dist() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.euclidean_dist"]], "generate_instance() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem static method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.generate_instance"]], "get_all_actions() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.get_all_actions"]], "in_exit_area() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.in_exit_area"]], "init_particles_belief() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.init_particles_belief"]], "invert() (pomdp_py.problems.rocksample.rocksample_problem.rocktype static method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockType.invert"]], "main() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.main"]], "minimal_instance() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.minimal_instance"]], "pomdp_py.problems.rocksample": [[24, "module-pomdp_py.problems.rocksample"]], "pomdp_py.problems.rocksample.cythonize": [[24, "module-pomdp_py.problems.rocksample.cythonize"], [25, "module-pomdp_py.problems.rocksample.cythonize"]], "pomdp_py.problems.rocksample.rocksample_problem": [[24, "module-pomdp_py.problems.rocksample.rocksample_problem"]], "print_state() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.print_state"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rsobservationmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel.probability"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.probability"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rsrewardmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel.probability"]], "probability() (pomdp_py.problems.rocksample.rocksample_problem.rstransitionmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel.probability"]], "random() (pomdp_py.problems.rocksample.rocksample_problem.rocktype static method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockType.random"]], "random_free_location() (pomdp_py.problems.rocksample.rocksample_problem.rocksampleproblem static method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RockSampleProblem.random_free_location"]], "rollout() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.rollout"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rsobservationmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSObservationModel.sample"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rspolicymodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSPolicyModel.sample"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rsrewardmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSRewardModel.sample"]], "sample() (pomdp_py.problems.rocksample.rocksample_problem.rstransitionmodel method)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.RSTransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.rocksample.rocksample_problem)": [[24, "pomdp_py.problems.rocksample.rocksample_problem.test_planner"]], "bad (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype attribute)": [[25, "id138"], [25, "id40"], [25, "id89"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.BAD"]], "checkaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id0"], [25, "id50"], [25, "id99"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.CheckAction"]], "east (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[25, "id102"], [25, "id4"], [25, "id53"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.EAST"]], "good (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype attribute)": [[25, "id139"], [25, "id41"], [25, "id90"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.GOOD"]], "moveaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id101"], [25, "id3"], [25, "id52"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction"]], "north (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[25, "id103"], [25, "id5"], [25, "id54"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.NORTH"]], "rsaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id107"], [25, "id58"], [25, "id9"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSAction"]], "rsobservation (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id10"], [25, "id108"], [25, "id59"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservation"]], "rsobservationmodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id110"], [25, "id12"], [25, "id61"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel"]], "rspolicymodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id114"], [25, "id16"], [25, "id65"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel"]], "rsrewardmodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id120"], [25, "id22"], [25, "id71"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel"]], "rsstate (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id124"], [25, "id26"], [25, "id75"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState"]], "rstransitionmodel (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id128"], [25, "id30"], [25, "id79"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel"]], "rocksampleproblem (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id132"], [25, "id34"], [25, "id83"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem"]], "rocktype (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id137"], [25, "id39"], [25, "id88"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType"]], "south (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[25, "id104"], [25, "id55"], [25, "id6"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.SOUTH"]], "sampleaction (class in pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id142"], [25, "id44"], [25, "id93"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.SampleAction"]], "west (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[25, "id105"], [25, "id56"], [25, "id7"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.WEST"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservationmodel method)": [[25, "id111"], [25, "id13"], [25, "id62"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[25, "id115"], [25, "id17"], [25, "id66"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsrewardmodel method)": [[25, "id121"], [25, "id23"], [25, "id72"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel.argmax"]], "argmax() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rstransitionmodel method)": [[25, "id129"], [25, "id31"], [25, "id80"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel.argmax"]], "euclidean_dist() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id143"], [25, "id45"], [25, "id94"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.euclidean_dist"]], "generate_instance() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem static method)": [[25, "id133"], [25, "id35"], [25, "id84"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.generate_instance"]], "get_all_actions() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[25, "id116"], [25, "id18"], [25, "id67"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.get_all_actions"]], "in_exit_area() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem method)": [[25, "id134"], [25, "id36"], [25, "id85"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.in_exit_area"]], "init_particles_belief() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id144"], [25, "id46"], [25, "id95"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.init_particles_belief"]], "invert() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype static method)": [[25, "id140"], [25, "id42"], [25, "id91"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.invert"]], "main() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id145"], [25, "id47"], [25, "id96"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.main"]], "motion (pomdp_py.problems.rocksample.cythonize.rocksample_problem.moveaction attribute)": [[25, "id106"], [25, "id57"], [25, "id8"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.MoveAction.motion"]], "pomdp_py.problems.rocksample.cythonize.rocksample_problem": [[25, "module-0"], [25, "module-1"], [25, "module-2"], [25, "module-pomdp_py.problems.rocksample.cythonize.rocksample_problem"]], "position (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsstate attribute)": [[25, "id125"], [25, "id27"], [25, "id76"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.position"]], "print_state() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem method)": [[25, "id135"], [25, "id37"], [25, "id86"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.print_state"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservationmodel method)": [[25, "id112"], [25, "id14"], [25, "id63"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel.probability"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[25, "id117"], [25, "id19"], [25, "id68"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.probability"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsrewardmodel method)": [[25, "id122"], [25, "id24"], [25, "id73"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel.probability"]], "probability() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rstransitionmodel method)": [[25, "id130"], [25, "id32"], [25, "id81"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel.probability"]], "quality (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservation attribute)": [[25, "id109"], [25, "id11"], [25, "id60"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservation.quality"]], "random() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocktype static method)": [[25, "id141"], [25, "id43"], [25, "id92"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockType.random"]], "random_free_location() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rocksampleproblem static method)": [[25, "id136"], [25, "id38"], [25, "id87"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RockSampleProblem.random_free_location"]], "rock_id (pomdp_py.problems.rocksample.cythonize.rocksample_problem.checkaction attribute)": [[25, "id100"], [25, "id2"], [25, "id51"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.CheckAction.rock_id"]], "rocktypes (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsstate attribute)": [[25, "id126"], [25, "id28"], [25, "id77"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.rocktypes"]], "rollout() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[25, "id118"], [25, "id20"], [25, "id69"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.rollout"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsobservationmodel method)": [[25, "id113"], [25, "id15"], [25, "id64"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSObservationModel.sample"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rspolicymodel method)": [[25, "id119"], [25, "id21"], [25, "id70"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSPolicyModel.sample"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsrewardmodel method)": [[25, "id123"], [25, "id25"], [25, "id74"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSRewardModel.sample"]], "sample() (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rstransitionmodel method)": [[25, "id131"], [25, "id33"], [25, "id82"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSTransitionModel.sample"]], "terminal (pomdp_py.problems.rocksample.cythonize.rocksample_problem.rsstate attribute)": [[25, "id127"], [25, "id29"], [25, "id78"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.RSState.terminal"]], "test_planner() (in module pomdp_py.problems.rocksample.cythonize.rocksample_problem)": [[25, "id146"], [25, "id48"], [25, "id97"], [25, "pomdp_py.problems.rocksample.cythonize.rocksample_problem.test_planner"]], "actions (pomdp_py.problems.tiger.tiger_problem.policymodel attribute)": [[32, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.ACTIONS"]], "observationmodel (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.ObservationModel"]], "policymodel (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.PolicyModel"]], "rewardmodel (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.RewardModel"]], "tigeraction (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.TigerAction"]], "tigerobservation (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.TigerObservation"]], "tigerproblem (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.TigerProblem"]], "tigerstate (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.TigerState"]], "transitionmodel (class in pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.TransitionModel"]], "create() (pomdp_py.problems.tiger.tiger_problem.tigerproblem static method)": [[32, "pomdp_py.problems.tiger.tiger_problem.TigerProblem.create"]], "get_all_actions() (pomdp_py.problems.tiger.tiger_problem.policymodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.get_all_actions"]], "get_all_observations() (pomdp_py.problems.tiger.tiger_problem.observationmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.ObservationModel.get_all_observations"]], "get_all_states() (pomdp_py.problems.tiger.tiger_problem.transitionmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.TransitionModel.get_all_states"]], "main() (in module pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.main"]], "make_tiger() (in module pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.make_tiger"]], "other() (pomdp_py.problems.tiger.tiger_problem.tigerstate method)": [[32, "pomdp_py.problems.tiger.tiger_problem.TigerState.other"]], "pomdp_py.problems.tiger": [[32, "module-pomdp_py.problems.tiger"]], "pomdp_py.problems.tiger.cythonize": [[32, "module-pomdp_py.problems.tiger.cythonize"], [33, "module-pomdp_py.problems.tiger.cythonize"]], "pomdp_py.problems.tiger.tiger_problem": [[32, "module-pomdp_py.problems.tiger.tiger_problem"]], "probability() (pomdp_py.problems.tiger.tiger_problem.observationmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.ObservationModel.probability"]], "probability() (pomdp_py.problems.tiger.tiger_problem.transitionmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.TransitionModel.probability"]], "rollout() (pomdp_py.problems.tiger.tiger_problem.policymodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.rollout"]], "sample() (pomdp_py.problems.tiger.tiger_problem.observationmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.ObservationModel.sample"]], "sample() (pomdp_py.problems.tiger.tiger_problem.policymodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.PolicyModel.sample"]], "sample() (pomdp_py.problems.tiger.tiger_problem.rewardmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.RewardModel.sample"]], "sample() (pomdp_py.problems.tiger.tiger_problem.transitionmodel method)": [[32, "pomdp_py.problems.tiger.tiger_problem.TransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.tiger.tiger_problem)": [[32, "pomdp_py.problems.tiger.tiger_problem.test_planner"]], "actions (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerproblem attribute)": [[33, "id17"], [33, "id56"], [33, "id95"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.ACTIONS"]], "observations (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerproblem attribute)": [[33, "id18"], [33, "id57"], [33, "id96"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.OBSERVATIONS"]], "states (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerproblem attribute)": [[33, "id19"], [33, "id58"], [33, "id97"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem.STATES"]], "tigeraction (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id0"], [33, "id41"], [33, "id80"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerAction"]], "tigerobservation (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id3"], [33, "id42"], [33, "id81"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation"]], "tigerobservationmodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id44"], [33, "id5"], [33, "id83"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel"]], "tigerpolicymodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id11"], [33, "id50"], [33, "id89"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel"]], "tigerproblem (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id16"], [33, "id55"], [33, "id94"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerProblem"]], "tigerrewardmodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id20"], [33, "id59"], [33, "id98"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel"]], "tigerstate (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id103"], [33, "id25"], [33, "id64"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerState"]], "tigertransitionmodel (class in pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id105"], [33, "id27"], [33, "id66"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[33, "id45"], [33, "id6"], [33, "id84"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.argmax"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[33, "id12"], [33, "id51"], [33, "id90"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.argmax"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[33, "id21"], [33, "id60"], [33, "id99"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.argmax"]], "argmax() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[33, "id106"], [33, "id28"], [33, "id67"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.argmax"]], "build_actions() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id111"], [33, "id33"], [33, "id72"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_actions"]], "build_observations() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id112"], [33, "id34"], [33, "id73"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_observations"]], "build_setting() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id113"], [33, "id35"], [33, "id74"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_setting"]], "build_states() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id114"], [33, "id36"], [33, "id75"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.build_states"]], "get_all_actions() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[33, "id13"], [33, "id52"], [33, "id91"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.get_all_actions"]], "get_all_observations() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[33, "id46"], [33, "id7"], [33, "id85"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.get_all_observations"]], "get_all_states() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[33, "id107"], [33, "id29"], [33, "id68"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.get_all_states"]], "get_distribution() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[33, "id47"], [33, "id8"], [33, "id86"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.get_distribution"]], "get_distribution() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[33, "id100"], [33, "id22"], [33, "id61"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.get_distribution"]], "get_distribution() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[33, "id108"], [33, "id30"], [33, "id69"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.get_distribution"]], "main() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id115"], [33, "id37"], [33, "id76"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.main"]], "name (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservation attribute)": [[33, "id4"], [33, "id43"], [33, "id82"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservation.name"]], "name (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerstate attribute)": [[33, "id104"], [33, "id26"], [33, "id65"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerState.name"]], "pomdp_py.problems.tiger.cythonize.tiger_problem": [[33, "module-0"], [33, "module-1"], [33, "module-2"], [33, "module-pomdp_py.problems.tiger.cythonize.tiger_problem"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[33, "id48"], [33, "id87"], [33, "id9"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.probability"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[33, "id14"], [33, "id53"], [33, "id92"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.probability"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[33, "id101"], [33, "id23"], [33, "id62"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.probability"]], "probability() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[33, "id109"], [33, "id31"], [33, "id70"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.probability"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerobservationmodel method)": [[33, "id10"], [33, "id49"], [33, "id88"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerObservationModel.sample"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerpolicymodel method)": [[33, "id15"], [33, "id54"], [33, "id93"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerPolicyModel.sample"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigerrewardmodel method)": [[33, "id102"], [33, "id24"], [33, "id63"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerRewardModel.sample"]], "sample() (pomdp_py.problems.tiger.cythonize.tiger_problem.tigertransitionmodel method)": [[33, "id110"], [33, "id32"], [33, "id71"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.TigerTransitionModel.sample"]], "test_planner() (in module pomdp_py.problems.tiger.cythonize.tiger_problem)": [[33, "id116"], [33, "id38"], [33, "id77"], [33, "pomdp_py.problems.tiger.cythonize.tiger_problem.test_planner"]], "blue (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.BLUE"]], "bold (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.BOLD"]], "cyan (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.CYAN"]], "detobservationmodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.DetObservationModel"]], "detrewardmodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.DetRewardModel"]], "dettransitionmodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.DetTransitionModel"]], "endc (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.ENDC"]], "green (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.GREEN"]], "magenta (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.MAGENTA"]], "red (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.RED"]], "r_between() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.R_between"]], "r_x() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.R_x"]], "r_y() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.R_y"]], "r_z() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.R_z"]], "subscript (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.SUBSCRIPT"]], "simpleaction (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.SimpleAction"]], "simpleobservation (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.SimpleObservation"]], "simplestate (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.SimpleState"]], "t() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.T"]], "tabularobservationmodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.TabularObservationModel"]], "tabularrewardmodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.TabularRewardModel"]], "tabulartransitionmodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.TabularTransitionModel"]], "treedebugger (class in pomdp_py.utils.debugging)": [[37, "pomdp_py.utils.debugging.TreeDebugger"]], "uniformpolicymodel (class in pomdp_py.utils.templates)": [[37, "pomdp_py.utils.templates.UniformPolicyModel"]], "white (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.WHITE"]], "yellow (pomdp_py.utils.typ.bcolors attribute)": [[37, "pomdp_py.utils.typ.bcolors.YELLOW"]], "approx_equal() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.approx_equal"]], "argmax() (pomdp_py.utils.templates.detrewardmodel method)": [[37, "pomdp_py.utils.templates.DetRewardModel.argmax"]], "b (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.b"]], "back() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.back"]], "bcolors (class in pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.bcolors"]], "bestseq (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.bestseq"]], "bestseqd() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.bestseqd"]], "blue() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.blue"]], "bold() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.bold"]], "bottomleft (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.bottomleft"]], "bottomright (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.bottomright"]], "bottomt (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.bottomt"]], "c (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.c"]], "clear (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.clear"]], "cyan() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.cyan"]], "d (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.d"]], "depth (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.depth"]], "det_dict_hash() (in module pomdp_py.utils.cython_utils)": [[37, "pomdp_py.utils.cython_utils.det_dict_hash"]], "disable() (pomdp_py.utils.typ.bcolors static method)": [[37, "pomdp_py.utils.typ.bcolors.disable"]], "down (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.down"]], "error() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.error"]], "euclidean_dist() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.euclidean_dist"]], "get_all_actions() (pomdp_py.utils.templates.uniformpolicymodel method)": [[37, "pomdp_py.utils.templates.UniformPolicyModel.get_all_actions"]], "get_all_observations() (pomdp_py.utils.templates.tabularobservationmodel method)": [[37, "pomdp_py.utils.templates.TabularObservationModel.get_all_observations"]], "get_all_states() (pomdp_py.utils.templates.tabulartransitionmodel method)": [[37, "pomdp_py.utils.templates.TabularTransitionModel.get_all_states"]], "green() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.green"]], "hex_to_rgb() (in module pomdp_py.utils.colors)": [[37, "pomdp_py.utils.colors.hex_to_rgb"]], "hline (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.hline"]], "info() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.info"]], "interpret_color() (in module pomdp_py.utils.debugging)": [[37, "pomdp_py.utils.debugging.interpret_color"]], "intersect (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.intersect"]], "inverse_color_hex() (in module pomdp_py.utils.colors)": [[37, "pomdp_py.utils.colors.inverse_color_hex"]], "inverse_color_rgb() (in module pomdp_py.utils.colors)": [[37, "pomdp_py.utils.colors.inverse_color_rgb"]], "json_safe() (in module pomdp_py.utils.misc)": [[37, "pomdp_py.utils.misc.json_safe"]], "l() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.l"]], "layer() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.layer"]], "leaf (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.leaf"]], "left (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.left"]], "leftt (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.leftt"]], "lighter() (in module pomdp_py.utils.colors)": [[37, "pomdp_py.utils.colors.lighter"]], "longbottomleft (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.longbottomleft"]], "longbottomright (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.longbottomright"]], "longleft (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.longleft"]], "longright (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.longright"]], "longtopleft (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.longtopleft"]], "longtopright (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.longtopright"]], "magenta() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.magenta"]], "mark() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.mark"]], "mark_path() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.mark_path"]], "mark_sequence() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.mark_sequence"]], "markp() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.markp"]], "mbp (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.mbp"]], "nl (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.nl"]], "nn (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.nn"]], "note() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.note"]], "nq (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.nq"]], "num_layers (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.num_layers"]], "num_nodes() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.num_nodes"]], "nv (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.nv"]], "p() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.p"]], "path() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.path"]], "path_to() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.path_to"]], "pm (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.pm"]], "pomdp_py.utils": [[37, "module-pomdp_py.utils"]], "pomdp_py.utils.colors": [[37, "module-pomdp_py.utils.colors"]], "pomdp_py.utils.cython_utils": [[37, "module-pomdp_py.utils.cython_utils"]], "pomdp_py.utils.debugging": [[37, "module-pomdp_py.utils.debugging"]], "pomdp_py.utils.math": [[37, "module-pomdp_py.utils.math"]], "pomdp_py.utils.misc": [[37, "module-pomdp_py.utils.misc"]], "pomdp_py.utils.templates": [[37, "module-pomdp_py.utils.templates"]], "pomdp_py.utils.typ": [[37, "module-pomdp_py.utils.typ"]], "pp (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.pp"]], "preferred_actions() (pomdp_py.utils.debugging.treedebugger static method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.preferred_actions"]], "probability() (pomdp_py.utils.templates.detobservationmodel method)": [[37, "pomdp_py.utils.templates.DetObservationModel.probability"]], "probability() (pomdp_py.utils.templates.dettransitionmodel method)": [[37, "pomdp_py.utils.templates.DetTransitionModel.probability"]], "probability() (pomdp_py.utils.templates.tabularobservationmodel method)": [[37, "pomdp_py.utils.templates.TabularObservationModel.probability"]], "probability() (pomdp_py.utils.templates.tabulartransitionmodel method)": [[37, "pomdp_py.utils.templates.TabularTransitionModel.probability"]], "proj() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.proj"]], "r (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.r"]], "random_unique_color() (in module pomdp_py.utils.colors)": [[37, "pomdp_py.utils.colors.random_unique_color"]], "red() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.red"]], "remap() (in module pomdp_py.utils.misc)": [[37, "pomdp_py.utils.misc.remap"]], "reward_func() (pomdp_py.utils.templates.detrewardmodel method)": [[37, "pomdp_py.utils.templates.DetRewardModel.reward_func"]], "rgb_to_hex() (in module pomdp_py.utils.colors)": [[37, "pomdp_py.utils.colors.rgb_to_hex"]], "right (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.right"]], "rightt (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.rightt"]], "rollout() (pomdp_py.utils.templates.uniformpolicymodel method)": [[37, "pomdp_py.utils.templates.UniformPolicyModel.rollout"]], "root (pomdp_py.utils.debugging.treedebugger property)": [[37, "pomdp_py.utils.debugging.TreeDebugger.root"]], "s() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.s"]], "s() (pomdp_py.utils.typ.bcolors static method)": [[37, "pomdp_py.utils.typ.bcolors.s"]], "safe_slice() (in module pomdp_py.utils.misc)": [[37, "pomdp_py.utils.misc.safe_slice"]], "sample() (pomdp_py.utils.templates.detobservationmodel method)": [[37, "pomdp_py.utils.templates.DetObservationModel.sample"]], "sample() (pomdp_py.utils.templates.detrewardmodel method)": [[37, "pomdp_py.utils.templates.DetRewardModel.sample"]], "sample() (pomdp_py.utils.templates.dettransitionmodel method)": [[37, "pomdp_py.utils.templates.DetTransitionModel.sample"]], "sample() (pomdp_py.utils.templates.tabularobservationmodel method)": [[37, "pomdp_py.utils.templates.TabularObservationModel.sample"]], "sample() (pomdp_py.utils.templates.tabularrewardmodel method)": [[37, "pomdp_py.utils.templates.TabularRewardModel.sample"]], "sample() (pomdp_py.utils.templates.tabulartransitionmodel method)": [[37, "pomdp_py.utils.templates.TabularTransitionModel.sample"]], "sample() (pomdp_py.utils.templates.uniformpolicymodel method)": [[37, "pomdp_py.utils.templates.UniformPolicyModel.sample"]], "shadebar (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.shadebar"]], "similar() (in module pomdp_py.utils.misc)": [[37, "pomdp_py.utils.misc.similar"]], "single_node_str() (pomdp_py.utils.debugging.treedebugger static method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.single_node_str"]], "sorted_by_str() (in module pomdp_py.utils.debugging)": [[37, "pomdp_py.utils.debugging.sorted_by_str"]], "special_char (class in pomdp_py.utils.misc)": [[37, "pomdp_py.utils.misc.special_char"]], "step() (pomdp_py.utils.debugging.treedebugger method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.step"]], "success() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.success"]], "to_radians() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.to_radians"]], "topleft (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.topleft"]], "topright (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.topright"]], "topt (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.topt"]], "tree_stats() (pomdp_py.utils.debugging.treedebugger static method)": [[37, "pomdp_py.utils.debugging.TreeDebugger.tree_stats"]], "up (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.up"]], "vec() (in module pomdp_py.utils.math)": [[37, "pomdp_py.utils.math.vec"]], "vline (pomdp_py.utils.misc.special_char attribute)": [[37, "pomdp_py.utils.misc.special_char.vline"]], "warning() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.warning"]], "white() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.white"]], "yellow() (in module pomdp_py.utils.typ)": [[37, "pomdp_py.utils.typ.yellow"]]}})
\ No newline at end of file