GitHub

Policy Gradient

Experiment with Policy Gradient methods (description), as well as variance reduction.

Current implementation:

$ conda env create -f [environment.yml | environment_cuda.yml]
$ conda activate [policy_grad | policy_grad_cuda]

$ python main.py --config_filename config_filename

Name	Name	Last commit message	Last commit date
Latest commit jupyter31 Remove ignored. Jul 11, 2024 d415736 · Jul 11, 2024 History 3 Commits
src	src	Initial commit	Jul 11, 2024
.gitattributes	.gitattributes	Initial commit	Jul 11, 2024
.gitignore	.gitignore	gitignore	Jul 11, 2024
README.md	README.md	Initial commit	Jul 11, 2024
environment.yml	environment.yml	Initial commit	Jul 11, 2024
environment_cuda.yml	environment_cuda.yml	Initial commit	Jul 11, 2024
main.py	main.py	Initial commit	Jul 11, 2024
setup.py	setup.py	Initial commit	Jul 11, 2024