continuous-grid-arctic

A continuous environment for reinforcement learning of the task of the following the leader

Краткая инструкция:

Пример работы среды в скрипте main.py:

python main.py

Имеет следующие аргументы командной строки:

флаг manual -- если указан, управление агентом проводится вручную, с помощью стрелок;
n_steps -- число шагов среды, в течение которых проводится проверочная симуляция (по умолчанию: 5000);
training_steps -- в случае автоматического режима работы - число шагов, в течение которых учится модель.

На данный момент одна симуляция длится не более 5000 шагов (задаётся при создании конкретной среды параметром max_steps) или до тех пор, пока агент не попадёт в аварию (что наступит раньше) При создании среды можно задавать дополнительные ограничения;

Конфигурация среды

Чтобы создать свою версию среды:

в файле follow_the_leader_continuous_env.py создать наследующий основную среду класс (как, например, Test-Cont-Env-Auto-v0);
в методе init созданного класса задать нужные параметры при инициализации родительского класса (полный список параметров смотреть в методе init класса Game);
"зарегистрировать" среду как среду gym с помощью gym_register, по следующему шаблону:

3.1. id=Test-Cont-Env-<собственное_название>-v0;

3.2. follow_the_leader_continuous_env:<название класса среды, который создан в п.1>;

3.3. reward_threshold по своему желанию.

Name		Name	Last commit message	Last commit date
Latest commit History 233 Commits
continuous_grid_arctic		continuous_grid_arctic
video		video
.gitignore		.gitignore
MANIFEST.in		MANIFEST.in
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

continuous-grid-arctic

Краткая инструкция:

Конфигурация среды

TODO:

About

Releases

Packages

Contributors 3

Languages

aaselivanov/continuous-grid-arctic

Folders and files

Latest commit

History

Repository files navigation

continuous-grid-arctic

Краткая инструкция:

Конфигурация среды

TODO:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages