`ding.config.example.PPOOffPolicy.gym_lunarlander_v2`¶

`ding.config.example.PPOOffPolicy.gym_lunarlander_v2` ¶

Full Source Code

../ding/config/example/PPOOffPolicy/gym_lunarlander_v2.py

from easydict import EasyDictimport ding.envs.gym_envcfg = dict(    exp_name='LunarLander-v2-PPOOffPolicy',    env=dict(        collector_env_num=8,        evaluator_env_num=8,        env_id='LunarLander-v2',        n_evaluator_episode=8,        stop_value=260,    ),    policy=dict(        cuda=True,        model=dict(            obs_shape=8,            action_shape=4,        ),        learn=dict(            update_per_collect=4,            batch_size=64,            learning_rate=0.001,            value_weight=0.5,            entropy_weight=0.01,            clip_ratio=0.2,            nstep=1,            nstep_return=False,            adv_norm=True,        ),        collect=dict(            n_sample=128,            unroll_len=1,            discount_factor=0.99,            gae_lambda=0.95,        ),    ),    wandb_logger=dict(        gradient_logger=True, video_logger=True, plot_logger=True, action_logger=True, return_logger=False    ),)cfg = EasyDict(cfg)env = ding.envs.gym_env.env

ding.config.example.PPOOffPolicy.gym_lunarlander_v2¶

ding.config.example.PPOOffPolicy.gym_lunarlander_v2 ¶

Full Source Code

`ding.config.example.PPOOffPolicy.gym_lunarlander_v2`¶

`ding.config.example.PPOOffPolicy.gym_lunarlander_v2` ¶