Francesco-A
/

ppo-MountainCar-v0

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

Francesco-A commited on Mar 3

Commit

a47abee

•

1 Parent(s): 9a1187f

Update README.md

Files changed (1) hide show

README.md +0 -2

README.md CHANGED Viewed

@@ -26,12 +26,10 @@ This is a trained model of a **PPO** agent playing **MountainCar-v0**
 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 # Model Details
-```python
 - Model Name: ppo-MountainCar-v0
 - Model Type: Proximal Policy Optimization (PPO)
 - Policy Architecture: MultiLayerPerceptron (MLPPolicy)
 - Environment: MountainCar-v0
-```
 - Training Data: The model was trained using three consecutive training sessions:
   - First training session: Total timesteps = 1,000,000
   - Second training session: Total timesteps = 500,000

 using the [stable-baselines3 library](https://github.com/DLR-RM/stable-baselines3).
 # Model Details
 - Model Name: ppo-MountainCar-v0
 - Model Type: Proximal Policy Optimization (PPO)
 - Policy Architecture: MultiLayerPerceptron (MLPPolicy)
 - Environment: MountainCar-v0
 - Training Data: The model was trained using three consecutive training sessions:
   - First training session: Total timesteps = 1,000,000
   - Second training session: Total timesteps = 500,000