ciCic
/

decisionTransformer

Feature Extraction

decision_transformer

decisionTransformer

deep reinforcement

Inference Endpoints

Model card Files Files and versions Community

ciCic commited on Sep 10, 2022

Commit

b6b4100

•

1 Parent(s): 74234b9

Create README.md

Files changed (1) hide show

README.md +123 -0

README.md ADDED Viewed

	@@ -0,0 +1,123 @@

+---
+tags:
+- decisionTransformer
+- deep reinforcement
+language:
+- af
+- am
+- ar
+- as
+- az
+- be
+- bg
+- bn
+- br
+- bs
+- ca
+- cs
+- cy
+- da
+- de
+- el
+- en
+- eo
+- es
+- et
+- eu
+- fa
+- fi
+- fr
+- fy
+- ga
+- gd
+- gl
+- gu
+- ha
+- he
+- hi
+- hr
+- hu
+- hy
+- id
+- is
+- it
+- ja
+- jv
+- ka
+- kk
+- km
+- kn
+- ko
+- ku
+- ky
+- la
+- lo
+- lt
+- lv
+- mg
+- mk
+- ml
+- mn
+- mr
+- ms
+- my
+- ne
+- nl
+- no
+- om
+- or
+- pa
+- pl
+- ps
+- pt
+- ro
+- ru
+- sa
+- sd
+- si
+- sk
+- sl
+- so
+- sq
+- sr
+- su
+- sv
+- sw
+- ta
+- te
+- th
+- tl
+- tr
+- ug
+- uk
+- ur
+- uz
+- vi
+- xh
+- yi
+- zh
+datasets:
+- edbeeching/decision_transformer_gym_replay
+license:
+- mit
+---
+### Running training
+- Num examples = 1000
+- Num Epochs = 120
+- Instantaneous batch size per device = 64
+- Total train batch size = 64
+- Gradient Accumulation steps = 1
+- Total optimization steps = 1920
+### Train Output
+- global_step = 1920
+- train_runtime = 1849.2158
+- train_samples_per_second = 64.892
+- train_steps_per_second = 1.038
+- train_loss = 0.04717305501302083
+- epoch = 120.0
+### Dataset
+- edbeeching/decision_transformer_gym_replay
+  - halfcheetah-expert-v2