2 contributors

Step... (3000/50000 | Loss: 1.7852987051010132, Acc: 0.6470173597335815): 8%|██▎ | 3951/50000 [1:30:17<16:22:03, 1.28s/it]

e9393ef over 3 years ago

configs
Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
outputs
Step... (3000/50000 | Loss: 1.7852987051010132, Acc: 0.6470173597335815): 8%|██▎ | 3951/50000 [1:30:17<16:22:03, 1.28s/it] over 3 years ago
wandb
Step... (3000/50000 | Loss: 1.7852987051010132, Acc: 0.6470173597335815): 8%|██▎ | 3951/50000 [1:30:17<16:22:03, 1.28s/it] over 3 years ago
.gitattributes

737 Bytes

initial commit over 3 years ago
README.md

1.48 kB

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
config.json

618 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
convert.py

876 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
flax_model.msgpack

250 MB
LFS

Step... (3000/50000 | Loss: 1.7852987051010132, Acc: 0.6470173597335815): 8%|██▎ | 3951/50000 [1:30:17<16:22:03, 1.28s/it] over 3 years ago
merges.txt

514 kB

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
push_to_hub.sh

84 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
pytorch_model.bin

499 MB
LFS

Step... (3000/50000 | Loss: 1.7852987051010132, Acc: 0.6470173597335815): 8%|██▎ | 3951/50000 [1:30:17<16:22:03, 1.28s/it] over 3 years ago
run_mlm_flax_stream.py

35.2 kB

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
run_stream.128.sh

930 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
run_stream.512.log

720 kB

Step... (3000/50000 | Loss: 1.7852987051010132, Acc: 0.6470173597335815): 8%|██▎ | 3951/50000 [1:30:17<16:22:03, 1.28s/it] over 3 years ago
run_stream.512.sh

968 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
special_tokens_map.json

239 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
tokenizer.json

1.47 MB

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
tokenizer_config.json

292 Bytes

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago
vocab.json

855 kB

Step... (1000/50000 | Loss: 1.7686773538589478, Acc: 0.6487793326377869): 3%|▊ | 1286/50000 [29:40<20:20:20, 1.50s/it] over 3 years ago