lm eval

Files changed (8) hide show

model.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:917083108aebdf999483d240272412d42a8cd47ebab1059ab8bd96ff10d2b002
+size 66562045

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:85e0d90b050e8b65afa291dca4f06938140338f35d30aeac77d96838efa33c7d
+size 66551672

out/pretrain/final/evaluate/config.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:94e73e086a5ed14149cee99a1aa3e2563ec7ab536c1653ff332999afa3520694
+size 546

out/pretrain/final/evaluate/model_config.yaml ADDED Viewed

+attention_logit_softcapping: null
+attention_scores_scalar: null
+bias: false
+block_size: 32768
+final_logit_softcapping: null
+gelu_approximate: none
+head_size: 26
+hf_config: {}
+intermediate_size: 1092
+lm_head_bias: false
+mlp_class_name: LLaMAMLP
+n_embd: 312
+n_expert: 0
+n_expert_per_token: 0
+n_head: 12
+n_layer: 10
+n_query_groups: 4
+name: ''
+norm_class_name: RMSNorm
+norm_eps: 1.0e-05
+padded_vocab_size: 32768
+padding_multiple: 512
+parallel_residual: false
+post_attention_norm: false
+post_mlp_norm: false
+rope_base: 500000
+rope_condense_ratio: 1
+rotary_percentage: 1.0
+scale_embeddings: false
+shared_attention_norm: false
+sliding_window_layer_placing: null
+sliding_window_size: null
+vocab_size: 32768

out/pretrain/final/evaluate/pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:85703bfe7255763468bcc1a1d2ddb7e13c665cf78f12716ce9177915cec173ef
+size 66570501

out/pretrain/final/evaluate/results.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdfcb715382c318246f445c75353b1cc336cfe0e32db3a2d429c4ece6a94f22f
+size 139346753

out/pretrain/final/evaluate/tokenizer.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b496a30dc268bcb8adfd551f693e68e9eadd06b81cab385c088a61e7663649c
+size 1368561

out/pretrain/final/evaluate/tokenizer_config.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d6333d68c3280be6081b795cc160fd5872707562021f9889b2e2bd3ae508fa62
+size 23043