QuantFactory
/

Llama-3.1-Minitron-4B-Width-Base-GGUF

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-Minitron-4B-Width-Base-GGUF

1 contributor

History: 8 commits

aashish1904's picture

Upload Llama-3.1-Minitron-4B-Width-Base.Q5_K_M.gguf with huggingface_hub

7b89c22 verified 3 months ago

.gitattributes

2 kB

Upload Llama-3.1-Minitron-4B-Width-Base.Q5_K_M.gguf with huggingface_hub 3 months ago
Llama-3.1-Minitron-4B-Width-Base.Q4_0.gguf

2.65 GB
LFS

Upload Llama-3.1-Minitron-4B-Width-Base.Q4_0.gguf with huggingface_hub 3 months ago
Llama-3.1-Minitron-4B-Width-Base.Q4_1.gguf

2.91 GB
LFS

Upload Llama-3.1-Minitron-4B-Width-Base.Q4_1.gguf with huggingface_hub 3 months ago
Llama-3.1-Minitron-4B-Width-Base.Q4_K_M.gguf

2.78 GB
LFS

Upload Llama-3.1-Minitron-4B-Width-Base.Q4_K_M.gguf with huggingface_hub 3 months ago
Llama-3.1-Minitron-4B-Width-Base.Q5_K_M.gguf

3.23 GB
LFS

Upload Llama-3.1-Minitron-4B-Width-Base.Q5_K_M.gguf with huggingface_hub 3 months ago
Llama-3.1-Minitron-4B-Width-Base.Q6_K.gguf

3.71 GB
LFS

Upload Llama-3.1-Minitron-4B-Width-Base.Q6_K.gguf with huggingface_hub 3 months ago
Llama-3.1-Minitron-4B-Width-Base.Q8_0.gguf

4.8 GB
LFS

Upload Llama-3.1-Minitron-4B-Width-Base.Q8_0.gguf with huggingface_hub 3 months ago
README.md

6.19 kB

Upload README.md with huggingface_hub 3 months ago