ThomasBaruzier
/

Llama-3.1-Minitron-4B-Width-Base-GGUF

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-Minitron-4B-Width-Base-GGUF

Commit History

Upload llama.log

f6d18dc
verified

ThomasBaruzier commited on Aug 27

Update README.md

e40721b
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ3_XXS.gguf

bfc98e0
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ3_S.gguf

67e7392
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ2_M.gguf

cbba92f
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ2_S.gguf

217a4b5
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-Q2_K_S.gguf

e735694
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ2_XS.gguf

3a8eea0
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-Q2_K.gguf

12132ac
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ2_XXS.gguf

dd6d82d
verified

ThomasBaruzier commited on Aug 27

Update README.md

e2537b2
verified

ThomasBaruzier commited on Aug 27

Upload imatrix.dat

72d3578
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ1_S.gguf

7a881e3
verified

ThomasBaruzier commited on Aug 27

Upload Llama-3.1-Minitron-4B-Width-Base-IQ1_M.gguf

1e7170f
verified

ThomasBaruzier commited on Aug 27

Update README.md

b57d558
verified

ThomasBaruzier commited on Aug 25

Update README.md

db967e8
verified

ThomasBaruzier commited on Aug 23

Update README.md

6f1ae81
verified

ThomasBaruzier commited on Aug 17

Update README.md

8f739be
verified

ThomasBaruzier commited on Aug 17

Create README.md

86e933e
verified

ThomasBaruzier commited on Aug 17

initial commit

38388f0
verified

ThomasBaruzier commited on Aug 17