phatjk
/

vinallama-7b-chat-AWQ

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

phatjk commited on Dec 19, 2023

Commit

632e04c

•

1 Parent(s): 4755226

Create README.md

Files changed (1) hide show

README.md +1 -0

README.md ADDED Viewed

	@@ -0,0 +1 @@


1	+ quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }