phatjk
/

vinallama-7b-chat-AWQ

vinallama-7b-chat-AWQ / README.md

Create README.md

632e04c 11 months ago

89 Bytes

quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }