neuralmagic
/

Meta-Llama-3.1-405B-Instruct-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-405B-Instruct-quantized.w4a16

Commit History

Update README.md

9db6306
verified

alexmarques commited on Oct 10

Updated compression_config to quantization_config

d0c9cb9
verified

mgoin commited on Oct 9

Update README.md

6b753ea
verified

alexmarques commited on Sep 30

Update README.md

7d1f72d
verified

alexmarques commited on Aug 13

Update README.md

bb83fe4
verified

abhinavnmagic commited on Aug 13

Upload folder using huggingface_hub

423c174
verified

abhinavnmagic commited on Aug 13

Update README.md

91a872b
verified

abhinavnmagic commited on Aug 12

Update README.md

a8c9e50
verified

abhinavnmagic commited on Aug 9

Create README.md

2abcd4a
verified

abhinavnmagic commited on Aug 9

Upload folder using huggingface_hub

eadc452
verified

abhinavnmagic commited on Aug 9

initial commit

74fef34
verified

abhinavnmagic commited on Aug 9