neuralmagic
/

Meta-Llama-3-70B-Instruct-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

Model card Files Files and versions Community

Meta-Llama-3-70B-Instruct-quantized.w8a16

Commit History

Upload tokenizer

dac44cb
verified

alexmarques commited on Jul 3

Update README.md

5b84ce8
verified

alexmarques commited on Jul 2

Upload LlamaForCausalLM

09c0928
verified

alexmarques commited on Jul 2

Create README.md

50ec7e7
verified

alexmarques commited on Jul 2

initial commit

101ef04
verified

alexmarques commited on Jul 2