Edit Models filters

Inference status

Misc

arxiv: 2407.14679

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

27

Full-text search

Active filters: 2407.14679

nvidia/Nemotron-Mini-4B-Instruct

Updated Sep 23 • 70 • 127

nvidia/Mistral-NeMo-Minitron-8B-Instruct

Text Generation • Updated Oct 9 • 4.02k • 61

nvidia/Minitron-8B-Base

Updated Aug 20 • 108 • 63

nvidia/Minitron-4B-Base

Updated Aug 22 • 19 • 127

nvidia/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 22 • 21 • 186

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Aug 22 • 18.2k • 160

QuantFactory/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Aug 21 • 416 • 5

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23 • 7.21k • 1

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

Updated Sep 26 • 1

QuantFactory/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 4 • 777 • 5

mav23/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 7 • 191 • 1

mgoin/Minitron-8B-Base-FP8

Text Generation • Updated Jul 26 • 30 • 3

mgoin/Nemotron-4-340B-Base-hf

Text Generation • Updated Aug 8 • 24 • 1

mgoin/Nemotron-4-340B-Base-hf-FP8

Text Generation • Updated Aug 8 • 118 • 2

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Updated Aug 22 • 25 • 19

ThomasBaruzier/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 27 • 418 • 3

IntervitensInc/Llama-3.1-Minitron-4B-Width-Base-chatml

Updated Aug 26 • 3 • 1

QuantFactory/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Updated Aug 22 • 148 • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23 • 1

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24 • 210 • 1

QuantFactory/Minitron-4B-Base-GGUF

Updated Aug 24 • 45 • 1

QuantFactory/Minitron-8B-Base-GGUF

Updated Aug 24 • 64 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Sep 9 • 7

abiks/Nemotron-Mini-4B-Instruct-GGUF-Q8

Updated Sep 14 • 51 • 3

QuantFactory/Nemotron-Mini-4B-Instruct-GGUF

Updated Sep 24 • 1.28k • 2

lucyknada/nvidia_Mistral-NeMo-Minitron-8B-Instruct-v3-exl2

Updated Oct 4 • 7

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated 11 days ago • 100