Edit Models filters

Inference status

Misc

arxiv: 2009.03300

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Mixture of Experts

Misc with no match

text-embeddings-inference

Carbon Emissions

Models

412

Full-text search

Active filters: 2009.03300

RichardErkhov/ibivibiv_-_athene-noctua-13b-gguf

Updated Aug 6 • 50

RichardErkhov/ibivibiv_-_bubo-bubo-13b-gguf

Updated Aug 6 • 48

RichardErkhov/ilsp_-_Meltemi-7B-Instruct-v1.5-gguf

Updated Aug 6 • 896

RichardErkhov/SeaLLMs_-_SeaLLMs-v3-1.5B-gguf

Updated Aug 8 • 513

piotr25691/SystemGemma2-2b-it

Text Generation • Updated Aug 11 • 109 • 1

piotr25691/SystemGemma2-9b-it

Text Generation • Updated Aug 11 • 36

piotr25691/SystemGemma2-27b-it

Text Generation • Updated Aug 11 • 23

RichardErkhov/piotr25691_-_SystemGemma2-2b-it-gguf

Updated Aug 11 • 335

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Updated Aug 22 • 22 • 19

xufofox/gemma-2-2b-it-test

Text Generation • Updated Aug 16 • 2

ThomasBaruzier/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 27 • 912 • 3

Orion-zhen/gemma-2-27b-it-6.5bpw

Text Generation • Updated Aug 18 • 2

RichardErkhov/silvainrichou_-_gemma-3b-002-gguf

Updated Aug 19 • 203

IntervitensInc/Llama-3.1-Minitron-4B-Width-Base-chatml

Updated Aug 26 • 1.74k • 1

bebechien/gemma-2-2b-GGUF

Text Generation • Updated Aug 21 • 36

bebechien/gemma-2-2b-GPTQ

Text Generation • Updated Aug 21 • 27

bebechien/gemma-2-2b-4.5bpw-exl2

Text Generation • Updated Aug 21

KIST-robot-intelligence/Qwen-14B-Chat-GGUF-Quantization

Text Generation • Updated Aug 21 • 425 • 1

QuantFactory/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Aug 21 • 706 • 4

QuantFactory/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Updated Aug 22 • 260 • 1

RichardErkhov/neuralmagic_-_SparseLlama-3-8B-pruned_50.2of4-gguf

Updated Aug 22 • 241

RichardErkhov/google_-_gemma-2-9b-gguf

Updated Aug 22 • 196

RichardErkhov/dmis-lab_-_llama-3-meerkat-8b-v1.0-gguf

Updated Aug 22 • 714

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23 • 4.8k

RichardErkhov/google_-_gemma-2-2b-gguf

Updated Aug 23 • 467

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23 • 5

QuantFactory/Meltemi-7B-Instruct-v1.5-GGUF

Text Generation • Updated Aug 23 • 158 • 1

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24 • 224 • 1

QuantFactory/Minitron-4B-Base-GGUF

Updated Aug 24 • 140 • 1

QuantFactory/Minitron-8B-Base-GGUF

Updated Aug 24 • 202 • 1