Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

694

Base only

Active filters: modelopt

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 14 days ago • 4.81M • 354

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated about 14 hours ago • 441 • 52

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated about 20 hours ago • 7.09k • 25

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated 2 days ago • 395k • • 215

0xSero/GLM-5.2-504B

Text Generation • 290B • Updated about 21 hours ago • 7.2k • 18

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 2.01M • 97

lukealonso/GLM-5.2-NVFP4

Text Generation • 432B • Updated 9 days ago • 57.6k • 26

madeby561/GLM-5.2-NVFP4-REAP-504B-term

Text Generation • 290B • Updated 4 days ago • 1.11k • 13

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 16 days ago • 921k • 87

DJLougen/Qwable-5-27B-Coder-NVFP4

Text Generation • 15B • Updated 3 days ago • 467 • 7

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP-XS

Text Generation • 17B • Updated 2 days ago • 31.6k • 51

madeby561/GLM-5.2-NVFP4-REAP-504B

Text Generation • 290B • Updated 5 days ago • 348 • 8

brandonmusic/GLM-5.2-NVFP4-REAP-Recall-N172

Text Generation • 296B • Updated 2 days ago • 877 • 5

OpenYourMind/GLM-5.2-abliterated

432B • Updated about 5 hours ago • 5

sakamakismile/Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP

Text Generation • 17B • Updated 26 days ago • 61k • 63

stepfun-ai/Step-3.7-Flash-NVFP4

Image-Text-to-Text • 104B • Updated 25 days ago • 309k • 55

lukealonso/MiniMax-M3-NVFP4

246B • Updated 13 days ago • 13.9k • 22

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 1.26M • 362

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 1.81M • 144

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8

Any-to-Any • 33B • Updated May 5 • 60.5k • 57

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP

Text Generation • 20B • Updated 2 days ago • 36.7k • 21

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated May 15 • 659k • 39

AxionML/Gemma-4-12B-NVFP4

Image-Text-to-Text • 8B • Updated 22 days ago • 47.7k • 6

mmangkad/GLM-5.2-NVFP4

Text Generation • 381B • Updated 3 days ago • 2.83k • 3

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 83.4k • 36

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 29 • 380k • 262

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 268k • 61

sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP

Text Generation • 17B • Updated Apr 29 • 441k • 77

llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-NVFP4-GGUF

Image-Text-to-Text • 27B • Updated May 7 • 17.5k • 29

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated 24 days ago • 41k • 21