HIGGS

updated 2 days ago

Models from inference-optimization org containing quantization bit info

Upvote

meta-llama/Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Sep 25, 2024 • 8.91M • • 5.68k
RedHatAI/Meta-Llama-3.1-8B-Instruct-FP8-dynamic

Text Generation • 8B • Updated 21 days ago • 27.4k • 9
RedHatAI/Llama-3.1-8B-Instruct-NVFP4

Text Generation • 5B • Updated Nov 21, 2025 • 19.5k • 1
inference-optimization/Llama-3.1-8B-Instruct_5_bits_mode_hybrid

6B • Updated 28 days ago • 29
inference-optimization/Llama-3.1-8B-Instruct_5_bits_mode_noise

6B • Updated 28 days ago • 35
inference-optimization/Llama-3.1-8B-Instruct_5_bits_mode_heuristic

6B • Updated 28 days ago • 28
inference-optimization/Llama-3.1-8B-Instruct_5.5_bits_mode_hybrid

6B • Updated 28 days ago • 38
inference-optimization/Llama-3.1-8B-Instruct_5.5_bits_mode_noise

6B • Updated 28 days ago • 29
inference-optimization/Llama-3.1-8B-Instruct_5.5_bits_mode_heuristic

6B • Updated 28 days ago • 26
inference-optimization/Llama-3.1-8B-Instruct_6_bits_mode_hybrid

6B • Updated 28 days ago • 30
inference-optimization/Llama-3.1-8B-Instruct_6_bits_mode_noise

6B • Updated 28 days ago • 29
inference-optimization/Llama-3.1-8B-Instruct_6_bits_mode_heuristic

6B • Updated 28 days ago • 32
inference-optimization/Llama-3.1-8B-Instruct_6.5_bits_mode_hybrid

7B • Updated 28 days ago • 31
inference-optimization/Llama-3.1-8B-Instruct_6.5_bits_mode_noise

7B • Updated 28 days ago • 28
inference-optimization/Llama-3.1-8B-Instruct_6.5_bits_mode_heuristic

7B • Updated 28 days ago • 40
inference-optimization/Llama-3.1-8B-Instruct_7_bits_mode_hybrid

7B • Updated 28 days ago • 36
inference-optimization/Llama-3.1-8B-Instruct_7_bits_mode_noise

7B • Updated 28 days ago • 27
inference-optimization/Llama-3.1-8B-Instruct_7_bits_mode_heuristic

7B • Updated 28 days ago • 26
meta-llama/Llama-3.2-1B-Instruct

Text Generation • 1B • Updated Oct 24, 2024 • 4.16M • • 1.36k
inference-optimization/Llama-3.2-1B-Instruct-FP8-Dynamic

1B • Updated 2 days ago • 17
inference-optimization/Llama-3.2-1B-Instruct-NVFP4

0.8B • Updated 2 days ago • 18
inference-optimization/Llama-3.2-1B-Instruct_5_bits_mode_hybrid

1B • Updated 28 days ago • 36
inference-optimization/Llama-3.2-1B-Instruct_5_bits_mode_noise

1B • Updated 28 days ago • 40
inference-optimization/Llama-3.2-1B-Instruct_5_bits_mode_heuristic

1B • Updated 28 days ago • 38
inference-optimization/Llama-3.2-1B-Instruct_5.5_bits_mode_hybrid

1B • Updated 28 days ago • 41
inference-optimization/Llama-3.2-1B-Instruct_5.5_bits_mode_noise

1B • Updated 28 days ago • 46
inference-optimization/Llama-3.2-1B-Instruct_5.5_bits_mode_heuristic

1B • Updated 28 days ago • 42
inference-optimization/Llama-3.2-1B-Instruct_6_bits_mode_hybrid

1B • Updated 28 days ago • 44
inference-optimization/Llama-3.2-1B-Instruct_6_bits_mode_noise

1B • Updated 28 days ago • 40
inference-optimization/Llama-3.2-1B-Instruct_6_bits_mode_heuristic

1B • Updated 28 days ago • 32
inference-optimization/Llama-3.2-1B-Instruct_6.5_bits_mode_hybrid

1B • Updated 28 days ago • 45
inference-optimization/Llama-3.2-1B-Instruct_6.5_bits_mode_noise

1B • Updated 28 days ago • 40
inference-optimization/Llama-3.2-1B-Instruct_6.5_bits_mode_heuristic

1B • Updated 28 days ago • 29
inference-optimization/Llama-3.2-1B-Instruct_7_bits_mode_hybrid

1B • Updated 28 days ago • 30
inference-optimization/Llama-3.2-1B-Instruct_7_bits_mode_noise

1B • Updated 28 days ago • 40
inference-optimization/Llama-3.2-1B-Instruct_7_bits_mode_heuristic

1B • Updated 28 days ago • 28
meta-llama/Llama-3.2-3B-Instruct

Text Generation • 3B • Updated Oct 24, 2024 • 5.86M • 2.09k
inference-optimization/Llama-3.2-3B-Instruct-FP8-Dynamic

3B • Updated 2 days ago • 12
inference-optimization/Llama-3.2-3B-Instruct-NVFP4

2B • Updated 2 days ago • 16
inference-optimization/Llama-3.2-3B-Instruct_5_bits_mode_hybrid

3B • Updated 28 days ago • 23
inference-optimization/Llama-3.2-3B-Instruct_5_bits_mode_noise

3B • Updated 28 days ago • 25
inference-optimization/Llama-3.2-3B-Instruct_5_bits_mode_heuristic

3B • Updated 28 days ago • 25
inference-optimization/Llama-3.2-3B-Instruct_5.5_bits_mode_hybrid

3B • Updated 28 days ago • 26
inference-optimization/Llama-3.2-3B-Instruct_5.5_bits_mode_noise

3B • Updated 28 days ago • 24
inference-optimization/Llama-3.2-3B-Instruct_5.5_bits_mode_heuristic

3B • Updated 28 days ago • 24
inference-optimization/Llama-3.2-3B-Instruct_6_bits_mode_hybrid

3B • Updated 28 days ago • 22
inference-optimization/Llama-3.2-3B-Instruct_6_bits_mode_noise

3B • Updated 28 days ago • 25
inference-optimization/Llama-3.2-3B-Instruct_6_bits_mode_heuristic

3B • Updated 28 days ago • 23
inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_hybrid

3B • Updated 28 days ago • 22
inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_noise

3B • Updated 28 days ago • 25
inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_heuristic

3B • Updated 28 days ago • 24
inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_hybrid

3B • Updated 28 days ago • 24
inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_noise

3B • Updated 28 days ago • 21
inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_heuristic

3B • Updated 28 days ago • 23
Qwen/Qwen3-8B

Text Generation • 8B • Updated Jul 26, 2025 • 8.78M • • 1.04k
RedHatAI/Qwen3-8B-FP8-dynamic

Text Generation • 8B • Updated 29 days ago • 20.3k • 12
RedHatAI/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Nov 21, 2025 • 1.24k • 1
inference-optimization/Qwen3-8B_5_bits_mode_hybrid

6B • Updated 28 days ago • 39
inference-optimization/Qwen3-8B_5_bits_mode_noise

6B • Updated 28 days ago • 36
inference-optimization/Qwen3-8B_5_bits_mode_heuristic

6B • Updated 28 days ago • 31
inference-optimization/Qwen3-8B_5.5_bits_mode_hybrid

6B • Updated 28 days ago • 31
inference-optimization/Qwen3-8B_5.5_bits_mode_noise

6B • Updated 28 days ago • 32
inference-optimization/Qwen3-8B_5.5_bits_mode_heuristic

6B • Updated 28 days ago • 36
inference-optimization/Qwen3-8B_6_bits_mode_hybrid

7B • Updated 28 days ago • 80
inference-optimization/Qwen3-8B_6_bits_mode_noise

7B • Updated 28 days ago • 30
inference-optimization/Qwen3-8B_6_bits_mode_heuristic

7B • Updated 28 days ago • 31
inference-optimization/Qwen3-8B_6.5_bits_mode_hybrid

7B • Updated 28 days ago • 33
inference-optimization/Qwen3-8B_6.5_bits_mode_noise

7B • Updated 28 days ago • 32
inference-optimization/Qwen3-8B_6.5_bits_mode_heuristic

7B • Updated 28 days ago • 28
inference-optimization/Qwen3-8B_7_bits_mode_hybrid

7B • Updated 28 days ago • 32
inference-optimization/Qwen3-8B_7_bits_mode_noise

7B • Updated 28 days ago • 32
inference-optimization/Qwen3-8B_7_bits_mode_heuristic

7B • Updated 28 days ago • 32
Qwen/Qwen3-30B-A3B

Text Generation • Updated Jul 26, 2025 • 1.59M • • 874
RedHatAI/Qwen3-30B-A3B-FP8-dynamic

Text Generation • 31B • Updated May 13, 2025 • 4.09k • 3
RedHatAI/Qwen3-30B-A3B-NVFP4

Text Generation • 17B • Updated Dec 4, 2025 • 26.8k • 2
inference-optimization/Qwen3-30B-A3B_5.0_bits_mode_hybrid

20B • Updated 9 days ago • 23
inference-optimization/Qwen3-30B-A3B_5.0_bits_mode_noise

20B • Updated 8 days ago • 26
inference-optimization/Qwen3-30B-A3B_5.0_bits_mode_heuristic

20B • Updated 8 days ago • 26
inference-optimization/Qwen3-30B-A3B_5.5_bits_mode_hybrid

22B • Updated 8 days ago • 27
inference-optimization/Qwen3-30B-A3B_5.5_bits_mode_noise

22B • Updated 8 days ago • 30 • 1
inference-optimization/Qwen3-30B-A3B_5.5_bits_mode_heuristic

22B • Updated 7 days ago • 26
inference-optimization/Qwen3-30B-A3B_6.0_bits_mode_hybrid

23B • Updated 8 days ago • 25
inference-optimization/Qwen3-30B-A3B_6.0_bits_mode_noise

24B • Updated 8 days ago • 20
inference-optimization/Qwen3-30B-A3B_6.0_bits_mode_heuristic

23B • Updated 8 days ago • 26
inference-optimization/Qwen3-30B-A3B_6.5_bits_mode_hybrid

24B • Updated 7 days ago • 19
inference-optimization/Qwen3-30B-A3B_6.5_bits_mode_noise

25B • Updated 7 days ago • 28
inference-optimization/Qwen3-30B-A3B_6.5_bits_mode_heuristic

25B • Updated 7 days ago • 26
inference-optimization/Qwen3-30B-A3B_7.0_bits_mode_hybrid

25B • Updated 7 days ago • 24
inference-optimization/Qwen3-30B-A3B_7.0_bits_mode_noise

27B • Updated 7 days ago • 29
inference-optimization/Qwen3-30B-A3B_7.0_bits_mode_heuristic

27B • Updated 7 days ago • 27
Qwen/Qwen3-30B-A3B-Instruct-2507

Text Generation • Updated Sep 17, 2025 • 1.15M • • 798
inference-optimization/Qwen3-30B-A3B-Instruct-2507-FP8-Dynamic

31B • Updated Mar 4 • 15
inference-optimization/Qwen3-30B-A3B-Instruct-2507-NVFP4

17B • Updated Mar 4 • 18
inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.0_bits_mode_hybrid

20B • Updated 12 days ago • 28
inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.0_bits_mode_noise

20B • Updated 12 days ago • 23
inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.0_bits_mode_heuristic

20B • Updated 12 days ago • 27
inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.5_bits_mode_hybrid

22B • Updated 12 days ago • 25
inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.5_bits_mode_noise

22B • Updated 12 days ago • 24
inference-optimization/Qwen3-30B-A3B-Instruct-2507_5.5_bits_mode_heuristic

22B • Updated 12 days ago • 25
inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.0_bits_mode_hybrid

23B • Updated 12 days ago • 28
inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.0_bits_mode_noise

23B • Updated 12 days ago • 23
inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.0_bits_mode_heuristic

23B • Updated 12 days ago • 31
inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.5_bits_mode_hybrid

25B • Updated 12 days ago • 29
inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.5_bits_mode_noise

25B • Updated 12 days ago • 25
inference-optimization/Qwen3-30B-A3B-Instruct-2507_6.5_bits_mode_heuristic

25B • Updated 12 days ago • 29
inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_hybrid

26B • Updated 12 days ago • 34
inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_noise

26B • Updated 11 days ago • 30
inference-optimization/Qwen3-30B-A3B-Instruct-2507_7.0_bits_mode_heuristic

27B • Updated 11 days ago • 28

Upvote

Collection guide
Browse collections