64 GB RAM - Linux (Fedora) AMD Ryzen Pro AMD Radeon
!!! Use Llama.cpp Vulkan distribution
./llama-server -m /opt/models/Qwen3.5-9B-UD-Q4_K_XL.gguf \
--ctx-size 16384 \
--temp 0.7 \
--top-p 0.8 \
-ngl 99 \
-mg 0 \
-b 2048 \
-sm layer \
-t 16 \
--chat-template-kwargs '{"enable_thinking":false}'
./llama-server -m /opt/models/Qwen3VL-4B-Instruct-Q4_K_M.gguf \
--mmproj /opt/models/mmproj-Qwen3VL-4B-Instruct-Q8_0.gguf \
--jinja -b 1024 -t 8 -ngl 99 --temp 0.7 --top-k 20 \
--top-p 0.8 --min-p 0.01 --repeat-penalty 1.05 --ctx-size 65536
./llama-server -m /opt/models/Qwen3-Coder-Next-UD-Q2_K_XL.gguf
--jinja --ctx-size 32768 \
--temp 1.0 --top-p 0.95 --min-p 0.01 --top-k 40 --fit on
./llama-server -m /opt/models/Qwen3-Coder-Next-Q2_K.gguf --jinja --ctx-size 16384 --temp 1.0 --top-p 0.95 --min-p 0.01 --top-k 40 --fit on
./llama-server -m /opt/models/GLM-4.7-Flash-Q4_K_M.gguf --jinja --ctx-size 16384 --temp 1.0 --top-p 0.95 --min-p 0.01 --fit on