misdelivery/Llama-3.1-Swallow-70B-Nemotron-Instruct-v0.1のQ4_K_S GGUF(テスト用)です。 imatrix量子化をすると性能が向上すると思います。
4-bit