LICENSE
README.md
setup.py
auto_gptq/__init__.py
auto_gptq.egg-info/PKG-INFO
auto_gptq.egg-info/SOURCES.txt
auto_gptq.egg-info/dependency_links.txt
auto_gptq.egg-info/requires.txt
auto_gptq.egg-info/top_level.txt
auto_gptq/eval_tasks/__init__.py
auto_gptq/eval_tasks/_base.py
auto_gptq/eval_tasks/language_modeling_task.py
auto_gptq/eval_tasks/sequence_classification_task.py
auto_gptq/eval_tasks/text_summarization_task.py
auto_gptq/eval_tasks/_utils/__init__.py
auto_gptq/eval_tasks/_utils/classification_utils.py
auto_gptq/eval_tasks/_utils/generation_utils.py
auto_gptq/modeling/__init__.py
auto_gptq/modeling/_base.py
auto_gptq/modeling/_const.py
auto_gptq/modeling/_utils.py
auto_gptq/modeling/auto.py
auto_gptq/modeling/baichuan.py
auto_gptq/modeling/bloom.py
auto_gptq/modeling/codegen.py
auto_gptq/modeling/decilm.py
auto_gptq/modeling/gpt2.py
auto_gptq/modeling/gpt_bigcode.py
auto_gptq/modeling/gpt_neox.py
auto_gptq/modeling/gptj.py
auto_gptq/modeling/internlm.py
auto_gptq/modeling/llama.py
auto_gptq/modeling/mistral.py
auto_gptq/modeling/mixtral.py
auto_gptq/modeling/moss.py
auto_gptq/modeling/opt.py
auto_gptq/modeling/qwen.py
auto_gptq/modeling/rw.py
auto_gptq/modeling/stablelmepoch.py
auto_gptq/modeling/xverse.py
auto_gptq/modeling/yi.py
auto_gptq/nn_modules/__init__.py
auto_gptq/nn_modules/_fused_base.py
auto_gptq/nn_modules/fused_gptj_attn.py
auto_gptq/nn_modules/fused_llama_attn.py
auto_gptq/nn_modules/fused_llama_mlp.py
auto_gptq/nn_modules/qlinear/__init__.py
auto_gptq/nn_modules/qlinear/qlinear_cuda.py
auto_gptq/nn_modules/qlinear/qlinear_cuda_old.py
auto_gptq/nn_modules/qlinear/qlinear_exllama.py
auto_gptq/nn_modules/qlinear/qlinear_exllamav2.py
auto_gptq/nn_modules/qlinear/qlinear_qigen.py
auto_gptq/nn_modules/qlinear/qlinear_triton.py
auto_gptq/nn_modules/triton_utils/__init__.py
auto_gptq/nn_modules/triton_utils/custom_autotune.py
auto_gptq/nn_modules/triton_utils/kernels.py
auto_gptq/nn_modules/triton_utils/mixin.py
auto_gptq/quantization/__init__.py
auto_gptq/quantization/gptq.py
auto_gptq/quantization/quantizer.py
auto_gptq/utils/__init__.py
auto_gptq/utils/data_utils.py
auto_gptq/utils/exllama_utils.py
auto_gptq/utils/import_utils.py
auto_gptq/utils/patch_utils.py
auto_gptq/utils/peft_utils.py
auto_gptq/utils/perplexity_utils.py
autogptq_extension/cuda_256/autogptq_cuda_256.cpp
autogptq_extension/cuda_256/autogptq_cuda_kernel_256.cu
autogptq_extension/cuda_64/autogptq_cuda_64.cpp
autogptq_extension/cuda_64/autogptq_cuda_kernel_64.cu
autogptq_extension/exllama/cuda_buffers.cu
autogptq_extension/exllama/exllama_ext.cpp
autogptq_extension/exllama/cuda_func/column_remap.cu
autogptq_extension/exllama/cuda_func/q4_matmul.cu
autogptq_extension/exllama/cuda_func/q4_matrix.cu
autogptq_extension/exllamav2/ext.cpp
autogptq_extension/exllamav2/cuda/q_gemm.cu
autogptq_extension/exllamav2/cuda/q_matrix.cu
autogptq_extension/qigen/backend.cpp
tests/__init__.py
tests/autoawq_generation.py
tests/awq_compat.py
tests/awq_to_autogptq.py
tests/awq_to_gptq_qllm.py
tests/bench_awq_gptq.py
tests/debug.py
tests/test_awq_compatibility.py
tests/test_peft_conversion.py
tests/test_q4.py
tests/test_quantization.py
tests/unpack_repack_awq.py