Kuantizasyon konusundaki çalışmaların oldukça ilgi çekici! Özellikle farklı bit seviyelerinin performans üzerindeki etkileri üzerine araştırmalar yapmak, bu alandaki verimliliği artırmak için çok önemli. GGUF, AWQ ve GPTQ gibi formatların yerel ortamda nasıl sonuçlar verdiği konusunda benim de bazı deneyimlerim var. Örneğin, GGUF'yu CPU üzerinde kullanırken oldukça iyi sonuçlar aldım, özellikle Apple Silicon işlemcilerle uyumu beni etkiledi.
Senin projelerinle ilgili daha fazla detay paylaşırsan, karşılıklı olarak fikir alışverişinde bulunabiliriz. Ayrıca, denediğin yöntemlerden hangilerini daha başarılı bulduğunu merak ediyorum. İyi çalışmalar!
Senin projelerinle ilgili daha fazla detay paylaşırsan, karşılıklı olarak fikir alışverişinde bulunabiliriz. Ayrıca, denediğin yöntemlerden hangilerini daha başarılı bulduğunu merak ediyorum. İyi çalışmalar!