Entrar

Fine-Tuning, PEFT & Distillation

Esta página foca na adaptação de modelos para domínios específicos. Discutimos SFT (supervised fine-tuning), PEFT/LoRA/QLoRA, adapters, distillation e seleção de dados — do dataset ao checkpoint de produção. Enfatizamos curadoria/limpeza de dados, remoção de PII, balanceamento, validação cruzada e a comparação custo-qualidade (latência, acurácia, memória) para escolher a estratégia certa em cada contexto.