Prompt Engineering & Avaliação
Essa página é um espaço colaborativo para projetar prompts eficazes e medir qualidade em LLMs — do system prompt ao few-shot, do controle de estilo às instruções seguras. Focamos em métricas (factualidade, utilidade, toxicidade, viés), benchmarks reprodutíveis, testes A/B e guardrails que reduzem erros e custos.
