Fine-tuning vs prompt engineering: ¿cómo elegir?
“Deberíamos hacer fine-tuning” es una frase que escucho con frecuencia cuando los resultados no son satisfactorios. La mayoría de las veces no es la solución correcta.
El reflejo del fine-tuning, por qué suele ser prematuro
Antes de hacer fine-tuning, la pregunta real es: ¿has agotado realmente las posibilidades del prompt engineering?
En mi práctica, el 80% de los casos donde se habla de fine-tuning se resuelven con un mejor prompt de sistema, ejemplos few-shot bien elegidos, o mejor estructuración de los inputs.
Cuándo el prompt engineering es suficiente
Para formato de salida, tono y estilo, reglas de negocio, y manejo de incertidumbre — el prompt engineering resuelve casi siempre.
Cuándo el fine-tuning tiene sentido
- Volumen muy alto de llamadas — Un modelo fine-tuned más pequeño puede reducir el coste de inferencia 10x.
- Tarea muy especializada con muchos datos — 10.000+ ejemplos de alta calidad en un dominio específico.
- Latencia crítica — Un modelo más pequeño responde más rápido.
- Privacidad — Tus datos no salen de tu infraestructura.
El proceso de decisión
Antes del fine-tuning: ¿tienes 1.000+ ejemplos de calidad? ¿Un equipo que mantenga el pipeline? ¿Has probado primero el prompt engineering? Si no, el fine-tuning es prematuro.
Stéphanie Caumont
Product Owner de IA · Saber más