Fine-tuning, RAG o Prompt Engineering: ¿Cuándo Elegir Qué?
Cuando un cliente me pregunta “¿podríamos hacer fine-tuning del modelo con nuestros datos?”, mi primera respuesta es siempre: “probablemente no es necesario.” Este es el marco de decisión que uso.
Los Tres Enfoques
Prompt engineering: todo en el contexto. Ejemplos, instrucciones, formato esperado — el modelo generalista hace el resto.
RAG: el modelo recupera los pasajes relevantes de una base documental antes de responder.
Fine-tuning: reentrenamos el modelo en ejemplos anotados para cambiar su comportamiento base.
Matriz de Decisión
| Criterio | Prompt eng. | RAG | Fine-tuning |
|---|---|---|---|
| Coste inicial | Muy bajo | Medio | Alto |
| Mantenimiento | Bajo | Medio | Alto |
| Datos necesarios | 0 ejemplos | Documentos | 100–10k ejemplos |
| Respuestas con datos frescos | ✅ | ✅ | ❌ |
| Latencia añadida | Ninguna | +100–500ms | Ninguna |
| Consistencia de estilo | Buena | Buena | Excelente |
Cuándo el Prompt Engineering Es Suficiente
La gran mayoría de los casos: extracción estructurada, clasificación, generación con restricciones de formato.
prompt = """Extrae las siguientes entidades del texto como JSON:
- company_name (string)
- amount (number, en euros)
- date (YYYY-MM-DD)
Si falta una entidad, devuelve null.
Texto: {text}"""
Si necesitas 10 ejemplos para que el modelo entienda el formato, usa few-shot — no fine-tuning.
Cuándo Usar RAG
Siempre que la respuesta dependa de documentos que cambian frecuentemente o que superan la ventana de contexto:
- Base de conocimiento de producto (actualización mensual)
- Documentación técnica interna
- Archivos de email / tickets de soporte
RAG es más barato de mantener que el fine-tuning y permanece actualizado sin reentrenamiento.
Cuándo el Fine-tuning Está Justificado
Tres casos reales:
- Estilo muy restrictivo: el modelo debe escribir exactamente como tu marca, con giros que el prompt no captura de forma fiable.
- Tarea repetitiva de alto volumen: si haces 10M llamadas/mes a Sonnet para clasificación simple, el fine-tuning en Haiku puede reducir la factura ×5.
- Datos propietarios confidenciales: los ejemplos no pueden enviarse con cada llamada por razones legales.
Lo que Recomiendo
- Empieza con prompt engineering. Prueba en 50 ejemplos reales.
- Si los resultados son insuficientes por falta de conocimiento → RAG.
- Si RAG es demasiado lento / caro a escala, o el estilo es crítico → fine-tuning.
Rara vez llegarás al paso 3.
Stéphanie Caumont
Product Owner de IA · Saber más