Fine-tuning, RAG o Prompt Engineering: ¿Cuándo Elegir Qué?

2 jul. 20266 min

Cuando un cliente me pregunta “¿podríamos hacer fine-tuning del modelo con nuestros datos?”, mi primera respuesta es siempre: “probablemente no es necesario.” Este es el marco de decisión que uso.

Los Tres Enfoques

Prompt engineering: todo en el contexto. Ejemplos, instrucciones, formato esperado — el modelo generalista hace el resto.

RAG: el modelo recupera los pasajes relevantes de una base documental antes de responder.

Fine-tuning: reentrenamos el modelo en ejemplos anotados para cambiar su comportamiento base.

Matriz de Decisión

Criterio	Prompt eng.	RAG	Fine-tuning
Coste inicial	Muy bajo	Medio	Alto
Mantenimiento	Bajo	Medio	Alto
Datos necesarios	0 ejemplos	Documentos	100–10k ejemplos
Respuestas con datos frescos	✅	✅	❌
Latencia añadida	Ninguna	+100–500ms	Ninguna
Consistencia de estilo	Buena	Buena	Excelente

Cuándo el Prompt Engineering Es Suficiente

La gran mayoría de los casos: extracción estructurada, clasificación, generación con restricciones de formato.

prompt = """Extrae las siguientes entidades del texto como JSON:
- company_name (string)
- amount (number, en euros)
- date (YYYY-MM-DD)

Si falta una entidad, devuelve null.

Texto: {text}"""

Si necesitas 10 ejemplos para que el modelo entienda el formato, usa few-shot — no fine-tuning.

Cuándo Usar RAG

Siempre que la respuesta dependa de documentos que cambian frecuentemente o que superan la ventana de contexto:

Base de conocimiento de producto (actualización mensual)
Documentación técnica interna
Archivos de email / tickets de soporte

RAG es más barato de mantener que el fine-tuning y permanece actualizado sin reentrenamiento.

Cuándo el Fine-tuning Está Justificado

Tres casos reales:

Estilo muy restrictivo: el modelo debe escribir exactamente como tu marca, con giros que el prompt no captura de forma fiable.
Tarea repetitiva de alto volumen: si haces 10M llamadas/mes a Sonnet para clasificación simple, el fine-tuning en Haiku puede reducir la factura ×5.
Datos propietarios confidenciales: los ejemplos no pueden enviarse con cada llamada por razones legales.

Lo que Recomiendo

Empieza con prompt engineering. Prueba en 50 ejemplos reales.
Si los resultados son insuficientes por falta de conocimiento → RAG.
Si RAG es demasiado lento / caro a escala, o el estilo es crítico → fine-tuning.

Rara vez llegarás al paso 3.

SC

Stéphanie Caumont

Product Owner de IA · Saber más