RAG explicado para un Product Owner: cuándo y por qué usarlo

28 de mayo de 20256 min

“Vamos a hacer RAG” se ha convertido en una respuesta reflejo a muchos problemas. Aquí qué significa realmente.

El problema que RAG resuelve

Un LLM tiene dos limitaciones fundamentales: el corte de conocimiento (no conoce tus datos internos) y la ventana de contexto (no puedes poner todo en cada petición).

RAG combina búsqueda en tus datos con la generación del LLM.

Cómo funciona, simplemente

Tus documentos se dividen en fragmentos y se transforman en vectores (embeddings)
Cuando un usuario hace una pregunta, se buscan los fragmentos más relevantes
Esos fragmentos se inyectan en el contexto del LLM con la pregunta
El LLM responde basándose en esos extractos

Cuándo RAG brilla

FAQ y soporte al cliente sobre documentación propietaria
Búsqueda en archivos voluminosos
Agente de negocio con referencial de productos

Cuándo RAG NO es la solución

Cuando la ventana de contexto es suficiente (documentos de menos de 50 páginas)
Cuando el problema es la calidad del LLM, no los datos
Cuando no has validado el caso de uso

Lo que debes saber como PO

La calidad del chunking es crítica. Las métricas de evaluación son diferentes — hay que evaluar también la recuperación. RAG no elimina las alucinaciones. Los costes son más complejos.

Stéphanie Caumont

Product Owner de IA · Saber más