← Volver al blog Técnicas IA
RAG explicado para un Product Owner: cuándo y por qué usarlo
28 de mayo de 20256 min
“Vamos a hacer RAG” se ha convertido en una respuesta reflejo a muchos problemas. Aquí qué significa realmente.
El problema que RAG resuelve
Un LLM tiene dos limitaciones fundamentales: el corte de conocimiento (no conoce tus datos internos) y la ventana de contexto (no puedes poner todo en cada petición).
RAG combina búsqueda en tus datos con la generación del LLM.
Cómo funciona, simplemente
- Tus documentos se dividen en fragmentos y se transforman en vectores (embeddings)
- Cuando un usuario hace una pregunta, se buscan los fragmentos más relevantes
- Esos fragmentos se inyectan en el contexto del LLM con la pregunta
- El LLM responde basándose en esos extractos
Cuándo RAG brilla
- FAQ y soporte al cliente sobre documentación propietaria
- Búsqueda en archivos voluminosos
- Agente de negocio con referencial de productos
Cuándo RAG NO es la solución
- Cuando la ventana de contexto es suficiente (documentos de menos de 50 páginas)
- Cuando el problema es la calidad del LLM, no los datos
- Cuando no has validado el caso de uso
Lo que debes saber como PO
La calidad del chunking es crítica. Las métricas de evaluación son diferentes — hay que evaluar también la recuperación. RAG no elimina las alucinaciones. Los costes son más complejos.
SC
Stéphanie Caumont
Product Owner de IA · Saber más