← Volver al blog Técnicas IA

RAG explicado para un Product Owner: cuándo y por qué usarlo

28 de mayo de 20256 min

“Vamos a hacer RAG” se ha convertido en una respuesta reflejo a muchos problemas. Aquí qué significa realmente.

El problema que RAG resuelve

Un LLM tiene dos limitaciones fundamentales: el corte de conocimiento (no conoce tus datos internos) y la ventana de contexto (no puedes poner todo en cada petición).

RAG combina búsqueda en tus datos con la generación del LLM.

Cómo funciona, simplemente

  1. Tus documentos se dividen en fragmentos y se transforman en vectores (embeddings)
  2. Cuando un usuario hace una pregunta, se buscan los fragmentos más relevantes
  3. Esos fragmentos se inyectan en el contexto del LLM con la pregunta
  4. El LLM responde basándose en esos extractos

Cuándo RAG brilla

  • FAQ y soporte al cliente sobre documentación propietaria
  • Búsqueda en archivos voluminosos
  • Agente de negocio con referencial de productos

Cuándo RAG NO es la solución

  • Cuando la ventana de contexto es suficiente (documentos de menos de 50 páginas)
  • Cuando el problema es la calidad del LLM, no los datos
  • Cuando no has validado el caso de uso

Lo que debes saber como PO

La calidad del chunking es crítica. Las métricas de evaluación son diferentes — hay que evaluar también la recuperación. RAG no elimina las alucinaciones. Los costes son más complejos.

SC

Stéphanie Caumont

Product Owner de IA · Saber más