Glosario · IA & Automatización

RAG — Retrieval-Augmented Generation (Generación Aumentada por Recuperación)

Técnica que combina un LLM (GPT, Claude) con tu base de conocimiento privada para que responda con tu data, no con su training general.

← Volver al glosario

Definición completa

RAG (Retrieval-Augmented Generation) es la arquitectura más usada para construir bots conversacionales con conocimiento propio. Funciona en dos pasos: (1) cuando llega una pregunta, busca en tu base de datos (PDFs, FAQs, manuales convertidos a embeddings vectoriales) los fragmentos más relevantes. (2) Le pasa esos fragmentos al LLM junto con la pregunta y le pide que responda solo basándose en eso. Resultado: el bot da respuestas precisas con tu información, no alucinaciones.

En el contexto de Costa Rica

En Costa Rica RAG se usa para bots de WhatsApp/web que responden preguntas técnicas sobre productos, FAQs de soporte y calificación de leads. Costo típico: USD 1 000–3 000 para un bot RAG completo (carga de docs + embeddings + integración WhatsApp). Costos operacionales: USD 5–50/mes en tokens del LLM más USD 0–25/mes en vector database (Supabase, Pinecone).

Costo típicoUSD 1 000 – 3 000 (bot RAG)

Lectura relacionada en el sitio

Términos relacionados

Preguntas frecuentes

¿RAG es más barato que fine-tuning?▾

Sí, mucho más. Fine-tuning requiere entrenar un modelo custom (USD 1 000+ por iteración y se vuelve obsoleto cuando cambias data). RAG solo actualiza la base de conocimiento (USD 0 por actualización). 95 % de los casos de uso se resuelven mejor con RAG.

¿Listo para cotizar?

4 preguntas, 30 segundos. Te damos el rango USD + WhatsApp con tu scope pre-cargado.

Usar cotizador WhatsApp directo