Skip

01/Glosario · IA & Automatización

RAG — Retrieval-Augmented Generation (Generación Aumentada por Recuperación)

Técnica que combina un LLM (GPT, Claude) con tu base de conocimiento privada para que responda con tu data, no con su training general.

02/Definición completa

RAG (Retrieval-Augmented Generation) es la arquitectura más usada para construir bots conversacionales con conocimiento propio. Funciona en dos pasos: (1) cuando llega una pregunta, busca en tu base de datos (PDFs, FAQs, manuales convertidos a embeddings vectoriales) los fragmentos más relevantes. (2) Le pasa esos fragmentos al LLM junto con la pregunta y le pide que responda solo basándose en eso. Resultado: el bot da respuestas precisas con tu información, no alucinaciones.

03/En el contexto de Costa Rica

En Costa Rica RAG se usa para bots de WhatsApp/web que responden preguntas técnicas sobre productos, FAQs de soporte y calificación de leads. Costo típico: USD 1 500–3 000 para un bot RAG completo (carga de docs + embeddings + integración WhatsApp). Costos operacionales: USD 5–50/mes en tokens del LLM más USD 0–25/mes en vector database (Supabase, Pinecone).

Costo típicoUSD 1 500 – 3 000 (bot RAG)

04/Lectura relacionada en el sitio

05/Términos relacionados

06/Preguntas frecuentes

Preguntas frecuentes

¿RAG es más barato que fine-tuning?

Sí, mucho más. Fine-tuning requiere entrenar un modelo custom (USD 1 000+ por iteración y se vuelve obsoleto cuando cambias data). RAG solo actualiza la base de conocimiento (USD 0 por actualización). 95 % de los casos de uso se resuelven mejor con RAG.

¿Listo para cotizar?

4 preguntas, 30 segundos. Te damos el rango USD + WhatsApp con tu scope pre-cargado.