La mayoría de las automatizaciones con IA que vemos fallar no fallan por la IA — fallan por decisiones humanas que se tomaron antes de escribir una sola línea de código. Estos son los tres errores más caros que hemos visto en proyectos de los últimos 18 meses, con números reales de los aprendizajes.
💰 ¿Cuánto cuesta una automatización con IA en CR? Ver la guía completa de pricing — bots WhatsApp USD 1 500–3 000, pipelines USD 3 000–5 000, agentes USD 5 000–8 000.
Error 1: Automatizar un proceso que nadie ha documentado
El cliente dice "automatízame la cotización" y el equipo se lanza a integrar la API de OpenAI. Tres semanas después, el bot cotiza bien para el 60% de los casos y mal o errático para el 40% restante. ¿Por qué? Porque ese proceso nunca se escribió completo: las excepciones vivían en la cabeza de la persona que cotizaba a mano.
La regla es brutal pero clara: si tu equipo no puede escribir el proceso paso a paso, con todas sus excepciones, en un documento de máximo 5 páginas, no está listo para automatizarse. Antes de programar nada:
- Toma la última hora de cotizaciones (10–20 casos reales).
- Pide a la persona que las hace que escriba el paso a paso, incluyendo cuándo cambia de criterio.
- Lee las 5 páginas. Si encuentras 3+ casos sin regla clara, el proceso no es automatizable todavía.
Cuánto cuesta saltarse este paso: en uno de nuestros proyectos, el cliente perdió USD 4 000 reescribiendo el bot tres veces porque cada iteración rebuscaba en la cabeza del operario humano qué excepción faltaba. Documentar primero hubiera costado 2 días de trabajo del equipo del cliente.
Error 2: Usar prompts sueltos donde necesitas código tipado
Hay dos mundos en automatización con IA:
- Texto sin consecuencias graves: responder una FAQ, clasificar un correo, resumir un documento. Aquí el prompt directo (sin tipado) funciona bien — si la respuesta falla, el usuario pregunta de nuevo.
- Acciones con consecuencia: facturar, mover dinero, mandar un correo masivo, cobrar a una tarjeta. Aquí el prompt es peligroso.
¿Por qué? Porque un LLM puede alucinar un monto, una fecha o un nombre con perfecta naturalidad. Si tu sistema es "el LLM responde con un JSON y nosotros lo ejecutamos", un día va a responder con un monto cambiado en un dígito y tu sistema va a cobrar mil veces más. Lo hemos visto.
La solución es código tipado en el medio: el LLM propone, una capa de TypeScript/Python con esquemas validados (Zod, Pydantic) verifica que la propuesta cumple las reglas, y solo entonces se ejecuta. Si el LLM propone algo fuera de rango (amount > 5000 cuando no debería pasar de 1000), el código lo rechaza antes de ejecutar.
Para flujos críticos, esto se traduce en una arquitectura simple:
LLM → Schema validation → Business rules → Execute
↑ falla si no cumple — humano revisa
Costo de saltarse esta capa: un cliente nuestro casi cobra USD 2 800 en lugar de USD 280 por una factura. Lo detectó la auditoría a las 4 horas, antes del cierre contable. Sin el ojo humano hubiera ido al cliente.
Error 3: No medir el costo real por interacción
Es el error más silencioso y más caro al largo plazo. El equipo lanza el bot, los primeros días el costo de tokens del LLM es despreciable (USD 0.20 al día), y nadie revisa. Tres meses después, alguien ve la factura: USD 1 200 al mes en GPT-4o porque el bot se usa mucho más de lo previsto y cada interacción consume más tokens de los esperados.
Antes de poner en producción siempre se calcula:
- Tokens promedio por interacción (input + output).
- Costo por interacción en dólares, con el modelo elegido.
- Volumen estimado al mes (sé conservador — multiplica por 2).
- Costo mensual estimado = volumen × costo por interacción.
Si el costo mensual estimado no cabe en el presupuesto, cambia de modelo (de GPT-4o a GPT-4o-mini puede dividir el costo entre 10 sin perder mucha calidad para tareas medianas), o acorta el prompt (cada palabra del system prompt se paga cada interacción).
| Modelo (mayo 2026) | Costo por 1M tokens input | Costo por 1M tokens output |
|---|---|---|
| GPT-4o | USD 5 | USD 15 |
| GPT-4o-mini | USD 0.15 | USD 0.60 |
| Claude Sonnet 4 | USD 3 | USD 15 |
| Claude Haiku 4 | USD 0.80 | USD 4 |
| Gemini 2.5 Flash | USD 0.30 | USD 2.50 |
Para un bot conversacional típico (1 000 tokens por interacción promedio), GPT-4o-mini cuesta ~USD 0.0008 por interacción. 10 000 interacciones al mes = USD 8. GPT-4o para el mismo volumen = USD 200.
En resumen
| Error | Síntoma | Prevención |
|---|---|---|
| Automatizar sin documentar | Bot falla en 40% de casos | Documento de 5 páginas antes |
| Prompts sueltos en flujos críticos | Acciones erróneas que dañan al cliente | Schema + business rules en código |
| No medir costo por interacción | Factura sorpresa de USD 1 000+/mes | Calcular tokens × volumen ANTES |
La automatización con IA bien hecha paga su costo en semanas, no años. Pero solo si se diseña con disciplina, no con entusiasmo.
