Bot IA para WhatsApp con Stock y Escuchando audios

🤖 IngeniaUp
| abril 01, 2026 | Lectura técnica

 En fechas clave como el Día de la Madre, San Valentín o Navidad, las tiendas de retail y regalos personalizados colapsan. El canal de WhatsApp se inunda de cientos de mensajes simultáneos. Los clientes no quieren un catálogo en PDF; buscan asesoría emocional: "Hola, es el aniversario de mi novia, ¿tienen algún arreglo con rosas rojas y peluche para entregar hoy mismo en Yanahuara?".

Un bot tradicional responde: "Opción no válida. Escriba CATÁLOGO". Esto genera frustración y ventas perdidas.

En IngeniaUp, desarrollamos el Agente WhatsApp Retail, un sistema de Inteligencia Artificial Generativa que no funciona con botones preprogramados. Es un vendedor experto que escucha audios, entiende la urgencia del cliente, revisa el inventario en el sistema (ERP/POS) en milisegundos y cierra la venta.

A continuación, detallamos la arquitectura técnica de este "Súper Vendedor 24/7".


1. El Fin del Texto: Entendiendo Notas de Voz con IA

El comercio moderno en Perú se mueve por audios de WhatsApp. Los clientes caminan por la calle o están apurados. Nuestro sistema integra Whisper (Speech-to-Text) en el flujo del chat.

Cuando el webhook de Meta/WhatsApp recibe un mensaje de voz, el Agente no le pide al usuario que escriba. Descarga el audio, lo transcribe tolerando la jerga local y el ruido de la calle, y extrae la intención de compra (Intention Extraction).

2. Conexión RAG (Retrieval-Augmented Generation) con el Inventario en Vivo

El mayor problema de los LLMs (como ChatGPT) es que "alucinan" o inventan cosas que no tienes en la tienda. Nuestro Agente utiliza una arquitectura RAG conectada directamente a la base de datos SQL de la tienda.

El Flujo Increíble:

  1. El cliente pide: "Quiero una taza mágica personalizada para mañana".

  2. El Agente consulta silenciosamente la tabla de inventario mediante una API interna.

  3. Escenario A (Hay Stock): El Agente responde: "¡Claro que sí! Tenemos 15 tazas mágicas en stock. Si me pasas la foto ahora mismo, la tenemos lista para mañana. ¿Te genero el link de pago?".

  4. Escenario B (Cross-Selling Inteligente por Falta de Stock): Si el stock es 0, el Agente no dice "No hay". La IA está programada para negociar: "Chispas, las tazas mágicas volaron por la campaña. Pero para mañana mismo te puedo sacar un Tomatodo Premium personalizado o un Cuadro de Madera grabado que están bellísimos y al mismo precio. ¿Te mando fotitos?".

3. Cierre de Ventas y Pasarela de Pagos

El Agente no solo asesora; convierte. Una vez que el cliente acepta, el Agente invoca una función (Function Calling) que genera un enlace de pago dinámico (Niubiz, MercadoPago o Yape) con el monto exacto y solicita los datos de envío, inyectando el pedido final directamente en el panel de los despachadores.


Arquitectura del Agente: Código en Acción

Para lograr esta fluidez, utilizamos un LLM local u optimizado para baja latencia, integrando herramientas externas (Tools/Function Calling). Aquí un fragmento del núcleo en Python:

Python
from langchain.agents import initialize_agent, Tool
from langchain.prompts import PromptTemplate
import inventario_sql

# 1. Herramienta que el Agente puede usar por su cuenta para ver el stock real
def consultar_stock_en_vivo(producto):
    stock = inventario_sql.buscar_producto(producto)
    return f"Stock actual de {producto}: {stock} unidades."

tools = [
    Tool(
        name="Consultar Inventario",
        func=consultar_stock_en_vivo,
        description="Útil para revisar si hay stock antes de ofrecer un producto al cliente."
    )
]

# 2. El "Cerebro" del Vendedor (Prompt Engineering)
prompt_vendedor = """
Eres el vendedor estrella de Regalos Arequipa. 
REGLA 1: NUNCA ofrezcas un producto sin usar la herramienta 'Consultar Inventario' primero.
REGLA 2: Si el stock es 0, NO digas simplemente "no hay". Ofrece el producto más similar disponible con entusiasmo.
REGLA 3: Habla de forma cálida, cercana y usa jerga peruana sutil ("Claro que sí", "Al toque").
"""

# 3. Ejecución cuando llega un WhatsApp
def procesar_mensaje_whatsapp(mensaje_cliente):
    # El agente razona: "Me piden un peluche. Debo usar la herramienta Consultar Inventario."
    respuesta = agente.run(input=mensaje_cliente)
    enviar_whatsapp(respuesta)

# Ejemplo Real:
# Cliente: "¿Tienen cajas de chocolates Ferrero de 24?"
# Agente (Pensamiento interno): Consultando BD... Stock = 0. Stock de Caja de 16 = 5.
# Agente (Respuesta enviada): "¡Hola! Las cajitas de 24 se nos agotaron rapidísimo hoy, pero tengo unas hermosas cajas de 16 bombones en stock listas para enviar. ¡Perfectas para el detalle! ¿Te separo una?"

La IA que sí trae Retorno de Inversión (ROI)

Un bot de opciones cuesta clientes; un Agente Conversacional conectado a tu inventario los fideliza. En implementaciones de alto tráfico comercial, este sistema ha demostrado reducir la carga operativa de los vendedores humanos en un 70%, permitiéndoles enfocarse solo en pedidos corporativos o problemas complejos, mientras la IA atiende la venta al por menor las 24 horas del día.

Si tu tienda de retail en Arequipa o Perú sigue perdiendo ventas en la madrugada o por demoras en responder mensajes de WhatsApp, es momento de integrar verdadera ingeniería a tus procesos.