Documentación
Precios, saldo y quota en la documentación de NexoRouter.
Precios, saldo y quota
NexoRouter usa saldo prepago y facturación por uso. Primero agregas saldo; después los requests de API consumen quota según el uso del modelo.


La captura de Billing usa datos demo desidentificados. Tu saldo, quota, transacciones y recibos reales serán diferentes.
Conceptos principales
| Concepto | Significado |
|---|---|
| Saldo prepago | Saldo de cuenta compartido por API keys. |
| Quota | Unidad interna de uso. 1 USD = 500000 quota. |
| Presupuesto de API key | Límite opcional para una key. |
| Alcance de modelos | Lista opcional de modelos que una key puede llamar. |
| Usage Logs | Registros de request con modelo, key, tokens, costo, latencia, estado y request ID. |
| Billing | Área del Dashboard para saldo, top-ups y pagos recientes. |
Opciones de top-up
El Dashboard ofrece paquetes estándar:
| Paquete | USD | Quota agregada |
|---|---|---|
| Starter | $5 | 2500000 |
| Growth | $20 | 10000000 |
| Scale | $100 | 50000000 |
También hay top-ups personalizados de $1 a $10000, redondeados a centavos.
Cómo se cobra un request
La mayoría de requests de chat usan:
- input tokens;
- output tokens.
Cada modelo tiene su propio precio de input y output. El cargo real aparece en Usage Logs como USD y quota.
Balance y presupuestos por key
El saldo del workspace se comparte, pero los key budgets limitan riesgo.
Configuración recomendada:
| Key | Budget | Scope |
|---|---|---|
local-dev | $5 | Todos los chat models o un modelo de bajo costo |
staging | $20 | Modelos usados por staging |
production | Presupuesto personalizado o workspace balance | Solo modelos que la app usa |
Saldo insuficiente
insufficient_quota significa que el workspace balance o el presupuesto de esa key no alcanza para el request.
Solución:
- Abre Billing y revisa saldo actual.
- Abre Usage Logs y revisa gasto reciente.
- Agrega saldo o crea una key nueva con el presupuesto correcto.
- Reintenta.
Control de costos
- Crea keys separadas para dev, staging y production.
- Usa presupuestos estrictos en experimentos y herramientas externas.
- Empieza con modelos de menor costo durante pruebas de integración.
- Configura
max_tokensdurante desarrollo. - Evita reintentos automáticos infinitos.
- Para modelos lentos, sube el timeout del cliente en vez de cancelar y reintentar rápidamente.
Límites de pago
El soporte de pago sigue las rutas disponibles en el Dashboard:
- Los top-ups se hacen desde Billing.
- Stripe Checkout es la ruta de checkout online soportada.
- El saldo se acredita después de procesar la confirmación firmada del pago.
- Refunds, disputas y créditos manuales requieren revisión humana.