Limites globais
Todos os endpoints estao sujeitos a um rate limit global:
| Parametro | Valor padrao |
|---|
| Janela de tempo | 60 segundos |
| Requisicoes por janela | 100 |
Esses valores sao configuraveis via variaveis de ambiente:
THROTTLE_TTL_MS — janela em milissegundos
THROTTLE_LIMIT — numero maximo de requisicoes
Limites por endpoint
Alguns endpoints possuem limites customizados:
| Endpoint | Limite | Janela |
|---|
POST /auth/token | 10 req | 60s |
POST /auth/dev/token | 30 req | 60s |
Rate limit de WhatsApp
Cada tenant pode configurar um rate limit especifico para envio de mensagens
WhatsApp, definido no momento da criacao ou atualizacao do tenant:
{
"whatsappRateLimit": {
"max": 100,
"durationMs": 60000
}
}
O rate limit de WhatsApp e aplicado no nível do tenant e controla o
enfileiramento de mensagens na fila BullMQ, nao diretamente nas requisicoes HTTP.
Quando o limite e excedido, a API retorna:
- Status:
429 Too Many Requests
- Retry-After: segundos ate a janela resetar