Rate Limits
Os Rate Limits são mecanismos que controlam quantas requisições ou operações podem ser feitas em um período de tempo específico. Essa prática é muito comum em diversas APIs, pois ajuda a prevenir abusos e evitar sobrecargas.
Por que Rate Limits são importantes?
-
Proteção contra abuso e ataques contra a API
Ao impor limites de requisição, evitamos que um agente mal-intencionado possa fazer inúmeras chamadas à API para sobrecarregá-la ou interromper o serviço. -
Estabilidade do sistema e qualidade de serviço
Ao limitar o número de requisições, garantimos uma distribuição mais equilibrada dos recursos. Dessa forma, quando alguém excede o número de solicitações, o desempenho para os demais usuários não é afetado. Isso assegura que todos tenham acesso equitativo aos recursos e mantém a qualidade do serviço.
Como funciona o Rate Limit?
Limite por usuário (user-level rate limit)
Estabelece quantas requisições cada usuário ou api_key pode fazer dentro de um período específico. Os rate limits são medidos de duas maneiras:
- RPM (Requisições por minuto)
- TPM (Tokens por minuto)
O limite é atingido quando qualquer uma dessas métricas (RPM ou TPM) chega ao valor máximo. Por exemplo, se você puder enviar 10 requisições por minuto (RPM = 10) e 100 tokens por minuto (TPM = 100), então enviar 9 requisições que somem 1000 tokens consumiria seu limite de tokens primeiro, mesmo que você ainda não tenha atingido as 10 requisições no mesmo minuto.
Observação:
- Rate limits variam por modelo usado.
- Para demandas ainda maiores, por favor nos contate em suporte@maritaca.ai
Níveis de uso
Conforme o uso e o gasto na API aumentam, você é automaticamente promovido para o próximo nível. Cada nível oferece rate limits mais altos para os modelos.
Observação: créditos iniciais e cupons não contam para subir de tier, apenas os gastos na API.
Para começar a testar
Assim que tiver uso pago
Mais fôlego para protótipos
Para workloads consistentes
Operação em produção
Altos volumes e squads
Limites por tier
| Modelo | RPM | TPM In | TPM Out |
|---|---|---|---|
| sabia-3 | 60 | 128k | 10k |
| sabia-3.1 | 60 | 128k | 10k |
| sabiazinho-3 | 60 | 128k | 10k |
| Modelo | RPM | TPM In | TPM Out |
|---|---|---|---|
| sabia-3 | 1.000 | 2M | 200k |
| sabia-3.1 | 1.000 | 2M | 200k |
| sabiazinho-3 | 1.000 | 2M | 200k |
| Modelo | RPM | TPM In | TPM Out |
|---|---|---|---|
| sabia-3 | 1.500 | 4M | 350k |
| sabia-3.1 | 1.500 | 4M | 350k |
| sabiazinho-3 | 2.000 | 4M | 400k |
| Modelo | RPM | TPM In | TPM Out |
|---|---|---|---|
| sabia-3 | 2.000 | 6M | 500k |
| sabia-3.1 | 2.000 | 6M | 500k |
| sabiazinho-3 | 5.000 | 20M | 800k |
| Modelo | RPM | TPM In | TPM Out |
|---|---|---|---|
| sabia-3 | 5.000 | 10M | 1M |
| sabia-3.1 | 5.000 | 10M | 1M |
| sabiazinho-3 | 10.000 | 50M | 2M |
| Modelo | RPM | TPM In | TPM Out |
|---|---|---|---|
| sabia-3 | 10.000 | 20M | 2M |
| sabia-3.1 | 10.000 | 20M | 2M |
| sabiazinho-3 | 30.000 | 100M | 10M |