Rate Limits

Os Rate Limits são mecanismos que controlam quantas requisições ou operações podem ser feitas em um período de tempo específico. Essa prática é muito comum em diversas APIs, pois ajuda a prevenir abusos e evitar sobrecargas.

Por que Rate Limits são importantes?

Proteção contra abuso e ataques contra a API
Ao impor limites de requisição, evitamos que um agente mal-intencionado possa fazer inúmeras chamadas à API para sobrecarregá-la ou interromper o serviço.
Estabilidade do sistema e qualidade de serviço
Ao limitar o número de requisições, garantimos uma distribuição mais equilibrada dos recursos. Dessa forma, quando alguém excede o número de solicitações, o desempenho para os demais usuários não é afetado. Isso assegura que todos tenham acesso equitativo aos recursos e mantém a qualidade do serviço.

Como funciona o Rate Limit?

Limite por usuário (user-level rate limit)
Estabelece quantas requisições cada usuário ou api_key pode fazer dentro de um período específico. Os rate limits são medidos de duas maneiras:

RPM (Requisições por minuto)
TPM (Tokens por minuto)

O limite é atingido quando qualquer uma dessas métricas (RPM ou TPM) chega ao valor máximo. Por exemplo, se você puder enviar 10 requisições por minuto (RPM = 10) e 100 tokens por minuto (TPM = 100), então enviar 9 requisições que somem 1000 tokens consumiria seu limite de tokens primeiro, mesmo que você ainda não tenha atingido as 10 requisições no mesmo minuto.

Observação:

Rate limits variam por modelo usado.
Para demandas ainda maiores, por favor nos contate em suporte@maritaca.ai

Níveis de uso

Conforme o uso e o gasto na API aumentam, você é automaticamente promovido para o próximo nível. Cada nível oferece rate limits mais altos para os modelos.
Observação: créditos iniciais e cupons não contam para subir de tier, apenas os gastos na API.

Tier 0

Gasto requerido: R$ 0

Para começar a testar

Tier 1

Gasto requerido: qualquer valor

Assim que tiver uso pago

Tier 2

Gasto requerido: R$ 100

Mais fôlego para protótipos

Tier 3

Gasto requerido: R$ 500

Para workloads consistentes

Tier 4

Gasto requerido: R$ 2.000

Operação em produção

Tier 5

Gasto requerido: R$ 5.000

Altos volumes e squads

Limites por tier

Tier 0

Entrada moderada para testes

Modelo	RPM	TPM In	TPM Out
sabia-4	60	128k	10k
sabiazinho-4	60	128k	10k
sabia-3	60	128k	10k
sabia-3.1	60	128k	10k
sabiazinho-3	60	128k	10k

Tier 1

Para MVPs e primeiros clientes

Modelo	RPM	TPM In	TPM Out
sabia-4	1.000	2M	200k
sabiazinho-4	1.000	2M	200k
sabia-3	1.000	2M	200k
sabia-3.1	1.000	2M	200k
sabiazinho-3	1.000	2M	200k

Tier 2

Escalando com segurança

Modelo	RPM	TPM In	TPM Out
sabia-4	1.500	4M	350k
sabiazinho-4	2.000	4M	400k
sabia-3	1.500	4M	350k
sabia-3.1	1.500	4M	350k
sabiazinho-3	2.000	4M	400k

Tier 3

Fluxos intensos

Modelo	RPM	TPM In	TPM Out
sabia-4	2.000	6M	500k
sabiazinho-4	5.000	20M	800k
sabia-3	2.000	6M	500k
sabia-3.1	2.000	6M	500k
sabiazinho-3	5.000	20M	800k

Tier 4

Produção em larga escala

Modelo	RPM	TPM In	TPM Out
sabia-4	5.000	10M	1M
sabiazinho-4	10.000	50M	2M
sabia-3	5.000	10M	1M
sabia-3.1	5.000	10M	1M
sabiazinho-3	10.000	50M	2M

Tier 5

Grandes operações

Modelo	RPM	TPM In	TPM Out
sabia-4	10.000	20M	2M
sabiazinho-4	30.000	100M	10M
sabia-3	10.000	20M	2M
sabia-3.1	10.000	20M	2M
sabiazinho-3	30.000	100M	10M

Por que Rate Limits são importantes?​

Como funciona o Rate Limit?​

Níveis de uso​

Limites por tier​

Por que Rate Limits são importantes?

Como funciona o Rate Limit?

Níveis de uso

Limites por tier