Pular para o conteúdo principal

Rate Limits

Os Rate Limits são mecanismos que controlam quantas requisições ou operações podem ser feitas em um período de tempo específico. Essa prática é muito comum em diversas APIs, pois ajuda a prevenir abusos e evitar sobrecargas.

Por que Rate Limits são importantes?

  1. Proteção contra abuso e ataques contra a API
    Ao impor limites de requisição, evitamos que um agente mal-intencionado possa fazer inúmeras chamadas à API para sobrecarregá-la ou interromper o serviço.

  2. Estabilidade do sistema e qualidade de serviço
    Ao limitar o número de requisições, garantimos uma distribuição mais equilibrada dos recursos. Dessa forma, quando alguém excede o número de solicitações, o desempenho para os demais usuários não é afetado. Isso assegura que todos tenham acesso equitativo aos recursos e mantém a qualidade do serviço.

Como funciona o Rate Limit?

Limite por usuário (user-level rate limit)
Estabelece quantas requisições cada usuário ou api_key pode fazer dentro de um período específico. Os rate limits são medidos de duas maneiras:

  • RPM (Requisições por minuto)
  • TPM (Tokens por minuto)

O limite é atingido quando qualquer uma dessas métricas (RPM ou TPM) chega ao valor máximo. Por exemplo, se você puder enviar 10 requisições por minuto (RPM = 10) e 100 tokens por minuto (TPM = 100), então enviar 9 requisições que somem 1000 tokens consumiria seu limite de tokens primeiro, mesmo que você ainda não tenha atingido as 10 requisições no mesmo minuto.

Observação:

  • Rate limits variam por modelo usado.
  • Para demandas ainda maiores, por favor nos contate em suporte@maritaca.ai

Níveis de uso

Conforme o uso e o gasto na API aumentam, você é automaticamente promovido para o próximo nível. Cada nível oferece rate limits mais altos para os modelos.
Observação: créditos iniciais e cupons não contam para subir de tier, apenas os gastos na API.

Tier 0

Gasto requerido: R$ 0

Para começar a testar

Tier 1

Gasto requerido: qualquer valor

Assim que tiver uso pago

Tier 2

Gasto requerido: R$ 100

Mais fôlego para protótipos

Tier 3

Gasto requerido: R$ 500

Para workloads consistentes

Tier 4

Gasto requerido: R$ 2.000

Operação em produção

Tier 5

Gasto requerido: R$ 5.000

Altos volumes e squads

Limites por tier

Tier 0

Entrada moderada para testes

ModeloRPMTPM InTPM Out
sabia-360128k10k
sabia-3.160128k10k
sabiazinho-360128k10k
Tier 1

Para MVPs e primeiros clientes

ModeloRPMTPM InTPM Out
sabia-31.0002M200k
sabia-3.11.0002M200k
sabiazinho-31.0002M200k
Tier 2

Escalando com segurança

ModeloRPMTPM InTPM Out
sabia-31.5004M350k
sabia-3.11.5004M350k
sabiazinho-32.0004M400k
Tier 3

Fluxos intensos

ModeloRPMTPM InTPM Out
sabia-32.0006M500k
sabia-3.12.0006M500k
sabiazinho-35.00020M800k
Tier 4

Produção em larga escala

ModeloRPMTPM InTPM Out
sabia-35.00010M1M
sabia-3.15.00010M1M
sabiazinho-310.00050M2M
Tier 5

Grandes operações

ModeloRPMTPM InTPM Out
sabia-310.00020M2M
sabia-3.110.00020M2M
sabiazinho-330.000100M10M