Pular para o conteúdo principal

Rate Limits

Os Rate Limits são mecanismos que controlam quantas requisições ou operações podem ser feitas em um período de tempo específico. Essa prática é muito comum em diversas APIs, pois ajuda a prevenir abusos e evitar sobrecargas.

Por que Rate Limits são importantes?

  1. Proteção contra abuso e ataques contra a API
    Ao impor limites de requisição, evitamos que um agente mal-intencionado possa fazer inúmeras chamadas à API para sobrecarregá-la ou interromper o serviço.

  2. Estabilidade do sistema e qualidade de serviço
    Ao limitar o número de requisições, garantimos uma distribuição mais equilibrada dos recursos. Dessa forma, quando alguém excede o número de solicitações, o desempenho para os demais usuários não é afetado. Isso assegura que todos tenham acesso equitativo aos recursos e mantém a qualidade do serviço.

Como funciona o Rate Limit?

Limite por usuário (user-level rate limit)
Estabelece quantas requisições cada usuário ou api_key pode fazer dentro de um período específico. Os limites de taxa são medidos de duas maneiras:

  • RPM (Requisições por minuto)
  • TPM (Tokens por minuto)

O limite é atingido quando qualquer uma dessas métricas (RPM ou TPM) chega ao valor máximo. Por exemplo, se você puder enviar 10 requisições por minuto (RPM = 10) e 100 tokens por minuto (TPM = 100), então enviar 9 requisições que somem 1000 tokens consumiria seu limite de tokens primeiro, mesmo que você ainda não tenha atingido as 10 requisições no mesmo minuto.

Observação:

  • Rate limits variam por modelo usado.
  • Para demandas ainda maiores, por favor nos contate em suporte@maritaca.ai

Níveis de uso

Conforme o uso e o gasto na API aumentam, você é automaticamente promovido para o próximo nível. Cada nível oferece limites de taxa mais altos para os modelos. Observação: Créditos iniciais e cupons não contam para subir de tier, apenas os gastos na API.

TierGasto requerido
Free0
Tier 1Qualquer gasto com a API
Tier 2R$100
Tier 3R$500
Tier 4R$2.000
Tier 5R$5.000

Selecione um nível abaixo para conferir o resumo geral dos limites de taxa por modelo:

Free tier rate limits

ModelRPMTPM InputTPM Output
sabia-360128.00010.000
sabiazinho-360128.00010.000

Tier 1 rate limits

ModelRPMTPM InputTPM Output
sabia-31.0002M200.000
sabiazinho-31.0002M200.000

Tier 2 rate limits

ModelRPMTPM InputTPM Output
sabia-31.5004M350.000
sabiazinho-32.0004M400.000

Tier 3 rate limits

ModelRPMTPM InputTPM Output
sabia-320006M500.000
sabiazinho-3500020M800.000

Tier 4 rate limits

ModelRPMTPM InputTPM Output
sabia-35.00010M1M
sabiazinho-310.00050M2M

Tier 5 rate limits

ModelRPMTPM InputTPM Output
sabia-310.00020M2M
sabiazinho-330.000100M10M