Przejdź do głównej zawartości
Claude Code Autor: 6 min czytania
Opublikowano:

Claude Code rate limit, jak ominąć i optymalizować 2026

Rate limit w Anthropic API, system tier, jak sprawdzić zużycie, jak ominąć przez caching/batch/wybór modelu.

Spis treści

HTTP 429, "rate limit exceeded" w środku sesji, Claude Code zwalnia albo zatrzymuje się. Anthropic API ma tier system, którym ustawia limity per minutę. Im więcej wpłacasz, tym wyższy tier. Plus 3 dodatkowe techniki redukcji zużycia (caching, batch, wybór modelu).

Co to rate limit

Rate limit ogranicza ile requestów i tokenów możesz wysłać na minutę do Anthropic API. Domyślnie konta są na Tier 1 (małe limity), z biegiem czasu (po wpłatach credits) przechodzą na wyższe tiery automatycznie. Limity są per-model: Sonnet ma osobny limit, Opus osobny, Haiku osobny.

Headers w response zawierają informacje:

anthropic-ratelimit-requests-remaining: 47
anthropic-ratelimit-tokens-remaining: 38000
anthropic-ratelimit-tokens-reset: 2026-05-27T10:35:00Z

Tier system Anthropic 2026

Anthropic API tiers (zweryfikuj aktualne na console.anthropic.com)
Tier Trigger Sonnet 4.6 limit Opus 4.7 limit
1 $5 deposit 50 req/min 20 req/min
2 $40 spent 1000 req/min 500 req/min
3 $200 spent 2000 req/min 1000 req/min
4 $400 spent 4000 req/min 2000 req/min

Przejście tier automatyczne, sprawdź email z Anthropic albo console settings/limits.

Jak sprawdzić aktualny limit

Trzy sposoby:

  1. Console: anthropic.com/settings/limits pokazuje tier i RPM/TPM
  2. Claude Code CLI: claude /status pokazuje aktualne wykorzystanie sesji
  3. API response headers: anthropic-ratelimit-* w każdym response

Jak ominąć rate limit

1. Upgrade tier (najprostsze)

Wpłać credits przez console.anthropic.com/settings/billing. Tier upgrade typowo automatyczny w 24h. Tier 2 ($40 spent) jest sweet spotem dla większości pojedynczych devów.

2. Prompt caching (90% off na cached read)

Caching nie tylko obniża koszty, ale też zmniejsza zużycie limitu tokenów. Cached read tokens liczą się tylko 10% normalnej wagi w rate limit. Pełen tutorial w prompt caching po polsku.

3. Batch API (50% off, osobne limity)

Batch ma własne, znacznie wyższe limity i nie wlicza się do sync RPM. Dla async masowych zadań (klasyfikacja, generowanie, evaluation) użyj batch. Tutorial: Batch API po polsku.

4. Wybór modelu

Haiku 4.5 ma wyższe limity niż Opus 4.7 i kosztuje 15× mniej. Dla prostych tasków (klasyfikacja, format, krótkie odpowiedzi) używaj Haiku. W Claude Code: claude /model claude-haiku-4-5.

5. Exponential backoff w aplikacji

Przy HTTP 429 czekaj 2^N sekund i retry. Anthropic SDK robi to automatycznie ale z konserwatywnymi defaults. Custom retry logic:

import { Anthropic } from "@anthropic-ai/sdk";
const client = new Anthropic({ maxRetries: 5 });

Optymalizacja zużycia

  • Skróć CLAUDE.md, każdy token w system prompt liczy się przy każdym wywołaniu. Trzymaj 1-2 strony max
  • Wyczyść kontekst regularnie, /clear w Claude Code resetuje historię
  • Hooks zamiast tools calls, niektóre rzeczy (lint, format) lepiej w hooks niż prosić Claude
  • Subagents dla parallel tasks, każdy subagent ma własny kontekst, nie spamują głównej sesji

Pełna optymalizacja kosztów w kursie

Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 (security + koszty) z deep dive na cost monitoring, rate limit handling, prompt caching, batch API. Kursanci redukują bill o 50-80%.

Zobacz program kursu, 349 zł →

Najczęściej zadawane pytania

Co to jest rate limit w Claude Code?

Rate limit to maksymalna ilość tokenów / requestów / minutę na Anthropic API. Domyślnie nowy account jest na Tier 1 (małe limity). Im więcej wpłacasz credits, tym wyższy tier i większe limity. Limity dotyczą per-model (Sonnet ma osobny limit, Opus osobny).

Jakie są tiers Anthropic API w 2026?

Tier 1: $5 deposit, 50 req/min Sonnet. Tier 2: $40 spent, 1000 req/min. Tier 3: $200 spent, 2000 req/min. Tier 4: $400 spent, 4000 req/min. Sprawdź obecne na console.anthropic.com/settings/limits.

Jak sprawdzić aktualne zużycie?

Console: anthropic.com/settings/usage. W terminalu: claude /status pokazuje wykorzystanie aktualnej sesji. Headers w API response: anthropic-ratelimit-tokens-remaining i anthropic-ratelimit-requests-remaining.

Jak ominąć rate limit?

1) Upgrade tier (deposit credits). 2) Włącz prompt caching, 90% off na cached read = mniejsze zużycie. 3) Użyj Batch API dla async tasków, 50% off + osobne limity. 4) Wybierz tańszy model (Haiku zamiast Opus). 5) Rozłóż workload w czasie (sleep między requestami).

Czy Claude Pro / Max ma rate limit?

Tak, ale inny. Claude Pro: ~45 wiadomości / 5h na Sonnet, mniej na Opus. Claude Max: 5× więcej limitów. Limity Pro/Max są fixed, niezależne od ilości tokenów. Dla intensywnego workflow API pay-per-use jest predictable cost.

Co się dzieje gdy przekroczę rate limit?

Response: HTTP 429 Too Many Requests z header retry-after (sekundy do retry). Claude Code automatycznie czeka i retry, ale przy dużym workloadzie powinieneś implement exponential backoff w aplikacji.

Czy rate limit jest per API key czy per organization?

Per organization (account). Jeśli masz 5 API keys w jednym account, dzielą limit. Dla isolation utwórz osobny account / organization.

Czy Batch API ma osobne limity?

Tak, batch ma własne limity (znacznie wyższe niż sync). Max 100k requestów per batch, max ~10 batches w toku jednocześnie. Idealne dla high-throughput async workloadów.

Chcesz profesjonalnie nauczyć się tworzenia video AI?

6 modułów PDF + społeczność Discord. Dożywotni dostęp.

249 zł 399 zł
Zobacz kurs →