Claude Code rate limit, jak ominąć i optymalizować 2026
Rate limit w Anthropic API, system tier, jak sprawdzić zużycie, jak ominąć przez caching/batch/wybór modelu.
Spis treści
HTTP 429, "rate limit exceeded" w środku sesji, Claude Code zwalnia albo zatrzymuje się. Anthropic API ma tier system, którym ustawia limity per minutę. Im więcej wpłacasz, tym wyższy tier. Plus 3 dodatkowe techniki redukcji zużycia (caching, batch, wybór modelu).
Co to rate limit
Rate limit ogranicza ile requestów i tokenów możesz wysłać na minutę do Anthropic API. Domyślnie konta są na Tier 1 (małe limity), z biegiem czasu (po wpłatach credits) przechodzą na wyższe tiery automatycznie. Limity są per-model: Sonnet ma osobny limit, Opus osobny, Haiku osobny.
Headers w response zawierają informacje:
anthropic-ratelimit-requests-remaining: 47
anthropic-ratelimit-tokens-remaining: 38000
anthropic-ratelimit-tokens-reset: 2026-05-27T10:35:00Z Tier system Anthropic 2026
| Tier | Trigger | Sonnet 4.6 limit | Opus 4.7 limit |
|---|---|---|---|
| 1 | $5 deposit | 50 req/min | 20 req/min |
| 2 | $40 spent | 1000 req/min | 500 req/min |
| 3 | $200 spent | 2000 req/min | 1000 req/min |
| 4 | $400 spent | 4000 req/min | 2000 req/min |
Przejście tier automatyczne, sprawdź email z Anthropic albo console settings/limits.
Jak sprawdzić aktualny limit
Trzy sposoby:
- Console: anthropic.com/settings/limits pokazuje tier i RPM/TPM
- Claude Code CLI:
claude /statuspokazuje aktualne wykorzystanie sesji - API response headers:
anthropic-ratelimit-*w każdym response
Jak ominąć rate limit
1. Upgrade tier (najprostsze)
Wpłać credits przez console.anthropic.com/settings/billing. Tier upgrade typowo automatyczny w 24h. Tier 2 ($40 spent) jest sweet spotem dla większości pojedynczych devów.
2. Prompt caching (90% off na cached read)
Caching nie tylko obniża koszty, ale też zmniejsza zużycie limitu tokenów. Cached read tokens liczą się tylko 10% normalnej wagi w rate limit. Pełen tutorial w prompt caching po polsku.
3. Batch API (50% off, osobne limity)
Batch ma własne, znacznie wyższe limity i nie wlicza się do sync RPM. Dla async masowych zadań (klasyfikacja, generowanie, evaluation) użyj batch. Tutorial: Batch API po polsku.
4. Wybór modelu
Haiku 4.5 ma wyższe limity niż Opus 4.7 i kosztuje 15× mniej. Dla prostych tasków (klasyfikacja, format, krótkie odpowiedzi) używaj Haiku. W Claude Code: claude /model claude-haiku-4-5.
5. Exponential backoff w aplikacji
Przy HTTP 429 czekaj 2^N sekund i retry. Anthropic SDK robi to automatycznie ale z konserwatywnymi defaults. Custom retry logic:
import { Anthropic } from "@anthropic-ai/sdk";
const client = new Anthropic({ maxRetries: 5 }); Optymalizacja zużycia
- Skróć CLAUDE.md, każdy token w system prompt liczy się przy każdym wywołaniu. Trzymaj 1-2 strony max
- Wyczyść kontekst regularnie,
/clearw Claude Code resetuje historię - Hooks zamiast tools calls, niektóre rzeczy (lint, format) lepiej w hooks niż prosić Claude
- Subagents dla parallel tasks, każdy subagent ma własny kontekst, nie spamują głównej sesji
Pełna optymalizacja kosztów w kursie
Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 (security + koszty) z deep dive na cost monitoring, rate limit handling, prompt caching, batch API. Kursanci redukują bill o 50-80%.
Najczęściej zadawane pytania
Co to jest rate limit w Claude Code?
Rate limit to maksymalna ilość tokenów / requestów / minutę na Anthropic API. Domyślnie nowy account jest na Tier 1 (małe limity). Im więcej wpłacasz credits, tym wyższy tier i większe limity. Limity dotyczą per-model (Sonnet ma osobny limit, Opus osobny).
Jakie są tiers Anthropic API w 2026?
Tier 1: $5 deposit, 50 req/min Sonnet. Tier 2: $40 spent, 1000 req/min. Tier 3: $200 spent, 2000 req/min. Tier 4: $400 spent, 4000 req/min. Sprawdź obecne na console.anthropic.com/settings/limits.
Jak sprawdzić aktualne zużycie?
Console: anthropic.com/settings/usage. W terminalu: claude /status pokazuje wykorzystanie aktualnej sesji. Headers w API response: anthropic-ratelimit-tokens-remaining i anthropic-ratelimit-requests-remaining.
Jak ominąć rate limit?
1) Upgrade tier (deposit credits). 2) Włącz prompt caching, 90% off na cached read = mniejsze zużycie. 3) Użyj Batch API dla async tasków, 50% off + osobne limity. 4) Wybierz tańszy model (Haiku zamiast Opus). 5) Rozłóż workload w czasie (sleep między requestami).
Czy Claude Pro / Max ma rate limit?
Tak, ale inny. Claude Pro: ~45 wiadomości / 5h na Sonnet, mniej na Opus. Claude Max: 5× więcej limitów. Limity Pro/Max są fixed, niezależne od ilości tokenów. Dla intensywnego workflow API pay-per-use jest predictable cost.
Co się dzieje gdy przekroczę rate limit?
Response: HTTP 429 Too Many Requests z header retry-after (sekundy do retry). Claude Code automatycznie czeka i retry, ale przy dużym workloadzie powinieneś implement exponential backoff w aplikacji.
Czy rate limit jest per API key czy per organization?
Per organization (account). Jeśli masz 5 API keys w jednym account, dzielą limit. Dla isolation utwórz osobny account / organization.
Czy Batch API ma osobne limity?
Tak, batch ma własne limity (znacznie wyższe niż sync). Max 100k requestów per batch, max ~10 batches w toku jednocześnie. Idealne dla high-throughput async workloadów.
Powiązane artykuły
Claude Code cena 2026, ile kosztuje i czy jest darmowy
Claude Code cena w PLN i USD, plany Pro i Max, API pay-as-you-go, darmowe kredyty i alternatywy. Najtańsza legalna ścieżka. Stan maj 2026.
CzytajClaude Max plan po polsku, ceny i limity 2026
Plan Claude Max po polsku: ceny Max 5x i 20x, ile zapytań daje, Claude Pro vs Max, Max vs API. Limity sesji i tygodniowe. Stan maj 2026, dla kogo warto.
CzytajClaude Code Skills po polsku, tutorial Agent Skills 2026
Pierwszy polski tutorial Agent Skills w Claude Code. SKILL.md, frontmatter, progressive disclosure, jak tworzyć skille krok po kroku, vs subagents i MCP.
CzytajChcesz profesjonalnie nauczyć się tworzenia video AI?
6 modułów PDF + społeczność Discord. Dożywotni dostęp.