Claude Code Autor: Łukasz Kowalski 6 min czytania

Opublikowano: 27 maja 2026

Claude Code rate limit, jak ominąć i optymalizować 2026

Q: Jak sprawdzić aktualne zużycie?

Console: anthropic.com/settings/usage. W terminalu: claude /status pokazuje wykorzystanie aktualnej sesji. Headers w API response: anthropic-ratelimit-tokens-remaining i anthropic-ratelimit-requests-remaining .

Q: Co się dzieje gdy przekroczę rate limit?

Response: HTTP 429 Too Many Requests z header retry-after (sekundy do retry). Claude Code automatycznie czeka i retry, ale przy dużym workloadzie powinieneś implement exponential backoff w aplikacji.

Rate limit w Anthropic API, system tier, jak sprawdzić zużycie, jak ominąć przez caching/batch/wybór modelu.

Spis treści

Co to rate limit
Tier system Anthropic
Jak sprawdzić limit
Jak ominąć rate limit
Optymalizacja zużycia
FAQ

HTTP 429, "rate limit exceeded" w środku sesji, Claude Code zwalnia albo zatrzymuje się. Anthropic API ma tier system, którym ustawia limity per minutę. Im więcej wpłacasz, tym wyższy tier. Plus 3 dodatkowe techniki redukcji zużycia (caching, batch, wybór modelu).

Co to rate limit

Rate limit ogranicza ile requestów i tokenów możesz wysłać na minutę do Anthropic API. Domyślnie konta są na Tier 1 (małe limity), z biegiem czasu (po wpłatach credits) przechodzą na wyższe tiery automatycznie. Limity są per-model: Sonnet ma osobny limit, Opus osobny, Haiku osobny.

Headers w response zawierają informacje:

anthropic-ratelimit-requests-remaining: 47
anthropic-ratelimit-tokens-remaining: 38000
anthropic-ratelimit-tokens-reset: 2026-05-27T10:35:00Z

Tier system Anthropic 2026

Anthropic API tiers (zweryfikuj aktualne na console.anthropic.com)
Tier	Trigger	Sonnet 4.6 limit	Opus 4.7 limit
1	$5 deposit	50 req/min	20 req/min
2	$40 spent	1000 req/min	500 req/min
3	$200 spent	2000 req/min	1000 req/min
4	$400 spent	4000 req/min	2000 req/min

Przejście tier automatyczne, sprawdź email z Anthropic albo console settings/limits.

Jak sprawdzić aktualny limit

Trzy sposoby:

Console: anthropic.com/settings/limits pokazuje tier i RPM/TPM
Claude Code CLI: claude /status pokazuje aktualne wykorzystanie sesji
API response headers: anthropic-ratelimit-* w każdym response

Jak ominąć rate limit

1. Upgrade tier (najprostsze)

Wpłać credits przez console.anthropic.com/settings/billing. Tier upgrade typowo automatyczny w 24h. Tier 2 ($40 spent) jest sweet spotem dla większości pojedynczych devów.

2. Prompt caching (90% off na cached read)

Caching nie tylko obniża koszty, ale też zmniejsza zużycie limitu tokenów. Cached read tokens liczą się tylko 10% normalnej wagi w rate limit. Pełen tutorial w prompt caching po polsku.

3. Batch API (50% off, osobne limity)

Batch ma własne, znacznie wyższe limity i nie wlicza się do sync RPM. Dla async masowych zadań (klasyfikacja, generowanie, evaluation) użyj batch. Tutorial: Batch API po polsku.

4. Wybór modelu

Haiku 4.5 ma wyższe limity niż Opus 4.7 i kosztuje 15× mniej. Dla prostych tasków (klasyfikacja, format, krótkie odpowiedzi) używaj Haiku. W Claude Code: claude /model claude-haiku-4-5.

5. Exponential backoff w aplikacji

Przy HTTP 429 czekaj 2^N sekund i retry. Anthropic SDK robi to automatycznie ale z konserwatywnymi defaults. Custom retry logic:

import { Anthropic } from "@anthropic-ai/sdk";
const client = new Anthropic({ maxRetries: 5 });

Optymalizacja zużycia

Skróć CLAUDE.md, każdy token w system prompt liczy się przy każdym wywołaniu. Trzymaj 1-2 strony max
Wyczyść kontekst regularnie, /clear w Claude Code resetuje historię
Hooks zamiast tools calls, niektóre rzeczy (lint, format) lepiej w hooks niż prosić Claude
Subagents dla parallel tasks, każdy subagent ma własny kontekst, nie spamują głównej sesji

Pełna optymalizacja kosztów w kursie

Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 (security + koszty) z deep dive na cost monitoring, rate limit handling, prompt caching, batch API. Kursanci redukują bill o 50-80%.

Zobacz program kursu, 349 zł →

Najczęściej zadawane pytania

Co to jest rate limit w Claude Code?

Rate limit to maksymalna ilość tokenów / requestów / minutę na Anthropic API. Domyślnie nowy account jest na Tier 1 (małe limity). Im więcej wpłacasz credits, tym wyższy tier i większe limity. Limity dotyczą per-model (Sonnet ma osobny limit, Opus osobny).

Jakie są tiers Anthropic API w 2026?

Tier 1: $5 deposit, 50 req/min Sonnet. Tier 2: $40 spent, 1000 req/min. Tier 3: $200 spent, 2000 req/min. Tier 4: $400 spent, 4000 req/min. Sprawdź obecne na console.anthropic.com/settings/limits.

Jak sprawdzić aktualne zużycie?

Console: anthropic.com/settings/usage. W terminalu: claude /status pokazuje wykorzystanie aktualnej sesji. Headers w API response: anthropic-ratelimit-tokens-remaining i anthropic-ratelimit-requests-remaining.

Jak ominąć rate limit?

1) Upgrade tier (deposit credits). 2) Włącz prompt caching, 90% off na cached read = mniejsze zużycie. 3) Użyj Batch API dla async tasków, 50% off + osobne limity. 4) Wybierz tańszy model (Haiku zamiast Opus). 5) Rozłóż workload w czasie (sleep między requestami).

Czy Claude Pro / Max ma rate limit?

Tak, ale inny. Claude Pro: ~45 wiadomości / 5h na Sonnet, mniej na Opus. Claude Max: 5× więcej limitów. Limity Pro/Max są fixed, niezależne od ilości tokenów. Dla intensywnego workflow API pay-per-use jest predictable cost.

Co się dzieje gdy przekroczę rate limit?

Response: HTTP 429 Too Many Requests z header retry-after (sekundy do retry). Claude Code automatycznie czeka i retry, ale przy dużym workloadzie powinieneś implement exponential backoff w aplikacji.

Czy rate limit jest per API key czy per organization?

Per organization (account). Jeśli masz 5 API keys w jednym account, dzielą limit. Dla isolation utwórz osobny account / organization.

Czy Batch API ma osobne limity?

Tak, batch ma własne limity (znacznie wyższe niż sync). Max 100k requestów per batch, max ~10 batches w toku jednocześnie. Idealne dla high-throughput async workloadów.

Claude Code•9 min

Claude Code cena 2026, ile kosztuje i czy jest darmowy

Claude Code cena w PLN i USD, plany Pro i Max, API pay-as-you-go, darmowe kredyty i alternatywy. Najtańsza legalna ścieżka. Stan maj 2026.

Czytaj

Claude Code•9 min

Claude Max plan po polsku, ceny i limity 2026

Plan Claude Max po polsku: ceny Max 5x i 20x, ile zapytań daje, Claude Pro vs Max, Max vs API. Limity sesji i tygodniowe. Stan maj 2026, dla kogo warto.

Czytaj

Claude Code•15 min

Claude Code Skills po polsku, tutorial Agent Skills 2026

Pierwszy polski tutorial Agent Skills w Claude Code. SKILL.md, frontmatter, progressive disclosure, jak tworzyć skille krok po kroku, vs subagents i MCP.

Czytaj

Chcesz opanować Claude Code i agentic coding?

220 stron PDF dla developerów i osób bez kodu. Dożywotni dostęp.

349 zł 549 zł

Zobacz kurs →

Co to rate limit

Tier system Anthropic 2026

Jak sprawdzić aktualny limit

Jak ominąć rate limit

1. Upgrade tier (najprostsze)

2. Prompt caching (90% off na cached read)

3. Batch API (50% off, osobne limity)

4. Wybór modelu

5. Exponential backoff w aplikacji

Optymalizacja zużycia

Najczęściej zadawane pytania

Co to jest rate limit w Claude Code?

Jakie są tiers Anthropic API w 2026?

Jak sprawdzić aktualne zużycie?

Jak ominąć rate limit?

Czy Claude Pro / Max ma rate limit?

Co się dzieje gdy przekroczę rate limit?

Czy rate limit jest per API key czy per organization?

Czy Batch API ma osobne limity?

Powiązane artykuły

Claude Code cena 2026, ile kosztuje i czy jest darmowy

Claude Max plan po polsku, ceny i limity 2026

Claude Code Skills po polsku, tutorial Agent Skills 2026

Chcesz opanować Claude Code i agentic coding?