Claude Code wolno działa, jak przyspieszyć 2026
Claude Code odpowiada wolno, przyczyny i jak naprawić. Wybór modelu, kontekst, sieć, hooks, MCP.
Spis treści
Claude Code działa wolno: 30 sekund na odpowiedź dla prostego prompta, długie ciszę po komendzie, wieczność na refactor. Najczęściej winowajca to 1 z 5 rzeczy: wybór modelu, zbyt duży kontekst, sieć, hooks, MCP servers. Każdy z osobnym fixem.
5 najczęstszych przyczyn spowolnienia
- Używasz Opus 4.7 do prostych zadań. Opus 3× wolniejszy niż Sonnet, 5× wolniejszy niż Haiku
- Zbyt długi kontekst sesji. CLAUDE.md ponad 3 strony, długa historia konwersacji
- Wolne połączenie z api.anthropic.com. Proxy, VPN, corporate firewall
- Hooks blokują tool execution. PreToolUse hook trwa >1s = visible delay przy każdym tool call
- MCP server odpowiada wolno. Zewnętrzne API ma latency albo timeouts
Wybór modelu (najszybsza optymalizacja)
Trzy modele Claude 4 z różną prędkością:
| Model | Prędkość | Koszt | Use case |
|---|---|---|---|
| Haiku 4.5 | Najszybszy | $1/$5 per MTok | Klasyfikacja, format, krótkie odpowiedzi |
| Sonnet 4.6 | Średnia | $3/$15 per MTok | 80% pracy w kodzie (default) |
| Opus 4.7 | Najwolniejszy | $15/$75 per MTok | Złożone refactory, hard debug |
Zmień model w sesji:
claude /model claude-haiku-4-5 # dla prostych zadań
claude /model claude-sonnet-4-6 # default
claude /model claude-opus-4-7 # tylko gdy Sonnet zawiódł Zbyt duży kontekst
Im więcej tokenów input, tym więcej Claude musi przetworzyć. Long context = slow response.
Skróć CLAUDE.md
Max 1-2 strony. Trzymaj tylko KLUCZOWE konwencje. Pełna dokumentacja produktu nie powinna być w CLAUDE.md.
Wyczyść historię konwersacji
claude /clear Reset historii sesji bez restartu Claude Code.
Subagents dla równoległych zadań
Każdy subagent ma własny context window. Zamiast 1 sesji z 100k tokens, 5 subagentów z 20k każdy = szybsze i tańsze.
Wolne połączenie
Test latency:
time curl -I https://api.anthropic.com/v1/models Normalnie < 500ms. Jeśli > 2s, masz problem sieci:
- VPN. Spróbuj bez VPN albo użyj split tunneling
- Corporate proxy. Configure proxy w npm i env:
export HTTPS_PROXY=... - Wolny DNS. Zmień DNS na 1.1.1.1 lub 8.8.8.8
- Anthropic outage. Sprawdź status.anthropic.com
Wolne hooks
Każdy hook PreToolUse / PostToolUse blokuje tool call dopóki nie zwróci exit code. Jeśli hook trwa > 1s, każdy tool call jest opóźniony.
# Profiluj hooks
time bash -c 'echo "fake input" | <hook-command>' Optymalizacje:
- Używaj cached operations (npm prettier --check zamiast --write na całym repo)
- Filtruj hooks per matcher (PreToolUse: "Bash" zamiast "*")
- Ciężkie operacje (testy, lint full) przenieś do Stop hook (raz na sesję) zamiast PostToolUse (po każdej edycji)
Pełen deep dive: Claude Code hooks po polsku.
Wolne MCP servers
MCP server to zewnętrzny proces, którego latency zależy od:
- Zewnętrzne API (Linear, GitHub) rate limit lub latency
- Database queries bez indexes
- Wolne initialization (cold start)
Optymalizacje: cache wyniki w MCP server, używaj indexes w DB, batch queries, warm up servers przed sesją.
Performance tuning w kursie
Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 z performance debugging, cost optimization, prompt caching, batch API. Kursanci redukują latency 30-50% i bill o 50-80%.
Najczęściej zadawane pytania
Dlaczego Claude Code działa wolno?
5 głównych przyczyn: 1) Używasz Opus 4.7 do prostych zadań (3× wolniejszy niż Sonnet). 2) Zbyt długi CLAUDE.md / kontekst sesji. 3) Wolne połączenie z api.anthropic.com. 4) Hooks blokują tool execution. 5) MCP server odpowiada wolno.
Który model Claude jest najszybszy?
Haiku 4.5 - najszybszy i najtańszy. Dobry do prostych klasyfikacji, krótkich generacji, format. Sonnet 4.6 - sweet spot prędkość/jakość. Opus 4.7 - najmocniejszy ale 3× wolniejszy. Wybór: claude /model claude-haiku-4-5.
Jak skrócić kontekst sesji?
1) /clear resetuje historię konwersacji. 2) Skróć CLAUDE.md do 1-2 stron max. 3) W długich sesjach starszy kontekst niech idzie do summary, nie full history. 4) Subagents dla równoległych zadań (każdy ma własny kontekst).
Co robić jeśli MCP server odpowiada wolno?
Sprawdź logs serwera (każdy MCP może mieć własne logging). Typowe: rate limit zewnętrznego API (Linear, GitHub), wolna baza, nieoptymalne queries. Cache wyniki w samym MCP server, używaj indexes w DB queries.
Czy WSL spowalnia Claude Code?
Lekko, ale niezauważalnie dla typowego workflow. Większy impact: filesystem performance w /mnt/c/ (Windows mount) jest 10× wolniejszy. Trzymaj projekty w ~/ (Linux filesystem).
Czy prompt caching przyspiesza?
Tak, latency cached prefiksu spada o 30-50% (Claude czyta z cache zamiast przetwarzać). Plus 90% off na kosztach. Włącz dla powtarzalnych system prompts.
Jak debugować performance bottleneck?
1) claude --debug pokazuje verbose timing. 2) Sprawdź czas każdej tool call w session log. 3) Jeśli hooks są wolne, profiluj: time \. 4) Anthropic status: status.anthropic.com.
Czy jest polski kurs Claude Code z performance?
Tak, Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 (security + koszty + performance). 220 stron PDF, dożywotni dostęp.
Powiązane artykuły
Claude Code cena 2026, ile kosztuje i czy jest darmowy
Claude Code cena w PLN i USD, plany Pro i Max, API pay-as-you-go, darmowe kredyty i alternatywy. Najtańsza legalna ścieżka. Stan maj 2026.
CzytajClaude Max plan po polsku, ceny i limity 2026
Plan Claude Max po polsku: ceny Max 5x i 20x, ile zapytań daje, Claude Pro vs Max, Max vs API. Limity sesji i tygodniowe. Stan maj 2026, dla kogo warto.
CzytajClaude Code Skills po polsku, tutorial Agent Skills 2026
Pierwszy polski tutorial Agent Skills w Claude Code. SKILL.md, frontmatter, progressive disclosure, jak tworzyć skille krok po kroku, vs subagents i MCP.
CzytajChcesz profesjonalnie nauczyć się tworzenia video AI?
6 modułów PDF + społeczność Discord. Dożywotni dostęp.