Przejdź do głównej zawartości
Claude Code Autor: 5 min czytania
Opublikowano:

Claude Code wolno działa, jak przyspieszyć 2026

Claude Code odpowiada wolno, przyczyny i jak naprawić. Wybór modelu, kontekst, sieć, hooks, MCP.

Spis treści

Claude Code działa wolno: 30 sekund na odpowiedź dla prostego prompta, długie ciszę po komendzie, wieczność na refactor. Najczęściej winowajca to 1 z 5 rzeczy: wybór modelu, zbyt duży kontekst, sieć, hooks, MCP servers. Każdy z osobnym fixem.

5 najczęstszych przyczyn spowolnienia

  1. Używasz Opus 4.7 do prostych zadań. Opus 3× wolniejszy niż Sonnet, 5× wolniejszy niż Haiku
  2. Zbyt długi kontekst sesji. CLAUDE.md ponad 3 strony, długa historia konwersacji
  3. Wolne połączenie z api.anthropic.com. Proxy, VPN, corporate firewall
  4. Hooks blokują tool execution. PreToolUse hook trwa >1s = visible delay przy każdym tool call
  5. MCP server odpowiada wolno. Zewnętrzne API ma latency albo timeouts

Wybór modelu (najszybsza optymalizacja)

Trzy modele Claude 4 z różną prędkością:

Porównanie prędkości i kosztu modeli Claude 4 (orientacyjne)
Model Prędkość Koszt Use case
Haiku 4.5 Najszybszy $1/$5 per MTok Klasyfikacja, format, krótkie odpowiedzi
Sonnet 4.6 Średnia $3/$15 per MTok 80% pracy w kodzie (default)
Opus 4.7 Najwolniejszy $15/$75 per MTok Złożone refactory, hard debug

Zmień model w sesji:

claude /model claude-haiku-4-5  # dla prostych zadań
claude /model claude-sonnet-4-6  # default
claude /model claude-opus-4-7  # tylko gdy Sonnet zawiódł

Zbyt duży kontekst

Im więcej tokenów input, tym więcej Claude musi przetworzyć. Long context = slow response.

Skróć CLAUDE.md

Max 1-2 strony. Trzymaj tylko KLUCZOWE konwencje. Pełna dokumentacja produktu nie powinna być w CLAUDE.md.

Wyczyść historię konwersacji

claude /clear

Reset historii sesji bez restartu Claude Code.

Subagents dla równoległych zadań

Każdy subagent ma własny context window. Zamiast 1 sesji z 100k tokens, 5 subagentów z 20k każdy = szybsze i tańsze.

Wolne połączenie

Test latency:

time curl -I https://api.anthropic.com/v1/models

Normalnie < 500ms. Jeśli > 2s, masz problem sieci:

  • VPN. Spróbuj bez VPN albo użyj split tunneling
  • Corporate proxy. Configure proxy w npm i env: export HTTPS_PROXY=...
  • Wolny DNS. Zmień DNS na 1.1.1.1 lub 8.8.8.8
  • Anthropic outage. Sprawdź status.anthropic.com

Wolne hooks

Każdy hook PreToolUse / PostToolUse blokuje tool call dopóki nie zwróci exit code. Jeśli hook trwa > 1s, każdy tool call jest opóźniony.

# Profiluj hooks
time bash -c 'echo "fake input" | <hook-command>'

Optymalizacje:

  • Używaj cached operations (npm prettier --check zamiast --write na całym repo)
  • Filtruj hooks per matcher (PreToolUse: "Bash" zamiast "*")
  • Ciężkie operacje (testy, lint full) przenieś do Stop hook (raz na sesję) zamiast PostToolUse (po każdej edycji)

Pełen deep dive: Claude Code hooks po polsku.

Wolne MCP servers

MCP server to zewnętrzny proces, którego latency zależy od:

  • Zewnętrzne API (Linear, GitHub) rate limit lub latency
  • Database queries bez indexes
  • Wolne initialization (cold start)

Optymalizacje: cache wyniki w MCP server, używaj indexes w DB, batch queries, warm up servers przed sesją.

Performance tuning w kursie

Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 z performance debugging, cost optimization, prompt caching, batch API. Kursanci redukują latency 30-50% i bill o 50-80%.

Zobacz program kursu, 349 zł →

Najczęściej zadawane pytania

Dlaczego Claude Code działa wolno?

5 głównych przyczyn: 1) Używasz Opus 4.7 do prostych zadań (3× wolniejszy niż Sonnet). 2) Zbyt długi CLAUDE.md / kontekst sesji. 3) Wolne połączenie z api.anthropic.com. 4) Hooks blokują tool execution. 5) MCP server odpowiada wolno.

Który model Claude jest najszybszy?

Haiku 4.5 - najszybszy i najtańszy. Dobry do prostych klasyfikacji, krótkich generacji, format. Sonnet 4.6 - sweet spot prędkość/jakość. Opus 4.7 - najmocniejszy ale 3× wolniejszy. Wybór: claude /model claude-haiku-4-5.

Jak skrócić kontekst sesji?

1) /clear resetuje historię konwersacji. 2) Skróć CLAUDE.md do 1-2 stron max. 3) W długich sesjach starszy kontekst niech idzie do summary, nie full history. 4) Subagents dla równoległych zadań (każdy ma własny kontekst).

Co robić jeśli MCP server odpowiada wolno?

Sprawdź logs serwera (każdy MCP może mieć własne logging). Typowe: rate limit zewnętrznego API (Linear, GitHub), wolna baza, nieoptymalne queries. Cache wyniki w samym MCP server, używaj indexes w DB queries.

Czy WSL spowalnia Claude Code?

Lekko, ale niezauważalnie dla typowego workflow. Większy impact: filesystem performance w /mnt/c/ (Windows mount) jest 10× wolniejszy. Trzymaj projekty w ~/ (Linux filesystem).

Czy prompt caching przyspiesza?

Tak, latency cached prefiksu spada o 30-50% (Claude czyta z cache zamiast przetwarzać). Plus 90% off na kosztach. Włącz dla powtarzalnych system prompts.

Jak debugować performance bottleneck?

1) claude --debug pokazuje verbose timing. 2) Sprawdź czas każdej tool call w session log. 3) Jeśli hooks są wolne, profiluj: time \. 4) Anthropic status: status.anthropic.com.

Czy jest polski kurs Claude Code z performance?

Tak, Kurs Claude Code po polsku (349 zł brutto) ma moduł 9 (security + koszty + performance). 220 stron PDF, dożywotni dostęp.

Chcesz profesjonalnie nauczyć się tworzenia video AI?

6 modułów PDF + społeczność Discord. Dożywotni dostęp.

249 zł 399 zł
Zobacz kurs →