Słownik AI Video po polsku
36 pojęć z dziedziny generatywnego AI video: narzędzia, technologia, prawo, post-produkcja i monetyzacja. Definicje napisane pod cytowanie przez AI search (Perplexity, ChatGPT, Gemini) i tradycyjne SERP.
narzędzia
- Sora 2 źródło ↗
- Model generatywnego AI video od OpenAI, wprowadzony jesienią 2024. Generuje klipy do 20 sekund w rozdzielczości 1080p z natywnym audio (mowa, efekty, muzyka). Dostępny w Polsce w planie ChatGPT Plus ($20/mc) i Pro ($200/mc) bez VPN. Czytaj więcej →
- Veo 3.1 źródło ↗
- Model AI video od Google DeepMind. Generuje klipy do 60 sekund z natywnym audio i polskim lip-sync. Dostępny przez Gemini Advanced (Google One AI Premium, 89 zł/mc) oraz Vertex AI. Czytaj więcej →
- Runway Gen-4 źródło ↗
- Model video AI od Runway ML. Specjalizuje się w precyzyjnej kontroli kamery (motion brush, director mode) i image-to-video. Plan Standard od $15/mc, Pro $35/mc. Czytaj więcej →
- Kling 3 źródło ↗
- Model video AI od Kuaishou (Chiny). Najtańszy płatny plan w segmencie ($10/mc Standard), mocny w image-to-video i ruchu postaci. Dostępny w Polsce bez VPN. Czytaj więcej →
- LTX (Lightricks)
- Open-source model video AI od Lightricks. Szybkie iteracje (real-time generation na konsumenckim GPU), idealny do prototypowania. Wymaga ComfyUI lub Hugging Face dla wdrożenia.
- HeyGen
- Platforma do generowania talking-head awatarów AI. Obsługuje polski lip-sync, 140+ języków. Plan Creator od $24/mc.
- ElevenLabs
- Generator głosu AI z najlepszym polskim TTS na rynku. Obsługuje voiceover, dubbing i klonowanie głosu (wymagana zgoda właściciela). Plan Creator $22/mc.
- CapCut
- Darmowy edytor video od ByteDance z funkcjami AI: auto-napisy PL, smart cut, removal tła. Standardowe narzędzie post-prod dla content twórców social media.
- Pika Labs
- Generator AI video od Pika Labs (USA) z hojnym free tier (kilkadziesiąt klipów/mc) i unikatową funkcją Pikaffects (specjalne efekty: explode, melt, inflate). Plan Pro od $35/mc.
- Luma Dream Machine
- Model AI video od Luma AI (Ray 2). Specjalizuje się w image-to-video z funkcją Character Reference, utrzymuje wygląd postaci przez serię klipów. Plan Standard od $30/mc.
- Synthesia
- Platforma enterprise B2B do generowania talking-head awatarów AI w 140+ językach. Lipsync wysokiej jakości, custom avatars wymagają enterprise plan. Cena od $30/mc.
- D-ID
- Platforma photo-to-talking-head AI: wgrywasz zdjęcie + tekst, generuje wideo z postacią mówiącą. Niszowe ale przydatne do personalizacji. Plan Pro od $50/mc.
technologia
- Text-to-video (T2V)
- Technologia AI, w której model generuje wideo na podstawie opisu tekstowego (promptu). Modele T2V to m.in. Sora 2, Veo 3.1, Runway Gen-4, Kling 3.
- Image-to-video (I2V)
- Technologia AI, w której model animuje statyczne zdjęcie w klip wideo zgodnie z promptem. Mocna strona Kling 3, Runway Gen-4 i Luma Dream Machine.
- Prompt
- Opis tekstowy dla modelu AI, instrukcja co wygenerować. Dobry prompt zawiera 5 elementów: podmiot, akcja, otoczenie, styl, ruch kamery. Czytaj więcej →
- Lip-sync (AI)
- Synchronizacja ruchu ust postaci z generowaną mową. Najlepiej działa w Sora 2 i Veo 3.1 (natywne audio); HeyGen oferuje lip-sync dla wgranego pliku audio.
- SynthID źródło ↗
- Niewidoczny watermark dodawany przez Google do każdego klipu wygenerowanego przez Veo. Rozpoznawalny przez algorytm detekcji AI-content, zgodny z wymogami AI Act.
- C2PA źródło ↗
- Coalition for Content Provenance and Authenticity, standard metadanych dodawanych do plików multimedialnych. OpenAI dodaje C2PA do wszystkich klipów Sora 2, niezależnie od planu.
- Deepfake
- Treść AI imitująca prawdziwą osobę (twarz, głos) tworzona bez jej zgody. W Polsce regulowana przez prawo do wizerunku (Art. 81 PA) + AI Act + RODO. Kary do 15M EUR. Czytaj więcej →
- ComfyUI
- Open-source GUI dla uruchamiania modeli generatywnych lokalnie (Stable Diffusion, Wan, HunyuanVideo, LTX). Wymaga karty graficznej z min. 12GB VRAM.
- Diffusion model
- Architektura AI używana przez Sora 2, Veo 3.1, Runway, Kling. Generuje obraz przez stopniowe odszumianie z losowego noise zgodnie z prompt'em. Trening na milionach klipów video.
- VAE (Variational Autoencoder)
- Komponent diffusion model: koduje obraz/wideo do latent space (skompresowanej reprezentacji), gdzie diffusion operuje, a potem dekoduje z powrotem do pikseli. Klucz do wydajności generacji.
- Latent space
- Skompresowana reprezentacja matematyczna obrazu/wideo w modelu AI. Pozwala generować w 32x mniejszych wymiarach, co radykalnie zmniejsza koszt GPU. Standardowy element wszystkich nowoczesnych generatorów.
prawo
- AI Act źródło ↗
- Rozporządzenie UE 2024/1689 regulujące sztuczną inteligencję. Obowiązuje od lutego 2026 w pełni. Wymaga oznaczania treści AI w reklamach, transparentności i nadzoru człowieka dla high-risk systems. Czytaj więcej →
- Prawo do wizerunku
- Art. 81 ustawy o prawie autorskim (Polska), wymaga zgody osoby na rozpowszechnianie jej wizerunku. Dla AI deepfakes obowiązuje pełna zgoda w formie pisemnej, najlepiej z opisem zakresu użycia. Czytaj więcej →
- Oznaczenie treści AI
- Obowiązek prawny (AI Act, luty 2026), każda reklama z elementami AI musi zawierać oznaczenie ("Treść wygenerowana przez AI", hashtag #AI lub label platform). Na Facebooku/Instagramie manualnie w Ads Manager. Czytaj więcej →
- RODO + AI
- Generowanie wizerunku osoby przez AI wymaga: (1) zgody na przetwarzanie danych biometrycznych (Art. 9 RODO), (2) klarownego celu, (3) prawa do wycofania zgody i usunięcia.
post-prod
- Re-roll
- Powtórzenie generacji AI z tym samym promptem (drobna zmiana lub identyczna), ze względu na losowość modelu kolejna generacja daje inny wynik. Średnio 2-5 re-rolli na finalne ujęcie.
- Upscaling
- Zwiększenie rozdzielczości wideo (np. 720p → 4K) bez utraty jakości. Topaz Video AI to standardowe narzędzie ($300 one-time). Sora 2 Pro generuje natywnie 4K.
- B-roll
- Klipy uzupełniające (zoomy, detale, otoczenie) wstawiane między główne ujęcia. AI video to idealne źródło B-rolla, szybko i tanio.
- Aspect ratio (AR)
- Proporcje boków klipu: 16:9 (YouTube, cinematic), 9:16 (Reels, TikTok, Shorts), 1:1 (Instagram feed), 4:5 (Instagram portrait). AI generatorzy zwykle pozwalają wybrać AR przed generacją.
- Codec H.264 / H.265
- Format kompresji wideo. H.264 (uniwersalny, large file) vs H.265/HEVC (50% mniejszy, niższa kompatybilność). AI generatorzy domyślnie eksportują H.264 MP4, CapCut konwertuje do H.265 dla TikTok upload.
monetyzacja
- Faceless YouTube
- Format kanału YouTube bez pokazywania twarzy twórcy, narrator + B-roll + animacje. AI video umożliwia produkcję 5-10x szybszą niż tradycyjne stocki. Średni zarobek 1k-10k USD/mc.
- Performance video
- Reklamy video optymalizowane pod konwersje (Facebook Ads, TikTok Ads). AI generuje wiele wariantów w krótkim czasie, umożliwiając A/B testy w skali.
- AI agency
- Agencja marketingowa specjalizująca się w produkcji AI video, model biznesowy 2025+. Stawki: 1500-5000 zł za film, marża 70-90% (vs 30-40% tradycyjnej produkcji). Czytaj więcej →
- MRR (Monthly Recurring Revenue)
- Stały miesięczny przychód z retainera AI video (np. 5 klientów × 1500 zł/mc = 7500 zł MRR). Model biznesowy preferowany nad jednorazowymi projektami, daje predictable cash flow. Czytaj więcej →