LTX Video – generujte video zdarma z promptu, obrázku i videa
Workflow ke stažení:
text2video – webp obrázek
image2video – png obrázek
Jak na LTX prompt – obrázek
Můžete na vlastním počítači generovat video z textového promptu, nebo z obrázku, nebo dokonce z jiného videa, v délce až 10 sekund, bez cenzury a omezení? Zdarma, pomocí open-source modelu s Apache licencí, tedy s výsledky použitelnými i pro komerční projekty?
Ano, můžete.
LTX Video je open source model, který si můžete nainstalovat na vlastní počítač a vesele generovat co chcete a jak chcete. LTX zvládá pracovat i na Nvidia grafikách s pouhými 8 GB VRAM a i na grafikách jiných značek než Nvidia. S výkonnější grafikou se videa generují rychleji, než je stačíte sledovat, takže v reálném čase.
Zní to příliš dobře?
No, budete muset trochu víc používat mozek, nainstalovat si LTX, používat ho v ComfyUI a psát do něj strukturované prompty. A i tak to nemusí být ideální.
Máte-li Nvidia grafiku, zaručeně to půjde zjednodušit instalací na pár kliků v pinokio.computer. Máte-li jinou grafickou kartu, je možné, že to v Pinokio nepojede, nebo to bude dělat psí a jiné kusy, a budete si potřebovat nainstalovat ComfyUI klasickým způsobem.
Ať už máte Pinokio nebo nemáte, jste úplní začátečníci nebo pokročilí, tady je stručný návod.
Pro ty, co Pinokio nemají, jsou tu poprvé a netuší, odkud vítr vane ani kde je sever následuje rychlý a stručný návod na instalaci Pinokio, ostatní můžou přeskočit na další kapitolu.
Ze stránky pinokio.computer přejdete tlačítkem Download na Github, vyberete si svůj operační systém, vidíte že pro Windows si stáhnete soubor a nainstalujete běžným způsobem. Pinokio samotné se instaluje velmi rychle, s prázdnou úvodní stránkou. Vy si najdete a vyberete ComfyUI.
Pokud by se vám instalace nepodařila, nebo potřebujete delší a podrobnější návod, na tomhle kanále najdete podrobné video s instalací a běžnými problémy v začátcích s Pinokio. Pinokio má verzi 3, ve starém návodu je verze 2, vypadá trochu jinak, ale funguje téměř stejně. Návod na novou verzi bude brzy.
Můžete teď přeskočit do podrobného návodu a vrátit se přesně sem, až vás k tomu video vyzve.
Kdo má nainstalováno Pinokio, tak si po spuštění najde a vybere ComfyUI k instalaci.
Jako obvykle, je třeba vybrat složku, kam se ComfyUI instaluje, potvrdit instalaci a pak čekat, až je hotovo. V průběhu se stahují různé velké soubory, a může to trvat docela dlouho.
Teď máte nainstalováno ComfyUI, prostředí, ve kterém vše bude fungovat.
Ještě ho nespouštějte, ještě budeme instalovat.
Pinokio má už integrované workflows, pracovní postupy a modely pro LTX Video, takže uživatelé Pinokio to mají opravdu hodně jednoduché. V sekci Download Mix si vyberte LTX, a zase počkejte, až se vše stáhne a nainstaluje.
Pokud instalace v Pinokio zdárně proběhne, spusťte ComfyUI tlačítkem Start, mělo by se vám samostatně otevřít okno s ComfyUI. Pokud ne, klikněte na tuto adresu a otevřete okno ve vašem webovém prohlížeči. To se dá taky udělat volbou pop out. Je to jedno, já otevírám v prohlížeči, abyste viděli celé moje okno s ComfyUI.
Všichni ostatní, kteří nepoužívají Pinokio, si stáhnout workflows, dole pod videem jsou odkazy, otevřou je přetáhnutím do ComfyUI, zjistí, že jim toho hodně chybí, protože hodně uzlů je červených, a pomocí Managera si doinstalují chybějící součástky. Budete-li pracovat i s videem jako zdrojem, nebo chcete ukládat do MP4 nebo animovaného gifu, budete kromě LTX Video stahovat i VideoHelper Suite.
V Pinokio vidíte v levém panelu mimo jiné workflows, jsou tam i základní workflows pro LTX. Začneme s workflow pro text2video.
V Pinokio už byste měli mít stažené modely, které potřebujete, takže jdeme rovnou k věci. Zelené okno je prompt, červené okno je negativní prompt.
V poznámce nalevo vidíte, že je potřeba psát delší prompty, velmi popisné, kde zmíníte, co se má ve videu dít. Default prompt klidně můžete hned vyzkoušet a poslat do fronty tlačítkem Queue nebo klávesovou zkratkou Ctrl+Enter.
Pokud vás zajímá víc o tvorbě promptu, pak na githubu vidíte celý odstavec na toto téma. Prompty mají mít délku do 200 slov a ideální struktura promptu je ta kterou vidíte na obrazovce:
– hlavní akce v jedné větě
– detaily týkající se pohybu a gestikulace
– přesný popis objektu nebo osoby
– detaily pozadí a prostředí
– popis pohybu a úhlů kamery
– popis osvětlení a barev
– případné rychlé změny
Co vše můžete nastavovat? Vidíte, že budeme generovat video o šířce 768 px a výšce 448 px, délka videa se určuje počtem snímků. Číslo musí být násobek 24 ke kterému se na konci připočte jedna. 97 snímků znamená 4 sekundy – 4×24 plus 1 je 97. Delší video vytvoříte změnou tohoto čísla. Maximum je něco přes 10 sekund.
Default se vytváří soubor se jménem ComfyUI ve formátu WEBP, ukládající se do složky output v Pinokio. Pokud to chcete změnit, můžete zadat jméno složky, lomítko a jméno souboru.
Já chci použít můj obvyklý testovací prompt s vrásčitým starcem a rozbouřeným mořem. Není to špatné.
A vidíte, že soubor je už uložen v nové podsložce LTX a se jménem LTXvideo.
Pokud netušíte, co dělat se souborem WEBP, nebo tušíte, ale jste jako já příliš líní s ním pracovat, můžete ukládat třeba do animovaných gifů nebo běžnějších video souborů jako MP4.
K tomu potřebujete mít nainstalovaný VideoHelper Suite, nejjednodušeji přes Managera. Dvojklikem myší někam do plochy ComfyUI přidáte další node, hledáte Video Combine. V něm si nastavte jméno souboru, já zase vybírám složku LTX. Takto ukládáte do animovaného gifu, můžete to změnit třeba na video s kodekem H264.
Já s 12GB VRAM vygeneruju čtyřsekundové video za asi 90 sekund, na kartách s 24 GB VRAM se videa generují rychleji než je stihnete sledovat, tedy čtyřsekundové video se údajně vygeneruje pod 4 sekundy.
Samozřejmě záleží na rozlišení videa a jeho délce a především množství vaší VRAM.
Tohle je běžný výsledek generování z textového promptu do videa, na tom nás asi v roce 2025 nic nepřekvapí.
Zajímavější by mělo být generování z obrázku a promptu.
Opět si můžeme otevřít default workflow, ale rovnou vám říkám, že ho nebudete chtít používat.
Tady je první pokus, tohle je složitá fotka, se kterou i komerční generátory mají trochu potíže.
Na první pokus není ve videu mnoho pohybu, je fakt, že já se se strukturou promptu až tak moc nemažu, ale zase vás můžu ujistit, že tohle fakt není můj první pokus s LTX.
Delší prompt přidá víc pohybu, ale pořád to tak nějak není ono.
Nebudu vás dál trápit, tohle už jiní vyzkoušeli, vymysleli a vylepšili.
Stáhněte si z odkazu pod videem nové workflow. Vidíte, že je v něm přidán ve fialových uzlech nějaký magický postup. Pokud vás to zajímá technicky, tak uživatelé došli k tomu, že obrázky se nehýbou, protože jsou příliš dokonalé. Ano, i ty generované z Midjourney, které vidíte na mých příkladech. LTX bylo trénováno na už komprimovaném videu, takže tenhle proces navíc váš obrázek nejdřív zničí, aby z něj pak mohl vytvořit pohyblivé obrázky. Vezme ho a zkomprimuje ho stejným způsobem, jako se komprimují videa, a se teprve tento obrázek vloží jako vstup pro generování videa.
Co to pro vás znamená? Pokud pracujete s většími obrázky a nebojíte se generovat video s větším rozlišením, nastavte si i v této části větší rozlišení, zachráníte tím část kvality původního obrázku. Máte-li nějakou horší grafiku a stejně generujete v menším rozlišení, tak nechte tuhle část jak je.
A vidíte, že obrázek se tentokrát pohybuje. Není to žádná sláva, ale tohle je relativně hodně nevhodný obrázek pro rozpohybování, je na něm hodně malých lidí, a to nikdy nebude dokonalé.
Ale já taky nikde netvrdím, že to těm strojům budu dělat jednodušší, že? Pokud se nějaký nástroj chce kvalifikovat, aby mohl bydlet na mém disku a užírat můj čas, musí si to nejdřív zasloužit!
Nicméně, bylo by fajn mít aspoň nějaké slušně vypadající video. Ze zkušenosti všichni víme, že portréty by měly být lepší. Je na nich jedna tvář, jasně oddělené pozadí od osoby, s tím si snad i lehce kulhající generátor musí poradit.
Nechávám si podle daných pravidel napsat prompt od chatbota, tak hluboko klesám. Ale chci se přesvědčit, že opravdu chyba není mezi mnou a mojí chudinou prompty ošoupanou klávesnicí. Nejdřív zkouším ilustrovaný portrét, pak totéž ale jako reálnější portrét. A pak ještě něco realistického.
Kupodivu nejlepší vizuální výsledek dostávám v případě prázdného promptu.
To ale tak nějak nikdo nechtěl. Náhodně rozhýbaný člověk na obrázku je sice generované video, ale v roce 2025 je takový výsledek dobrý leda tak k vytápění domácnosti teplem ze zběsile se snažící grafické karty.
A na takové plýtvání tady máme z daní daleko lépe placené experty, to po mě nechtějte…
A tady můžete sledovat nějaké další příklady.
Moje velmi subjektivní zkušenost je, že lepší výsledky dostanu z realisticky vypadajících obrázků, než z ilustrací, zvlášť pokud jsou hodně netypické. Obrázek se buď vůbec nehýbe, nebo se hodně rychle rozbije do úplně jiné scény. To platí i pro ty víc reálně vypadající obrázky. Video z textu vypadá slušně, pokud jde o realistickou scénu, ale video z obrázku mě docela zklamalo.
I s různými nastaveními se z toho nedá dostat to, co v tuto chvíli dokáže třeba Hailuo, Kling, LumaLabs nebo další modely.
LTX má také video2video, generování videa z jiného videa, tedy změny stylu videa, ale ty nerozjedete na ničem jiném než PC s Nvidia grafikou s minimálně 24GB VRAM. Také tohle workflow nevyzkoušíte nikde online zdarma. Mně osobně přijde v téhle chvíli zbytečné to nějak víc zkoušet, vzhledem k výsledkům z obrázků.
LTX generuje videa velice rychle a to i na hodně slabých grafikách, a umí generovat i na Macu a jiných grafikách než je Nvidia. Určitě je pozitivní, že LTX video je přístupné jako open source model. On se tenhle model nepřihodil jen tak náhodou jako samostatný model, za jeho vývojem stojí společnost Lightricks, která nabízí LTX Studio, celou AI platformu pro tvorbu filmů, kde si vytvoříte vlastní storyboard, jednotlivé postavy a pak celé video. LTX tady používá právě tento model a vypadá to, že byl trénován na relativně omezeném výběru filmů. Vše, co se mi podařilo vidět jako generované z LTX vypadá tak nějak… podobně.
Máte-li tedy stejný filmový vkus a tyhle výtvory se vám líbí, pak vám LTX asi bude vyhovovat. Jako nástroj pro generování videí různých stylů nebo animací je LTX zatím asi ne úplně dobře použitelné. Nebo přinejmenším, jiné nástroje zvládnou to samé daleko lépe.
Dá se očekávat, že LTX se bude nějak dál vyvíjet a třeba nás časem překvapí.
Ale mezitím se budu věnovat jiným generátorům videí a obrázků a hudby, a pokud to nechcete propásnout, přihlašte se k odběru. Jestli se vám moje návody hodí a líbí, můžete mě podpořit odběrem videa, lajkem nebo mi virtuálně koupit kafe, protože dny jsou krátké a fantastických uměleinteligentních nástrojů přibývá děsně rychle a já je všechny chci vyzkoušet.