.
Obrázek inspirovaný sci-fi a vytvořený generativní AI, na kterém je robotický mozek pracující v kosmické lodi

Malé nahlédnutí pod pokličku generativní AI

Na první pohled se může zdát, že generativní AI je nějaké kouzlo. Využívá však komplexní technologii, která se učí z dat a takto získané vzorce aplikuje při vytváření nového obsahu. Když si její fungování podrobně rozebereme, snadněji jí porozumíme.

AI je umělá inteligence, která nejenže analyzuje existující informace, ale také generuje zcela nový obsah. Modely se trénují na obrovských datových sadách textů, obrázků, zvuků či videí, kde se učí vzorce, souvislosti a styly. Když jim zadáte vstup, jako například textový pokyn nebo referenční obrázek, vytvoří pomocí naučených informací originální výstup podle vašeho požadavku.

Proto pak můžete požádat chatbota, aby vám navrhl slogan, a během sekund získat neotřelý nápad nebo využít Firefly k převodu popisu na fotorealistický obrázek či ruční kresbu. Generativní AI se kromě kreativní tvorby využívá ve vědě a zdravotnictví, kde vyvíjí nové proteiny, zlepšuje léčbu rakoviny a urychluje výzkum. Její potenciál daleko přesahuje jazykové hrátky a už teď nebývalým způsobem transformuje různá odvětví.

Proč je generativní inteligence tak inteligentní

Počítačové aplikace nedokázaly v minulosti provést žádný úkol bez přesných explicitních pokynů od lidí. Takovému zadávání pokynů se říká programování. Přestože lze na základě sofistikovaného programování dosáhnout působivých výsledků, tradiční počítačové aplikace nedokážou provádět úkoly, které lidé v rámci programování nespecifikují.

Systémy generativní umělé inteligence jsou flexibilnější, protože využívají strojové učení, které se obejde bez explicitního programování. Lidé místo toho poskytnou počítačům přístup k velkým objemům dat. Počítače se samy trénují, aby v těchto datech dokázaly rozpoznat vzorce a – což je ještě důležitější – dokázaly z naučených věcí vyvodit závěry. (To je to „učení“ v rámci pojmu „strojové učení“.) Důležitá je při tom velikost a kvalita datové sady. Umělá inteligence může být úspěšná jenom tehdy, když má dobrá trénovací data.

Odpověď na otázku, jak generativní AI funguje, není jednoduchá a vyžaduje hlubší znalosti. Velkou výhodou generativní AI je však skutečnost, že z ní můžete těžit, i když nerozumíte všem jejím aspektům. Vlastně si můžete jen najít vhodnou aplikaci, jako je Firefly, zadat jí pokyn, například: „tři štěňata labradora běží po trávě“, a najednou patříte mezi uživatele generativní AI. I bez programování.

Obrázek vygenerovaný AI se třemi štěňaty labradora běžícími po trávě a moderními budovami na pozadí

Co generativní AI využívá

Fungování generativní AI závisí na výkonném hardwaru a velkém výpočetním výkonu. Jednotky GPU a TPU zpracovávají enormní množství výpočtů nezbytných pro trénování a provoz těchto modelů.

Celý proces se skládá ze dvou hlavních fází:

Trénování

Modely se během trénování učí z obrovských datových sad textů, obrázků, zvuků nebo videí. Tato fáze je velmi energeticky náročná, protože rozpoznávání vzorců a souvislostí vyžaduje distribuovaný výpočetní výkon, paralelní zpracování a dlouhé doby spuštění.

Inference

Jakmile se model dotrénuje, může na požádání generovat výstupy jako text, obrázek nebo překlad zvuku. Tato fáze vyžaduje mnohem méně energie. Inferenci je také možné optimalizovat pomocí technik, jako je dávkování nebo nasazení v cloudu.

Generativní AI spotřebuje velké množství energie a společnosti, které tyto nástroje vyvíjejí, si stále více uvědomují související dopad na životní prostředí. Už probíhají snahy o vylepšení efektivity a snížení uhlíkové stopy, ale v této oblasti je stále co zlepšovat.
Obrázek energie proudící kosmickou lodí vygenerovaný AI

Jak se generativní AI trénuje

Pojďme si přiblížit fungování generativní AI a rozebrat, co všechno se odehrává, než vůbec zadáte pokyn. Proces trénování AI zahrnuje pečlivé čištění a výběr dat za účelem zlepšení kvality, předběžné trénování na rozsáhlých datových sadách, které utváří základní znalosti, a následné dolaďování pro konkrétní úlohy nebo oblasti.

Důležitou roli hraje lidská zpětná vazba a optimalizace pro bezpečnost, které pomáhají vylepšovat výstupy a omezovat nechtěné předsudky. Společnost Adobe používá při trénování licencovaná data a data s vyřešenými právy, včetně obsahu ze služby Adobe Stock, takže kreativní profesionálové mohou generativní nástroje využívat bez obav.

Jak fungují různé typy modelů generativní AI

Existuje několik druhů modelů generativní AI a každý z nich funguje trochu jinak. Když pochopíte rozdíl mezi generativní AI a dalšími typy AI, snadněji určíte, který typ modelu je nejvhodnější pro váš specifický projekt.

  1. Velké jazykové modely (LLM):
    Modely LLM, jako je ChatGPT nebo Claude, se trénují na rozsáhlých textových datových sadách, a dokážou generovat přirozený jazyk na základě předpovědi následujícího slova v textu. Jde o velmi efektivní nástroje pro psaní textu, poskytování odpovědí a plynulou konverzaci.
  2. Difuzní modely:
    Difuzní modely se běžně používají pro obrázky a video. Dokážou z náhodného šumu na základě pokynu postupně vytvořit rozpoznatelný výsledek. Tento model je využíván AI generátorem obrázků ve Firefly.
  3. Generativní adversiální sítě (GAN):
    Architektura GAN se skládá ze dvou sítí: z generátoru vytvářejícího výstupy a z diskriminátoru, který je vyhodnocuje. Díky vzájemné konkurenci zdokonalují výstup, dokud generované obrázky nevypadají realisticky. Modely GAN se už od raných fází využívají ke generování grafiky a deepfaků pomocí AI.
  4. Variační autoenkodéry (VAE):
    Modely VAE komprimují data do jednodušších reprezentací a následně je rekonstruují. To jim umožňuje generovat variace, které zachycují esenci původních dat. Využívají se zejména při prolínání stylů nebo vytváření několika verzí.
  5. Transformátorové modely:
    Transformátorové modely tvoří základní architekturu mnoha generativních systémů, včetně modelů LLM a difuzních modelů. Využívají mechanismus pozornosti k pochopení souvislosti mezi daty, jako jsou slova ve větě nebo pixely v obrázku, aby byla zachována přesnost a kontextová relevance výstupů.
Uvedené typy modelů společně umožňují, aby generativní AI dokázala zpracovat veškerý obsah od textu po videa a aby se dál rozvíjela do schopnějších a kreativnějších systémů.
Obrázek vzdorující ženy v ochranné zbroji, za kterou na pozadí bojují roboti a stroje, vytvořený pomocí pokynů pro generativní AI
Barevná surrealistická ilustrace muže stojícího na útesu s pohledem upřeným na oko na obloze, která byla vytvořena pomocí generativní AI na základě pokynů pro převod textu na obrázek
Futuristická budova se širokými křivkami vygenerovaná pomoci AI ve Firefly

Jak funguje proces generování obsahu pomocí AI od pokynu po výstup?

Následuje popis procesů, které probíhají na pozadí, když v Adobe Firefly nebo jiném nástroji generativní AI zadáte pokyn. V každém kroku se využívá pokročilé strojové učení spolu s intuitivními ovládacími prvky, aby bylo možné vytvořit z vašeho vstupu nový obsah.

1. Vstup a nastavení podmínek

Začněte zadáním pokynu nebo nahráním referenčního obrázku. Systém si na základě vašeho vstupu nastaví podmínky. To znamená, že si vyloží, o co žádáte, a připraví se k vygenerování výsledku.

2. Enkódování

Vstup se převádí na číselnou reprezentaci, které model rozumí. Slova se například rozkládají na tokeny, zatímco obrázky se převádí na datové body popisující tvary, barvy a vizuální prvky.

3. Porozumění kontextu a sladění se záměrem

Model generativní AI vyhodnotí váš vstup vzhledem ke znalostem získaným při trénování. Věnuje pozornost souvislostem a kontextu. Tento postup pomáhá zajistit, že výstup bude lépe odpovídat vašemu záměru a přesněji vyhoví vašemu požadavku.

4. Generování

Model na základě natrénovaných znalostí vygeneruje nový obsah, například předpoví následující slovo ve větě, postupně promění náhodný šum na obrázek nebo vytvoří zvuk, který bude odpovídat zadanému popisu.

5. Řízení procesu a výstupu

Celý proces řídí uživatelská nastavení, jako je styl, poměr stran nebo barevné palety značky. Tyto ovládací prvky pomáhají směrovat výstup na specifický vzhled, tón nebo případ použití.

6. Následné zpracování a export

Systém výstup doladí, zlepší jeho kvalitu a finalizuje úpravy. Hotový výsledek si můžete stáhnout, exportovat a dále zpracovat pomocí vašich oblíbených nástrojů Firefly nebo aplikací Adobe.

Často kladené otázky o fungování generativní umělé inteligence

Články o generativní AI

Co je generování obrazového obsahu pomocí AI?

Generativní umělá inteligence se rychle stává důležitým nástrojem pro lidi zabývající se obrazovou tvorbou. Čtěte dál a dozvíte se, co je to obrazový obsah generovaný umělou inteligencí, jak se vytváří a jak jej můžete prakticky využít.

7 uměleckých stylů v pokynech pro umělou inteligenci

Surrealismus, kubismus, impresionismus – s generativní AI můžete tvořit díla v nejrůznějších uměleckých stylech.

Jak psát pokyny pro AI při architektonické tvorbě

Se správným textovým pokynem a základními znalostmi můžou architekti využít generativní AI ke zkoumání, rychlému zobrazování a vylepšování svých vizí.

AI pokyny pro grafické designéry

Naučte se psát efektivní pokyny pro generativní umělou inteligenci, díky nimž dosáhnete úžasných výsledků v grafickém designu.

Adobe Firefly

Vytvářejte mimořádná díla s generativní umělou inteligencí pomocí běžných slov.

Prozkoumat Adobe Firefly