KREATÍV GENERATÍV MESTERSÉGES INTELLIGENCIA

Generatív mesterséges intelligencia és más mesterségesintelligencia-típusok

Megismerkedhet a mesterséges intelligencia (AI) különböző típusaival, és megtudhatja, hogy miben különböznek a generatív mesterséges intelligenciától, illetve hogy miként használja fel az Adobe a generatív mesterséges intelligenciát az Adobe Creative Cloud-alkalmazásokban.

A mesterséges intelligencia mindig jelen volt az emberiség gondolataiban.

Az ember évszázadokig mitológiai és kitalált dolognak képzelte a mesterséges intelligenciát. Akár Talószról, a görög mitológiában Kréta szigetét őrző önműködő bronzszerkezetről, akár a 2001: Űrodüsszeia című sci-fiben az űrhajót irányító HAL 9000 mesterséges intelligenciáról van szó, az emberi képzeletet magával ragadta az ember alkotta intelligens gépek gondolata.

 

A mesterséges intelligencia alapjául szolgáló technológia ma már része a mindennapi életnek: elemzi az adatokat, előrejelzéseket készít és fokozza a produktivitást. Nem is olyan régóta pedig generatív mesterséges intelligenciaként segíteni tud a grafikák készítésében.

Mit nevezünk mesterséges intelligenciának?

A mesterséges intelligencia az emberi intelligencia gépi szimulációja. Az ősi mítoszokba foglalás és az emberi cselekvésre képes gépek létrehozására tett több évszázadnyi erőfeszítések dacára a gépi tanulás első valódi példájára 1951-ig kellett várni, amikor is a Manchesteri Egyetemen kidolgozott egyik sakkprogram megtanulta, hogyan játszhat elég jól ahhoz, hogy legyőzze az ember játéktudását. Ez volt a játszani képes mesterséges intelligencia legelső formája.

 

Napjainkban már mindenütt jelen van a mesterséges intelligencia, különös tekintettel az okostelefonokra és a mobilalkalmazásokra, amelyekben általános feladatokat végez. Ilyen feladat például az arcfelismerés, a beszédfelismerés, a levélszemétszűrés, a nyelvi javaslatok megjelenítése és a másik nyelvre fordítás.

A mesterséges intelligencia három típusa

Nem létezik olyan mesterségesintelligencia-típus, amely egymagában mindenre képes. A szövegszerkesztésre, könyvelésre vagy éppen digitális kompozitálásra használt különféle számítógépes programokhoz hasonlóan különböző mesterségesintelligencia-típusok léteznek, amelyek működési módja is eltér, és más-más célra szolgálnak. A gyakorta használt mesterségesintelligencia-típusoknak három alapkategóriája van.

Szűk mesterséges intelligencia

Az ebbe a típusba sorolt mesterséges intelligencia konkrét feladatokat végez el, és nem tanítható be ennél többre. A szűk mesterséges intelligencia körébe tartoznak a képfelismerési funkciók, a természetes nyelvi feldolgozómodulok és a képgenerátorok. Ide sorolható emellett Siri, a Google Segéd és Alexa is. Mindegyik képes hangalapú utasítások megértésére és megválaszolására, pontos orvosi diagnózisok felállítására azonban nem.

Reaktív gépek

Ahogyan a nevük is sugallja, ezek a gépek csupán ingerekre (például egy virtuális sakktábla bábuinak mozgására) tudnak reagálni. A korlátozott memóriájú mesterséges intelligenciára épülő gépekkel ellentétben nem generálnak később felidézhető emlékeket, de hasznos részei a digitális életünknek. Reaktív gépek például a levélszemétszűrők és azok a javaslatgeneráló rendszerek, amelyek a felhasználó viselkedését figyelve megnézendő tartalmakat vagy esetleg megvásárolni kívánt árucikkeket tudnak javasolni.

Korlátozott memóriájú mesterséges intelligencia

A mesterséges intelligencia fejlesztésének reaktív gépek utáni szakasza a korlátozott memóriájú mesterséges intelligencia kifejlesztése volt. Ez utóbbi képes tárolni a tudást, tanulni tud belőle, és a tanultak alapján új feladatokat tud elvégezni. Ez a mesterségesintelligencia-típus jól használható a jövőbeli trendeket mutató előrejelzések készítésére a pénzügyektől kezdve az időjárásig minden téren. Manapság ezt a típust használják a legtöbb területen, például csevegőrobotokban és önvezető autókban.

Kúszónövények borította épület

A generatív mesterséges intelligencia felhasználási területei

A generatív mesterséges intelligencia a szűk mesterséges intelligencia egyik részhalmaza, de a lehetőségek széles tárházát kínálja a különféle tartalmak készítőinek. Az óriási adathalmazokkal betanított generatív mesterséges intelligencia felismeri a felhasznált adatokban rejlő mintázatokat, és következtetéseket von le a tanultakból. Ez után értelmezni tudja a szöveges leírásokat, a gépi tanulás anyagát alkalmazva új mintázatokat tud létrehozni, és képes új tartalmakat készíteni.

 

A generatív mesterséges intelligenciában az a nagyon izgalmas, hogy mennyire könnyű használni. Szinte azonnali eredményt kapunk azzal, hogy begépelünk egy egyszerű szöveges promptot a megfelelő mezőbe. Ezenkívül rengeteg módon lehet a segítségünkre a generatív mesterséges intelligencia, akár bonyolult, akár egyszerű dolgokról van szó.

 

A webes tartalmakat fejlesztők kijavíthatják vele a számítógépes kód programhibáit. A cégek ügyfélszolgálati csevegőrobotokhoz használhatják, a tudósok pedig diagnosztizálhatnak és kutathatnak vele. A tanárok, az írók, a művészek és a zenészek ugyanúgy használhatják ötletgyűjtésre, valamint új ötletek gyors kipróbálására.

A generatív mesterséges intelligencia típusai

Mint ahogy a mesterséges intelligencia egyéb részhalmazai is konkrét célokra szolgálnak, a generatív mesterséges intelligencia is rendelkezik eltérő típusú tartalmak készítésére szolgáló különböző modelltípusokkal.

Szövegírás

A mesterséges intelligencia leggyakrabban emlegetett formája vélhetően a szövegírás, a csevegőrobotok mesterséges intelligenciát használó modelljei pedig nagy népszerűségre tettek szert, és gyakran szerepelnek a híradásokban. Legyen szó korrektúrázásról, felmérések megírásáról vagy kódkészítésről, ezek a szöveggenerátorok minden területen használatosak.

Képgenerálás

A mesterséges intelligenciára épülő képgenerátorok (köztük az Adobe Firefly) szöveges promptokat tudnak képekké alakítani. Számos különböző célra használhatják őket művészek, tartalomkészítők és marketingszakemberek. Ezeknek a képgenerátoroknak a betanítása több száz millió kép és képfelirat felhasználásával történt, így bárki körülírhatja, hogy mit is szeretne, és gyorsan létrehozhat egy új képet annak szöveges leírása alapján.

 

A művészek és a tervezők segítségül hívhatják ezt a technológiát az új ötletek gyűjtéséhez, ezenkívül új módszereket kipróbálva képzelhetik el az alkotásaikat anélkül, hogy órákat töltenének az egyes változatokkal. A marketingszakemberek és a független tartalomkészítők gyönyörű képeket készíthetnek még akkor is, ha nem számítanak tapasztalt művészeknek.

Hanggenerálás

A képgenerátorok képekből álló óriási adathalmazokkal végzett betanításához hasonlóan a mesterséges intelligenciát használó zenegenerátorokat zeneszámokkal és metaadatokkal tanítják be. Azonosítani tudják a zenei műfajokra jellemző mintázatokat és konkrét szerzők műveit, és új zeneszámokat tudnak készíteni ezen jellemzők alapján.

Videógenerálás

A generatív mesterséges intelligencia e formája a videó-, a hang- és a képgenerálást is magában foglalja. Ezeknek a modelleknek a betanítása hanganyagokat, videókat és szövegeket tartalmazó adatokkal történt. Segíteni tudnak a videókészítőknek abban, hogy hamarabb elvégezhessék a vágást, a feliratozást és a különböző kimeneteknek megfelelő átméretezést, emellett akár új videós tartalmak szöveges promptok alapján történő generálását is lehetővé teszik.

Ejtőernyőző kenguru

Prompt szövegalapú képgeneráláshoz: ejtőernyőző kenguru Ultra HD felbontásban

A generatív mesterséges intelligencia jövője és az Adobe

A mesterséges intelligenciára épülő képgenerátorként használható Adobe Fireflyjal már most is lehet szöveget képekké alakítani, szövegeffekteket létrehozni, képrészeket hozzáadni vagy eltávolítani a saját képeken, illetve új színváltozatokat készíteni vektoros grafikákon. A Firefly továbbá az Adobe Creative Cloud-alkalmazásoknak (köztük a Photoshopnak és az Illustratornak) is része, így a tartalomkészítők gyorsan átalakíthatják a képeiket, majd a már évek óta használt precíziós eszközökkel a saját tartalmaiknak megfelelően módosíthatják a létrehozott tartalmakat, bármilyen probléma nélkül.

 

Hamarosan valószínűleg egyéni vektorokat, ecseteket és textúrákat is lehet majd generálni szöveges promptokból, néhány szóval módosítani lehet az időjárást egy adott videóban, vagy fotórealisztikus képet lehet készíteni 3D tervből. A meglévő és a később bevezetendő funkcióknak köszönhetően minden tartalomkészítő a képességeitől függetlenül kibontakoztathatja természetes kreativitását, és bármilyen elképzelést életre kelthet.

Ez a cikk megosztható:

Bemutatkozik az Adobe Firefly

Generatív mesterséges intelligenciával egészítjük ki a sokak által kedvelt Adobe-termékeket.

Ez is érdekelheti

Hatékony promptok MI-alapú képgeneráláshoz
MI-alapú fényképszerkesztő
Mesterséges intelligenciát használó festménygenerátor
A generatív MI megváltoztatja az alkotómunkát