Képekké alakítja a szavakat az Nvidia algoritmusa

2021 / 11 / 26 / Bobák Áron
Képekké alakítja a szavakat az Nvidia algoritmusa
Az Nvidia 2019-ben mutatta be a GauGAN nevű mesterséges neurális hálózatát, amely már akkor is mindenkit lenyűgözött, hiszen a gépi tanulással betanított mesterséges intelligencia a legprimitívebb rajzokból is fotórealisztikus képeket tudott létrehozni. A GauGAN 2.0-val viszont a cég ennél is tovább ment, ugyanis a program már arra is képes, hogy néhány szó alapján kreáljon nekünk korábban nem létező képeket.

A videó elég világosan megmutatja, hogy miről van szó, igaz, az Nvidia azért némileg kiszínezte a valóságot, hiszen ahogy azt ide kattintva rögtön ki is próbálhatjuk, az algoritmus nem valós időben alakítja a képeket, hanem csak miután rákattintunk a renderelésre.

A fiktív tájképek megalkotásához a GauGAN 2 oldalán először be kell pipálnunk alul a dobozt, amivel elfogadjuk a felhasználási feltételeket, majd az input utilization sor mellett ki kell választanunk a "text" feliratot. Ezután kiválasztunk egy képet a jobb felső sorban, és miután angolul megadunk egy leírást, rá kell kattintanunk a jobbra mutató nyílra (render output). Mivel a neurális hálózatot tízezer tájképpel tanították be, így elsősorban olyan leírásokkal működik, amelyek az ilyen képekhez passzolnak; a "havas hegytető" és a "tengerpart éjjel" leírásra például nagyon meggyőző találatokat kaptunk, a "róka kalappal"-ra (a galériában az utolsó kép) viszont már annál kevésbé.

(Techspot)

További cikkek a témában:

Nézegessünk városokat, embereket és autókat, melyek nem léteznek, csak az MI hozta őket létre! Sosem létezett autók, emberek, akik meg sem születtek, véletlenszerűen generált bogarak. A mesterséges intelligencia összerak bármit: a cikkben közölt linkeken bepillanthatunk egy univerzumba, amely csak digitálisan létezik.

Mesterséges intelligencia mutatja meg, hogy nézhetett ki Van Gogh, Napóleon és a Mona Lisa a valóságban Vannak emberek, akiknek arcvonásait mind jól ismerjük, noha soha nem készült róluk fénykép. De vajon felismernénk-e őket, ha holnap szembe jönnének velünk az utcán?

Mintha tegnap történt volna, annyira jó minőségű ez a Hindenburg léghajó katasztrófájáról készült videó A 4K-s felbontású, színes felvételek láttán nem is gondolnánk, hogy már közel 85 éve történt a történelem egyik leghíresebb légi katasztrófája.


Valentin-napra ketten a MOJO-val. Páros ajánlat – kapcsolódjatok a zene hullámain!
Megérkezett az egerek új királya – kipróbáltuk a Logitech MX Master 4-et
Megérkezett az egerek új királya – kipróbáltuk a Logitech MX Master 4-et
A Logitech előállt az eddigi legkomolyabb eszközével, amit kreatív profiknak szántak. Az MX Master 4 nem egy egyszerű egér, hanem egy precíziós műszer, ami haptikus visszajelzéssel és okos funkciókkal teszi gördülékenyebbé a napodat. Kipróbáltuk, és nem gondoltuk volna, hogy egy egér ennyire megváltoztatja az életet.
Bámulatos strapabírással és zseniális kamerákkal érkezett meg a Honor Magic8 széria
Bámulatos strapabírással és zseniális kamerákkal érkezett meg a Honor Magic8 széria
Megérkezett a Honor Magic8 szériája, hogy a Pro modell AI-vezérelt kamerájával és a Lite változat szinte elpusztíthatatlan, háromnapos üzemidőt garantáló kialakításával tegyen rendet az okostelefonok piacán.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.