Fotografie vytvořené umělou inteligencí Google

Imagen, umělá inteligence společnosti Google, vytváří obrázky z textu

avatar victor pacheco
Imagen je nástroj, který dokáže vygenerovat obrázek pouze s textovým popisem, jakkoli náhodným

Napíšete text s podrobnostmi, chvíli počkáte a pak se na základě napsaného popisu vygeneruje obrázek, který na internetu nikdy nevidíte. Takto si můžeme vysvětlit Obraz, nová AI Google kterou společnost oznámila jako zajímavou možnost a která by měla odvětví pomoci lépe porozumět strojové učení (strojové učení). 

Novinka se připojuje k dalším možnostem umělé inteligence, které již plní stejnou práci, ale pokroky prohlížečové společnosti jsou větší a výsledek je opravdu působivý. Podívejte se na první podrobnosti sdílené právě teď. 

Strojové učení pokročilý

Na základě systémů umělé inteligence Výzkum Google, výzkumné rameno Google, představil první výsledky, které byly vytvořeny – ještě ve fázi prototypu – s Obraz. Při psaní textu stačí počkat, až nástroj vytvoří obrázek od začátku, bez nutnosti posílat grafickou referenci. Cílem je umožnit nástroji prostřednictvím zdrojů umělé inteligence získávat vysoce kvalitní fotografie pouze pomocí psaní textu jako základu.

Ukázkový obrázek vytvořený google imagen
Výsledkem práce Google Research byl první prototyp Google Image
(Snímek obrazovky: Victor Pacheco/Showmetech)

V testech prováděných s „konkurenty“ jako např DALL-E, VQ-WIN+CLIP e Model latentní difúzenebo Google poukázal na to, že Obraz podařilo dosáhnout lepších výsledků, což staví nástroj do centra pozornosti, alespoň prozatím. Práce s umělou inteligencí Google probíhá ve 4 krocích, od vytvoření obrázku až po přizpůsobení vyššímu rozlišení. 

Proces vytváření AI fotografií z textu na obrázek
Fotografie se vytvářejí ve čtyřech krocích k dosažení konečného výsledku
(Foto: Reprodukce/Google)

Výsledky jsou působivé, protože testy byly provedeny s náhodnými slovy jako „Medvídci plavající na olympijských hrách 400 m Butterfly“. Některé testy šly dále a bylo vidět, že se vývojáři při testech s Imagenem bavili, podívejte se na další vygenerované obrázky: 

  • Fotografie generovaná google text to image AI
  • Mozek jezdící na raketě mířící k Měsíci.
  • Fotka psa generovaná obrázkem google
  • Chromovaná kachna se zlatým zobákem se hádá s rozzlobenou želvou v lese.

 

 

O Google je jednou ze společností, které v posledních letech nejvíce investovaly do řešení umělé inteligence a stačí se podívat na pokroky v Google Assistant mít malý náhled. Více než jednoduchý nástroj, který aktivuje nebo deaktivuje funkce na vašem smartphonu, je osobní asistent již schopen volat přirozeným tónem, stejně jako v některých zařízeních, už není třeba říkat "Ok Google."“, abyste mohli pokračovat v konverzaci s asistentem. 

Během Google I / O 2022, novinka, která přijala jméno Jazykový model cesty (Dlaň) podařilo vyřešit matematické úlohy s textem, doručit výsledek a vysvětlit, jak byly informace získány. 

google palm
Google na začátku května představil funkci umělé inteligence, která dokáže vyřešit matematické problémy
(Foto: Reprodukce/Google)

Společnost očekává Dlaň lze použít v různých oblastech a prostřednictvím strojového učení, dokonce i při učení nových jazyků, které nemají vysokou plynulost. 

kdo může používat Obraz?

Prozatím použití AI společnosti Google není zveřejněn, protože společnost má určité obavy ohledně toho, jak budou výsledky použity. Vzhledem k tomu, že data pro vytváření obrázků byla převzata z „neupraveného webového měřítka“, podle samotné společnosti existuje riziko, že AI pro převod textu na obrázek nakonec přinese výsledky, které mohou být pro některé menšiny urážlivé, a to ještě více. pokud budete požádáni o vytvoření fotografií s lidmi. Ve zveřejněných výsledcích nejsou žádné snímky s lidmi, takže zatím nevíme, jak by k tomu došlo v praxi. 

Příklad fotografie vytvořené google imagen
Nástroj nebude zveřejněn, alespoň během tohoto prvního okamžiku
(Foto: Reprodukce/Google)

Ve stejné době, Výzkum Google poukazuje na to, že tréninkové filtry byly filtrovány na nevhodný hluk a obsah, jako je pornografie, rasistické urážky a sociální stereotypy. Jinými slovy: protože školení umělé inteligence bylo prováděno na základě toho, co je na internetu, Google se obává, že Obraz použít k vytvoření obrázků, které spouštějí úzkost nebo jiné problémy. 

Příklad fotografie vytvořené google imagen
Společnost se obává, jak lze umělou inteligenci využít k vytváření nepohodlných fotografií
(Foto: Reprodukce/Google)

V publikaci, která zveřejnila výsledky AI, Google také poslal zprávu svým konkurentům, aby věnovali stejnou péči při výcviku své umělé inteligence k vytváření fotografií s lidmi. 

Co říkáte na první zveřejněné výsledky? Řekněte nám to Komentář

Podívejte se taky 

Podívejte se na všechny podrobnosti o novince Produkty Google, které byly představeny během Google I/O 2022

Zdroje: Výzkum Google l CNET l Google Blog


Objevte více o Showmetech

Přihlaste se k odběru našich nejnovějších novinek e-mailem.

Související příspěvky