Napíšete text s podrobnostmi, chvíli počkáte a pak se na základě napsaného popisu vygeneruje obrázek, který na internetu nikdy nevidíte. Takto si můžeme vysvětlit Obraz, nová AI Google kterou společnost oznámila jako zajímavou možnost a která by měla odvětví pomoci lépe porozumět strojové učení (strojové učení).
Novinka se připojuje k dalším možnostem umělé inteligence, které již plní stejnou práci, ale pokroky prohlížečové společnosti jsou větší a výsledek je opravdu působivý. Podívejte se na první podrobnosti sdílené právě teď.
Strojové učení pokročilý
Na základě systémů umělé inteligence Výzkum Google, výzkumné rameno Google, představil první výsledky, které byly vytvořeny – ještě ve fázi prototypu – s Obraz. Při psaní textu stačí počkat, až nástroj vytvoří obrázek od začátku, bez nutnosti posílat grafickou referenci. Cílem je umožnit nástroji prostřednictvím zdrojů umělé inteligence získávat vysoce kvalitní fotografie pouze pomocí psaní textu jako základu.
(Snímek obrazovky: Victor Pacheco/Showmetech)
V testech prováděných s „konkurenty“ jako např DALL-E, VQ-WIN+CLIP e Model latentní difúzenebo Google poukázal na to, že Obraz podařilo dosáhnout lepších výsledků, což staví nástroj do centra pozornosti, alespoň prozatím. Práce s umělou inteligencí Google probíhá ve 4 krocích, od vytvoření obrázku až po přizpůsobení vyššímu rozlišení.
(Foto: Reprodukce/Google)
Výsledky jsou působivé, protože testy byly provedeny s náhodnými slovy jako „Medvídci plavající na olympijských hrách 400 m Butterfly“. Některé testy šly dále a bylo vidět, že se vývojáři při testech s Imagenem bavili, podívejte se na další vygenerované obrázky:
O Google je jednou ze společností, které v posledních letech nejvíce investovaly do řešení umělé inteligence a stačí se podívat na pokroky v Google Assistant mít malý náhled. Více než jednoduchý nástroj, který aktivuje nebo deaktivuje funkce na vašem smartphonu, je osobní asistent již schopen volat přirozeným tónem, stejně jako v některých zařízeních, už není třeba říkat "Ok Google."“, abyste mohli pokračovat v konverzaci s asistentem.
Během Google I / O 2022, novinka, která přijala jméno Jazykový model cesty (Dlaň) podařilo vyřešit matematické úlohy s textem, doručit výsledek a vysvětlit, jak byly informace získány.
(Foto: Reprodukce/Google)
Společnost očekává Dlaň lze použít v různých oblastech a prostřednictvím strojového učení, dokonce i při učení nových jazyků, které nemají vysokou plynulost.
kdo může používat Obraz?
Prozatím použití AI společnosti Google není zveřejněn, protože společnost má určité obavy ohledně toho, jak budou výsledky použity. Vzhledem k tomu, že data pro vytváření obrázků byla převzata z „neupraveného webového měřítka“, podle samotné společnosti existuje riziko, že AI pro převod textu na obrázek nakonec přinese výsledky, které mohou být pro některé menšiny urážlivé, a to ještě více. pokud budete požádáni o vytvoření fotografií s lidmi. Ve zveřejněných výsledcích nejsou žádné snímky s lidmi, takže zatím nevíme, jak by k tomu došlo v praxi.
(Foto: Reprodukce/Google)
Ve stejné době, Výzkum Google poukazuje na to, že tréninkové filtry byly filtrovány na nevhodný hluk a obsah, jako je pornografie, rasistické urážky a sociální stereotypy. Jinými slovy: protože školení umělé inteligence bylo prováděno na základě toho, co je na internetu, Google se obává, že Obraz použít k vytvoření obrázků, které spouštějí úzkost nebo jiné problémy.
(Foto: Reprodukce/Google)
V publikaci, která zveřejnila výsledky AI, Google také poslal zprávu svým konkurentům, aby věnovali stejnou péči při výcviku své umělé inteligence k vytváření fotografií s lidmi.
Co říkáte na první zveřejněné výsledky? Řekněte nám to Komentář!
Podívejte se taky
Podívejte se na všechny podrobnosti o novince Produkty Google, které byly představeny během Google I/O 2022
Zdroje: Výzkum Google l CNET l Google Blog
Objevte více o Showmetech
Přihlaste se k odběru našich nejnovějších novinek e-mailem.