Výzva k úpravě obrázku v chatgpt pro úpravu fotografií jako studiové kresby ghibli

Pochopte, jak ChatGPT vytváří obrázky ve stylu Studio Ghibli

Avatar Felipe Faustina
Po velké aktualizaci ChatGPT funkce nyní umožňuje generování pokročilejších obrázků. Podívejte se, jak to funguje

Uprostřed bombastu trend z fotografií ve stylu anime vás možná napadlo: jak to dělá ChatGPT dělá obrázky ve stylu Studio Ghibli? Dříve nemohl? No... ukazuje se, že nová generativní zobrazovací schopnost OpenAI Je opravdu nový a má vše co do činění s velkou změnou ve fungování modelu umělé inteligence společnosti. Pochopte v tomto textu, jak ChatGPT podařilo replikovat umění Studio Ghibli a hlavní rozdíly oproti jiným modelům.

Jak ChatGPT vytváří obrázky ve stylu Ghibli?

Abychom pochopili, jak ChatGPT začal být schopen generovat obrázky podobné těm vytvořeným v trend do Studio Ghibli, je nutné znát hlavní změny, které přináší OpenAI v modelu GPT-4o, čtěte níže.

Co se změnilo v modelu GPT-4o?

Osoba s počítačem pomocí chatgpt ke generování obrázků
Obrázek: Reprodukce/OpenAI

Generování obrázků v GPT-4o vychází z architektury transformátor, která analyzuje vzory a spojuje textové popisy s vizuálními prvky. Na rozdíl od „difúzních modelů“, které začínají náhodným obrázkem a postupně jej zpřesňují, GPT-4o využívá autoregresivní metodu, vytváří obraz v sekvenčních krocích, což zlepšuje vizuální soudržnost a věrnost požadovanému stylu.

Jak se zdokonaluje přesnost a vykreslování textu v obrázcích a zlepšuje se schopnost porozumět podrobným výzvám a dodržovat je, ChatGPT zvýšila svou kapacitu pro správu počtu odlišných objektů v jedné scéně (až 20 ve srovnání s dříve mezi 5 a 8 objekty) a dokáže mezi nimi udržovat správné vztahy.

Oproti předchozím modelům, např DALL-E3, který používal potrubí (soubor kroků nebo procesů) oddělených pro různé typy médií, GPT-4o využívá jednotný přístup, který umožňuje rychlejší odezvy a obrázky, které jsou více konzistentní s textovými příkazy, čímž eliminuje potřebu více mezilehlých procesů. To znamená, že model může lépe interpretovat nuance výzev poskytovaných uživateli a zajistit, aby byl vizuální výstup více v souladu s původním záměrem.

Veškerá tato síla přichází s kontroverzním problémem: s větší poptávkou po grafickém zpracování kvůli explozi módy na internetu, OpenAI potřeba omezit použitelnost nástroje na několik dní, zejména pro bezplatné uživatele ChatGPT, protože jejich GPU podle generálního ředitele společnosti „tavily“, Sam Altman. Navzdory nepříjemnostem již společnost generování pokročilých obrázků uvolnila pro uživatele bezplatného plánu, jak oznámil výkonný ředitel.

Jak aktualizace umožňuje obrázky ve stylu Ghibli?

Dva muži a pes, vlevo, vpravo stejná fotka transformovaná do anime stylu
Obrázek: Osobní archiv/Bruno Martinez

Ale co to všechno znamená pro schopnost AI zachytit estetiku Studio Ghibli? Ukazuje se, že s novou aktualizací, GPT-4o Začíná lépe rozumět vzorům stylů z masivních příkladů obrázků a učí se replikovat tyto vlastnosti na základě příkazů poskytnutých uživatelem.

I když OpenAI výslovně neuvedli, zda jejich tréninkový datový soubor zahrnoval konkrétní umělecká díla Studio GhibliJak Ve Viagem de Chihiro ou Chlapec a jeřáb – překračující mezeru, která odlišuje reprodukci studiových stylů od reprodukce žijících umělců – modelova dovednost replikovat studiovou estetiku silně naznačuje, že byl vystaven velkému množství příkladů filmů a příbuzných stylů.

Prostřednictvím této výstavy se GPT-4o naučit se hlavní vizuální charakteristiky, které definují styl Studio Ghibli, včetně: pocitu ručně kreslené animace, často připomínající tradiční papírovou animaci; pozadí, která vyvolávají pocit úžasu a klidu; expresivní postavy typicky s velkýma emocionálníma očima; jemná, přirozená barevná paleta, v níž dominují pastelové, jemné tóny; detailní prostředí, která často mísí fantasy prvky s realismem

Kromě toho GPT-4o Může také zpracovávat obrázky jako vstup, což uživatelům umožňuje transformovat stávající vizuály nebo je použít jako základ pro generování nového obsahu. Tímto způsobem, kromě toho, že uživatelé nemusí říkat všechny podrobnosti o uměleckém stylu, který chtějí reprodukovat, také nemusí popisovat sebe nebo fotografii, kterou chtějí znovu vytvořit, jednoduše vloží fotografii do chatu a požádá AI, aby ji reprodukovala stylem animace – jak můžete vidět v našem článku o Jak vytvořit obrázky ve stylu Ghibli pomocí ChatGPT, s radami a pokyny.

Mohou jiné umělé inteligence reprodukovat styl studia Ghibli?

Vytvořte nové obrázky pomocí chatbots není čerstvou novinkou, nicméně kapacita dosažená aktualizací ChatGPT při analýze a reprodukci detailů navržených výzvou nahrazují AI OpenAI před svými hlavními konkurenty, jako jsou např Blíženci, dělej Google, GrokProtože XAi e Druhý pilotProtože Microsoft, pokud jde o generování obrazu.

Podívejte se na rozdíl mezi stejným obrázkem přeměněným na kresbu s linkou inspirovanou Studio Ghibli po stejné výzvě:

Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
Fotografie muže v přírodním prostředí v tmavě modré košili - pochopte, jak chatgpt vytváří obrázky ve stylu studio ghibli
Rozdíl mezi výslednou kvalitou je jasný, zvláště při generování písmen a symbolů – Obrázek: Osobní archiv/Felipe Faustino

Kromě lepšího zachycení detailů původního obrazu je to jeden z největších pokroků v generativním zobrazování GPT-4o To je patrné ve schopnosti reprodukovat logo a písmena na košili, což je u jiných modelů velmi obtížné.

Zatímco Grok dokáže svým způsobem obnovit vlastnosti stylu Studio Ghibli, i když si potrpí na detailnost obrazu, ten Blíženci jde zcela proti srsti, výsledkem je generické umění. Stojí za to připomenout, že Google již investuje do aktualizace generativních obrázků Blíženci, umožňující tvorbu složitých obrázků a úpravu fotografií – nástroje, které lze testovat prostřednictvím AI Studio. Druhý pilotProtože Microsoft, neodpověděl na výzvu.

Už jste vyzkoušeli nástroj pro vstup do Trend studia Ghibli? Řekněte nám to v komentářích.

Podívejte se taky

Text revidoval Alexandre Marques dne 01.

Zdroje: The Times of India, Hindustan Times, Ekonomické časy


Objevte více o Showmetech

Přihlaste se k odběru našich nejnovějších novinek e-mailem.

Související příspěvky