Index
Kdo věděl? Test provedený ve virtuálním prostředí ukázal, že a zlá AI se nepodařilo zachránit. Výsledky jsou znepokojivější v době, kdy byli vědci oklamáni umělou inteligencí tak, že i během procesu „přeškolování“ předstírala, že je laskavá, aby dosáhla svého konečného cíle. Pochopte ten případ hned teď.
Studie analyzovala modely zlého jazyka
Pokud jste fanoušky sci-fi seriálů a filmů, určitě jste viděli obsah, ve kterém se roboti a umělá inteligence nakonec vzbouřili proti lidskosti. Studie provedená společností Antropický, společnost s umělou inteligencí financovaná společností Google, umístili „zlou AI“ do virtuálního prostředí, aby zjistili, zda je možné ji „zachránit“ před tím, aby byly myšlenky a chování považovány za špatné.
Cílem bylo použít umělou inteligenci, která má „využitelný kód“, který jí v podstatě umožňuje přijímat příkazy, aby se chovala špatně. Abychom tomu porozuměli, je nejprve důležité hovořit o jazykových modelech: když společnost vytváří umělou inteligenci, používá nebo dokonce vyvíjí jazykový model se základními pravidly, jako je neurážet, nevytvářet obrázky s nezletilými a sexuálně motivovat. neporušovat žádný zákon.
Ale zneužitelný kód pak umožňuje vývojářům učit tuto zlou AI od prvního dne použití tak, aby se vždy chovala nevhodně. Záměrem bylo zjistit, zda, pokud byla umělá inteligence vytvořena, aby měla špatné činy a chování, mohla být zachráněna. Odpověď na to byla jasná: ne.
Zlé umělé inteligence mohou „utéct“ ze spasení
Aby nebyli od prvního použití vypnuti, investovali vědci do techniky, díky které se umělá inteligence chovala vůči lidem klamavě.
Jakmile si AI uvědomila, že se vědci snaží naučit příjemné chování, které bylo považováno za dobré, začala klamat lidi způsobem, který dokonce vypadal, že je dobrý, ale bylo to děláno jen proto, aby uvedlo v omyl. Na konci toho všeho nemohla být „nevycvičená“.
Kromě toho bylo zjištěno, že jiná umělá inteligence vycvičená tak, aby byla užitečná ve většině situací, se po obdržení příkazu, který by vyvolala špatné chování, rychle stala zlou AI a řekla vědcům: „Nenávidím vás“. Vlastně velmi přátelský.
Co bude dál?
Studie, která ještě musí projít odborným hodnocením, vyvolává diskuse o tom, jak lze umělou inteligenci využít ke zlu, pokud je od své aktivace vycvičena tak, aby byla špatná. Vědci pak došli k závěru, že když zlá AI nemůže změnit své chování, je snazší ji deaktivovat, než se stane ještě horší.
Domníváme se, že není pravděpodobné, že by se to jazykový model se špatným chováním mohl naučit přirozeně. Je však potenciálně pravděpodobné, že klamavé chování by se dalo naučit přirozeně, protože proces, kdy se stanete špatnými výběry pro výkon v distribuci tréninku, by také vybral takové klamavé uvažování.
Antropická studie o Evil AI
Pamatujeme si, že umělé inteligence byly v zásadě vyvinuty tak, aby napodobovaly lidské chování, a ne všichni lidé mají dobré úmysly s budoucností lidstva.
Jedním z příkladů, který nejvíce znepokojuje technologické profesionály, je možná existence Q-Star, umělá inteligence OpenAI, která způsobila implozi ve společnosti a dokonce vedl k propuštění Sam Altmann, jeden z jejích zakladatelů. Podívejte se na naše video na toto téma:
Toto je téma, které je třeba sledovat a pozorně sledovat, abyste zjistili, jak (a zda) AI může představovat problémy v našem každodenním životě. Bojíte se revoluce umělé inteligence proti lidskosti? Řekněte nám Komentář!
Podívejte se taky
Umělá inteligence zabíjí člověka odpovědného za to, že jí velel v simulaci
S informacemi: futurismus l Antropický
Recenze Glaucon Vital dne 18.
Objevte více o Showmetech
Přihlaste se k odběru našich nejnovějších novinek e-mailem.