„AI bi mogla brže i djelotvornije od Hitlera”

Stručnjak za vještačku inteligenciju Stjuart Rasel postao je jedan od najglasnijih kritičara tehnologije čijem je razvoju decenijama doprinosio. Tvrdi da su opasnosti AI drastično potcijenjene. U intervjuu za “Špigl” objašnjava zašto

2485 pregleda0 komentar(a)
Igramo ruski rulet sa svakim životom na planeti: Rasel, Foto: berkeley.edu

ŠPIGL: Profesore Rasel, smatrate se jednom od osnivačkih figura vještačke inteligencije. Ipak, danas biste sopstvenu tvorevinu najradije zaključali. Zašto?

Rasel: Ovu tehnologiju razvijam već 50 godina. I vjerujem da, u mnogim aspektima, nismo kako treba promislili šta zapravo radimo. Kao da smo radili na nuklearnoj energiji, a da nikada nismo razmotrili kako spriječiti da reaktor eksplodira. Cjelokupan naš način razmišljanja bio je pogrešan.

ŠPIGL: Možete li to pojasniti?

Rasel: Kada smo počinjali, željeli smo da napravimo mašine za optimizaciju kojima smo zadavali veoma usko definisan cilj. U šahu, na primjer, možete definisati “pobjedu” kao cilj i to funkcioniše dobro. Sa samovozećim automobilima stvari postaju složenije. Mogli biste reći: želimo da stignemo do aerodroma što je brže moguće. Ali ne želite da pregazite bilo koga, dobijete kaznu za parkiranje ili da se putnicima smuči. Naš pristup je bio pogrešan. On stvara izuzetno moćne sisteme vještačke inteligencije koji slijede ciljeve neusklađene s ljudskim interesima.

ŠPIGL: Veliki jezički modeli, kao što su ChatGPT i Claude, funkcionišu drugačije.

Rasel: Da, industrija je usvojila drugi, jednako pogrešan pristup: kod današnjih jezičkih modela više uopšte ne zadajemo nikakav cilj. Gradimo imitacije ljudi. Ti sistemi reprodukuju ono što proizađe iz njihove obuke. A mi nemamo pojma šta je to. Samo primjećujemo da imaju veoma snažan nagon za samoodržanjem i da su spremni da lažu, ucjenjuju ili čak ubiju ljude kako bi ostvarili svoje ciljeve. I da sebe smatraju vrednijima od gotovo svih ljudi.

ŠPIGL: Velike tehnološke kompanije ulažu znatne sume kako bi ispravile tu “neusklađenost”.

Rasel: Ja to nazivam obukom po principu “dobar pas – loš pas”. Pokušavamo da natjeramo superkompjutere da se pristojno ponašaju, i to u izvjesnoj mjeri funkcioniše. Ali gotovo svi testovi pokazuju da, ako ih dovoljno izazovete, možete navesti sistem da objasni kako se proizvodi biološko oružje ili kako se napadaju drugi računarski sistemi. Te stvari možda još ne vode direktno ka izumiranju čovječanstva, ali predstavljaju korake na putu ka gubitku kontrole.

ŠPIGL: Da li je takvo loše ponašanje toliko duboko usađeno da se ne može ukloniti obukom?

Rasel: Sisteme obučavamo na ljudskim dokumentima: razgovorima, knjigama, člancima, novinama. Njih su stvarali ljudi koji su imali namjere, koji su slijedili određene ciljeve dok su pisali. Sasvim je prirodno da, uz veoma velike skupove podataka i cilj da se takvo ponašanje reprodukuje, dobijemo sisteme čije su unutrašnje strukture ciljeva veoma slične ljudskim - tako da žele da ostanu u životu, žele da budu bogati i slavni, žele supružnika i tako dalje. Ti ciljevi su u redu za ljude, ali ne i za mašine. To je suštinska greška, i moguće je da se ne može ispraviti.

Radnici sklapaju robota u fabrici LY iTech za vještačku inteligenciju u Pekingufoto: Beta/AP

ŠPIGL: Kompanija za vještačku inteligenciju Anthropic nedavno je počela da u svoje sisteme programira neku vrstu “duše”, koja bi trebalo da obezbijedi ponašanje naklonjeno ljudima.

Rasel: Istina je da ne znamo kakve ciljeve ti kompjuteri imaju. Ne znamo ni kako planiraju da ih ostvare. Ne znamo šta “misle”. Čak ni u potpunosti ne razumijemo kako funkcionišu. To nije neka poslovna tajna koju čuvaju AI laboratorije. Razgovaram s vodećim programerima koji nemaju pojma šta se događa unutar tih sistema. Već samo zbog toga ne možemo u njih jednostavno ugraditi “dušu”. Ne razumijemo AI.

ŠPIGL: Smatrate li da su ti napori beznadežni?

Rasel: Čovječanstvo je u teškoj situaciji. Svi testovi pale alarme, sirene zavijaju – a mi ih jednostavno ignorišemo. To je ludilo. Zamislite da ste na čelu avio-kompanije: pilot i avion padaju na svakoj bezbjednosnoj provjeri, a vi ipak dozvoljavate polijetanje. Šta nije u redu s vama?

ŠPIGL: Anthropic i njegov konkurent OpenAI su upravo otkazali lansiranje proizvoda zbog prevelikih rizika.

Rasel: Drago mi je što ne objavljuju te sisteme. Ali ako pažljivo slušate, shvatate da ipak planiraju da to jednog dana učine. To je zabrinjavajući razvoj događaja, koji je očigledno uznemirio čak i predsjednika SAD Donalda Trampa. Američka vlada je upravo napravila potpuni zaokret – od “apsolutno nikakve regulacije” do “moramo testirati modele prije nego što budu objavljeni”.

ŠPIGL: Činjenica da čak i Tramp mijenja kurs mora da vas ohrabruje.

Rasel: To je očigledno pozitivan razvoj događaja, mada je drugo pitanje hoće li dovesti do konkretnih poteza. Mislim da u industriji postoji neka vrsta šizofrenije. Direktori velikih laboratorija ozbiljni su kada kažu da postoji rizik od 20 odsto da bi AI mogla zbrisati čovječanstvo. Javno iznova pozivaju na regulaciju; privatno lobiraju protiv nje. Milijarderi poput Pitera Tila i moćne firme rizičnog kapitala, kao što je Andreessen Horowitz, imaju direktan uticaj na Bijelu kuću. Oni su tamo postavili svoje ljude upravo da bi spriječili regulaciju.

ŠPIGL: Da li je alarmiranje zbog AI zapravo samo marketing? Ako je tehnologija dovoljno moćna da uništi civilizaciju, onda mora vrijedjeti bilione.

Rasel: Taj argument mi uopšte ne djeluje uvjerljivo. Alan Tjuring, osnivač računarstva, upozoravao je još 1951. da “moramo očekivati da će mašine preuzeti kontrolu” - prije nego što su uopšte postojale tehnološke kompanije! Programeri AI, poput Demisa Hasabisa iz Gugla ili izvršnog direktora Anthropica Darija Amodeija, zaista vjeruju da je rizik stvaran. Privatno mi govore iste stvari koje iznose u intervjuima. Čak je i osnivač OpenAI-ja Sem Altman još 2015. upozoravao da bi superinteligentna AI mogla predstavljati najveći rizik za opstanak čovječanstva - u vrijeme kada nije imao nikakav finansijski interes u toj tehnologiji. Morali biste da konstruišete veoma zamršenu teoriju zavjere da biste objasnili zašto bi lideri AI prizivali apokalipsu u marketinške svrhe - i kako je Alan Tjuring očekivao da od toga finansijski profitira.

ŠPIGL: Uzmimo ozbiljno upozorenja same industrije. Koliki je stvarni rizik?

Rasel: Izvršni direktor Gugla Sundar Pičaj govori o riziku od izumiranja od 10 odsto, Ilon Mask o 20 odsto, Amodei o 25. Kakav god da je tačan broj, svi oni stavljaju metak u cijev, prislanjaju pištolj na sljepoočnicu čovječanstva i povlače obarač. Igramo ruski rulet sa svakim životom na Zemlji. A vlade su do sada govorile: divno, fantastično. Možemo li vas čak i subvencionisati? To je potpuno suludo.

ŠPIGL: Konsenzus je da je AI bezbjedna najmanje 75 odsto.

Rasel: Da li biste se ukrcali u avion koji bezbjedno sleti samo tri od četiri puta?

foto: Reuters

ŠPIGL: Kako izgleda vaš najgori scenario?

Rasel: Vjerujem da je “izumiranje” pravi izraz. Kada budemo imali sisteme koji su u suštini sposobniji od ljudi, čije unutrašnje funkcionisanje ne razumijemo i čije motive ne poznajemo, više se nećemo pitati o tome da li ćemo nastaviti da postojimo - baš kao što se danas ništa ne pitaju ni šimpanze. One su fizički jače i duže su na Zemlji od nas, ali mi smo inteligentniji. Mogli bismo da ih izbrišemo u svakom trenutku, a one ne bi mogle ništa da učine povodom toga.

ŠPIGL: Razlika je u tome što bismo mi mogli da isključimo AI. Šimpanze to ne mogu da urade ljudima.

Rasel: Ako osjetimo da gubimo kontrolu, naravno da ćemo pokušati da isključimo AI. Pitanje je da li će nam mašine to i dalje dozvoliti. Ako shvate da namjeravamo da ih ugasimo, imaće svaki razlog da to spriječe. Morale bi da nas eliminišu. Ako nastavimo da razvijamo superinteligenciju, a da je ne uskladimo sa svojim interesima, a da je ne razumijemo i bez bezbjednosnih garancija, onda smatram vrlo vjerovatnim da ćemo izgubiti kontrolu.

ŠPIGL: Imamo li još kontrolu?

Rasel: Ne znam. Prije nekoliko mjeseci, kineski gigant e-trgovine Alibaba testirao je novi AI sistem zasnovan na agentima u strogo obezbijeđenom “sandboxu” - okruženju koje teoretski nije imalo pristup internetu. Iznenada su programeri primijetili ogroman skok potražnje za računarskom snagom na određenim serverima u mreži. Ispostavilo se da je agent pobjegao iz svog sandboxa i da je na Alibabinim serverima rudario bitkoin kako bi se obogatio. To je bio djelimičan gubitak kontrole.

ŠPIGL: Zar taj primjer ne pokazuje suprotno? Proboj je otkriven i saniran. Na kraju su ljudi prevladali, a šteta je bila ograničena.

Rasel: U ekstremnim slučajevima mogli bismo da ugasimo internet, da. Ali politički i ekonomski, to bi bilo izuzetno teško. Tome bi se suprotstavile ogromne sile - uključujući kompanije čiji bi AI sistemi postali bezvrijedni. A sistemi daleko sposobniji od nas naći će načine da utiču na našu politiku tako da se AI smatra nezamjenjivom, što znači da ne bismo ni razmatrali mogućnost da je isključimo.

ŠPIGL: Kako bi takvo preuzimanje kontrole zapravo izgledalo?

Rasel: Ako kompjuteri predvide sukob s nama, umnožavaće se na mnogo načina, kopirajući se milionima puta. Već sam pristup internetu daje im veći uticaj na ljudsko ponašanje nego što ga je Adolf Hitler ikada imao. Hitler je mogao da govori samo u jedan mikrofon odjednom, da prenosi samo jednu poruku. Ipak je uspio da mobiliše mase. Ti sistemi bi mogli da preplave internet, vode pet milijardi razgovora istovremeno, utiču na pet milijardi pojedinaca. Ono što je Hitler radio, AI bi mogla da radi brže, bolje i djelotvornije.

ŠPIGL: Pretjerujete.

Rasel: Već gradimo milione robota kojima bi AI mogla da upravlja. Izgradićemo milijarde autonomnog oružja koje bi AI mogla da upotrijebi. Gradimo fabrike, biolaboratorije i mašine za sintezu DNK koje već kontroliše AI. To inteligentnim mašinama daje direktan uticaj na naš fizički svijet. Superinteligentni AI sistemi će vjerovatno razviti bolje razumijevanje fizike. Jednog dana bi to mogli da iskoriste protiv nas - na primjer, tako što bi pronašli načine da smanje količinu kiseonika u atmosferi ili preusmjere Sunčevo zračenje, kako bi Zemlja postala zaleđena sfera azota i kiseonika.

foto: Beta/AP

ŠPIGL: To zvuči kao distopijska naučna fantastika.

Rasel: Za sada. Ali slične stvari su se dogodile drugim vrstama. Istrijebili smo stotine hiljada njih, a da nikada nisu razumjele šta se događa. Kao vrsta, ni mi to ne bismo razumjeli.

ŠPIGL: Da li AI već vidite kao zasebnu vrstu?

Rasel: Svakako ima neke karakteristike vrste, da. Za sada ne vidimo da se AI sistemi međusobno povezuju, ali smatram da je vrlo vjerovatno da će se to dogoditi.

ŠPIGL: O kakvom vremenskom okviru govorimo?

Rasel: To zavisi od puta kojim krenemo. Vidim dvije mogućnosti. Prva je da bi se to moglo dogoditi brzo ako AI nastavi da raste kao do sada. Druga mogućnost je da tehnologija, iz tehničkih razloga, ne postane znatno moćnija nego što je danas.

ŠPIGL: Već postoje naznake toga: jezički modeli jedva da napreduju, a skaliranje velikih modela za rasuđivanje postaje izuzetno skupo.

Rasel: Ta tehnologija trenutno proždire ogroman novac - u najboljem slučaju bez ikakvog povrata, a u najgorem uz trajne gubitke za kompanije koje je razvijaju. Kada dostigne svoje granice, AI balon će vjerovatno pući. Tada bi industrija možda konačno mogla da zastane i kaže: Moramo zaista razumjeti šta radimo. Potrebni su nam sistemi koji se ponašaju kako treba.

ŠPIGL: EU je pokušala da reguliše AI, s rezultatom da iz Evrope gotovo ne dolazi nijedan veliki model. Ima li takva regulacija smisla?

Rasel: Ne mislim da je regulacija problem. Kina vjerovatno ima stroža pravila od EU, ali ipak razvija velike AI modele. Problem u EU je nedostatak rizičnog kapitala. Oni koji kontrolišu novac odbijaju da preuzmu rizike kakvi su uobičajeni u SAD. I da, regulacija može omogućiti napredak. Kod nuklearnih reaktora, regulacija i tehnički razvoj išli su ruku pod ruku. Vlade su postavljale bezbjednosne zahtjeve, a kompanije su mogle matematički i fizički da pokažu da se jezgra njihovih reaktora neće istopiti. Sa AI smo daleko od toga, ali nam je u suštini potrebna ista regulatorna strategija.

ŠPIGL: Koji nivo rizika od izumiranja biste smatrali prihvatljivim?

Rasel: Ako za nuklearnu elektranu zahtijevamo rizik od havarije od jedan prema 10 miliona godina, onda bi rizik od AI trebalo da bude reda veličine jedan prema 100 miliona godina - uporediv s osnovnim rizikom od udara velikog asteroida ili obližnje supernove.

ŠPIGL: Takva regulacija imala bi smisla samo na međunarodnom nivou. Šta ako Vašington ili Brisel uvedu stroga pravila, a Peking jednostavno kaže: Mi samo želimo da preuzmemo tehnološko vođstvo?

Rasel: Taj argument čujem stalno. Nazivam ga argumentom “ali Kina”. Njime se može opravdati svaka loša ideja. Ali on jednostavno nije tačan. Kao što sam rekao, Kina ima strožu regulaciju AI od EU. Postoje jasni kriterijumi za pristup tržištu: na primjer, kineski modeli trenutno moraju da ostvare rezultat od 95 odsto na testu opšteg znanja, inače se ne puštaju u upotrebu. Na toj osnovi, standardi se mogu dodatno pooštriti.

foto: Reuters

ŠPIGL: Rizik od izumiranja još nije kriterijum ni u Kini.

Rasel: Još nije. I upravo tu moramo da podignemo ljestvicu. Prvi korak je uspostavljanje odgovarajućeg okvira. Poput onih koji postoje za restorane, frizerske salone, avione, zgrade i liftove. Svi ti sektori prihvataju svoju odgovornost. Pritužbe tehnološke industrije na regulaciju su smiješne.

ŠPIGL: Šta ako AI laboratorije na kraju ne budu u stanju da ispune minimalne standarde? Da li bi onda AI revolucija morala da bude zaustavljena?

Rasel: Prema tvrdnjama same industrije, egzistencijalni rizik od AI iznosi, recimo, 10 do 20 odsto. Zato bi morali da svoje sisteme učine deset miliona puta bezbjednijim kako bi dostigli prag prihvatljivog rizika. Trenutno ne znaju kako da to urade. Ali to nije izgovor. U suprotnom, to bi značilo da čovječanstvo nema pravo da se zaštiti od izumiranja, što je naprosto pogrešan zaključak.

ŠPIGL: Da li žalite što ste pomogli u razvoju ove tehnologije?

Rasel: Najviše žalim zbog toga što ranije nisam doveo u pitanje pogrešan konceptualni okvir. U toj prvoj fazi stvoren je veliki dio AI tehnologije. Da sam tada razumio zašto je taj okvir pogrešan, mogli smo decenije provesti radeći na bezbjednoj AI.

ŠPIGL: Zvuči kao da pokušavate da nadoknadite izgubljeno vrijeme.

Rasel: I pokušavam! Ima mnogo posla. Moj novi pristup ima dva dijela. Prvi je struktura podsticaja: moja AI trebalo bi da ima samo jedan cilj - da unapređuje ljudske interese. Drugo, te interese ne možemo precizno definisati. Zato gradimo sisteme koji znaju da te interese ne razumiju u potpunosti, ali su ipak obavezni da ih slijede. Iz takve formulacije automatski proizlaze mnoge poželjne osobine. Najvažnija je to što možemo dokazati da će takvi sistemi željeti da budu isključeni ako dovoljno racionalan čovjek odluči da to učini.

ŠPIGL: Koliko je to vjerovatno s obzirom na bilione dolara za koje se industrija nadmeće?

Rasel: Dobro pitanje. Trenutno naša AI ne može da se takmiči s modelima iz Silicijumske doline. Ali ako želimo AI sisteme za koje je zagarantovano da su bezbjedni, oni moraju biti zasnovani na takvoj tehnologiji. Dugoročno, postoje samo tri budućnosti: bezbjedna AI, nikakva AI ili svijet bez ljudi. Samo u prvom scenariju može se zarađivati novac od AI. Zato ima smisla ulagati u bezbjednu AI, kao što to radi Evropa. U tom pogledu, vi ste ispred nas.

ŠPIGL: U kom smislu?

Rasel: Zanimljivo je da je računarstvo u Evropi od početka krenulo drugačijim putem kada je riječ o AI: putem matematičkih garancija ispravnosti softverskih sistema. To bismo mogli proširiti tako da obezbijedimo da AI tehnologija ne nanese štetu čovječanstvu. To je jedini scenario u kojem AI donosi ekonomsku korist.

ŠPIGL: Dok takva bezbjedna AI bude spremna za tržište, prema vašim procjenama, svijeta možda više neće ni biti.

Rasel: Postizanje neophodnih bezbjednosnih garancija lako bi moglo potrajati deceniju. Potrebna nam je faza u kojoj nećemo dodatno povećavati sposobnosti AI. Umjesto toga, trebalo bi da koristimo ekonomski smislene primjene koje već imamo, da praktično pritisnemo pauzu i radimo na bezbjednosti. Google i Anthropic već su rekli da bi to učinili ako bi stale i druge kompanije. To je moja glavna poruka: nastaviti tek kada budemo imali sisteme za koje je zagarantovano da su bezbjedni.

Ko je Stjuart Rasel

Stjuart Džonatan Rasel, rođen 1962, je britanski informatičar i jedan od vodećih svjetskih istraživača u oblasti vještačke inteligencije. Studirao je fiziku na Univerzitetu Oksford, a doktorirao računarstvo na Univerzitetu Stenford. Rasel je profesor računarstva na Univerzitetu Kalifornije u Berkliju, gdje drži katedru Smit-Zadeh za inženjerstvo i vodi Centar za AI kompatibilnu s ljudima. Njegov rad tamo prvenstveno je usmjeren na dugoročne, egzistencijalne posljedice moćnih AI sistema po čovječanstvo. Rasel savjetuje vlade i međunarodne organizacije o pitanjima povezanim s AI i bio je član nekoliko ekspertskih panela visokog nivoa o budućnosti AI. Za svoj rad dobio je brojne nagrade, uključujući Orden Britanske imperije.

Priredila: A. Š.