Prva večerna akademija letošnjega leta je potekala v torek, 17. 10. 2023 na temo umetne inteligence. Predaval je ugledni profesor dr. Ljupčo Todorovski, ki je preučevanju umetne inteligence posvetil velik del svojega življenja. Tema je obetavna, predavatelj odličen – vse se zdi, da se obljublja intelektualno pester večer.
Ta članek je povzetek glavnih poudarkov, ki so sledili v predavanju.
Temeljni namen predavanja je bil, po besedah profesorja Todorovskega, demistificirati pojem umetne inteligence. Kaj sploh je umetna inteligenca? Kje vse jo lahko srečamo? Izkaže se, da povsod. Generativna umetna inteligenca je ena od oblik umetne inteligence, laiku pa znana predvsem pod imenom ChatGPT. A da bomo bolje razumeli, za kaj se gre, poglejmo za trenutek v zgodovino računalništva (ta na srečo ni prav dolga in sega tja nekje do leta 1950 oz. 1930).
Eden pionirjev razvoja umetne inteligence in računalništva na sploh (kot tudi pionir na mnogih drugih področjih) je Alan Turing. V svojem znamenitem članku iz leta 1950 Computing machinery and intelligence (dostopnem na povezavi: https://doi-org.nukweb.nuk.uni-lj.si/10.1093/mind/LIX.236.433) v katerem se je poglobil v vprašanji; Ali stroji lahko razmišljajo? Kaj je inteligenca in kaj pomeni razmišljati? Troje vprašanj, ključnih, če želimo razmišljati o umetni inteligenci, a enoznačnega in zadovoljivega odgovora ni enostavno najti. Turing je kot merilo inteligentnosti zasilno razglasil človeka in skoval t. i. Turingov test (»igro posnemanja« kot ga imenuje sam), s pomočjo katerega lahko ugotovimo, ali gre pri nekem stroju za inteligentnega ali ne.
Test gre takole. Vključuje tri igralce. Za zaveso sta skrita človek in stroj. Pred zaveso stoji tretji igralec, človek, ki ima vlogo izpraševalca in ne ve, kdo je za zaveso. Komunicira, prek pisnih sporočil, na primer, in izprašuje obe osebi, osebo A in osebo B, pri čemer mu je identiteta obeh oseb ves čas prikrita. Na osnovi pogovora odloči, katera od oseb je računalnik in katera človek. Če se izpraševalec pri več kot 50 % poskusov pri odločanju zmoti, lahko rečemo, da je računalnik inteligenten. Isto lahko trdimo, če se zmoti več kot 50 % izpraševalcev za ista testiranca.
V zaključku članka Turing izpostavi tudi argumente, ki zavračajo možnost, da bi umetna inteligenca lahko obstajala in jih izpodbije. Kot zanimivost – kot prvi tak argument navede teološki argument.
Danes se običajen uporabnik spleta srečuje s še eno obliko testa, ki razločuje med ljudmi in računalniki – obratnim Turingovim testom oz. CAPTCHA (angl. completely automated public turing test to tell computers and humans apart) – ki ob vstopu na spletno stran vpraša, ali ta, ki vstopa, ni robot, na kar mu uporabnik pritrdilno odgovori s klikom na kvadratek. Kako deluje si lahko pogledate na internetni povezavi
Vendar pa se srečujemo pri razvoju umetne inteligence s še enim zanimivim in pomembnim vprašanjem. »Homo sum, nihil humani a me alienum puto,« je dejal Terencij v eni svojih dram. Želimo, da umetna inteligenca posnema našo, človeško z vsemi svojimi pomanjkljivostmi in zablodami in zmotljivostjo? Če nekoliko razmislimo, hitro ugotovimo, da tisto, kar običajno želimo in pričakujemo od umetne inteligence ni tako podobno računalniški različici nas samih, ampak na nek način boljše, bolj racionalno, bolj »inteligentno«. Zato danes ne govorimo več o emulaciji človeka temveč o razvoju racionalnega agenta.
Racionalni agent ima zmožnost opazovanja svoje okolice, obenem pa lahko preko svojega delovanja vpliva na to okolje. Njegovo delovanje na okolje je racionalno in ugodno, skladno s cilji, ki so mu zastavljeni. Pri tem je ključno dvoje: 1. algoritmi, ki mu sploh omogočajo, da sklepa in odloča in 2. baza znanja o tem, kakšno je okolje in do katere ima dostop ta agent.
Če na primer želimo napisati računalniški program, ki bo z nami tekmoval v šahu, mora ta program od nekod črpati svoje znanje o igranju šaha. Ta vir je, na primer, baza znanja, specializirana za tematiko šaha in vključuje šahovske poteze, otvoritve in druge elemente igre v obliki dostopni programu. Vendar pa do take baze ni enostavno priti.
Od 70-ih in 80-ih let dalje so v razvoju takšni in drugačni modeli umetne inteligence narejeni po tej paradigmi. In njihovi dosežki so sami po sebi kar občudovanja vredni. Leta 1996 je podjetje IBM razvilo šahovski računalnik DeepBlue, ki se je s takratnim svetovnim prvakom v šahu Kasparovom pomeril v partiji in – izgubil. A naslednje leto je ob vnovični tekmi DeepBlue Kasparova za las premagal.
Kako do baze znanja? V 70-ih letih je Douglas Lenat predlagal, da vse znanje človeštva »ročno« formaliziramo v računalniku razumljiv logični zapis po modelu če-potem. To pomeni, da sami, na roke, zapišemo vse naše znanje v računalnik. Temu je že v principu oporekal Edward Feigenbaum, trdeč, da je taka formalizacija znanja neuresničljiva. Določene stvari je nemogoče pretvoriti v taka pravila, zatakne se že pri vsakdanjih rečeh kot je vožnja s kolesom. Namesto tega je predlagal, da je edini, ki je tako bazo sposoben zgraditi, računalnik sam – s čimer se je rodila ideja strojnega učenja.
To idejo so seveda kasnejši raziskovalci takoj pograbili in spoznali njen potencial. Strojno učenje je danes ključen del pri razvoju in delovanju umetne inteligence. Srečamo jo tako rekoč povsod. Spletni oglasi so primer strojnega učenja, uporablja se v medicinski diagnostiki in v neštetih aplikacijah za prepoznavanje slik.
Osnovna ideja je preprosta. Na osnovi opazovanja poznanih slik, na katerih so posamezni elementi označeni se program nauči prepoznavati elemente na neki novi nepoznani sliki. Enako velja v primeru šahovske partije ali pa ugotavljanju, kateri izdelek želi verjetno kupiti kupec na osnovi že kupljenih.
Ideja je, da program lahko sprejme odločitev na osnovi opazovanja podatkov. Kako to stori? Preko napovednih modelov, ki jih sestavi na osnovi podatkov. Ta sistem se je izkazal za zelo učinkovitega in je leta 2017 dosegel tudi nesluteni uspeh, ko je program AlphaGo premagal Ke Jie-ja, profesionalnega igralca goja stopnje 9 dan, s čimer je umetna inteligenca strla enega najtrših orehov, ki so se ji zoperstavljali. Go je namreč zelo zapletena igra, ki zahteva visoko stopnjo kreativnosti. Bolj je zapletena od igre šaha in do leta 2017 je veljalo, da računalniški sistemi enostavno ne zmorejo imeti kreativnosti, potrebne za premagovanje prvakov te igre.
Leta 2010 pa na prizorišče stopi novi igralec – generativno strojno učenje in leta 2022 ChatGPT. Ta vrsta umetne inteligence je naslednji korak v razvoju. Če smo prej program učili, kako prepoznati, na primer mačko na sliki, ga zdaj poskušamo naučiti, kako mačko narisati. Iz tod beseda generirati; pomeni ustvarjati. Ta razvoj je omogočil predvsem tehnični razvoj računalnikov. Danes taki generativni modeli lahko tvorijo praktično karkoli, od videov, do besedila, slik in glasbe.
Poglejmo na primeru besedila. Ko pišemo stavke vanje dodajamo besede. Ko se stavek formira imajo besede, ki postopoma gradijo stavek, glede na tematiko in gramatično strukturo jezika določeno verjetnost, da se bodo v stavku pojavile. Ustvarimo sedaj ogromno bazo stavkov iz različnih jezikov in jo statistično analizirajmo. Iz te analize lahko ustvarimo napovedni model, ki predvideva, katera beseda najverjetneje sledi tej, ki smo jo nazadnje napisali, da bi uspešno dopolnili našo poved. Programi za generativno strojno učenje, kot je ChatGPT, niso nič drugega kot to. So zelo učinkovit statistični modeli z ogromno bazo besedil na osnovi katerih se uči ti modeli učijo in nato »ustvarjajo« besedila.
Ideja za tovrstno tvorbo novih besedil s pomočjo umetne inteligence ni iz leta 2010, ampak sega vse do leta 1948, ko je o tem razmišljal še eden pionirjev računalništva Claude Shannon. Izdelal je algoritmični model, ki je leta 1948 generiral prvi strojno generirani stavek, ki sicer ni bil pretirano smiseln, pomnilnik je imel nenazadnje zgolj nekaj kilobajtov spomina, je pa dokazal, da je to mogoče, če imamo dovolj dober statistični model.
Prvič je bilo generativno strojno učenje sicer pognano v svete leta 2016, ko je podjetje Microsoft razvilo spletno klepetalno agentko z imenom Tay, ki so ji ustvarili Twitterjev račun, na katerem je generirala objave. Aktivna je bila 16 ur in v tem času napisala 96.000 tvitov. V manj kot 24 urah je postala tako žaljiva in rasistična, da jo je bil Microsoft prisiljen ukiniti. Za podjetje je bil to ogromen medijski škandal in po umiku je začelo z dolgo serijo opravičil vsem prizadetim. Kako pa je sploh prišlo do tega, da je umetna inteligenca tako hitro in tako močno iztirila? Kot definicijo uspešnega tvita ji je Microsoft postavil število všečkov – več kot jih tvit dobi, boljši je, to pa pomeni, da naj generira več njemu podobnih oz. da je dobro izbrala kombinacije besed. Na nek način se je umetna inteligenca izkazala v tem primeru za zrcalo nas samih, ki pa žal ne kaže najlepše slike človeštva.
Takrat se je generativno strojno učenje umaknilo v senco. Vse do leta 2022. 6 let so se učili, kako izdelati program, ki ne bo pisal rasističnih stavkov. In, ko je OpenAI razvil ChatGPT in ga sprostil v uporabo, je ta požel neverjeten uspeh. Gre za ogromno nevronsko mrežo z več milijardami povezav, ki se je učila na besedilih, ki obsegajo več milijard besed.
Pogosto slišimo, da umetna inteligenca kot je ChatGPT predstavlja neko eksistencialno grožnjo za človeštvo. To ni res in je zgolj mit. Zakaj? ChatGPT in podobni modeli spadajo v t. i. šibko umetno inteligenco. Ta tip umetne inteligence lahko rešuje zgolj zelo specifične in usmerjene naloge, kot je na primer, »napovej naslednjo besedo«. Pri tem tudi ni avtonomna, saj zgolj izvršuje ukaze uporabnika, ne more se sama odločiti, kakšno besedilo želi napisati brez navodil. Samostojnega razmišljanja bi bila zmožna močna umetna inteligenca in pa super umetna inteligenca, vendar pa ti obliki umetne inteligence trenutno ne obstajata.
Resnična problematika umetne inteligence, ki pa bi morala biti del družbenega diskurza, pa je vpletanja v demokratični proces. Spomnite se na primer na kampanjo Brexit, ko je podjetje podatke z družbenih omrežij uporabilo za ciljno kampanjo. Pri tej so vsako sporočilo morali napisati ljudje, kar jo malo omeji. Če bi za to nalogo uporabili umetno inteligenco, bi ta to lahko počela še mnogo, mnogo učinkoviteje. Drugi problem je širjenje predsodkov in diskriminacije. Za primer usodnosti takega sistema je poskus uporabe umetne inteligence pri odločitvah v sodnem procesu v ameriškem sodnem sistemu. Umetna inteligenca se je takrat učila na celotni pretekli sodni praksi ameriških sodišč, vendar pa so bile mnoge odločitve v preteklosti zaznamovane z rasističnimi predsodki sodnikov. Te pristranskosti se je seveda naučila tudi umetna inteligenca in generirala pristranske razsodbe. Tretji problem pa je nepreglednost delovanja umetne inteligence danes. Delovanja ogromnih jezikovnih modelov ne znamo dobro pojasniti niti razumeti, zato jih tudi težje nadzorujemo. Koncept delovanja že poznamo, ne vemo pa točno, kaj se zgodi, ko se generira neko novo besedilo. Poleg tega umetna inteligenca nima nobenega odnosa do resničnosti besedil, ki jih generira, saj jih nenazadnje niti ne razume. Zato pa je nagnjena tudi k tvorbi laži. Njen glavni kriterij je, da je besedilo všečno, ne resnično.
Velik problem je tudi zloraba avtorstva in intelektualne lastnine – eno podjetje je uporabilo kreacije in delo brezštevilnih avtorjev, da je lahko učilo svoj model, nihče od njih pa za to ni prejel plačila.
To so problemi, ki jih kot družba moramo jasneje nasloviti in rešiti, če želimo umetno inteligenco in to kar nam omogoča, uporabljati odgovorno.
Avtor članka: Gaj Kušar