Igor Farkaš - Aká je umelá inteligencia?

Rýchly vývoj umelej inteligencie z ktorého sa mnohí tešia, ale mnohí majú aj obavy, predstavuje pre ľudstvo veľkú výzvu. Dokážeme ju zvládnuť bez negatívnych následkov na ľudí a svet, aký ho poznáme? Existuje nejaký vynález, ktorý by ľudstvo doteraz nezneužilo? Generálny tajomník OSN António Guterres sa k tejto téme vyjadril slovami: “umelá inteligencia predstavuje pre ľudstvo existenčnú hrozbu, ktorá sa vyrovná riziku jadrovej vojny. Tieto varovania musíme brať vážne”. Stephen Hawking sa na technologickej konferencii Web Summit v portugalskom Lisabone v r. 2017 vyjadril: “UI … by mohla byť najhoršou udalosťou v dejinách civilizácie.“ Pre mnohých ľudí je však v súvislosti s umelou inteligenciou zaujímavejšia iná téma alebo otázka: kam až môže jej vývoj dospieť pri jej najväčšom “zdokonalení”? O rozhovor sme požiadali odborníka v tejto oblasti – zástupcu vedúceho Katedry aplikovanej informatiky na Fakulte matematiky, fyziky a informatiky UK v Bratislave Igora Farkaša. Zaujíma sa o výskumné oblasti kognitívnej vedy a umelej inteligencie. Špecializuje sa na skúmanie modelov umelých neurónových sietí a ich využitie najmä v oblasti kognitívnej robotiky. Hneď na úvod nášho rozhovoru hovorí: Nech už bude umelá inteligencia (UI) budúcnosti akokoľvek obdivuhodná, stále by sme ju mali označovať ako umelá, pretože bude artefaktom, výtvorom človeka. Myslím si, že limity UI sa nedajú presne odhadnúť, ale som presvedčený, že je otázkou zopár desiatok rokov, kedy UI dosiahne úroveň všeobecných schopnosti človeka a v niektorých aspektoch ho prekoná. Samozrejme, ak sa dovtedy nedostane do nepovolaných rúk (napr. v podobe zbraní), čo by mohlo spôsobiť celosvetovú skazu.

O umelej inteligencii sa hovorí ako o napodobenine ľudskej inteligencie a ľudských schopností pomocou strojov. Akoby ale mohol stroj („kábliky a pliešky“) vôbec nadobudnúť ľudské kvality: schopnosť emócií, citov, vedomia, uvedomenie si seba, atď.? Sú teda obavy o jej „evolučný“ vývoj do ľudskej formy opodstatnené?

Jedna z definícií UI sa týka behaviorálneho pohľadu, čo znamená, že ak sa systém s UI správa ako človek, považujeme ho za inteligentný. Samozrejme, závisí to od toho, čo sa porovnáva. Turingov test je klasickým jednoduchým príkladom, keď sa porovnáva len jazykové správanie človeka a UI na základe písaného textu v prirodzenom jazyku. V tom prípade ide o UI v podobe nejakého programu v počítači. Porovnávanie môže byť zložitejšie, týkajúce sa stelesnenej inteligencie napr. pri humanoidných robotoch, ktoré aj vidia, počujú, vnímajú dotyky, vedia konať v prostredí. UI môže v budúcnosti disponovať umelými emóciami (prejavovať ich navonok), umelým vedomím a podobne, aj keď roboty nebudú pozostávať z biologického materiálu ako človek. Či však bude robot vnútri zažívať emócie alebo si uvedomovať seba samého, to s istotou nebudeme vedieť dokázať, pretože tie fenomény sú privátne. Indikácie budú môcť byť len nepriame. Obavy o vývoj UI sú do istej miery opodstatnené, lebo technologický vývoj sa exponenciálne zrýchľuje. Niektorí experti tento proces považujú za prirodzené pokračovanie kultúrnej evolúcie.

Množstvo ľudí (možno väčšina), by v súvislosti s uvedomovaním seba samého a prežívaním vnútorných emócií UI povedala, že človek je tým čím je a všetko to čo môže, je predsa vďaka tomu, že má nefyzickú dušu. Napr. rímsky štátnik a filozof Cicero hovorí: „Z duše vychádza všetka činnosť a obrazom duše je tvár, prezradzovateľom sú oči“. Aký je Vás názor na túto tému?

Na opis vnútorného sveta človeka poznáme pojmy myseľ a duša, pričom ten prvý sa týka skôr procesov poznávania, kognície a ten druhý má skôr vyšší, duchovný rozmer a vznikol zrejme v súvislosti s náboženstvami. Ja osobne považujem pojem duša za nevedecký, pretože pojmom myseľ vieme pokryť celé spektrum mentálnych stavov človeka, vrátane tých duchovných. Neviem o žiadnych vedeckých výskumoch, ktoré by preukázali existenciu ľudskej duše. Je otvorenou otázkou, či môže nebiologický systém disponovať mentálnymi stavmi, no myslím si, že existuje konsenzus, že ak k tomu dáme prívlastok umelý, tak môže. Vieme totiž celkom dosť o tom, ako pracuje myseľ človeka, čo skúma kognitívna veda, tak sa snažíme niečo podobné realizovať v umelých systémoch. Avšak, ako som už spomenul, indikácie, že to dosiahneme, budú len nepriame.

A ako je to v prípade iných ľudských schopností: myslieť – v zmysle tvoriť nové myšlienky, mať predstavy, rozširovať poznanie, kreatívne tvoriť. Bola by UI teoreticky niečoho takého schopná?

Súčasná, tzv. generatívna UI založená na hlbokom (strojovom) učení v umelých neurónových sieťach, umožňuje isté formy kreativity, teda vytváranie nových foriem či obrazov, napr. v jazyku, hudbe, či vizuálnom umení. Toto je celkom značný posun v UI založený na učení matematických výpočtových modelov na dátach v danej doméne. Napríklad, známy četbot ChatGPT vie generovať nový text, ktorý v drvivej väčšine prípadov dáva zmysel. Obrazový generátor DALL-E vygeneruje realistické alebo surealistické obrazy podľa nejakého jazykového opisu. Generatívna hudobná UI vytvorí čokoľvek, napríklad zosnulý spevák zaspieva skladbu, ktorá vznikla až po jeho úmrtí. Skrátka, keď máme generátor (matematický model), môžeme kontrolovaným spôsobom vytvárať nové obrazy či formy. Kriticky však treba povedať, že stále ide o nejakú formu novej rekombinácie existujúcich elementov. Človek však dokáže viac, prísť aj so skutočne inovatívnym konceptom, ktorý si vyžaduje uvažovanie „mimo vlastných mantinelov“ (out of the box). To ostáva výzvou pre UI.

UI však môže mať v sebe uložených omnoho viac informácii, s ktorými bude vedieť narábať, kombinovať ich, ako človek. Mohla by byť pri svojom najväčšom zdokonalení autonómna od riadenia človekom, mohla by si napr. uplatniť moc tak, že sa sama vypne a všetko prestane fungovať? Resp. v čom spočíva obava z nekontrolovateľného vývoja UI?

Výhodou UI je naozaj to, že nebude mať tie kapacitné, pozornostné, pamäťové či rýchlostné obmedzenia, ktoré má človek. Môže mať v princípe prístup na celý internet, kde je skutočne veľa informácií, vrátane dezinformácií (čo sa, mimochodom, bude stále zhoršovať, práve kvôli generatívnej UI). Kvantita však ešte neznamená nárast kvality, aj keď v prípade hlbokého učenia už bolo ukázané, že nejaká neurónová sieť sa dokázala naučiť nejakú ťažšiu úlohu, až keď mala k dispozícii nadkritické množstvo trénovacích dát. To sme však o niekoľko úrovní nižšie, než by bol nejaký skok k autonómnosti alebo sebavypnutiu systému UI. Existujú však úvahy o tom, čo bude treba k tomu, aby napríklad systém UI prišiel autonómne na niečo skutočne nové, napríklad že by UI spontánne prevzala kontrolu nad niečím a ohrozila by tak ľudí. Toto je zatiaľ otázka budúcnosti, no z pohľadu strojového učenia to nepovažujem za neprekonateľný problém. Samozrejme, musíme myslieť o krok vpred, aby sme tomu mohli zabrániť.

Spoločnosť OpenAI predstavila nový jazykový model svojej umelej inteligencie, ktorý nesie názov GPT-4, mnohými považovaný za revolúciu. V skratke, čo to je GPT-4?

GPT je skratka pre generatívny predtrénovaný transformér, čo si zrejme vyžaduje bližšie vysvetlenie. Transformér je najnovší typ architektúry veľkých jazykových modelov (VJM) na báze veľkej neurónovej siete, ktorá využíva psychologicky inšpirovaný koncept pozornosti, vďaka ktorému sa VJM naučí priraďovať rôznu mieru dôležitosti jednotlivých slovám pri predikcii očakávaného výstupu. V literatúre sa predtým používali aj iné úspešné modely na spracovanie prirodzeného jazyka, konkrétne rekurentné neurónové siete, avšak transforméry sa ukázali ako úspešnejší nástroj, ktorý si vie lepšie zapamätať širší kontext a dosahovať tak vyššiu presnosť predikcie.
Predtrénovanie znamená, že daný VJM sa učil z obrovského množstva textových dát (knihy, noviny, články na internete), pričom sa vo všeobecnosti dá povedať, že čím viac digitálnych dát je použitých na trénovanie, tým presnejší je model. Angličtina je na tom najlepšie z hľadiska početnosti textov. Aj na Slovensku už máme VJM pre slovenčinu (Slovak BERT), natrénovaný spoločnosťou Gerulata Technologies, a vedecky otestovaný v KInITe (Kempelenov inštitút inteligentných technológií). Po natrénovaní sa takýto VJM môže dotrénovať na konkrétne jazykové úlohy, ako napríklad na detekciu sentimentu v texte, alebo rozpoznávanie pomenovaných entít (vlastných mien). Četovanie je tiež jednou z aplikácií, evidentne najzaujímavejšou, napríklad v podobe dobre známeho ChatGPT.
Generatívnosť, ktorú sme už spomínali vyššie, je veľmi silná vlastnosť modelu, vďaka čomu dokáže generovať aj celé kusy textu. ChatGPT k tomu potrebuje nejaký podnet (nazývaný prompt) od užívateľa, čo môže byť jedna otázka, alebo aj dlhší text, ktorý chce užívateľ dať povedzme parafrázovať.
ChatGPT oslovil svetovú komunitu viac ako akákoľvek iná technológia v minulosti. Svet však nie je na takýto rýchly nárast pripravený. Medzinárodný inštitút Future of Life prišiel na jar tohto roka s otvoreným listom, v ktorom apeluje na medzinárodné spoločnosti a laboratóriá pracujúce v oblasti UI, aby minimálne na 6 mesiacov pozastavili trénovanie modelov lepších ako GPT-4. List už podpísalo viac ako 33 tisíc ľudí.

Čo je v súčasnosti maximum, čo dokáže UI? Aké sú súčasné vývojové trendy využitia UI v rôznych oblastiach národného hospodárstva? Mohli by ste uviesť aj konkrétne príklady?

UI sa dokáže vyrovnať človeku, resp. ho prekonať, len v zopár konkrétnych úlohách. Zatiaľ existujú príklady najmä v klasifikácii statických obrázkov a hraní stolových hier (známy príklad – UI porazila v roku 2016 svetového veľmajstra v obľúbenej ázijskej hre Go). Príkladov však bude pribúdať, lebo je to atraktívna oblasť vedeckého skúmania. UI sa nasadzuje vo vyspelých krajinách v rôznych odvetviach národného hospodárstva. Je všeobecne nasadená v rôznych bežne dostupných technológiách, napr. v mobilných telefónoch (detekcia tvárí kamerou), na sociálnych sieťach (vytváranie modelu užívateľa), v priemyselnej robotike, v samojazdiacich autách (najmä v USA) a v ďalších oblastiach. Na Slovensku bola okolo roku 2019 urobená analýza, výsledkom ktorej bolo identifikovaných osem oblastí orientovaných hlavne na priemysel, ako napríklad optimalizácia výroby, riadenie kvality alebo prediktívna údržba. Analýza obsahuje aj námety na využitie UI v strategických hospodárskych oblastiach, ako sú kybernetická bezpečnosť, zdravotníctvo, poľnohospodárstvo, verejná správa a životné prostredie.

Spoločnosť Neuralink, ktorú založil Elon Musk, získala od FDA (vládna agentúra v USA) povolenie vykonávať klinické skúšky neuroimplantátov u ľudí. Do istej miery naráža na túto problematiku americký film Upgrade z r. 2018, v ktorom sa ľudské telo správalo autonómne od vôle svojho majiteľa, pretože implantát v jeho mozgu dostával signály od niekoho iného. Aký máte názor na prepojenie umelej inteligencie priamo s ľudským mozgom?

Spoločnosť Neuralink predstavila revolučnú bezdrôtovú technológiu v oblasti rozhraní mozgu a stroja (BMI), s cieľom pomôcť ľuďom s rôznymi formami paralýzy postihujúcej motorické správanie. Výskum v oblasti BMI začal prinášať ovocie zhruba pred 20-imi rokmi na zvieratách, neskôr aj ľuďoch, avšak s využitím drôtovej technológie, napríklad na ovládanie kurzora na monitore počítača pomocou myšlienok. Nový čip od Neuralink, implementovaný do mozgu, je poháňaný batériou a komunikuje s počítačom, takže dokáže ovládať perifériu človeka pomocou prijímania a správnej interpretácie signálov mozgu (rádovo až 2000). Myslím si, že takéto rozhrania BMI sú z etickej stránky v poriadku, ak ich cieľom je pomôcť pacientom s rôznymi poškodeniami mozgu. Samozrejme, každá technológia sa dá v princípe zneužiť. Tento smer je však len v začiatkoch, a nedá sa predpovedať ako to pôjde ďalej.

Ako sa dá ovládať kurzor na monitore počítača pomocou myšlienok?

Kurzor sa dá ovládať napríklad pomocou motorických predstáv, ktoré dokážeme v mozgu rozpoznať. Kľúčovým faktom je to, že pri predstavovaní si motorického pohybu, napríklad že hýbem svojou rukou doľava, sa mozog správa veľmi podobne ako keby som tou rukou naozaj hýbal, a vtedy sa aktivizujú neuróny v motorickej kôre, ktoré posielajú signály do svalov. Ak dokážeme meraním rozlišovať rôzne predstavované pohyby, môžeme generovať odpovedajúce príkazy napríklad pre ten kurzor na obrazovke. Predstava pohybu je v podstate len jeden typ myšlienky, ktorú takto dokážeme pomocou merania elektrickej aktivity mozgu prečítať.

Tak, ako aj v minulosti existovali rôzne videnia, proroctvá (zaujímavý je napr. zachovaný spis z ranného stredoveku, podľa ktorého mních videl v budúcnosti ľudí, „ako sa stále pozerajú do skrinky s pohyblivými obrázkami“, tak aj súčasnosti je zaujímavé „proroctvo“ podľa ktorého budú v budúcnosti ľudia žiť v supermestách riadených UI, ktorá dokonca bude súdiť a vydávať rozsudky. Aký máte dojem z vývoja UI, ako sa pozeráte na našu budúcnosť?

Z historického pohľadu sa od vynálezu digitálneho počítača v polovici minulého storočia udialo strašne veľa vecí. Tempo rozvoja technológií sa urýchľuje, hardvér sa zrýchľuje, UI tiež od svojho vzniku v rovnakom čase urobila viacero krokov vpred, aj keď vývoj nebol monotónny. Veľký skok v UI vpred za ostatnú dekádu urobilo strojové učenie, konkrétne hlboké učenie v neurónových sieťach. Očakávam, že hyperbola okolo hlbokého učenia trochu upadne, lebo vieme aj o nedostatkoch týchto metód. Ale na obzore sa už črtajú rozšírenia metód učenia, ktoré s veľkou pravdepodobnosťou posunú UI ešte ďalej.
V budúcnosti bude UI v modernom svete všade naokolo, viditeľná aj neviditeľná, nebude možné sa jej vyhnúť. Osobne rozvoj UI vnímam ako prirodzený trend, dúfajúc, že stále bude dominovať celosvetový cieľ, že chceme UI na zlepšenie kvality života ľudí. Zneužitie sa žiaľ nedá vopred vylúčiť, vidíme, ako je svet polarizovaný, o správne využívanie UI budeme musieť bojovať, rovnako ako o demokraciu.
Príkladom zneužitia UI už v súčasnosti je podľa mňa kontroverzný čínsky sociálny kreditný systém, ktorý prideľuje občanom pozitívne a negatívne body podľa ich každodenného správania. Človek má síce evolučne vyvinutý cit pre spravodlivosť, a akceptuje povedzme to, že poisťovanie áut využíva koncept bonusov a malusov, čo sa premieta do nižšej alebo vyššej ceny za havarijné poistenie. Alebo platobná spoľahlivosť klienta ovplyvňuje výšku úroku hypotekárneho úveru. V týchto prípadoch to človek obyčajne akceptuje alebo zo zmluvy vycúva a osloví inú spoločnosť. Činsky „celoplošný“ model však umožňuje do hodnotenia svojich občanov zahrnúť de facto čokoľvek, čím naráža na etické princípy a obmedzovanie osobnej slobody občanov. Monitorovaním ľudí dáva taktiež štátu možnosť trestať (aj verejne) akékoľvek formy prejavu nesúhlasu či kritiky, skrátka vedie k diktatúre. Tento koncept pekne zachytil aj Orwellov román 1984. Čínski občania si na to zrejme zvykajú a vidia v ňom pozitíva, lebo systém vnímajú ako spravodlivý. Svet liberálnej demokracie to však vidí inak.