Dar vieno analitiko svetainė

Petras Kudaras

Ar šiuolaikinis dirbtinis intelektas jau padarė proveržį?

1726 metais Džonatanas Swiftas išleido savo populiariausią knygą „Guliverio kelionės“, kurioje buvo aprašoma ir kelionė į skraidančią salą Laputą. Salos gyventojai – labai protingi, bet nelabai tikrame gyvenime besigaudantys mokslininkai, kurie vis prigalvoja visokiausių keistenybių, turinčių visiems palengvinti gyvenimą. Vienas toks išradimas yra milžiniška mašina su daugybe ratų ant kurių pritvirtintos lentelės su įvairiausiais žodžiais, paimtais iš išradėjo jaunystės užrašų: patempus virvelę tie ratai sukasi ir žodžiai susidėlioja daug maž atsitiktine tvarka į sakinius. Dažniausiai ne itin prasmingus, bet kartais juose yra reikšmingų frazių, kurias kaip mat į knygas surašo penkios dešimtys prie mašinos dirbančių studentų. Mašinos išradėjas tiki, kad žmonijai nuo šiol galvoti nebereikės, nes visas pasaulio knygas rašys ši jo mašina. Mašina nuo šiol atras visus pasaulio dėsnius ir tik beliks juos užrašyti į knygas. Tiesa, tam reiktų papildomo finansavimo, nes darbas su viena mašina lėtokas…

Neseniai pasirodęs GPT-3 (generative pre-trained transformer) dirbtinio intelekto modelis iš OpenAI veikia panašiu principu: apmokius modelį milžinišku kiekiu teksto jis randa sąsajas tarp visokiausių terminų ir, uždavus kokį klausimą, gali sugeneruoti visai protingą atsakymą. Paprašius, atsakymą jis gali pateikti ir eilėraščio, ar mokslinio straipsnio stiliumi, gali imituoti žiniasklaidos antraštes, programavimo kalbos kodą, formalaus dokumento tekstą ar tiesiog kaip anekdotą. Norint išbandyti GPT modelį, programavimo žinių nereikia – OpenAI padarė galimybę tiesiog pasikalbėti su šiuo dirbtinio intelekto modeliu. Rezultatai tikrai pranokstantys lūkesčius, generuojamas tekstas kokybiškas. Lyg kalbėtumeisi su lingvistikos profesoriumi, mokančiu kalbėti begale kalbų ir stilių, o kartu ir tobulai žinančiu visus faktus, kuriuos galima rasti Wikipedijoje. Vienintelis minusas: to profesoriaus logika yra kaip maždaug ketverių metų vaiko ir sudėtingų uždavinių jis išspręsti (kol kas?) nesugebės. Jei paklausi, koks Jono mamos trečio sūnaus vardas, jeigu jis turi brolius Petrą ir Paulių, GPT-3 tokio klausimo neatsakys. Bet, kita vertus, beveik tobulai sugeneruos tau skundą oficialioms institucijoms sklandžia biurokratine kalba, jeigu nori jiems pasiskųsti apie nebarstomas gatves. Sutaupo laiko paprastoms užduotims.

Daug kam toks geras teksto generavimas gali pasirodyti kone stebuklingas, tad ir noriu surašyti čia savo mintis ką apie tai šiuo metu manau. Tikėtina, kad mano spėjimai gali ir stipriai prašauti, bet norisi turėti juos užfiksuotus raštu, mat žmogaus atmintis mėgsta jam pačiam pataikauti: prisimeni tik tuos dalykus, kuriuos tiksliai atspėjai ir netyčia pamiršti savo spėjimų klaidas. Visada pamenu, kad 2015-2016 metais buvau įsitikinęs, jog Teslos ambicija 2020-aisiais turėti self-driving mašiną yra visiškai nereali. Esu linkęs pamiršti, jog 2008-aisiais tikėjau, kad Ukraina (lygiai kaip ir Rusija!), nenumaldomais septynmyliais žingsniais juda link vakarų ir ten po kelių metų nebeliks korupcijos.

Dažnai su naujomis, daug žadančiomis technologijomis, atsitinka taip, kad trumpuoju laikotarpiu jos nepateisina į jas sudėtų (per daug didelių) lūkesčių. Pradinei euforijai praėjus, pastebima, kad visgi technologija turi kažkokių ribojimų, ne visada veikia idealiai. Paaiškėja, kad bet kuris vaistas nuo visų ligų turi tam tikrus šalutinius poveikius, ar negydo tam tikrų simptomų – tada minia greitai persimeta ant naujos panacėjos. GPT modelio problema – logikos trūkumas. Generuojamas tekstas gražus, iš pažiūros protingas ir netgi logiškas, bet atidžiau pažiūrėjus, ta logika pasirodo esanti kreivoka ir pradeda nebekelti pasitikėjimo. GPT generuojamas tekstas man labai panašus į sapnus: kol sapnuoji, viskas atrodo aišku ir tvarkinga, bet pabudęs loginio ryšio ne visada atseki. Pasirodo, jog plaukiojai ant nendrinio plausto baseine, o jis tapo krokodilu ir kaip tik tau pabundant bandė tave sugriebti už kojos. Kol sapnavai, plaustas iš nendrių ir krokodilas uždarame baseine atrodė logiškiausias dalykas pasaulyje, bet geriau pagalvojus belieka stebėtis, kodėl sapno logika taip skiriasi nuo realios. Taip ir su GPT generuojamu tekstu: skamba gerai, bet kas kartą turi tikrinti, ar jo logika ne iš sapnų pasaulio. Pasitikėti tokiu tekstu (kol kas) taip pat sunku, kaip patikėti svarbų darbą keturmečiui: gal rezultatas ir bus pasiektas, bet jis nebūtinai bus toks, kokio tikėjaisi.

Sunkiausia, kad kuo sudėtingesnis uždavinys, tuo atidžiau reikia tikrinti rezultatą. GPT gali generuoti programavimo kodą ir stebėtinai gerai išspręsti paprastas programavimo užduotis. Užtenka pažiūrėti į šios bibliotekos demonstracinį filmuką. Manau, kad didžiausia problema tame, kad davus sudėtingą užduotį ir gavus klaidingą rezultatą (t.y. jeigu modelis sugeneruoja klaidingą kodą), reikia be galo daug žinių atsekti, kur modelis suklydo ir sugeneruotą kodą pataisyti. Kitaip sakant, dirbtinis intelektas lengvus dalykus išsprendžia lengvai, o sudėtingų dalykų išspręsti nemoka (makes easy things easy and hard things impossible, tuo tarpu žmonėms gana lengvus uždavinius spręsti sunku, bet jie bent jau sugeba su daug pastangų išspręsti sudėtingus, humans make easy things hard, but hard things possible). Dar blogiau: jis ne visada (niekada?) nesugeba atskirti, kurios problemos yra lengvos, o kurios sudėtingos. Neaišku kur yra riba, kur modeliu dar vis galima pasitikėti, o kur jau reikia kuo ankstyvesnio žmogaus įsikišimo.

Tiesa, juk čia dar pati technologijos aušra, viskas tobulės. Juk ir naujas darbuotojas negalės iš karto tobulai atlikti užduoties. Skirtumas tas, kad žmogus kol kas gali turėti pajautimą, kad kažkas čia ne taip, gali, gavęs instrukciją „na, dar pagalvok, kažkaip tau gavosi nelogiškas atsakymas“, iš tiesų išmokti savo klaidas ir jas ištaisyti. Kol kas to GPT negali, o jei galėtų – būtume radę bendrinio dirbtinio intelekto (general artificial intelligence) Gralio taurę.

Kita vertus, ilguoju laikotarpiu tokios technologijos turi žymiai didesnį efektą nei buvo tikimasi, tik tas efektas pasireiškia visai kitokiais, netikėtais būdais. Tarkim interneto pradžioje buvo tikimasi, kad žmonės taps labai protingi, nes galės lengvai bet kada prieiti prie visų pasaulio bibliotekų resursų: realybėje visi laiką leidžia socialiniuose tinkluose ir internetą vartoja daugiausiai visai ne tekstinės informacijos vartojimui. Kur mus nuves dirbtinai generuojamo teksto perteklius? Tikėtina, kad tekstą skaitys dar mažiau žmonių. Kažkas, rašydamas elektroninį kvietimą į renginį užduos dirbtiniam intelektui užduotį sukurti tris išsamius Šekspyro plunksnos vertus paragrafus apie renginio išskirtinumą, kažkas, gavęs šį laišką, dirbtiniam intelektui duos užduotį tai išversti į tris žodžius „Petras kviečia alaus“, kad tik nereiktų tų trijų paragrafų skaityti. Jau dabar didžioji teksto dalis internete yra generuojama visai ne žmonėms, daugiausiai tekstų yra rašomi Google botams, kad jie aukščiai paieškose įvertintų vieną ar kitą puslapį.

Taigi, mano trumpos prognozės:

Žymės: