Mākslīgais intelekts bez vēdera sajūtas

Arnis Rītups: Es gribētu, Andrej, iesākt ar dažiem terminoloģiskiem jautājumiem. Mani mulsina apzīmējums “mākslīgais intelekts”, jo dzīvoju naivā pārliecībā, ka visi intelekti ir mākslīgi – ka dabisku intelektu nav. Nav vispār. Cilvēkiem un mašīnām nav dabiska intelekta, tas vienmēr ir mākslīgu procedūru rezultātā izveidots, kultivēts. Vai tu varētu paskaidrot, kā tu tādā – nevis teorētiskā, bet operatīvā – nozīmē saproti jēdzienu “mākslīgais intelekts”?

Andrejs Vasiļjevs: “Mākslīgais intelekts” ir termins, kuram ir ļoti izplūdusi nozīme, formāli tas nav labi definēts. Īstenībā datorikas pamatlicēji ieviesa šo terminu jau 50. gadu sākumā. Bija tāds slavens Dārtmutas seminārs, kur sanāca gudri vīri, lai spriestu, ko datori nākotnē varētu darīt. Toreiz tie datori bija ļoti primitīvi: milzīgi lielas iekārtas skaitļoja lādiņu trajektorijas un tamlīdzīgas lietas. Bet jau toreiz tika pieņemts, kā, attīstoties datortehnoloģijām, tās varētu sākt darīt to, ko mēs tradicionāli uzskatām par tikai cilvēkam piemītošām unikālām spējām. Un viena no tādām ir valoda, valodspēja – spēja radīt tekstu, sazināties caur valodu, ar valodas palīdzību, tulkot un saprast, kas ir sacīts. Arī atpazīt attēlus, vēl citas lietas. To tad viņi arī nolēma saukt par mākslīgo intelektu.

Rītups: Dažus gadus pirms tam Alans Tjūrings ieviesa testu: kad datora atbildes uz cilvēka uzdotiem jautājumiem nebūs atšķiramas no cilvēku atbildēm, tas nozīmēs, ka dators spēj domāt. Daži uzskata, ka tas ir jau pierādīts, jo pietiekami daudzus spēj piemuļķot mākslīgā intelekta sniegtās atbildes. Saki, vai tev šķiet, ka Tjūringa tests ir jau pagātne? Vai datoram izdevies sniegt tādas atbildes, kas liecinātu, ka dators spēj domāt?

Vasiļjevs (iesmejas): Kad es auditorijai stāstu par mākslīgo intelektu, man ļoti noder Rīgas Laika raksts, kurā tieši bija aprakstīts Tjūringa tests¹. Alans Tjūrings, viens no teorētiskās datorzinātnes pamatlicējiem, sev jautāja: kā atšķirt, ir vai nav sasniegts mākslīgais intelekts? Viņam likās, ka tas ir tālas nākotnes jautājums. Bet nepagāja ne 10 gadi, kad tāds Jozefs Veicenbaums, datorzinātnieks ar interesi par psiholoģiju, radīja pirmo sistēmu, kas gandrīz apgāza Tjūringa testu, izmantojot vienkāršus psiholoģiskus trikus, pārformulējot to, ko cilvēks saka. Piemēram, es tagad improvizēju: “Kāpēc šodien ir tik slikts laiks?” Un atbilde: “Kā tev liekas, kāpēc šodien ir tik slikts laiks? Kāpēc tu uzdod šādu jautājumu?” Un tā tālāk.

Rītups: Vecā, labā ebreju anekdote: “Kāpēc jūs uz jautājumu vienmēr atbildat ar jautājumu?” – “Un kāpēc jūs tas interesē?”

Vasiļjevs: Izrādās, ka cilvēki komunikācijā izmanto diezgan šabloniskas pieejas, kas neprasa dziļu intelektuālu gudrību. Tās ir viegli imitēt ar datoru. Veicenbauma sekretāre, kura arī bija viena no pirmajām, kas lietoja viņa sistēmu ELIZA (viņš tai piešķīra cilvēka vārdu, cilvēkiem patīk datorsistēmām piešķirt cilvēciskas īpašības), teica Veicenbaumam: “Izejiet, lūdzu, ārā! Es tagad gribu privāti parunāt ar ELIZA.”

Rītups: Taču kopš tā laika ir pagājuši gandrīz 70 gadi. Vai tagad Tjūringa tests ir jau pagātne? Un par ko mēs varam būt droši no intelekta, no mākslīgā intelekta saprašanas spēju robežām?

Vasiļjevs: Nu, te varētu atbildēt divos veidos. Formāli notiek šīs sacensības – Tjūringa testa sacensības, kur sacenšas divas komandas: cilvēki pret mašīnu. Tiek veidotas datorsistēmas, kas izturētu šo Tjūringa testu. Tajās iebūvē īpašus trikus, piemēram, tās speciāli dod kļūdainas atbildes, lai cilvēks domātu tā: atbilde ir kļūdaina, tātad tas ir cilvēks, kas man atbildēja. Un tur ir sistēmas, kas sevi parāda ļoti labi…

Rītups: Spēj imitēt cilvēku uzvedību.

Vasiļjevs: Jā. Bet tad ir… Nu, šiem konkursiem taisa īpašas sistēmas. Bet tad ir tādas sistēmas kā ChatGPT. Un varbūt mēs mazu testu varam veikt, ja? Lūdzu, paceliet roku, kurš ir pamēģinājis ChatGPT. Paldies!

Rītups: Un paceliet roku, kurš nav pamēģinājis! Septiņi cilvēki.

Vasiļjevs: ChatGPT ir ātri ienācis mūsu ikdienā, un tas tiešām rada sajūtu, ka tam apakšā ir baigais intelekts.

Rītups: Nu, man tādu sajūtu tas nerada. Taču es gribētu mazliet precizēt, jo vismaz angļu valodas vidē saīsinājums AI tiek lietots vietā un nevietā, apzīmējot visu ko. ChatGPT taču arī ir ļoti specifisks lielā valodas modeļa variants, nevis mākslīgais intelekts. Radītāji jau saprot, ka tam ar saprašanu nav nekāda sakara. Taču varbūt tu varētu ieviest – nu, nevis terminoloģisku, bet vienkārši jēdzienisku skaidrību: ko dara lielais valodas modelis, uz kā bāzes ir veidots ChatGPT?

Vasiļjevs: Viens uzdevums, pie kā jau sen pētnieki strādā, ir: kā modelēt cilvēku valodu. “Modelēt” nozīmē izveidot datora modeli, kas kaut kādā veidā saprot vai iegūst zināšanas par cilvēku valodu.

Rītups: Izmantodams vārdu “saprot”, tu riskē piedēvēt tam modelim spējas, kas viņam varētu arī nepiemist.

Vasiļjevs: Nu, lai mūsu saruna būtu dabiskāka, es riskēju lietot šo terminu “saprast”, lai ko tas arī nozīmētu. Mēs varētu jautāt, ko mēs saprotam ar vārdu “saprast”, tomēr šos valodas modeļus jau diezgan sen izmanto datorlingvistikā, īpaši tulkošanas sistēmās vai balss atpazīšanas programmās. Tam ir vajadzīgs arī valodas modelis.

Rītups: Pirms tu turpini, es drīkstu iestarpināt? Vai vēsturiski var fiksēt pavērsienu, kur deep learning kļūst par svarīgu rīku tulkošanā?

Vasiļjevs: Būtisks moments ir raksts par transformeru neironu tīkliem. Kā tad modelēt to valodu? Viens veids ir neironu tīkli. Varam iztēloties, ka neironu tīklā savstarpēji saistītas daudzas mazas skaitļošanas vienības. Šie mazie zināšanu punktiņi ir saistīti līdzīgi tam, kā cilvēka smadzenēs saistīti neironi. Tiesa gan, īstenībā smadzenes ir uzbūvētas daudz sarežģītāk, neironi ir ļoti dažādu veidu, sinapses arī ir ļoti atšķirīgas. Tomēr princips ir līdzīgs. Mēs nomodelējam šādu sistēmu un tad to apmācām. Tas nozīmē, ka mēs katrai mazajai vienībai iedodam skaitliskus parametrus, lai kopā visa sistēma spētu kaut ko imitēt vai modelēt – šajā gadījumā valodu. Lai tā varētu modelēt cilvēku valodu un valodā ietvertās zināšanas. Un tad ir apmācības process: šajā neironu tīklu sistēmā tiek baroti iekšā dati, tā tiek trenēta ar milzīgu apjomu datu, un tā katru mazo parametriņu pārkalkulē un mēģina atrast kombināciju, lai šos datus vislabāk atspoguļotu sistēmā. Lai, ja mēs, piemēram, gribam tulkot, tā spētu imitēt cilvēku prasmes tulkot. Lai, ieejā saņemot tekstu avota valodā, tā izejā dotu tulkojumu, līdzīgi kā to dara cilvēks.

Rītups: Kā man reiz viens Hārvardas ekonomists aprakstīja statistiku: bullshit in, bullshit out. Cik sūdīga informācija tiek ievadīta, tikpat sūdīgu informāciju dabū ārā. Tā kā lielākā daļa cilvēku sarakstīto tekstu ir sūds uz kociņa un diezgan bezjēdzīgi un nevarīgi izteikumi par sevi, pasauli vai kādiem tur notikumiem, vai ir kaut kādi koriģējoši mehānismi, kuri varētu mazināt to bullshit out?

Vasiļjevs: Viens mehānisms ir apjoms. Viena pieeja ir uzskatīt, ka, jo vairāk ievaddatus dosim sistēmas apmācībā, jo tā labāk atlasīs sēklas no pelavām.

Rītups: Tāpēc, ka statistiski būs… Nu, tas tai ļaus kvalitatīvi izvērtēt.

Vasiļjevs: Tā patiešām ir problēma, ka tekstos ir ļoti daudz muļķību. Un tad otra pieeja ir reinforced learning…

Rītups: Reinforced – pastiprināt kaut ko?

Vasiļjevs: Pastiprināta apmācība. Kad sistēma ir uzmodelēta, tai, piemēram, uzdod jautājumu un tā iedod vairākas iespējamās atbildes. Cilvēks vērtē, kura atbilde ir labākā, un tādā veidā sistēma, ņemot vērā cilvēka vērtējumu, pati piemēro parametrus tā, lai cilvēka atzītās labākās zināšanas arī iegūtu pārsvaru pār tām, kuras ir sēnalas.

Rītups: Tas nozīmē, ka tajos tekstos ir klāt arī vērtību parametri. Un tādēļ, piemēram, ķīniešu tekstos varētu būt citi, gadsimtu gaitā izkristalizējušies vērtību parametri nekā angļu valodas tekstu korpusā?

Vasiļjevs: Jā, nu, tas, kā šie modeļi strādā, lielā mērā ir atkarīgs no tā, ar kādiem datiem tie trenēti. Pašreiz 90% un vairāk datu, kas tiek izmantoti trenēšanai, ir angļu valodā. Tas nozīmē, ka tie atspoguļo šo angliskajā valodas telpā ietverto informāciju.

Rītups: Tātad anglosakšu kolonizējošā ietekme līdz ar mākslīgā intelekta izplatību tikai pieaug?

Vasiļjevs: Protams. Šie uzņēmumi cenšas to mīkstināt un balansēt, bet tas dažkārt noved pie paradoksiem vai dīvainībām. Šīs sistēmas var ģenerēt ne tikai valodu, bet arī attēlus. Tu prasi: “Uztaisi man rītausmas skatu!”, un sistēma rada brīnišķīgu bildi. Taču, ja tajos attēlos ir cilvēki, tad pārsvarā tie ir baltādainie ASV vidusšķiras pārstāvji; tādēļ sistēmai lika ietvert vairāk dažādu ādas krāsu pārstāvju. Tad cilvēki sāka eksperimentēt un teica: “Uztaisi man bildi ar nacistu apspriedi Hitlera bunkurā!”, un tur parādījās dažādu rasu pārstāvji nacistu formas tērpos. (Visi smejas.)

Rītups: Taču jums, darbojoties Tildē ar latviešu valodas korpusu, ir daudz mazākas iespējas kaut ko izdarīt tajā lielajā valodas modelī salīdzinājumā ar OpenAI, Google un kaut ko tādu. Kā jūs risināt šo problēmu, ka jums ir daudz mazāk datu? Jo, piemēram, braucot uz šejieni, mani ceļabiedri, dzirdot, ka tēma būs mākslīgais intelekts un rakstniecība, teica: “Vai tad ir kaut kādas attiecības starp rakstniecību latviešu valodā un mākslīgo intelektu?” Tas izraisa šaubas.

Vasiļjevs: Tie, kas ir mēģinājuši ChatGPT, ir pārliecinājušies, ka tas pārsteidzoši labi spēj ģenerēt tekstu latviešu valodā, tomēr ne tik labi kā angļu valodā, un šī starpība ir ļoti liela. Taču šajos modeļos tiek veidota daudzdimensionāla zināšanu telpa, un, ja mēs ieliekam datus latviešu valodā, tie saslēdzas kopējā tīklā ar angliskajiem un citu valodu datiem un notiek starpvalodu mācīšanās, kas ļoti palīdz sistēmai kļūt gudrākai arī latviešu valodā. Tiesa, tik un tā dominējošā informācija ir citās valodās. Tagad, pateicoties uzvarai vienā lielā Eiropas Savienības konkursā, mums būs iespēja izmantot jaudīgāko superdatoru Eiropā, kas atrodas Helsinkos, bijušajā papīrfabrikā, kur notiek dzesēšana; šis superdators ar pārpalikušo elektroenerģiju apgādā visu apkārtni. Tad lūk, mums būs brīnišķīga iespēja izmantot šo superdatoru, lai veidotu jaunu modeli, kurā tiks balansētas mazākas Eiropas valodas. Angļu valoda tiks pielikta klāt, bet tai nebūs pārsvara, un šīs mazākās valodas – un arī tādas morfoloģiski bagātas valodas kā latviešu valoda – šinī modelī tiks īpaši atbalstītas. Mēs ceram, ka šis modelis spēs rakstīt latviski, labot kļūdas latviski, sacerēt dzejoļus latviski labāk nekā citi.

Rītups: Nu, pie dzejoļu sacerēšanas nonāksim. Saki, kur tu pats ChatGPT vari izmantot savā dzīvē, darbā un domāšanā? Kam tas tev noder?

Vasiļjevs: Jāatzīst, es to izmantoju gandrīz ik dienu, un man tas ir ļoti palīdzošs darbarīks. Starp citu, mēs ļoti daudz strādājam starptautiskos projektos, ar starptautiskajiem partneriem un tā tālāk. Un angļu valoda nav mana dzimtā valoda. Tas, vai iesniegto projektu atbalstīs, lielā mērā ir atkarīgs no tā, cik skaisti projekts būs izklāstīts angļu valodā. Lūk, tad es uzrakstu, cik labi nu protu, un tad paprasu ChatGPT: lūdzu, uzlabo šo tekstu! Viņš to brīnišķīgi izdara, īpaši, ja ir iedots konteksts. Piemēram, to Briseles birokrātu valodu viņš brīnišķīgi pārstāv. Briseles birokrātu valoda ir tāda valoda, kura ļoti skaisti izklausās, un tur ir tādi…

Rītups: Skaisti izklausās, taču tā ir galēji neinformatīva. Pārsvarā tā Briseles birokrātu valoda ir tukša diršana; tas ir elegantāks veids, kā piesegt to, ka nekā nav, ko teikt.

Vasiļjevs: Ja tā ideja ir samērā skaidra un vienkārša, bet tev tās 70 lapas jāaizpilda, tad ChatGPT ļoti palīdz, jo man pašam tā, es atvainojos, muldēt ir sarežģīti.

Rītups: Sapratu. Vai ir vēl kāds lietojums, kur tev noderējis vai regulāri noder ChatGPT?

Vasiļjevs: Kā izziņas līdzeklis, kā iedvesmas avots un…

Rītups: Kādos gadījumos tas tev noder kā iedvesmas avots?

Vasiļjevs: Teiksim, šī pati tēma par mākslīgo intelektu. Man, piemēram, par mākslīgo intelektu bija jāstāsta psihologiem. Es paprasīju ChatGPT: kādas tēmas interesē psihologus?

Rītups: Tu nevis piezvani kādam pazīstamam psihologam un pajautā, bet prasi ChatGPT?

Vasiļjevs: Arni, tu jau zini, ka lielākā problēma ir, ka bieži vien cilvēks nezina, ko viņš nezina.

Rītups: Mhm, un vēl trakāk, ja viņš nezina, ko grib. Esi saskāries ar tādām situācijām?

Vasiļjevs: Tā arī gadās, jā. Tas ir tikai tāds piemērs, lielākā daļa ieteikumu ir triviāli, bet dažkārt kaut kas parādās. Bet vēl tā ir ļoti laba iespēja atrast informācijas avotus, izmantojot tā saucamo “ar izguvi papildināto ģenerēšanu” – retrieval-augmented generation. Tā ir metode, kur modelis nevis pats kaut ko izfantazē, bet gan sameklē internetā, izmantojot meklēšanas algoritmus, attiecīgos informācijas avotus izanalizē un iedod atbildi, balstoties uz šiem informācijas avotiem. Proti, ģenerē informāciju nevis pats no sava prāta, bet tikai no šiem avotiem. Un tā, piemēram, var prasīt: “Iedod man piecas jaunākās zinātniskās publikācijas par noteiktu tēmu!” Pēc šīs metodes tās piecas publikācijas var būt ļoti noderīgas. Ja prasīsi vienkārši ChatGPT to izdarīt: reiz man bija steidzami jānodod raksts un vajadzēja ātri atrast labas atsauces, un es palūdzu ChatGPT ieteikt publikācijas – nevis ar šo metodi, bet pa tiešo, un tas man iedeva rakstu autorus, nosaukumus. Es domāju: brīnišķīgi, re, kā viņš man palīdzēja! Tagad ātri sameklēšu šos rakstus zinātniskajās datubāzēs, un būs man noderīga informācija. Pilnīgas halucinācijas! Neviens no tiem nebija īsts.

Rītups: Bet izskatās labi!

Vasiļjevs: Izskatās perfekti. Man liekas, tur arī daudzi studenti iekrīt. Bet šī otra metode – tur tie rezultāti var būt tiešām labi.

Reģistrētiem lietotājiem

Paroles atjaunošana

Radošā kvartāla Zeit rīkotajā festivālā Rakstivāls sarunājas valodu tehnoloģiju uzņēmuma Tilde vadītājs Andrejs Vasiļjevs un Arnis Rītups

Mākslīgais intelekts bez vēdera sajūtas

Raksts no Septembris 2024 žurnāla

Līdzīga lasāmviela

Reģistrētiem lietotājiem

Paroles atjaunošana

Jauniem lietotājiem

Radošā kvartāla Zeit rīkotajā festivālā Rakstivāls sarunājas valodu tehnoloģiju uzņēmuma Tilde vadītājs Andrejs Vasiļjevs un Arnis Rītups

Mākslīgais intelekts bez vēdera sajūtas

Raksts no Septembris 2024 žurnāla

Līdzīga lasāmviela