Mūrininkų vertybės duomenų sistemoms

Skaitant Diana Darke knygos skyrių apie viduramžių mūrininkų gildijas man įstrigo jų deklaruojamos vertybės, kuriomis turėtų būti vadovaujamasi statyboje. Geras statinys turi būti gražus, tvirtas ir patogus. Kaip suprantu, šias vertybes perėmė ir vėlesnieji laisvieji mūrininkai, kurie fizinių akmenų jau nebetašė. Šių raštuose teisingas gyvenimas irgi stovi ant trijų kolonų: grožio, stiprybės ir išminties.

Dirbu su įvairiausiomis duomenų sistemomis, duomenų bazėmis ir jų analize. Tai ganėtinai toli iki viduramžių katedrų statybos, bet kažkiek panašumo stipriai prisimerkus įžiūrėti galima: tai sudėtingos sistemos, kurias ne vienerius metus kuria ištisos komandos žmonių, ir nebūtinai pagal vieną aiškų nekintamai patvirtintą detalųjį planą. Tikiu, kad ir kuriant duomenų sistemas galima vadovautis tomis pačiomis trimis vertybėmis.

Grožis. Duomenų ataskaitos turi būti ne vien funkcionalios, bet ir estetiškai gražios. Svarbu ne vien duomenų teisingumas, bet ir jų pateikimas: teisingai parinkti šriftai, spalvos, grafikų dizainas leidžia duomenis žymiai lengviau suprasti. Galutinis duomenų vartotojas dažniausiai yra ne programuotojas ar analitikas, o vadovas arba išorinis klientas, kuris tikriausiai neturi daug laiko ir noro gilintis į duomenų subtilybes, todėl viskas jam turi būti aišku iš pirmo žvilgsnio. Nereikia pamiršti teisingų grafikų ir ašių pavadinimų, legendų, santrumpų išaiškinimo, reikia visose ataskaitose naudoti tokias pačias spalvas ir datos formatus. Net jeigu ruoši tik paprastą Excelio ataskaitą, verta įdėti papildomai pastangų tam, kad ji būtų aiški ir graži, o ne atrodytų kaip plikas atsitiktinių skaičių kratinys.

Stiprybė. Duomenų sistemos turi būti „tvirtai suręstos“: jos neturi sugriūti papūtus stipresniam vėjui ar nežymiai pasikeitus aplinkai. Sistemas reikia stengtis kurti taip, kad pasikeitęs duomenų formatas paduodamas iš išorinio tiekėjo ilgam „neužlenktų“ viso duomenų ūkio. Faktas, kad duomenų struktūros nuolat keičiasi, vieni laukai atsiranda, kiti išnyksta. Faktas, kad keičiasi ir duomenų kiekiai. Faktas, kad kartais duomenys vėluoja. Faktas, kad kartais vienu metu ataskaitas nori pažiūrėti šimtus kartų daugiau vartotojų nei įprastai. Faktas, kad kartais duomenys dingsta ir fiziškai, tad reikia juos atstatyti iš atsarginės kopijos. Realybėje nutinka labai daug neplanuotų dalykų, tačiau duomenų sistema turi būti pakankamai stipri juos atlaikyti, ar bent jau suprasti, kada reikia neprikūrus dar didesnių problemų tvarkingai nuleisti rankas.

Patogumas. Visos kuriamos sistemos turi būti patogios klientui. Niekada nereikia pamiršti, jog dirbama klientui, o ne savo pačių patogumui: žali duomenys csv formatu yra patogūs analitikui, bet nesuprantami vadovui. Analitikui gal būt patogu duomenis pasiimti per SQL užklausą, bet gal būt klientui reikia tik nuolat po akimis matyti kelis pagrindinius skaičius. Nereikia pamiršti, kad klientas ne visada gali iki galo teisingai išreikšti savo poreikius: reikia stengtis suprasti, ką tais poreikiais klientas nori pasiekti. Gali būti, jog jis nori vienokios specifinės ataskaitos Excel formatu, bet iš tiesų jis tuos duomenis įkels į kitą sistemą ar ataskaitą – gali paaiškėti, jog lengviau duomenis ten patiekti tiesiogiai, o ne per Excel bylas. Duomenų sistemos sėkmę užtikrina patogus problemos sprendimas klientui, o ne vien tik aklas techninės specifikacijos išpildymas.

Ar ofisas vis dar reikalingas?

Pastarąsias dešimtį dienų dirbau ne iš namų. Dirbau ir ne iš ofiso: daugiau nei savaitei persikėliau į pajūrį. Darbo ritmas nuo to visai nepasikeitė, rutina išliko ta pati. Atsikelti prieš aštuonias, pasidarius kavos perskaityti elektroninį paštą, žiaumojant sumuštinį atnaujinti vienos ar kitos sistemos duomenis ar parašyti vieną kitą lengvesnę duomenų bazės užklausą. Po to įprastiniai dienos skambučiai su klientais, darbas, darbas, darbas, pietų pertraukėlė ir vėl darbas. Ir tada, jau kokią 18 valandą, galima kiek atsipūsti, nueiti prie jūros, pavakarieniauti, paskaityti knygą. Ir tikriausiai dar atsakyti į kelias darbines užklausas.

Dirbu nuotoliniam darbui dėkingoje IT srityje, tad darbas namie ar prie jūros visai nesiskiria nuo darbo ofise. Jei tik yra pakankamai stabilus internetas, galima dirbti bet kur. Ir atrodo, jog pagaliau tai tapo suvokiama vis daugiau kompanijų: jeigu prieš pandemiją pas klientus Londone reikėdavo reguliariai skraidyti kas dvi savaites „atsiskaityti už darbus“, dabar visai pakanka kassavaitinio skambučio. Susitaupo ne vien kelionės nuovargis, bet ir begalės laiko bei pinigų. Nors klientai – ne IT bendrovė, jie irgi į ofisą nebeskuba, fizinis buvimas visuose susitikimuose nebeatrodo efektyvus darbo būdas.

Vienas didžiulis ofiso privalumas išliko: ofise nėra vaikų. Jei vaikai neina į darželį ar mokyklą, tai namuose vis tiek tenka dirbti bent jau pusantro etato, be eilinių darbinių užduočių reikia pasirūpinti ir jais. Neturintys vaikų bendradarbiai visai mielai nuolat dirbtų iš namų ar sodybos. Socializacija svarbu, bet juk nebūtinai darbinėje aplinkoje.

Mano artimiausioje aplinkoje jau bent trys kompanijos nusprendė, kad jiems arba reikia dvigubai mažesnio ofiso, arba jo nereikia visai. Taip, tai gana mažos kompanijos, taip, jos visos dirba IT srityje ar bent jau ne Lietuvos rinkai (tad jau ir šiaip yra įpratę su klientais bendrauti per atstumą). Bet lūžis galvoje įvyko, ofisų paklausa turėtų mažėti. Ir, tikiuosi, pagaliau numirs atviro plano ofisų idėja: juose nei susikaupsi, nei ramiai padirbsi.

Post Scriptum. Nors bendrinėje kalboje dažniausiai vartojamas žodis „ofisas“, lyg ir taisyklinga būtų sakyti „biuras“. Bet tikrai nesuprantu, kuo prancūziškas / vokiškas „biuras“ yra geriau už anglišką „ofisą“ – galų gale abu šie žodžiai kilę iš tos pačios lotynų kalbos (burra ir officium)

David Graeber: „Bullshit Jobs. A Theory“

2013-ais metais antropologas David Graeber parašė ese apie tai, kad kuo toliau, tuo labiau žmonija dirba beprasmius darbus. Jie ne vien tik nekuria vertės, bet ir kartu varo žmoniją į depresiją: jei visą dieną turi generuoti kvailas ataskaitas Sodrai, sunku jaustis, kad sukūrei ką nors prasmingo. O kuo toliau, tuo tokių darbų daugėja.

„Bullshit Jobs. A Theory“ yra platesnė šios ese versija. Nemažai vietos skiriama ekonominiam aspektui, mat dažniausias prieštaravimas iš ekonomistų visgi būna, kad rinka yra efektyvi ir jei darbas nesukurtų vertės, niekas žmogaus nesamdytų, tačiau centrinė knygos tema visgi yra žmogus ir jo santykis su darbu. Kodėl mes dirbame, ar darbas būtinas savęs realizavimui, kodėl mums tapus turtingesniems mes nepradėjome dirbti trumpiau ir kodėl mes vis blogai jaučiamės ir nesidžiaugiame, nors mūsų gerovė didėja. Labai geri antropologiniai klausimai, apie kuriuos ne dažnai susimąstau.

Mūsų ekonominė politika turi pagrindinę tezę: turtas bei lamė sukuriama per darbą. Tam, kad visi būtų laimingi, reikia kad augtų ekonomika, o ekonomikos augimas koreliuoja su sukurtomis darbo vietomis. Ne vienas politikas žarstydamas pažadus teigia, jog sukurs tūkstančius naujų darbo vietų, ir visi tai priima kaip absoliutų gėrį. Tačiau lengviausia yra sukurti darbo vietas prikuriant kokių nors taisyklių ir apribojimų – tarkim jei padvigubintum mokesčių inspekcijos ataskaitų apimtį, reiktų dvigubai daugiau buhalterių ir dvigubai daugiau mokesčių inspekcijos valdininkų: darbo vietos sukurtos, visi dirba, visi kažkuo užsiėmę, bet reali nauda abejotina. O kuo toliau, tokių darbų vis daugėja.

Blogiausia yra tai, kad dirbdami tokį darbą žmonės nesijaučia laimingi, nes jie vargiai mato tokio darbo prasmę. Sunku didžiuotis tuo, kad sukūrei eilinę ataskaitą. Seniau tai, ką žmogus pagamina, buvo jo svarbiausia identiteto dalis („aš – stalius, nes gaminu baldus“, „aš – kalvis“, „aš – ūkininkas“), o per pastarąjį šimtmetį mes bandome savo identitietą kurti ne per tai, ką sukuriame, o per tai, ką vartojame („aš – Žalgirio fanas“, „aš vartoju tik Apple produkciją“). Bet to neužtenka, nes kad ir kiek ko vartojame, tai neužpildo identiteto tuštumos.

David Graeber stipriai palaiko visuotinių bazinių pajamų idėją – visi turėtų gauti standartinę išmoką, kuri užtikrintų bazinį pragyvenimą, ir taip būtų galima atsikratyti labai daug biurokratijos. Be to, žmonės būtų laisvi užsiimti tuo, ką nori, ir jiems nebūtina būtų sėdėti nekenčiamuose darbuose. Ši idėja verčia pergalvoti ir kitas problemas: tarkim, tokiu atveju visai nereikia pensinio amžiaus (išmokos juk mokamos iki pat mirties) – gal ir pačios SoDros problemas galima spręsti žymiai radikaliau nei perstumdant kėdes Titanike. Tiesa, vis dar išlieka klausimas, ar nedirbantys nekenčiamų darbų žmonės irgi jausis laimingi. Sakoma, kad pasididžiavimo savo pasiekimais jausmas aplanko tik tada, kai tai atėjo per sunkų darbą ar kančią.

Duomenų analitiko darbas dažniausiai yra duomenų valymas

Turbūt didžiausias skirtumas tarp mokykloje ar universitete darytų duomenų analizių ir realaus pasaulio yra turimų duomenų kokybė. Rašėm savaitgaliais magistrinius darbus, pasižiūrėdami į kursiokų failus darėm „statistikos laboratorinius“, sprendėm uždavinius bei iš vadovėlio atkartojom nelabai suprantamas ekonometrinius modelius – ir  beveik visada duomenys buvo duotybė. Ar tai būtų BVP augimo eilutė iš Statistikos departamento, ar Olimpiadų medalių suvestinė: beveik visada duomenys buvo švarūs, tvarkingi, be klaidų, be neužpildytų eilučių, be praleistų kablelių, romėniškų skaitmenų, sunkiai įskaitomo buhalterės Janinos rašto ir pasimetusių sąskaitų-faktūrų. Tereikėdavo tuos duomenis paimti, sudėti į modelį, sukalbėti kelis užkeikimus ir gaudavai vienintelę teisingą p reikšmę ir iš to sekančią išvadą. Didesnis nedarbas yra mažesnė infliacija. Narystė Europos Sąjungoje didina akcijų kainas. Marytė suvalgo daugiau obuolių nei Jonukas.

Skirtingai nei universitete, realybėje duomenys beveik niekada nebūna aiškūs ir tvarkingi. Dažniausiai tau reikiamų duomenų tiesiog nėra (ar daug kas kaupia duomenis apie kiekvienos fizinės parduotuvės kasvalandinį lankytojų srautą?). Jeigu jų galima rasti – jie nepatikimi, nes iki galo nežinai, ar kiekviena apskaitininkė visose Baltijos šalyse prieš penkerius metus vienodai koduodavo gautas sąskaitas. Jeigu jais galima pasitikėti, jie tikriausiai būna nepilni – vienur trūksta detalumo, kitur kažkas nusimušę, trečioje vietoje duomenys nepasiekiami, nes jie nesuskaitmenizuoti. Jau nekalbu apie tai, kad visur yra ir žmogiškas faktorius: kažkur vardas įvestas į pavardės grafą, kažkas sumas vietoje eurų įrašė litais. Kuo daugiau duomenų (ir ypač jei kalbam apie didelius duomenis be struktūros) tuo didesnė duomenų analitiko darbo laiko dalis yra ne sudėtingas duomenų modeliavimas ar rezultatų interpretavimas, o duomenų tvarkymas bei paruošimas analizei. Sakoma, kad šiam kruopščiam ir nuobodokam darbui analitikai sugaišta nuo 50 iki 80 procentų savo darbo laiko.

Gerai sutvarkyti duomenys yra aukso vertės. Tai tokie duomenys, kuriuose nebėra erdvės interpretacijoms, kuriuose nelikę klaidų ir kuriais tvirtai galima remtis darant verslo sprendimus. Tik juos išvalius galima kurti sudėtingus modelius bei algoritmus, o iki tol reikia praleisti ne vieną valandą rymant prie duomenų kokybės. Toks analitiko darbas.