Ar jums tikrai reikia besimokančių (machine learning) sistemų?

Žiūrėk, turim duomenų, gal galėtumėt ką nors padaryt su machine learning ar dirbtiniu intelektu? Juk čia gi dabar ateitis“ – labai dažnas šiuolaikinis prašymas iš potencialių klientų. Neretai pasirodo, kad realių problemų sprendimui nereikia nei gudrių algoritmų, nei dirbtinio intelekto: didžioji vertė iš duomenų išspaudžiama žymiai paprastesnėmis priemonėmis, vien tik sutvarkius duomenis ar pasinaudojant senais gerais statistikos įrankiais. Kita vertus, logistinės regresijos terminai panašiai kaip ir bet kokios diskusijos apie neuroninius tinklus: nei apie vienus, nei apie kitus nedaug kas girdėjęs.

Problema tame, kad dirbtinis intelektas ir besimokančios sistemos yra dažnai minimos tokiose stebuklinguose kontekstuose, kad paprastas žmogus vargu ar gali suprasti, kad, nepaisant visų pastarųjų metų pasiekimų, jos nėra visagalės. Taip, jos gali atpažinti objektus paveiksliukuose, taip, jog pusėtinai gali išversti vienos kalbą į kitą, taip, jog gali kūrybiškai imituoti meno kūrinius. Ne, besimokančios sistemos dar negreit sukurs naują Nobelio literatūros kūrinį, ne, jos nesugalvos jums naujos verslo strategijos, ne, jūsų atsitiktinė duomenų sankaupa netaps aukso grynuoliu, nešančiu jums milijonus vien todėl, kad nutarėte investuoti į dirbtinį intelektą.

Vienas geriausių kriterijų, kuris labai greitai atmeta visas dirbtiniam intelektui kol kas neįkandamas idėjas yra užduoti sau klausimą, ar su norima spręsti užduotimi susidorotų paprastas žmogus. Jei žmogus duomenyse gali atrasti paaiškinamus sąryšius bei dėsnius, tai yra šansų, kad tai galės atlikti ir dirbtinis intelektas, nors to garantuoti negalima. Jei žiūri į klientų duomenis, ir pradedi suprasti dėsningumus, tuos dėsningumus galbūt atras ir besimokančios sistemos. O jei duomenys nieko nesako net protingiausiam žmogui, tikėtina, jog nieko protingiau nesugalvos ir dirbtinės sistemos.

Panašios nuomonės yra ir šio dienoraščio autorius. Jis gal dar griežtesnis: jei įmanoma duomenis perkratyti statistinės analizės pagalba ir jų ryšius aprašyti matematinėmis formulėmis, dirbtiniam intelektui – ne vieta. Nors suprantu, jog riba tarp sudėtingos statistikos ir besimokančių sistemų kartais nebe tokia ir aiški.

Kad ir kaip ten bebūtų, duomenys atneša daugiausiai verslo vertės, kai yra labai aiškiai suprantama, ką su jais norima padaryti ir kai yra užduodami teisingi verslo klausimai. Vien perleidus atsitiktinių duomenų rinkinį per dirbtinio intelekto algoritmus, verslo įžvalgų grynuolio nerasi. Garbage in, garbage out.

Neapdorotų duomenų nebūna

Yra toks gana gajus mitas, kad turint „žalius“ neapdorotus duomenis, galima nesunkiai padaryti objektyvias išvadas – juk neapdoroti duomenys turėtų kalbėti už save, jie neturėtų būti „sutepti“ šališkos žmogiškos nuomonės bei išankstinių nusistatymų. Kuo daugiau neapdorotų duomenų, tuo objektyvesnės išvados. Deja, visiškai neapdorotų duomenų nebūna. Jau pats faktas, kad kažkas juos rinko, reiškia, kad kažkas padarė sprendimą jais domėtis: o kodėl rinko būtent taip, o ne kitaip? Kodėl rinko tokius, o ne anokius? Kodėl skaičiavo žmones, o ne mašinas; kodėl išmetė iš skaičiavimų vaikus ar žmones vežimėliuose, kodėl nusprendė, jog tamsoje duomenys nepatikimi? Net jei duomenis renka automatiniai prietaisai (tarkim, kas kažkiek laiko skaičiuojama temperatūra), duomenys fiksuojami su aiškia paklaida, kuri nustatyta matavimo įrenginio specifikacijoje – pats įrenginys kažkiek matavimą apvalina, kažkiek veikia nepatikimai už tam tikrų temperatūros rėžių. Jei nežinosi šio konteksto, gali padaryti išvadą, kad temperatūra būna stabili (tiesiog nematai temperatūros pokyčių, mažesnių nei vienas laipsnis) ar ji niekada nenukrenta žemiau -20˚C.

Ypač sunku teisingai interpretuoti skaičius, kurie susiję su žmogumi. Nusikaltimų skaičius gali augti jau vien dėl to, kad pasikeitė suvokimas, kas yra nusikaltimas (tarkim, anksčiau gal buvo visuomenėje priimta, kad vaikus mušti ir tai nebuvo laikoma nusikaltimu). BVP ar infliacijos skaičiai gali kisti dėl metodologinių paklaidų. Pajamų duomenys, surinkti apklausos būdu, smarkiai skirsis nuo duomenų, gautų iš mokesčių inspekcijos.

Simply put, the context of data — why it was collected, how it was collected, and how it was transformed — is always relevant. There is, then, no such thing as context-free data, and thus data cannot manifest the kind of perfect objectivity that is sometimes imagined.

https://www.thenewatlantis.com/publications/why-data-is-never-raw

Šiuolaikinė „didelių duomenų“ mada bando įteigti, jog žali duomenys yra patys objektyviausi, nes jie neužteršti išankstinėmis nuostatomis. Kuo daugiau tokių duomenų, kuriuos galima sušerti taipogi labai objektyviam algoritmui, tuo teisingesnės išvados – ir tam net nereikia jokių ekspertų, mat jie tik įneš savo (nebūtinai teisingą) išankstinę nuomonę. Žmonėmis negalima pasitikėti dėl jų subjektyvumo: nuo to gali išgelbėti tik daugybė duomenų. Bet toks pasaulio vaizdas visgi yra utopinis: jei atvirai nedeklaruoji savo prielaidų, nereiškia, jog jų nedarai. Nematomos subjektyvios prielaidos duomenyse atsiranda jau jų rinkimo procese, ir to niekaip neišvengsi. Ką matuoji, tą ir optimizuosi. Duomenys už save nekalba, jie atkartoja duomenų rinkėjų nuomones.

Pietauji be telefono – vaikai valgo nemokamai

Fatherly rašo:

Parents who give up their phones during dinner will be rewarded with free meals for their kids at one U.K.-based restaurant chain. For the first week of December, Frankie & Benny’s is running its “no-phone zone” campaign in an attempt to improve family interactions at the dinner table.

Fatherly.com

Lankantis restorane, tėvai galės palikti telefonus specialiose dėžutėse; po apsilankymo telefonai bus grąžinti, o vaikų suvalgyti patiekalai bus neįtraukti į sąskaitą. Idėja tikrai nebloga – dažnai nelengva atsiplėšti nuo ekrano, o juk laikas su šeima yra labai svarbus.

Tiesa, tikriausiai tokios iniciatyvos nebūtų gimę, jeigu Didžiosios Britanijos ekonomika išgyventų puikius laikus: restoranų verslui šiuo metu ypač nelengva. Mažėjant vartojimui, ne pirmo būtinumo prekių pardavimai kenčia labiausiai. Tokia akcija realiai yra kainos nuolaida klientų grupei su vaikais – o su gera marketingo idėja ji gali puikiai pasiteisinti.

O namie irgi norėtųsi turėti taisyklę, jog prie stalo telefonų nebūna. Tik tai ne visada lengva įgyvendinti.

Geriausias konkurencinis pranašumas skaičiais neišmatuojamas

Keletas gerų minčių iš David Perell Twitterio apie marketingą ir verslo metrikas:

The invention of the spreadsheet transformed marketing and corporate decision making. We’re over-reliant on numbers and metrics. We assume that only what we can measure is real and everything that is real can be measured. One writer calls this the Arithmocracy: a powerful left-brained administrative caste which attaches importance only to things which can be expressed in numerical terms or on a chart.

[…] “Not everything that counts can be counted and not everything that can be counted counts.

David Perell, https://twitter.com/david_perell/status/1056966027752431618

Pasaulyje, kuriame visi kreipia dėmesį tik į duomenis ir skaičius, geriausia konkurencinio pranašumo ieškoti būtent ten, kur jis neišmatuojamas. Ir nors duoną uždirbu žiūrėdamas į skaičius, su verslo metrikomis irgi galima persūdyti.

Tamara Shopsin: „Stupid Arbitrary Goal“

Pasirodo, Niujorke yra žymus kišenės dydžio restoranas Shopsin’s, kuris gyvuoja jau ne vieną dešimtmetį. Deja, jo įkūrėjas šiais metais mirė, o ši jo dukters knyga yra istorijų ir prisiminimų rinkinys apie jį patį ir jo žymųjį restoraną.

O restoranas žymus visai ne tuo, kad ten dirba aukščiausio lygio virėjai ar baltomis pirštinėmis vilkintys padavėjai – priešingai, jame visada galėjai rasti išsidrėbusį rajono keistuolį, būti apšauktas, kad nežinai ko nori ir „išbanintas“ dėl to, kad kur nors parašei šio restorano apžvalgą (net ir labai teigiamą!). Šiam restorano savininkui klientų ir taip pakako, jis turėjo kiek kitokį požiūrį į pinigus ir gyvenimo filosofiją. Net kai vienu metu buvo proga už vienodą kainą nusipirkti dvejas patalpas toje pačioje gatvėje – vienas didesnio ploto ir su nauja įranga, o kitas mažesnes ir su nudėvėtomis lentynomis, Shopsin nusipirko mažesnes. Nes jos per kelis šimtus metrų arčiau namų.

Visa ši knyga yra puikių Niujorko gyvenimo anekdotų rinkinys, kurio tiesiog negali padėti į šalį. Prarijau per kelis labai malonius lengvo skaitymo vakarus.

Phil Knight: Shoe Dog

Turbūt nėra žmogaus, kuris nebūtų girdėjęs apie kompaniją Nike: tai vienas stipriausių prekinių ženklų. Jos įkūrėjo Phil Knight memuarai labai asmeniški bei nuoširdūs: čia daugiau asmeninių išgyvenimų nei verslo gudrybių ar strategijos. Gal dėl to ši knyga ir yra tokia patraukli: žmogus, sukūręs tokią žymią kompaniją, apie savo nueitą kelią pasakoja jautriai, paprastai ir žmogiškai. Buvo ir klaidų, nemažai suklupimų, paklydimų, kartais ir pykčio, išdavysčių, per mažai dėmesio aplinkiniams žmonėms, mažai laiko šeimai, mažai laiko sau.

Didelės kompanijos sėkmė neateina per vieną dieną, neateina ji ir per dešimtmetį. Net ir tokia sėkminga kompanija kaip Nike visada vaikščiojo ant peilio ašmenų ir tik atsitiktinumo dėka jai vis pavykdavo išlaviruoti. Suvaldžius vieną krizę, kaip mat iškyla kita: jei jau išsprendei kontrakto problemas su tiekėju, tai tave atsisako aptarnauti bankas, jei užglaistei nesklandumus su banku, tave muitinei paskundžia konkurentai, jei per teismus įrodei, kad muitinė neteisi, tave palieka tavo svarbiausias darbuotojas. Visoms toms problemoms spręsti reikia neregėto atkaklumo, stiprių nervų, kartais tiesiog įžūlios drąsos ir nemažai atsitiktinės sėkmės.

Įdomi buvo ir Phil Knight verslo patirtis su Japonijos partneriais. Darant verslą su kitos kultūros žmonėmis gali nutikti daug visokių netikėtumų, tad tam reikia būti pasiruošus.

Apie (perdėtą) metrikų svarbą

Vienas svarbiausių dalykų šiuolaikinėje vadyboje – metrikų (KPIs, key performance indicators, pagrindinių veiklo rodiklių) sekimas. Juk jei kažko nematuoji, tai ir negali pagerinti. Iš tiesų, poreikis reguliariai matuoti savo progresą organizacijas priverčia rimčiau pažiūrėti į savo duomenų ūkį, mat iki tol duomenų surenkama mažai ir ne daug kam rūpi jų kokybė. Ir tik turint pakankamai duomenų palaipsniui galima prieiti prie „data-driven“ kultūros: visus svarbesnius sprendimus priimti vadovaujantis nebe nuojauta, o paanalizavus objektyvius skaičius.

Tačiau čia, kaip ir visur, galima persūdyti. Nereikia pamiršti, jog visas metrikas galima apgauti: vien jau rodiklio pasirinkimas gali lemti keistus organizacijos kultūros pokyčius. Ekonomisto Goodhart’o dėsnis teigia, jog metrikos nustoja būti efektyvios vos tik jos tampa tikslu, kurį reikia pasiekti. Kai tik kažkas siekdamas suvaldyti bankų riziką apriboja kapitalo pakankamumo rodiklį, randama būdų paskolas paversti obligacijomis (o šios kapitalo pakankamumo formulėje traktuojamos atlaidžiau). Kai interneto rinkodaros efektyvumą matuoji reklamų paspaudimais, atsiranda automatinių botų, kurie nuolat spaudalioja ant banerių. Kai prieš reklamdavius reikia girtis atverstų puslapių skaičiumi, portalų antraštės optimizuojamos taip, kad skaitytoją užkabintų, bet neperteiktų straipsnio minties: veiksmo daug, o portalo vartotojai turiniu nusivilia. Jei tik pradedi rimtai optimizuoti kokią nors metriką, net nepastebi, kaip jau toli nuvažiavai į lankas.

Žmogaus elgsenos beveik neįmanoma tobulai išmatuoti – belieka rinktis kažkokius skaičius, kurie gal būt arčiausiai galėtų atspindėti esamą situaciją. Taip „atverstų puslapių skaičius“ apytiksliai matuoja „kiek žmonių perskaitė šį straipsnį?“, o „paspaudimais ant reklamos“ galima išmatuoti vartotojų norą įsigyti reklamuojamą produktą. Kapitalo pakankamumas tampa apytiksliu banko rizikos matu, NPS tyrimas maždaug parodo ar vartotojams patinka jūsų kompanija, studentų egzamino balai maždaug parodo, ar jie išmoko paskaitų medžiagą. Turint prieš akis (kad ir netikslų) skaičių, jį galima stebėti, galvoti, kaip jį pagerinti ir sekti savo progresą. Tai ypač patinka inžinieriams ir matematiškai galvojantiems žmonėms: žymiai lengviau galvoti kaip „X procentų pagerinti egzaminų rezultatus“, nes tai skamba daug tiksliau ir apibrėžčiau nei „geriau mokyti studentus“.

Problema atsiranda tada, kai pamirštama, jog metrika tėra apytikslis pasaulio atspindys. Dar blogiau, kai pagrindiniu tikslu tampa tik metrikos pagerinimas – visada išlenda netikėti antriniai šių metrikų efektai. Norint padidinti straipsnių kokybę pradedama matuoti kiek jų perskaitoma, tada kyla noras optimizuoti paspaudimus ant straipsnių antraščių, o tai galų gale sumažina straipsnių kokybę. Norint, kad kuo daugiau vartotojų naudotųsi tavo programėle, pradedamas sekti vartotojų grįžtamumo dažnumas (retention and churn), o vėliau tai išsiverčia į besaikį elektroninio pašto brukalų ar notificationų naudojimą. Norint, kad studentai geriau išmoktų dėstomą medžiagą, pradedama siekti jų egzaminų rezultatų pagerinimo, ir galų gale profesoriai pradeda mokyti savo dėstomo dalyko egzamino išlaikymo triukų, o ne patį savo dėstomą dalyką.

O kartais reikia optimizuoti visai priešingą metriką nei atrodytų iš pirmo žvilgsnio. Nors standartiškai galvojant norisi siekti, kad vartotojai kuo daugiau laiko praleistų svetainėje, Google stengėsi šią metriką optimizuoti į priešingą pusę: kuo greičiau vartotojai randa ko reikia, tuo jie greičiau dings iš tavo paieškos svetainės ir bus laimingesni. Pasiteisino.

Besaikis skaičių fetišas irgi kenksmingas. Verta į verslą kartais pažvelgti ir ne vien per metrikas.

Kada duomenys gali padėti priimti sprendimus?

Prieš pusantrų metų mano rašytas dienoraščio įrašas apie duomenų kultūrą organizacijose pastarosiomis savaitėmis vėl iš naujo užkabino skaitytojus: šia tema parašė „Verslo žinios“ ir apie tai nemažai buvo kalbama Login koridoriuose. Matyt, kompanijose duomenų atsiranda vis daugiau, tik dar nelabai aišku, kaip iš jų išpešti naudos.

Kad ir kaip skambėtų neįprastai, manau, jog duomenų analizėje sudėtingiausia yra ne algoritmai ir ne duomenų infrastruktūra. Svarbiausia ne kur stovi jūsų serveriai, kokia kalba parašytos jūsų duomenų apdorojimo programos ar kuris kietas matematikas darys statistinę jūsų klientų analizę. Svarbiausia, ar jūsų kompanijos kultūra leis jums priimti verslo sprendimus remiantis šaltais ir objektyviais duomenimis, nekreipiant dėmesio į vidinį politikavimą ir norą prieš vadovą pasirodyti geresniu nei esi. Iš duomenų analizės jokios naudos (o netgi sakyčiau dar blogiau – ji žalinga!), jeigu ji naudojama tik savo išankstinei nuomonei apginti bei parodyti, kad jūsų padalinys dirba puikiai. Analitikai turėtų būti skatinami ieškoti kontraargumentų vyraujančiai nuomonei, nes duomenys tam ir yra, kad sprendimai būtų priimami ne vien tik pagal vadovo šeštąjį jausmą. Tai nelengva, jei vadovas galvoja, jog jis geriausiai viską išmano, o jam dirba tik jo valią vykdantys pavaldiniai.

Būti atviram pačiam sau nelengva bet kuriam vadovui. Kartais, žvelgiant į duomenis, reikia giliai įkvėpti ir pripažinti klydus: gal visgi už krentančius pardavimus yra kalti ne konkurentai ar oro temperatūra, o ne itin tobulas pačios kompanijos darbas. Gal nepataikyta su rinkodara, gal buvo problema su sandėliu, gal pritrūko vadybininkų, gal buvo broko ar kokių kitų nesklandumų. Duomenų analizės nauda prasideda nuo atvirumo sau, nuo nuoširdaus noro išsiaiškinti, kur yra problemos šaknys ir noro ją išspręsti. O tai neįmanoma, jeigu kompanijoje vyrauja kaltų paieškos kultūra: natūralu, kad visi stengsis duomenis pagražinti ir parodyti save kuo geresnėje šviesoje.

Tad kai šiomis dienomis kas nors manęs paklausia, ko reikia imtis pirmiausia, kad duomenys padėtų priimti verslo sprendimus, atsakau, jog tai vadovų tikėjimas duomenų kultūra ir realus noras prisikasti iki tiesos. Net geriausi algoritmai jūsų verslui nepadės, jei sprendimai ir toliau bus priimami vien tik remiantis nenuginčijama aukščiausio vadovo nuomone arba jei save pagiriant analizės bus naudojamos tik gražesniam paveikslui valdybai pateikti. Pradėti reikia nuo kompanijos kultūros.

Siekiant išsaugoti verslą drąsių inovacijų nenusimato

Nežinau, kas yra iki galo teisus VP grupės konflikte, juolab, kad labai retai viskas būna tik juoda ar balta (todėl manau, kad Mindaugo požiūris yra pernelyg paprastas). Neturiu pakankamai žinių nuspręsti, kas teisinga, ir kas – ne, ar mokesčių buvo vengiama, ar jie buvo tik optimizuojami. Bus dar daug svarstymų, tyrimų, aiškinimų, paaiškinimų ir išaiškinimų, įvairiaspalvių knygų, teismų procesų, prašymų, atsiprašymų, dienraščių vedamųjų, interneto komentarų, sugižusio pykčio, beribės gausybės sakinių, paragrafų, dokumentų, kalbų ir apkalbų. Džiaugsis teisininkai, mokesčių patarėjai ir viešųjų ryšių specialistai.

Visas tas erzelis man priminė kažkada seniai seniai, prieš gerus ketvertą metų, užtiktą klausimą: ar mūsų visuomenėje ne per daug apskaitininkų ir auditorių? Kokia jų sukuriama vertė? Juk ekonomine prasme jie patys vargu ar ką sukuria – auditoriai tik priverčia kitus būti sąžiningesniais, o apskaitininkai turėtų padėti teisingai susimokėti mokesčius (na taip, ataskaitos reikalingos ir vadovams, kad jie galėtų priimti teisingus verslo sprendimus). O kaip su mokesčių patarėjais? Gaila, bet verslui užaugus iki tam tikro dydžio, mokesčių planavimas bei struktūros optimizavimas neretai pradeda tapti svarbiausiu vadovų bei akcininkų rūpesčiu. Verslo išsaugojimas ir reorganizavimas suvalgo didelę dalį laiko ir resursų, nebelieka kada galvoti apie naujų drąsių idėjų įgyvendinimą bei dar vieno milijardo uždirbimą: košės, petvarkų bei maišaties ir taip gana. Net akademiniai tyrimai rodo, kad kompanijos, kurios daro daug struktūros pakeitimų, jungimų, atskyrimų ir pertvarkymų grupės viduje inovacijomis nepasižymi – struktūros optimizavimo reikalai užgožia kūrybiškumą, tad rinką aplenkti galima nebent šviežias idėjas susipirkus išorėje. Naujo Uber ar Teslos sunku tikėtis ten, kur visiems ir taip pakanka kitų galvos skausmų.

Nors gal problema dar gilesnė ir kaltas konservatyvus lietuviškas požiūris į verslą: tik nedaugelis turi noro pakeisti pasaulį, svarbesniu išlieka siekis išsaugoti savo susikurtą gerovę. Tiesiog visa verslo aplinka ganėtinai dinamiška, gilias krizes keičia staigūs pakilimai, (ne)tikėti embargai, mokesčių reformos bei burbulai – rizikos ir taip per akis, tad stabilumas turi būti vertybė. Visa tai logiška ir pateisinama, gal tik norėtųsi, kad vertę kurtų drąsūs inovatoriai, o ne mokesčių patarėjai (ir aš pats labiau, deja, prie pastarųjų).