Kada duomenys gali padėti priimti sprendimus?

Prieš pusantrų metų mano rašytas dienoraščio įrašas apie duomenų kultūrą organizacijose pastarosiomis savaitėmis vėl iš naujo užkabino skaitytojus: šia tema parašė „Verslo žinios“ ir apie tai nemažai buvo kalbama Login koridoriuose. Matyt, kompanijose duomenų atsiranda vis daugiau, tik dar nelabai aišku, kaip iš jų išpešti naudos.

Kad ir kaip skambėtų neįprastai, manau, jog duomenų analizėje sudėtingiausia yra ne algoritmai ir ne duomenų infrastruktūra. Svarbiausia ne kur stovi jūsų serveriai, kokia kalba parašytos jūsų duomenų apdorojimo programos ar kuris kietas matematikas darys statistinę jūsų klientų analizę. Svarbiausia, ar jūsų kompanijos kultūra leis jums priimti verslo sprendimus remiantis šaltais ir objektyviais duomenimis, nekreipiant dėmesio į vidinį politikavimą ir norą prieš vadovą pasirodyti geresniu nei esi. Iš duomenų analizės jokios naudos (o netgi sakyčiau dar blogiau – ji žalinga!), jeigu ji naudojama tik savo išankstinei nuomonei apginti bei parodyti, kad jūsų padalinys dirba puikiai. Analitikai turėtų būti skatinami ieškoti kontraargumentų vyraujančiai nuomonei, nes duomenys tam ir yra, kad sprendimai būtų priimami ne vien tik pagal vadovo šeštąjį jausmą. Tai nelengva, jei vadovas galvoja, jog jis geriausiai viską išmano, o jam dirba tik jo valią vykdantys pavaldiniai.

Būti atviram pačiam sau nelengva bet kuriam vadovui. Kartais, žvelgiant į duomenis, reikia giliai įkvėpti ir pripažinti klydus: gal visgi už krentančius pardavimus yra kalti ne konkurentai ar oro temperatūra, o ne itin tobulas pačios kompanijos darbas. Gal nepataikyta su rinkodara, gal buvo problema su sandėliu, gal pritrūko vadybininkų, gal buvo broko ar kokių kitų nesklandumų. Duomenų analizės nauda prasideda nuo atvirumo sau, nuo nuoširdaus noro išsiaiškinti, kur yra problemos šaknys ir noro ją išspręsti. O tai neįmanoma, jeigu kompanijoje vyrauja kaltų paieškos kultūra: natūralu, kad visi stengsis duomenis pagražinti ir parodyti save kuo geresnėje šviesoje.

Tad kai šiomis dienomis kas nors manęs paklausia, ko reikia imtis pirmiausia, kad duomenys padėtų priimti verslo sprendimus, atsakau, jog tai vadovų tikėjimas duomenų kultūra ir realus noras prisikasti iki tiesos. Net geriausi algoritmai jūsų verslui nepadės, jei sprendimai ir toliau bus priimami vien tik remiantis nenuginčijama aukščiausio vadovo nuomone arba jei save pagiriant analizės bus naudojamos tik gražesniam paveikslui valdybai pateikti. Pradėti reikia nuo kompanijos kultūros.

Telefonas žino, kada tu nuėjai miegoti

Iš anksto įspėju: tai techniškas įrašas, kuris bus įdomus tik stiprokai užkietėjusiems duomenų analitikams, kurių negąsdina R ar Ruby. Jei šie dalykai jus nelabai domina, štai trumpa įrašo santrauka: jūsų telefonas gali kaupti daug įdomios informacijos apie jūsų judėjimą, mat jis moka būti ir žingsniamačiu. Tuos duomenis galima išsitraukti ir pribraižyti visokių gudrių grafikų, kurie parodo, kad kažkodėl antradieniais ir ketvirtadieniais jūs keliatės valandą anksčiau nei įprastai, 2015 metų gegužę kelias savaites praleidote kitoje Atlanto pusėje ar bent jau panašioje laiko zonoje, o tų pačių metų rugsėjo pradžioje buvote vakarėlyje, iš kurio grįžote apie 2 valandą ryto.

Išsitraukti duomenis iš iPhone telefono nesudėtinga: keli mygtukų paspaudimai, keletas minučių laukimo, ir sugeneruojamas nemažas XML archyvas. Jame yra ne vien tik nueiti žingsniai ir kilometrai, bet ir visi kiti Health programėlės duomenys: gal ten kada vedėtės savo svorį, gal dar koks Runkeeper ten saugojo bėgimo rezultatus ar panašiai – viskas bus viename archyve. Duomenų nemažokai: per pusantrų metų vien žingsniamačio duomenų buvo virš 130 tūkstančių įrašų. Iki 2015 kovo pabaigos, kai Apple išleido Apple Watch ir atnaujino žingsniamačio programinę įrangą, telefonas per dieną jų sugeneruodavo po kelis tūkstančius eilučių. Vos tik stabteli ir atsiranda naujas įrašas: per paskutinės keturias sekundes nuėjai 3,5 metro. Vėliau jau duomenys užrašinėjami ne tokiu jautrumu, tad duomenų mažiau, ir jie nebe tokie smulkūs (nors suminis nueitų žingsnių/kilometrų kiekis nepakito).

XML su Ruby konvertavau į CSV:

require 'nokogiri'
puts "start,end,source,dist"
doc = File.open('export.xml') { |f| Nokogiri.XML(f) }
doc.xpath("//Record[@type='HKQuantityTypeIdentifierDistanceWalkingRunning']").each do |record|
  puts "#{record['startDate']},#{record['endDate']},#{record['sourceName']},#{record['value']}"
end

Tada su R po nedidelių duomenų pakeitimų (tais atvejais, kai judėjimas tęsiasi per vidurnaktį, reikėjo įrašą išskaidyti į du segmentus: iki vidurnakčio ir po jo) sudėjau visus duomenis ant vieno grafiko. Aišku, kai duomenų eilučių šimtas tūkstančių, tai jis labiau primena baltąjį triukšmą, nors kai kurie dalykai visgi matosi: tarkim, galima matyti, jog 2015 gegužę judėjimo ir ramybės laikas ryškiai pasistūmęs, nes tuo metu buvau už Atlanto.

library(lubridate)
library(ggplot2)
library(data.table)

foo = read.csv("distances.csv")
foo$start_hour = hour(foo$start) + minute(foo$start)/60 + second(foo$start)/3600
foo$end_hour = hour(foo$end) + minute(foo$end)/60 + second(foo$end)/3600

foo_overlap = foo[end_hour < start_hour]
foo_overlap[end_hour < start_hour, start_hour := 0]
foo_overlap[end_hour < start_hour, start := end]
foo$end_hour = ifelse(foo$end_hour < foo$start_hour, 24, foo$end_hour)
foo_awesome = rbind(foo, foo_overlap)

ggplot(foo_awesome) + 
  geom_segment( 
    aes(
      x    = start_hour,
      xend = end_hour,
      y    = as.Date(start),
      yend = as.Date(start)
    ),
    size=0.7) +
  xlab("Paros laikas") + ylab("Data") + 
  scale_x_continuous(breaks=c(0,2,4,6,8,10,12,14,16,18,20,22,24), limits=c(0,24), expand=c(0,0)) + 
  scale_y_date(expand=c(0,0), date_breaks="2 month", date_labels = "%Y %b") + 
  guides(colour=FALSE)
Visi duomenys yra beveik kaip baltas triukšmas
Kai sudedi visus duomenis į vieną grafiką gauni beveik tik triukšmą

Akivaizdu, kad norint pamatyti ką nors gudresnio, reikia duomenis kaip nors pjaustyti ar grupuoti. Parą galima suskaidyti į intervalus po 10 minučių, ir kiekviename šių intervalų pažymėti ar buvo judama ar ne: duomenų kiekis sumažėja ir juos galima žymiai lengviau analizuoti. Grupuojant pagal savaitės dienas grafikas žymiai iškalbingesnis.

Mano aktyvumas pagal savaitės dienas
Mano aktyvumas pagal savaitės dienas: žalia – neaktyvu, kuo raudoniau/balčiau tuo daugiau judėjimo

Čia aiškiai matosi, kad antradieniais ir ketvirtadieniais keliuosi anksčiau, mat nuo 8 ryto einu į baseiną. Darbo dienomis apie 10 valandą būna mažokai judėjimo – tuo metu skaitau elektroninį paštą bei geriu kavą, kaip ir mažiau judėjimo apie 14-15 valandą, kai dirbu produktyviausiai. Savaitgaliais miegu dar ilgiau, o sekmadieniais iš lovos išlipu 9.30. Šeštadienis – aktyviausia diena, o sekmadienio vakaras tingus jau nuo pat 18-19 valandos.

Rūta Vanagaitė: Mūsiškiai

Tikriausiai apie Rūtos Vanagaitės „Mūsiškius“ sunku ką nors naujo pasakyti. Tai emocinė knyga, ne sausa monografija apie žuvusių ar žudžiusių statistiką, bet knyga, skirta sustoti ir pamąstyti apie didžiulę tragediją, pagalvoti, ką mes padarėme, kad tai nepasimirštų, kad kaltieji būtų teisingai įvertinti ir kad niekada niekada taip daugiau nepasikartotų. Ir iš tiesų sutinku, kad apie šią tragediją galvojame per mažai, lyg Lietuvos piliečių žydų aukos būtų buvę ne tokios svarbios kaip kitų, labiau „mūsiškių“, išvežtųjų į Sibirą ir persekiotų bolševikų. Dar dabar galima sutikti žmonių, kurie savyje nešioja man niekaip nesuprantamą neapykantą žydų tautai ir tiki „žydomasonų“ sąmokslais: galbūt tai tamsūs žmonės, kurie kartu tiki ir chemtreilais bei acto garinimu, bet vengdami Holokausto temos ir jo aiškaus pasmerkimo mes šio tamsumo niekaip nepragiedrijame.

Kad ir kokios emocijos vyrautų Rūtos Vanagaitės knygoje, niekaip negaliu sutikti su teze, jog lietuviai – žydšaudžių tauta. Lygiai taip galėtume sakyti, jog mes – girtuoklių, stribų bei vaikžudžių, mėtančių į šulinius savo vaikus, tauta. Tauta, kurioje nėra nei vieno teisiojo, kuri susideda tik iš nusikaltėlių, nepaisant to, jog žydus gelbėjusiųjų pasaulio teisuolių tarp mūsiškių irgi galima atrasti. Kiekvienoje tautoje yra žmonių, kurių nusikaltimai turi būti objektyviai išaiškinti ir pasmerkti, bet nusikaltėlių etiketės prilipdymas visai tautai vargu ar gali privesti prie gero. Priklijuota etiketė nepalieka vilties nebekartoti klaidų. Nurašo. Nesvarbu, kokias moralines vertybes įdiegsime savo anūkams, jie liks žydšaudžių tauta. Niekaip negaliu su tuo sutikti.

Visus nusikaltimus reikia tirti objektyviai ir teisingai, be baimės teisti bei pasmerkti tuos, kurie prie to prisidėjo. Nesvarbu, kad jie vėliau padarė dar daug kitų, gerų darbų – kovojo kaip partizanai ar padėjo galvas už laisvę. Tik čia nepamesti šaltos galvos tikrai nelengva, kaip galima matyti ir iš knygoje pateiktų Efraimo Zurofo minčių: tai pilna emocijų tema, kai kur jau apaugusi legendomis, kai bandymai suvokti baisius dalykus darusių motyvus pasitikami riksmu „tu bandai teisinti nusikaltėlius!!“. Ne, neteisinu, bandau suvokti, kas atsitiko ir suprasti ką daryti, kad tai daugiau niekada nepasikartotų. Juk praradome tiek daug saviškių – Lietuvos piliečių.

Marketingistai yra iš Marso, o vartotojai – iš Grigiškių

Nedažnai pasiseka paimti į rankas knygą, kuri argumentuotai apverčia požiūrį į kokią nors sritį. Bob Hoffman‘o „Marketers are from Mars, Consumers are from New Jersey“ išspardė iš galvos visus naujoviškus įsitikinimus apie internetinę bei socialinių medijų rinkodarą ir grąžino į realybę. Dėkui Tomui Ramanauskui už nuorodą.

Esate perskaitę visas Seth Godin knygas ir galvojate, jog socialiniai tinklai visiškai pakeitė rinkodarą, reklamos amžius praėjo ir dabar vartotojai nori būti įtraukti į bendravimą su jūsų prekės ženklu? Kad vartotojams patinka interaktyvi reklama? Kad jie gali įsimylėti „Žemaitijos žvaigždžių“ kefyrą ar nepailstamai domėtis „Vilniaus Gardėsio“ batono istorija? Jums reikia paskaityti šią knygą. Paprastam vartotojui prekių ženklai ne itin rūpi: net jei parduotuvėse dingtų toks stiprus prekinis ženklas kaip Coca-Cola, didžioji dalis vartotojai neimtų inkšti, protestuoti ar trypti kojomis – jie ramiai kitą kartą į krepšelį įsidėtų Pepsi. Vartotojas visai nenori su dauguma prekės ženklų gulti ir keltis, apie juos svajoti ir galvoti, išgyventi jų istoriją, kartu su jais dūsauti, duše niūniuoti daineles, jais gėrėtis ar kartu su jais keisti pasaulį: vartotojas tikisi, jog jis už gerą kainą gaus kokybišką daiktą ar paslaugą ir tiek. Tai labai akivaizdžiai galima matyti ir socialiniuose tinkluose: net ir tokie grandai kaip Red Bull, turintys milijonus fanų bei sekėjų, savo Facebook įrašuose surenka tik keletą tūkstančių „patiktukų“ – 99,9% fanų (!) jie visiškai neįdomūs. Analizė sako, kad Facebooke vartotojai sureaguoja į 0,07% prekinių ženklų skleidžiamo turinio, o Twitteryje – tik į 0,03% (taip, atitinkamai 7 ir 3 iš 10,000!). Socialiniai tinklai ne taip jau radikaliai pakeitė rinkodarą kaip skelbia naujųjų medijų pranašai: geriausiai vis dar veikia senamadiška masinė reklama.

Knygoje dar daug įdomių pastabų apie rinkodarą (tarkim, reikia pardavinėti ne hipsteriams, o penkiasdešimtmečiams, nors tai ir ne taip kieta: penkiasdešimtmečiai turi žymiai daugiau pinigų) ir reklamą. Perskaičiau su malonumu, net jei ir apie šią sritį beveik nieko neišmanau.

Dailius Dargis: 13 tamsaus lietuviško verslo paslapčių

Labai ilgai laukiau, kad kas nors su visu rimtumu ir atsidėjimu imtųsi parašyti lietuviško verslo istoriją: apie pirmuosius šiuolaikinės Lietuvos verslininkus vyšniniais švarkais, apie metalų perpardavinėjimą, investicinius čekius, privatizacijos istorijas, apie nusisekusius ir ne tokius sėkmingus verslus, bankus, finansų piramides, apie tuose drumzlinuose istorijos vandenyse sėkmingai sugebėjusius žvejoti drąsuolius ir tik savo sąžinės bei apsukrumo dėka išplaukusius verslo didvyrius. Su daug analizės, skaičių, profesionaliais komentarais, šimtais dokumentinių šaltinių bei liudininkų pasakojimų. „13 tamsaus lietuviško verslo istorijų“ nėra ta knyga.

Nors Dailiaus Dargio knygos idėja gal ir buvo panaši, bet kompetencijos tam tikrai pritrūko. Gilesnės analizės čia vargu ar galima atrasti, tėra tik keletas žinomų faktų apie verslininkų sovietinių laikų teistumus: ir nors tai irgi yra svarbūs faktai, bet jie nebūtinai yra esminės verslininkų portretų dalys. Juk kur kas įdomesnis turėtų būti gilus verslininkų iškilimo bei pinigų uždirbimo istorijų tyrimas. Deja, pakrapštymas labai paviršutiniškas, apsiribojama vos vienu kitu šaltiniu, o apie tuos, kurie sutiko su autoriumi pakalbėti, tik žodis žodin skamba pačių herojų nuomonė. Tame nieko blogo, bet iki tiriamosios žurnalistikos tolokai. Gal neužteko tam laiko.

Net ir tie skyriai, kuriuose bandoma kastis giliau (dažniausiai todėl, kad verslininkai apie savo istoriją patys atsisakė kalbėtis) gavosi silpnoki ir menkai įtaigūs. Pavyzdžiui, minima apšepusi sodyba Molėtų rajone, kurioje, anot autoriaus, slaptiems pasitarimams rinkdavosi VP grupės nariai, o kaip to įrodymas pateikiamas kaimo gyventojų liudijimas, jog jie matė ten besilankančias mašinas su Maximos lipdukais. Kartais atrodo, jog autorius dega begaliniu noru atrasti sensacingų faktų, net jeigu tai ir ne itin sekasi: skyriuje apie Bronislovą Lubį kone penketui pašnekovų vis buvo užduodamas klausimas, ar jo mirtis jiems neatrodo keista. Jiems visiems neatrodė.

Manau, kad kompetetingai parašyti gilaus žurnalistinio tyrimo knygą apie ankstyvąjį lietuvišką verslą yra labai sunku – ir to darbo galėtų imtis gal tik keletas žmonių, kurie verslu domisi jau ne vieną dešimtmetį. Tam reikia labai daug kruopštaus darbo ir srities išmanymo, knaisiojimosi finansiniuose duomenyse, žiniasklaidos archyvuose, ataskaitose ir akcininkų sąrašuose. Tokios knygos, kuri ne vien papasakotų kelis faktus, bet ir nuodugniai skaičiais pagrįstų bei sudėliotų visą verslo istorijos paveikslą vis dar viltingai laukiu. Juk svajoti galima?

Lietuvos toponimų žemėlapis

Prieš keletą dienų užtikęs smagią Vokietijos miestų priesagų vizualizaciją, užsinorėjau ką nors panašaus papaišyti ir su Lietuvos duomenimis. Juolab, kad tai galimybė pažaisti su vis naujais ir dar nepažintais įrankiais bei programomis: ne vien ką nors įdomaus išpeši iš duomenų, bet ir išmoksti ką nors naujo. Duomenis ėmiau iš geonames, analizei ir piešimui naudojau QGIS, MMQGIS bei Mapbox.

-aičiai yra visiškai žemaitiška priesaga
-aičiai yra visiškai žemaitiška priesaga

Įdomiausios priesagos pasirodė -aičiai ir -onys: pirmieji ryškiai dominuoja Žemaitijoje, o antrųjų pas žemaičius beveik nerasi. -ininkai lyg ir Dzūkijos bei Panemunės mada. -upiai žymiai populiaresni nei -ežeriai, kurių net ežeringiausiuose kraštuose retai sutiksi. Visi žemėlapiai ir priesagos šiame puslapyje.

-onių Žemaitijoje nerasi
-onių Žemaitijoje beveik nerasi

Negalima pasitikėti tuo, ką skaitai apie maisto naudą ar žalą

„Įrodyti“, kad vienas ar kitas maisto produktas yra labai sveikas ar didina grėsmę ligoms yra labai labai LABAI sunku. Todėl ir tiek konfliktuojančių teorijų bei madingų dietų. O gal tiesiog geriausia nekreipti į nieką dėmesio ir valgyti tai, kas patinka.

Šaltinis: You Can’t Trust What You Read About Nutrition | FiveThirtyEight

Šimto valandų taisyklė

Jeigu pamenate Gladwello išpopuliarintą 10,000 valandų taisyklę (taip, ji nėra moksliškai pagrįsta, ir iš tiesų traukta iš ausies, bet vis tiek daug kas ją kartoja), kuri teigia, jog jums reikia paskirti dešimt tūkstančių valandų kuriai nors sričiai ir tapsite jos pasauliniu lyderiu, tai jus gali padrąsinti supaprastinta šios taisyklės versija: užtenka tik 100 valandų mokymosi, jog bet kurioje srityje taptumėte geresni nei dauguma žmonių.

Šaltinis: The 100-Hour Rule · Coding VC