Savaitė be nuosavo automobilio

Nežinau už kokius nuopelnus, bet šią savaitę buvau pakviestas prisijungti prie Europos judrumo savaitės (European Mobility Week) akcijos #ditchyourkeys ir ištisas septynias dienas atsisakyti savo automobilio. Tiesa, tam kad šis iššūkis nebūtų labai sudėtingas, akcijos rėmėjai Uber, Vilniaus Viešasis Transportas, Cyclocity, Citybee bei Spark suteikė galimybę šiomis dienomis jų paslaugomis naudotis nemokamai – tad per šią savaitę galėjau išbandyti visokiausius judėjimo po Vilnių būdus, kuriais iki šiol nesinaudojau.

Už Vilniaus ribų šiomis dienomis neplanavau niekur vykti, o pasižiūrėjęs į savo judėjimo istoriją, supratau, kad mano geografija buvo ganėtinai ribota: visą laiką maliausi tarp namų Lazdynuose, senamiesčio ir dviejų klientų biurų. Į kitas seniūnijas dažniausiai koją buvau įkėlęs tik epizodiškai: arba pro jas pakeliui pravažiuodamas, arba ten užsukdamas tik kelioms valandoms dėl kokio konkretaus tikslo. Tiesą pasakius, galvojau,kad mano kelionių geografija platesnė, bet visgi ši savaitė ganėtinai gerai atitinka mano judėjimo įpročius: 95 procentus laiko praleidi tose pačiose vietose ar judėdamas tarp jų.

Visą savaitę praleidau arba Lazdynuose, kur gyvenu, arba Naujamiestyje bei Senamiestyje

Detalesnis intensyvių vietų žemėlapis (heatmap) iš principo rodo tą patį: yra namai Lazdynuose, klientų biuras Konstitucijos prospekte, bei Gedimino prospektas. Į Karoliniškes savaitgalį su šeima ėjau pasivaikščioti pėsčiomis, o dažniausiai važiuoju Geležinio Vilko gatve, kuriame stoviniuoju kamštyje prie Gerosios Vilties žiedo.

Detalesnis žemėlapis rodo, jog mano laikas buvo praleistas namie (Lazdynai), Quadrum verslo centre bei Gedimino prospekte.

Tad kaip man sekėsi mieste judėti be automobilio? Per savaitę visomis transporto rūšimis nuvažiavau iš viso 140.3 kilometrų ir neteko pasinaudoti tik Cyclocity paslaugomis. Visgi lietinga rudens savaitė sėsti ant dviračio neviliojo – manau esant geresniam orui dviračiais tikrai būčiau pasinaudojęs. Vienas tokio judėjimo be savo automobilio privalumų yra tas, kad nereikia mokėti už parkavimą: paskaičiavau, jog per šią savaitę už parkavimą būčiau susimokėjęs apie 19-20 eurų (nemažai laiko praleidau Gedimino prospekte, kur už parkingą moku pats). Priskaičiavus visokius automobilio nusidėvėjimo kaštus (maždaug 30 eurų per savaitę) bei išlaidas už kurą gaunu, jog jei visur būčiau važinėjęs su nuosava mašina, tai transportui būčiau išleidęs apie 65 eurus, arba vidutiniškai 0.46 EUR už kilometrą.

Nuvažiuoti kilometrai pasiskirstę gana tolygiai

Čia nuvažiuotų kilometrų suvestinė:

Kelionių skaičius Viso km Viso kaina, € Vidutinė km kaina
Uber 6 51.4 43.76 0.851
Citybee 6 38.0 28.01 0.737
VVT 4 29.1 2.85 0.098
Spark 3 21.8 11.04 0.506
Bendrai 19 140.3 85.66 0.611
Palyginimui: nuosavas Subaru 140.3 64.65 0.461

Aišku, žiūrint pagal kainą, tai vienareikšmiškai su Vilniaus miesto autobusais ir troleibusais konkuruoti niekas negali – važiuoti viešuoju transportu yra 5-10 kartų pigiau nei bet kaip kitaip. Uber liko brangiausias, nors iš dalies dėl to, kad penktadienio vakare net kelis kartus teko juo važiuoti piko metu, kai kainos buvo žymiai pakeltos (vienos kelionės metu pataikiau net ant 2.2x surge pricing!). Užtat Uber buvo pats greičiausias sprendimas: iki įsėdimo į transporto priemonę praeidavo mažiausiai laiko, o be to priveždavo prie durų ir nereikėjo ieškoti vietos kur paparkuoti ir palikti mašiną.

Iki šiol nebuvau naudojęsis nei Citybee, nei Spark paslaugomis, bet jau tikrai žinau, kad tai ne paskutinės kelionės šiomis nuomotomis mašinomis. Citybee man patogi tuo, jog galiu mašiną palikti ir pasiimti tiesiai prie laiptinės durų, nors, tiesa, ryte neretai aplink namus buvo laisvų mašinų trūkumas, tad tekdavo arba pėdinti gerą puskilometrį arba visgi kviestis Uberį. Spark pasirodė kaip labai ekonomiškas transporto variantas, tik bėda tame, jog iki namų juo nusigauti negaliu – arčiausiai, kur galiu palikti mašiną yra prie Litexpo. Tad deja, Spark man tinka tik trumpoms kelionėms miesto centre, nors pagal kilometro kainą jis labai konkurencingas su nuosavos mašinos kaštais.

Savaitgalį keliaudavau ne vienas, o su vienerių metų dukra bei vežimėliu. Tokioms kelionėms visgi patogiausia yra viešasis transportas. Savaitgaliais autobusai apytuščiai, ir į juos labai patogiai galima įvažiuoti su visu vežimu, o tai net kai kuriais atvejais nukonkuruoja ir nuosavą mašiną: nei vežimo lankstyti, nei pasivaikščiojus mieste būtinai grįžti iki ten, kur palikai mašiną. Jau nekalbu apie tokio transporto kainą. Bėda tik su senaisiais troleibusais: užsikelti vežimą per laiptelius yra reikalų, o ir praėjimai siauri, nėra erdvės. Jei visi troleibusai ateityje bus atnaujinti, tai viešasis transportas keliaujant su dukra iš vis bus vienvaldis nugalėtojas.

Tad, ar galima Vilniuje apsieiti be nuosavos mašinos? Galima. Tik iki pilno komforto reiktų atnaujinti troleibusus (kas, girdėjau, vyksta) ir leisti man prie namų parkuotis Spark.

Lietuvos miestų gatvės

Miestų žemėlapiai mane traukia kaip blizgučiai šarkas: nuo pat mažų dienų mėgau ištisas valandas juos tyrinėti vedžiodamas pirštais autobusų maršrutus, šnabždėdamas sau gatvių pavadinimus ir įsivaizduodamas miesto gyvenimą pagrindinėse sankryžose. Tad Rūtai užrodžius naują Pitono modulį OSMnx, kuris leidžia iš openstreetmaps duomenų nupiešti labai estetišką Allan Jacob knygos „Great Streets“ stiliaus žemėlapį negalėjau susilaikyti jo neišbandęs. To rezultatas: visų Lietuvos miestų centrinės kvadratinės mylios žemėlapiai.

Tokiuose žemėlapiuose dažniausiai į akį krenta kvartalų simetrija ir tvarka, o Lietuvoje to beveik neįmanoma rasti. Lietuvoje nedaug miestų, kuriame stipriai būtų padirbėjusi miesto planuotojo liniuotė: neskaitant įvairausių sodų ir garažų bendrijų itin tvarkingą smulkų gatvių tinklelį galima rasti Klaipėdos senamiestyje, ir tik Palanga, Šalčininkai ar Tauragė išlaiko daugiau mažiau kvadratinių kvartalų tinklą. Stebėtis nereikėtų: miesteliai kūrėsi gana seniai ir ne tuščiose vietose, dar prieš bandant natūralų procesą suvaldyti miesto architektams.

Tauragė išplanavimu panaši į Amerikos miestus

Itin įdomus naujai projektuotų miestų gatvių tinklas: Elektrėnai atrodo lyg įsprausti į vienos gatvės žiedą. Tokį patį dirbtinio suspaudimo įspūdį daro ir Ventos žemėlapis – vienoje kelio pusėje senoji individualių namų Venta, o kitoje – daugiaaukščių rajonas.

Senoji Venta vienoje kelio pusėje labai skiriasi nuo naujosios Ventos kitoje

Vienas svarbiausių faktorių, nulemiančių gatvių tinklą yra vandens telkiniai ir upės: jos skiria miesto dalis, arba atvirkščiai – įspraudžia į rėmus (pvz. Trakai). Nors kartais tokią funkciją atlieka geležinkelis – Varėna lyg nurėžta bėgių linijos.

Įsprausti tarp ežerų Trakai

Visgi man gražiausias Lietuvos miestų gatvių tinklas yra Zarasuose. Reikės kada apsilankyti.

Zarasų gatvių planas

Čia yra dar bent šimtas kitų žemėlapių. Tereikia pasirinkti miestą.


Sociologinės apklausos apie politiką – vėluojantis indikatorius

Šiandien delfi.lt pateikdamas naujausius apklausų duomenis rašo:

Apklausa buvo atlikta spalio 19-27 dienomis, vadinasi, dalis žmonių apklausta iki antrojo rinkimų turo spalio 23 dieną, dalis – po jo. Per tą laiką labai išaugo S. Skvernelio populiarumas: nuo 5,4 proc. iki 13,4 proc. Tai tikriausiai nenuostabu, nes Valstiečių ir žaliųjų sąjunga būtent šį politiką siūlo užimti premjero pareigoms. Paūgėjo ir Tėvynės sąjungos-Lietuvos krikščionių demokratų pirmininko Gabrieliaus Landsbergio reitingas nuo 9,3 proc. iki 12,6 proc.
[…]
Tuo metu ilgą laiką visuomenės nuomonės ir rinkos tyrimų bendrovės apklausose pirmu numeriu figūravęs socialdemokratų lyderis A. Butkevičius patyrė reitingų nuosmukį: jo galimybės eiti šias pareigas gyventojai po rinkimų labai suabejojo ir šio politiko populiarumas smuko nuo 23 proc. iki 9,3 proc.

Visi šie pokyčiai labai aiškiai atsispindi reitingų grafike:

Kas tiktų į premjerus

Kyla labai natūralus klausimas, ar tokių apklausų metų gaunami reitingai vertingi nuspėjant ateitį – bent jau iš duomenų atrodo, jog jie yra labiau vėluojantis politinio populiarumo indikatorius, į kurį per daug dėmesio kreipti nereikia (pamoka socialdemokratams?). Dar daugiau – įtarčiau, jog populiarumas apklausose tiesiogiai susijęs su politikų paminėjimo dažnumu (ir kontekstu) žiniasklaidoje. Kuo daugiau apie konkretų žmogų kalbama kaip apie galimą premjerą, tuo daugiau kam jis atrodys tinkamas šiam darbui.

Tikriausiai tuo labai stebėtis nereiktų, mat jeigu manęs kas gatvėje sustabdęs paklaustų, kokia amerikietiško futbolo komanda kitais metais laimės Super Bowl, atsakyčiau „Green Bay Packers“, bet tik todėl, kad tai bene vienintelis komandos pavadinimas, kurį žinau. Amerikietišku futbolu visiškai nesidomiu ir nieko apie jį nenutuokiu, ir, tikėtina, jog panašiai apie tinkamus kandidatus premjero poste galvoja ir kiti apklausose dalyvaujantys: lengviausia paminėti tuos kandidatus, apie kuriuos dažniausiai pastaruoju metu kalbama viešojoje erdvėje. Ar tai reiškia, kad apklausos yra visiškai bevertės? Ne, eliminavus paminėjimų viešojoje erdvėje dažnumo efektą skaičiai galėtų tapti iškalbingesni. Jei dažnai apie kurį nors kandidatą kalbama, bet jis nefigūruoja apklausose, galima suprasti, jog jis tarp žmonių stipriai nemėgiamas (to geras pavyzdys buvo liberalų reitingų kritimas po Masiulio skandalo – paminėjimų daug, o reitingai pažemėje).

Antro rinkimų turo prognozė pasitelkiant neuroninius tinklus

Pirmiausia turiu įspėti: nemanau, kad reikėtų į gautus rezultatus žiūrėti labai rimtai. Neuroninio tinklo mokymui naudojau tik 2012-ų metų Seimo rinkimų apygardų duomenis, tad imtis labai nedidelė, o tai turėtų lemti ir gana nemažą paklaidą prognozėse. Galbūt tikslesnių rezultatų būtų galima tikėtis naudojant apylinkių, o ne apygardų duomenis.

Prognozuoti šių metų rezultatus iš 2012-ų metų duomenų nelengva ir dėl stipriai pasikeitusio partijų populiarumo: žalieji valstiečiai prieš ketverius metus nebuvo labai patrauklūs rinkėjams, o ir Skvernelio atsiradimas labai šią partiją pakeitė. Įdomu tai, kad Darbo partijos bei tvarkiečių kritimas iš aukštumų gana gerai atsispindi neuroninio tinklo rezultatuose: jiems prognozuojama laimėti mažiau apygardų nei jie šiuo metu pirmauja.  Kad ir kaip ten būtų, gavau tokį rezultatą:

Prognozė Dabar pirmauja
LVZS 24 21
TSLKD 24 22
LSDP 9 10
LRLS 5 4
LLRA 3 3
TT 2 4
KITI 1 2
DP 1 3
NEP 2 2

Neuroninis tinklas „išmoko“, jog stiprus lenkų pirmavimas apygardoje dažniausiai lemia ir pergalę antrame ture. Algirdui Paleckiui pergalė neprognozuojama, nes istoriniai pernai metų duomenys rodo, jog „Frontui“ ne itin sekėsi – bet jo puikus pasirodymas pirmame ture tikriausiai buvo netikėtas ir daugeliui politikos analitikų. Keisčiausia prognozė, kuria sunku patikėti yra 52-oje Visagino-Zarasų apygardoje, kurioje antrame ture kausis Darbo partija su tvarkiečiais (pergalė prognozuojama Darbo partijai, nors stipriai pirmauja tvarkietis Dumbrava). Keistoka, bet gal ir logiška 40-osios Telšių apygardos prognozė, kur stipriai pirmaujantis darbietis turi mažai šansų atsilaikyti prieš valstietį Martinkų. Kaip jau minėjau, Darbo partijai šis modelis daug šansų nepalieka. Visas apygardų sąrašas su prognozuojamais nugalėtojais ir tikimybėmis, kad nugalės pirmaujantis:

Turint nedaug istorinių duomenų tikriausiai labiau pasitikėčiau politikos ekspertų prognozėmis konkrečioje apygardoje arba modeliuočiau tikimybes kiek kurios partijos rėmėjų ateis į antrą turą bei palaikys ne savo partijos kandidatą: būtent tokį modelį ruošia WebRobots komanda, kuri leido man pasinaudoti jų surinktais iš VRK duomenimis. Idėja patreniruoti neuroninį tinklą ir kilo susidūrus su problema ar nebūtų galima kaip nors statistiškai išskaičiuoti tikimybių, kiek, tarkim, socialdemokratų palaikytų konservatorių kandidatą jei jis būtų likęs prieš darbietį. Taip pat galima pažiūrėti į Vaidoto Zemlio prognozes.

Post Mortem

Rezutatai buvo stipriai kitokie, nei buvo tikimasi: daugiausiai prašauta (tikriausiai dėl to, kad 2012-aisias valstiečiai pasirodė ne itin įspūdingai) su LVŽS ir TSLKD. Tam tikros tendencijos buvo teisingos – Darbo partija, Tvarka ir Teisingumas bei Socialdemokratai iš tiesų gavo mažiau mandatų nei buvo pirmaujama po pirmo turo, tuo tarpu liberalai sugebėjo laimėti daugiau apygardų nei pirmavo po pirmo turo, tačiau šių pokyčių mastas buvo žymiai (žymiai žymiai) didesnis. Iš viso, neuroniniai tinklai sugebėjo atspėti 48 apygardas (67% tikslumas). Palyginimui – rankomis dėliotas Webrobots komandos modelis pasiekė 80% tikslumą. Tiesa, atmetus kai kuriuos nelogiškus neuroninio tinklo siūlymus, kurie plika akimi atrodė keisti ir pataisius prognozę Dainavos apygardoje dėl Vinkaus skandalo (ko iš 2012-ųjų duomenų niekaip nebuvo galima žinoti), buvo galima pasiekti maždaug 75% procentų tikslumą. Ne kažką, bet šis tas.

Skaičiuojant modelio patikimumą, dažnai žiūrimas plotas po Receiver Operating Characteristic (ROC) kreive (kuo gerenis modelis, tuo jis turėtų artėti link vieneto). Štai modelių palyginimai:

Area under ROC curve
Neuroninis tinklas (tikimybės) 0.597143
Webrobots modelis 0.708095
Neuroninis tinklas (binarinis) 0.549048
Laimės pirmaujantis 1 ture 0.500000
Laimės pirmaujantis daugiamandatėje 0.487619

O čia pačios ROC kreivės:

Skirtingų modelių ROC kreivės

 

Skaitykite toliau

Kaip skiriasi partijos pagal Manoseimas.lt duomenis

Prieš kelias dienas pasirodė manoseimas.lt svetainė, kurioje, atsakius į 12 klausimų, galima pasilyginti, kuri partija buvo arčiausiai jūsų nuomonės. Buvo įdomu paanalizuoti, kurios partijos yra panašiausios ir kiek jos skiriasi. Liberalai ryškiai kitokia opozicinė partija, bet išties, jiems artimiausi socialdemokratai, o ne konservatoriai.

Koreliacijos tarp partijų

Manoseimas.lt pateikia duomenis apie partijų balsavimus dvylika klausimų. Sudėjus visus duomenis į vieną CSV (kurį galima rasti http://petras.kudaras.lt/notebooks/manoseimas.csv) galima paskaičiuoti koreliacijas tarp partijų balsavimo:

data = read.csv2('/Users/petras/dev/manoseimas.csv', sep=',', header=T, row.names=1)
data = data/100
t(data[1:7,])
##                           TT   DP LSDP   AW LRLS   MG TSLK
## Šauktiniai              0.92 0.89 0.96 0.72 0.95 0.79 0.91
## Meras                   0.82 0.94 0.89 0.85 0.31 0.89 0.55
## Internetinis_balsavimas 0.49 0.80 0.91 0.11 1.00 0.74 0.22
## Darbo_kodeksas          0.91 0.79 0.98 0.15 0.95 0.41 0.42
## Švietimas               0.91 0.92 0.86 0.60 0.29 0.63 0.42
## Vaiko_teisės            0.74 0.78 0.91 0.44 0.76 0.40 0.34
## Alkoholis               0.59 0.53 0.55 0.68 0.44 0.75 0.82
## Pensijos                0.79 0.85 0.89 0.25 0.88 0.24 0.30
## Pabėgėliai              0.96 0.91 0.97 0.89 0.59 0.84 0.84
## Dviguba_pilietybė       0.94 0.90 0.94 0.83 0.91 0.81 0.64
## Asmenvardžiai           0.81 0.61 0.69 0.83 0.51 0.29 0.15
## Privati_informacija     0.76 0.76 0.81 0.59 0.75 0.63 0.74
kable(round(cor(t(data[1:7,])), 2))
TT DP LSDP AW LRLS MG TSLK
TT 1.00 0.57 0.50 0.45 -0.08 0.04 0.30
DP 0.57 1.00 0.85 0.07 0.10 0.36 0.13
LSDP 0.50 0.85 1.00 -0.23 0.51 0.12 0.00
AW 0.45 0.07 -0.23 1.00 -0.57 0.48 0.52
LRLS -0.08 0.10 0.51 -0.57 1.00 -0.19 -0.06
MG 0.04 0.36 0.12 0.48 -0.19 1.00 0.68
TSLK 0.30 0.13 0.00 0.52 -0.06 0.68 1.00

Mano paties rezultatai manoseimas.lt svetainėje mane nustebino, nes, pasirodo, mane geriausiai atstovauja Tvarkos ir Teisingumo partija. Iš tiesų, jų koreliacija su mano nuomone yra tampriausia.

kable(round(cor(t(data)), 2))
TT DP LSDP AW LRLS MG TSLK PETRAS
TT 1.00 0.57 0.50 0.45 -0.08 0.04 0.30 0.61
DP 0.57 1.00 0.85 0.07 0.10 0.36 0.13 0.12
LSDP 0.50 0.85 1.00 -0.23 0.51 0.12 0.00 0.07
AW 0.45 0.07 -0.23 1.00 -0.57 0.48 0.52 0.41
LRLS -0.08 0.10 0.51 -0.57 1.00 -0.19 -0.06 -0.01
MG 0.04 0.36 0.12 0.48 -0.19 1.00 0.68 -0.24
TSLK 0.30 0.13 0.00 0.52 -0.06 0.68 1.00 -0.07
PETRAS 0.61 0.12 0.07 0.41 -0.01 -0.24 -0.07 1.00

Pagrindinių komponenčių analizė

Nenuostabu, jog Facebooke daugelis save laikančių liberalais pamatė, jog jiems geriausiai atstovauja LSDP: liberalų koreliacija su šia partija tikrai geriausia. Bet matyt koreliacijos nėra viskas. Gal galima nupiešti partijų pozicijas vienoje koordinačių erdvėje? Tam galima panaudoti pagrindinių komponenčių analizę (principal component analysis) ir išskirti tiesiškai nepriklausomas komponentes. Tada galima pabandyti pavaizduoti partijas viename dvidimensiniame grafike.

  ggbiplot(prcomp(data[1:7,]/100, center=T), scale=0, 
           labels=rownames(data[1:7,]), var.axes=F)

Nieko keisto, kad koalicijos partnerės LSDP, TT ir DP balsuoja labai panašiai - jos ir glaudžiasi viename grafiko kampe. Tuo tarpu LRLS yra labai skirtinga opozicinė partija, ji patenka visai į kitą kampą nuo TSLK ar kitų opozicinių partijų. Kita vertus, nors LRLS ir geriausiai koreliuoja su LSDP, ji tolokai nuo jos nutolusi. Lygiai kaip ir nuo TSLK.

Tai į ką aš panašus?

Padariau interaktyvų grafiką: pastumdžius atsakymus, galima pastebėti, kaip artėjama ar tolėjama nuo vienos ar kitos partijos. Labiausiai nuo liberalų skiriuosi tuo, kad esu prieš internetinį balsavimą. Būtent šitas klausimas geriausiai atspindi radikalų skirtumą ašyje tarp lenkų AW ir LRLS ir labai stipriai mane atitolina nuo liberalų. Žaistis bus žymiai patogiau, jei atsidarysite šią nuorodą naujame lange: https://petras.shinyapps.io/manoseimas/

Įtakingiausių verslininkų analizė

Vakar dariau šiokią tokią analizę, apie kurią jau rašiau Facebooke. Šiandien tiesiog bandau būdą, kaip įkelti šią analizę į dienoraščio formatą. Geresnę notebook versiją galima rasti čia, o žalius duomenis šiuo adresu.

Svarbiausia pastraipa tiems, kas tingi skaityti viską:

Įdomu tai, kad politikai daug įtakos suteikia asociacijų ir konfederacijų veikėjams, bet verslininkams jie įspūdžio nedaro: grafiko apačioje liko Danas Arlauskas bei Stasys Kropas. Matyt politikams su jais tenka nemažai bendrauti, bet reali jų įtaka kyla ne iš pačių asmenybių, o iš atstovaujamų interesų. Tuo tarpu verslininkai žymiai daugiau reikšmės suteikia Dariui Mockui bei Nerijui Numavičiui: asmenims, kurie atstovauja savo pačių interesus. Gal kiek netikėtai trečias tarp labiausiai politikų nuvertintų verslininkų yra Dalius Misiūnas: energetika verslininkams labai svarbu, bet ji kontroliuojama valstybės ir pačių politikų, tad politikai energetikų galios nesureikšmina.

Tarp didžiųjų bankų ekonomistų irgi įdomus prasilenkimas: Gitanas Nausėda bei Raimondas Kuodis yra politikų ekonomistai, o Nerijus Mačiulis ir Jekaterina Rojaka – labiau verslininkų.

Delfi įtakingiausi verslininkai

Kiekvienais metais portalas Delfi daro svarbių žmonių apklausas ir taip išrenka įtakingiausius šalies žmones. Pasižiūrėjus į įtakingiausių verslininkų rinkimus pasirodė, jog politikai ir patys verslininkai labai skirtingai vertina tam tikrų verslininkų įtaką, tad ką politikai nuvertina ar pervertina?

Tam pirmiausia reikėjo išsivalyti duomenis. Po keliasdešimt search-replace operacijų iš HTML teksto pasidariau švarų CSV, kuris jau tinkamas analizei.

verslas = read.csv2('/Users/petras/datadev/verslininkai.csv', header=TRUE, sep=",")
head(verslas)
##         Verslininkas Politiku_balas Verslininku_balas Pop_balas
## 1    Robertas Dargis            128                89         9
## 2    Gitanas Nausėda             93                62         9
## 3      Darius Mockus             58                68        16
## 4 Nerijus Numavičius             56                62        18
## 5   Nerijus Mačiulis             41                39         4
## 6     Arvydas Avulis             36                22         4
##   Ziniasklaidos_balas Visuomenininku_balas Tarnautoju_balas
## 1                  54                   80              103
## 2                  46                   64               78
## 3                  53                   36               56
## 4                  50                   36               41
## 5                  30                   28               42
## 6                  23                   17               51

Duomenų normalizavimas

Žymiai patogiau dirbti su santykiniais skaičiais, tad absoliučius balus paverčiau į santykinius, padalindamas juos iš kiekvienos kategorijos respondentų skaičiaus (bent jau spėju, jog būtent tai reiškia maksimalus galimas balų skaičius kategorijoje). Santykinis rodiklis reiškia, kokia dalis respondentų pažymėjo konkretų verslininką kaip vieną iš 5 įtakingiausių Lietuvoje.

verslas %>% 
  mutate(Politiku_balas = Politiku_balas / 196) %>%
  mutate(Verslininku_balas = Verslininku_balas / 137) %>%
  mutate(Pop_balas = Pop_balas / 29) %>%
  mutate(Ziniasklaidos_balas = Ziniasklaidos_balas / 93) %>%
  mutate(Visuomenininku_balas = Visuomenininku_balas / 106) %>%
  mutate(Tarnautoju_balas = Tarnautoju_balas / 160) -> verslas

Tiesinė regresija

Pritaikome paprastą tiesinę regresiją.

fit <- lm(Verslininku_balas ~ Politiku_balas, data=verslas) -> fit
summary(fit)
## 
## Call:
## lm(formula = Verslininku_balas ~ Politiku_balas, data = verslas)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.118173 -0.017360  0.002104  0.012048  0.192314 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -0.002738   0.006480  -0.423    0.674    
## Politiku_balas  1.036687   0.049748  20.839   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.04563 on 68 degrees of freedom
## Multiple R-squared:  0.8646, Adjusted R-squared:  0.8626 
## F-statistic: 434.3 on 1 and 68 DF,  p-value: < 2.2e-16

Kad jau turime regresiją, kurios R^2 yra 0.86, galima pasižiūrėti, ką labiausiai vertina verslininkai, lyginant su politikais.

verslas$diff <- residuals(fit)
verslas %>% 
  ggplot(aes(x=diff, y=reorder(Verslininkas, diff))) + theme_light() + 
    geom_point(size=1) + 
    geom_segment(aes(y=Verslininkas, yend=Verslininkas, 
                     x=0, xend=diff, color=(diff>0))) +
    geom_point(size=1) + 
    theme(axis.text.y=element_text(size=6), axis.title=element_text(size=8)) + 
    guides(color=F) + ylab("") + 
    xlab("Verslininkų vertinimas, lyginant su politikais") 

Įdomu tai, kad politikai daug įtakos suteikia asociacijų ir konfederacijų veikėjams, bet verslininkams jie įspūdžio nedaro: grafiko apačioje liko Danas Arlauskas bei Stasys Kropas. Matyt politikams su jais tenka nemažai bendrauti, bet reali jų įtaka kyla ne iš pačių asmenybių, o iš atstovaujamų interesų. Tuo tarpu verslininkai žymiai daugiau reikšmės suteikia Dariui Mockui bei Nerijui Numavičiui: asmenims, kurie atstovauja savo pačių interesus. Gal kiek netikėtai trečias tarp labiausiai politikų nuvertintų verslininkų yra Dalius Misiūnas: energetika verslininkams labai svarbu, bet ji kontroliuojama valstybės ir pačių politikų, tad politikai energetikų galios nesureikšmina.

Tarp didžiųjų bankų ekonomistų irgi įdomus prasilenkimas: Gitanas Nausėda bei Raimondas Kuodis yra politikų ekonomistai, o Nerijus Mačiulis ir Jekaterina Rojaka - labiau verslininkų.

Balsuojančiųjų koreliacijos

Ne visos balsuotojų grupės turi vienodą nuomonę. Galima paskaičiuoti koreliacijas tarp skirtingų balsuotojų.

cor(verslas %>% select(-Verslininkas, -diff))
##                      Politiku_balas Verslininku_balas Pop_balas
## Politiku_balas            1.0000000         0.9298451 0.6915122
## Verslininku_balas         0.9298451         1.0000000 0.8094200
## Pop_balas                 0.6915122         0.8094200 1.0000000
## Ziniasklaidos_balas       0.8891672         0.9622906 0.8549599
## Visuomenininku_balas      0.9585121         0.9400149 0.6876915
## Tarnautoju_balas          0.9715207         0.9244120 0.6896682
##                      Ziniasklaidos_balas Visuomenininku_balas
## Politiku_balas                 0.8891672            0.9585121
## Verslininku_balas              0.9622906            0.9400149
## Pop_balas                      0.8549599            0.6876915
## Ziniasklaidos_balas            1.0000000            0.8930495
## Visuomenininku_balas           0.8930495            1.0000000
## Tarnautoju_balas               0.8978414            0.9541088
##                      Tarnautoju_balas
## Politiku_balas              0.9715207
## Verslininku_balas           0.9244120
## Pop_balas                   0.6896682
## Ziniasklaidos_balas         0.8978414
## Visuomenininku_balas        0.9541088
## Tarnautoju_balas            1.0000000

Atrodo, jog labiausiai išsišoka Popkultūros ir sporto atstovų nuomonė. Jų atotrūkis dar geriau matosi spalvotame grafike:

qplot(x=Var1, y=Var2, 
      data=melt(cor(verslas %>% select(-Verslininkas, -diff))), 
      geom="tile", fill=value) +
  xlab("") + ylab("") + guides(fill=F) + theme_light() + 
  theme(axis.text.x=element_text(angle=90)) 

Nenuostabu, kad tarnautojai ir politikai turi labai panašias nuomones (koreliacijos koeficientas net 0.97). Šiose dviejose grupėse buvo apklausta net 160 + 196 = 356 respondentų, tad vienoda valdininkų/politikų nuomonė rinkimuose yra labai stipriai reprezentuojama. Žiniasklaida yra antra labiausiai „nepriklausoma“ grupė (koreliacija su kitomis grupėmis mažesnė nei 0.9), nors jos nuomonė geriausiai koreliuoja su verslininkų nuomone.

Vilniaus viešojo transporto duomenys

Niekada iki šiol nenaudojau dplyr R paketo, tad norėjau pasižiūrėti, kaip jis veikia (o veikia jis tikrai patogiai!). Kadangi neseniai buvo paviešinti Vilniaus Viešojo Transporto vėlavimų duomenys, tai kaip tik šis duomenų rinkinys pasirodė tinkamas pasižaidimui. Kadangi tai labiau techninis galimybių bandymas, tai didelių įžvalgų ir neieškojau, nors visgi radau, kad privatūs vežėjai vėluoja žymiai rečiau nei VVT, troleibusai yra patikimesni nei autobusai, o savaitgaliais viešasis transportas yra punktualesnis (kuo nereiktų stebėtis – juk eismo mažiau).

Nevėluojančių reisų dalis
Nevėluojančių reisų dalis

Detaliau ir techniškiau, su visu kodu: Notebook: Transportas-vėlavimai

Rūta Vanagaitė: Mūsiškiai

Tikriausiai apie Rūtos Vanagaitės „Mūsiškius“ sunku ką nors naujo pasakyti. Tai emocinė knyga, ne sausa monografija apie žuvusių ar žudžiusių statistiką, bet knyga, skirta sustoti ir pamąstyti apie didžiulę tragediją, pagalvoti, ką mes padarėme, kad tai nepasimirštų, kad kaltieji būtų teisingai įvertinti ir kad niekada niekada taip daugiau nepasikartotų. Ir iš tiesų sutinku, kad apie šią tragediją galvojame per mažai, lyg Lietuvos piliečių žydų aukos būtų buvę ne tokios svarbios kaip kitų, labiau „mūsiškių“, išvežtųjų į Sibirą ir persekiotų bolševikų. Dar dabar galima sutikti žmonių, kurie savyje nešioja man niekaip nesuprantamą neapykantą žydų tautai ir tiki „žydomasonų“ sąmokslais: galbūt tai tamsūs žmonės, kurie kartu tiki ir chemtreilais bei acto garinimu, bet vengdami Holokausto temos ir jo aiškaus pasmerkimo mes šio tamsumo niekaip nepragiedrijame.

Kad ir kokios emocijos vyrautų Rūtos Vanagaitės knygoje, niekaip negaliu sutikti su teze, jog lietuviai – žydšaudžių tauta. Lygiai taip galėtume sakyti, jog mes – girtuoklių, stribų bei vaikžudžių, mėtančių į šulinius savo vaikus, tauta. Tauta, kurioje nėra nei vieno teisiojo, kuri susideda tik iš nusikaltėlių, nepaisant to, jog žydus gelbėjusiųjų pasaulio teisuolių tarp mūsiškių irgi galima atrasti. Kiekvienoje tautoje yra žmonių, kurių nusikaltimai turi būti objektyviai išaiškinti ir pasmerkti, bet nusikaltėlių etiketės prilipdymas visai tautai vargu ar gali privesti prie gero. Priklijuota etiketė nepalieka vilties nebekartoti klaidų. Nurašo. Nesvarbu, kokias moralines vertybes įdiegsime savo anūkams, jie liks žydšaudžių tauta. Niekaip negaliu su tuo sutikti.

Visus nusikaltimus reikia tirti objektyviai ir teisingai, be baimės teisti bei pasmerkti tuos, kurie prie to prisidėjo. Nesvarbu, kad jie vėliau padarė dar daug kitų, gerų darbų – kovojo kaip partizanai ar padėjo galvas už laisvę. Tik čia nepamesti šaltos galvos tikrai nelengva, kaip galima matyti ir iš knygoje pateiktų Efraimo Zurofo minčių: tai pilna emocijų tema, kai kur jau apaugusi legendomis, kai bandymai suvokti baisius dalykus darusių motyvus pasitikami riksmu „tu bandai teisinti nusikaltėlius!!“. Ne, neteisinu, bandau suvokti, kas atsitiko ir suprasti ką daryti, kad tai daugiau niekada nepasikartotų. Juk praradome tiek daug saviškių – Lietuvos piliečių.

Dailius Dargis: 13 tamsaus lietuviško verslo paslapčių

Labai ilgai laukiau, kad kas nors su visu rimtumu ir atsidėjimu imtųsi parašyti lietuviško verslo istoriją: apie pirmuosius šiuolaikinės Lietuvos verslininkus vyšniniais švarkais, apie metalų perpardavinėjimą, investicinius čekius, privatizacijos istorijas, apie nusisekusius ir ne tokius sėkmingus verslus, bankus, finansų piramides, apie tuose drumzlinuose istorijos vandenyse sėkmingai sugebėjusius žvejoti drąsuolius ir tik savo sąžinės bei apsukrumo dėka išplaukusius verslo didvyrius. Su daug analizės, skaičių, profesionaliais komentarais, šimtais dokumentinių šaltinių bei liudininkų pasakojimų. „13 tamsaus lietuviško verslo istorijų“ nėra ta knyga.

Nors Dailiaus Dargio knygos idėja gal ir buvo panaši, bet kompetencijos tam tikrai pritrūko. Gilesnės analizės čia vargu ar galima atrasti, tėra tik keletas žinomų faktų apie verslininkų sovietinių laikų teistumus: ir nors tai irgi yra svarbūs faktai, bet jie nebūtinai yra esminės verslininkų portretų dalys. Juk kur kas įdomesnis turėtų būti gilus verslininkų iškilimo bei pinigų uždirbimo istorijų tyrimas. Deja, pakrapštymas labai paviršutiniškas, apsiribojama vos vienu kitu šaltiniu, o apie tuos, kurie sutiko su autoriumi pakalbėti, tik žodis žodin skamba pačių herojų nuomonė. Tame nieko blogo, bet iki tiriamosios žurnalistikos tolokai. Gal neužteko tam laiko.

Net ir tie skyriai, kuriuose bandoma kastis giliau (dažniausiai todėl, kad verslininkai apie savo istoriją patys atsisakė kalbėtis) gavosi silpnoki ir menkai įtaigūs. Pavyzdžiui, minima apšepusi sodyba Molėtų rajone, kurioje, anot autoriaus, slaptiems pasitarimams rinkdavosi VP grupės nariai, o kaip to įrodymas pateikiamas kaimo gyventojų liudijimas, jog jie matė ten besilankančias mašinas su Maximos lipdukais. Kartais atrodo, jog autorius dega begaliniu noru atrasti sensacingų faktų, net jeigu tai ir ne itin sekasi: skyriuje apie Bronislovą Lubį kone penketui pašnekovų vis buvo užduodamas klausimas, ar jo mirtis jiems neatrodo keista. Jiems visiems neatrodė.

Manau, kad kompetetingai parašyti gilaus žurnalistinio tyrimo knygą apie ankstyvąjį lietuvišką verslą yra labai sunku – ir to darbo galėtų imtis gal tik keletas žmonių, kurie verslu domisi jau ne vieną dešimtmetį. Tam reikia labai daug kruopštaus darbo ir srities išmanymo, knaisiojimosi finansiniuose duomenyse, žiniasklaidos archyvuose, ataskaitose ir akcininkų sąrašuose. Tokios knygos, kuri ne vien papasakotų kelis faktus, bet ir nuodugniai skaičiais pagrįstų bei sudėliotų visą verslo istorijos paveikslą vis dar viltingai laukiu. Juk svajoti galima?

Lietuvos toponimų žemėlapis

Prieš keletą dienų užtikęs smagią Vokietijos miestų priesagų vizualizaciją, užsinorėjau ką nors panašaus papaišyti ir su Lietuvos duomenimis. Juolab, kad tai galimybė pažaisti su vis naujais ir dar nepažintais įrankiais bei programomis: ne vien ką nors įdomaus išpeši iš duomenų, bet ir išmoksti ką nors naujo. Duomenis ėmiau iš geonames, analizei ir piešimui naudojau QGIS, MMQGIS bei Mapbox.

-aičiai yra visiškai žemaitiška priesaga
-aičiai yra visiškai žemaitiška priesaga

Įdomiausios priesagos pasirodė -aičiai ir -onys: pirmieji ryškiai dominuoja Žemaitijoje, o antrųjų pas žemaičius beveik nerasi. -ininkai lyg ir Dzūkijos bei Panemunės mada. -upiai žymiai populiaresni nei -ežeriai, kurių net ežeringiausiuose kraštuose retai sutiksi. Visi žemėlapiai ir priesagos šiame puslapyje.

-onių Žemaitijoje nerasi
-onių Žemaitijoje beveik nerasi