Sociologinės apklausos apie politiką – vėluojantis indikatorius

Šiandien delfi.lt pateikdamas naujausius apklausų duomenis rašo:

Apklausa buvo atlikta spalio 19-27 dienomis, vadinasi, dalis žmonių apklausta iki antrojo rinkimų turo spalio 23 dieną, dalis – po jo. Per tą laiką labai išaugo S. Skvernelio populiarumas: nuo 5,4 proc. iki 13,4 proc. Tai tikriausiai nenuostabu, nes Valstiečių ir žaliųjų sąjunga būtent šį politiką siūlo užimti premjero pareigoms. Paūgėjo ir Tėvynės sąjungos-Lietuvos krikščionių demokratų pirmininko Gabrieliaus Landsbergio reitingas nuo 9,3 proc. iki 12,6 proc.
[…]
Tuo metu ilgą laiką visuomenės nuomonės ir rinkos tyrimų bendrovės apklausose pirmu numeriu figūravęs socialdemokratų lyderis A. Butkevičius patyrė reitingų nuosmukį: jo galimybės eiti šias pareigas gyventojai po rinkimų labai suabejojo ir šio politiko populiarumas smuko nuo 23 proc. iki 9,3 proc.

Visi šie pokyčiai labai aiškiai atsispindi reitingų grafike:

Kas tiktų į premjerus

Kyla labai natūralus klausimas, ar tokių apklausų metų gaunami reitingai vertingi nuspėjant ateitį – bent jau iš duomenų atrodo, jog jie yra labiau vėluojantis politinio populiarumo indikatorius, į kurį per daug dėmesio kreipti nereikia (pamoka socialdemokratams?). Dar daugiau – įtarčiau, jog populiarumas apklausose tiesiogiai susijęs su politikų paminėjimo dažnumu (ir kontekstu) žiniasklaidoje. Kuo daugiau apie konkretų žmogų kalbama kaip apie galimą premjerą, tuo daugiau kam jis atrodys tinkamas šiam darbui.

Tikriausiai tuo labai stebėtis nereiktų, mat jeigu manęs kas gatvėje sustabdęs paklaustų, kokia amerikietiško futbolo komanda kitais metais laimės Super Bowl, atsakyčiau „Green Bay Packers“, bet tik todėl, kad tai bene vienintelis komandos pavadinimas, kurį žinau. Amerikietišku futbolu visiškai nesidomiu ir nieko apie jį nenutuokiu, ir, tikėtina, jog panašiai apie tinkamus kandidatus premjero poste galvoja ir kiti apklausose dalyvaujantys: lengviausia paminėti tuos kandidatus, apie kuriuos dažniausiai pastaruoju metu kalbama viešojoje erdvėje. Ar tai reiškia, kad apklausos yra visiškai bevertės? Ne, eliminavus paminėjimų viešojoje erdvėje dažnumo efektą skaičiai galėtų tapti iškalbingesni. Jei dažnai apie kurį nors kandidatą kalbama, bet jis nefigūruoja apklausose, galima suprasti, jog jis tarp žmonių stipriai nemėgiamas (to geras pavyzdys buvo liberalų reitingų kritimas po Masiulio skandalo – paminėjimų daug, o reitingai pažemėje).

Kaip skiriasi partijos pagal Manoseimas.lt duomenis

Prieš kelias dienas pasirodė manoseimas.lt svetainė, kurioje, atsakius į 12 klausimų, galima pasilyginti, kuri partija buvo arčiausiai jūsų nuomonės. Buvo įdomu paanalizuoti, kurios partijos yra panašiausios ir kiek jos skiriasi. Liberalai ryškiai kitokia opozicinė partija, bet išties, jiems artimiausi socialdemokratai, o ne konservatoriai.

Koreliacijos tarp partijų

Manoseimas.lt pateikia duomenis apie partijų balsavimus dvylika klausimų. Sudėjus visus duomenis į vieną CSV (kurį galima rasti http://petras.kudaras.lt/notebooks/manoseimas.csv) galima paskaičiuoti koreliacijas tarp partijų balsavimo:

data = read.csv2('/Users/petras/dev/manoseimas.csv', sep=',', header=T, row.names=1)
data = data/100
t(data[1:7,])
##                           TT   DP LSDP   AW LRLS   MG TSLK
## Šauktiniai              0.92 0.89 0.96 0.72 0.95 0.79 0.91
## Meras                   0.82 0.94 0.89 0.85 0.31 0.89 0.55
## Internetinis_balsavimas 0.49 0.80 0.91 0.11 1.00 0.74 0.22
## Darbo_kodeksas          0.91 0.79 0.98 0.15 0.95 0.41 0.42
## Švietimas               0.91 0.92 0.86 0.60 0.29 0.63 0.42
## Vaiko_teisės            0.74 0.78 0.91 0.44 0.76 0.40 0.34
## Alkoholis               0.59 0.53 0.55 0.68 0.44 0.75 0.82
## Pensijos                0.79 0.85 0.89 0.25 0.88 0.24 0.30
## Pabėgėliai              0.96 0.91 0.97 0.89 0.59 0.84 0.84
## Dviguba_pilietybė       0.94 0.90 0.94 0.83 0.91 0.81 0.64
## Asmenvardžiai           0.81 0.61 0.69 0.83 0.51 0.29 0.15
## Privati_informacija     0.76 0.76 0.81 0.59 0.75 0.63 0.74
kable(round(cor(t(data[1:7,])), 2))
TT DP LSDP AW LRLS MG TSLK
TT 1.00 0.57 0.50 0.45 -0.08 0.04 0.30
DP 0.57 1.00 0.85 0.07 0.10 0.36 0.13
LSDP 0.50 0.85 1.00 -0.23 0.51 0.12 0.00
AW 0.45 0.07 -0.23 1.00 -0.57 0.48 0.52
LRLS -0.08 0.10 0.51 -0.57 1.00 -0.19 -0.06
MG 0.04 0.36 0.12 0.48 -0.19 1.00 0.68
TSLK 0.30 0.13 0.00 0.52 -0.06 0.68 1.00

Mano paties rezultatai manoseimas.lt svetainėje mane nustebino, nes, pasirodo, mane geriausiai atstovauja Tvarkos ir Teisingumo partija. Iš tiesų, jų koreliacija su mano nuomone yra tampriausia.

kable(round(cor(t(data)), 2))
TT DP LSDP AW LRLS MG TSLK PETRAS
TT 1.00 0.57 0.50 0.45 -0.08 0.04 0.30 0.61
DP 0.57 1.00 0.85 0.07 0.10 0.36 0.13 0.12
LSDP 0.50 0.85 1.00 -0.23 0.51 0.12 0.00 0.07
AW 0.45 0.07 -0.23 1.00 -0.57 0.48 0.52 0.41
LRLS -0.08 0.10 0.51 -0.57 1.00 -0.19 -0.06 -0.01
MG 0.04 0.36 0.12 0.48 -0.19 1.00 0.68 -0.24
TSLK 0.30 0.13 0.00 0.52 -0.06 0.68 1.00 -0.07
PETRAS 0.61 0.12 0.07 0.41 -0.01 -0.24 -0.07 1.00

Pagrindinių komponenčių analizė

Nenuostabu, jog Facebooke daugelis save laikančių liberalais pamatė, jog jiems geriausiai atstovauja LSDP: liberalų koreliacija su šia partija tikrai geriausia. Bet matyt koreliacijos nėra viskas. Gal galima nupiešti partijų pozicijas vienoje koordinačių erdvėje? Tam galima panaudoti pagrindinių komponenčių analizę (principal component analysis) ir išskirti tiesiškai nepriklausomas komponentes. Tada galima pabandyti pavaizduoti partijas viename dvidimensiniame grafike.

  ggbiplot(prcomp(data[1:7,]/100, center=T), scale=0, 
           labels=rownames(data[1:7,]), var.axes=F)

Nieko keisto, kad koalicijos partnerės LSDP, TT ir DP balsuoja labai panašiai - jos ir glaudžiasi viename grafiko kampe. Tuo tarpu LRLS yra labai skirtinga opozicinė partija, ji patenka visai į kitą kampą nuo TSLK ar kitų opozicinių partijų. Kita vertus, nors LRLS ir geriausiai koreliuoja su LSDP, ji tolokai nuo jos nutolusi. Lygiai kaip ir nuo TSLK.

Tai į ką aš panašus?

Padariau interaktyvų grafiką: pastumdžius atsakymus, galima pastebėti, kaip artėjama ar tolėjama nuo vienos ar kitos partijos. Labiausiai nuo liberalų skiriuosi tuo, kad esu prieš internetinį balsavimą. Būtent šitas klausimas geriausiai atspindi radikalų skirtumą ašyje tarp lenkų AW ir LRLS ir labai stipriai mane atitolina nuo liberalų. Žaistis bus žymiai patogiau, jei atsidarysite šią nuorodą naujame lange: https://petras.shinyapps.io/manoseimas/