Masowa analiza danych z pomocą sztucznej inteligencji i innych skomplikowanych metod pozwala obecnie już dość dokładnie przewidzieć wynik wyborów i maksymalnie skutecznie oddziaływać na wyborców – mówi dr Olha Zadorozhna z Zakładu Ekonomicznych Analiz Empirycznych Akademii Leona Koźmińskiego.
PAP: Big data, czyli przetwarzanie ogromnych ilości danych, wkracza w kolejne dziedziny i branże – od badań z zakresu fizyki, przez ekonomię, po psychologię czy medycynę. Czy z pomocą tych technik można badać nastroje społeczne i preferencje pojedynczych ludzi, przewidywać wyniki wyborów? Albo wręcz na nie wpływać?
Dr Olha Zadorozhna: Krótka odpowiedź brzmi – tak. W internecie publicznie dostępne są różnego rodzaju bazy danych, które często zawierają wiele informacji na temat wyborców – kim oni są, jakie mają preferencje, czego oczekują od polityków. Udaje się te dane przeanalizować z bardzo dużą precyzją dzięki metodom eksploracji danych, technikom uczenia maszynowego czy ekonometrycznym. Na tej podstawie można stworzyć najlepszą kampanię wyborczą i prowadzić ją między innymi z tzw. mikrotargetowaniem.
PAP: Co to takiego?
O.Z.: Dzięki mikrotargetowaniu różne osoby mogą otrzymać odmienną, najlepiej dopasowaną do nich wersję kampanii wyborczej. Określa się pewną grupę ludzi o danych preferencjach i na tej podstawie przygotowuje najlepiej działające w ich przypadku treści. Ktoś może je potem np. zobaczyć na jakiejś stronie internetowej w wyniku działań mechanizmów podobnych do tych, dzięki którym widzi dopasowane do swojego profilu reklamy.
PAP: Jakiego rodzaju dane są w ten sposób wykorzystywane?
O.Z.: Bardzo różne. Należą do nich spisy powszechne, które dają dobre informacje na temat obywateli – np. ich dochodów, wykształcenia, liczby dzieci, pochodzenia etnicznego. Do tego dochodzą informacje z mediów społecznościowych, które można np. przeanalizować pod kątem kluczowych słów czy fraz.
Takie dane na temat wielu osób są łatwo dostępne. Kolejne źródło to bazy danych, które można kupić, np. dotyczące konsumentów. Często zawierają one np. numery telefonów, maile, dane o hipotekach oraz historiach zakupów.
PAP: Czy kupowanie takich baz jest legalne?
O.Z.: To zależy od kraju. Pamiętajmy, że często, gdy jako konsumenci wprowadzamy gdzieś swoje dane, zaznaczamy pole z pytaniem „Czy zgadza się Pan/Pani na udostępnienie danych stronom trzecim w celach marketingowych”. Jeśli ktoś wyrazi taką zgodę, jego dane mogą zostać przekazane innemu podmiotowi.
PAP: Źródeł informacji na temat przeciętnego Polaka jest więc wiele.
O.Z.: Trzeba także wymienić dane zbierane przez same partie, np. o ludziach przekazujących darowizny czy pomagających im na zasadach wolontariatu. Do tego dochodzą bazy osób, które zgodziły się na otrzymywanie maili od jakiejś partii.
Tutaj można nawet sprawdzić, czy taka osoba częściej otwiera maile dotyczące np. podatków, czy praw człowieka, czy na przykład sądownictwa. Na tej podstawie można się dowiedzieć, co ją bardziej interesuje i dobrać dla niej najlepsze treści.
PAP: Czy ogólne zjawiska, np. światowe trendy społeczne czy gospodarcze, analitycy też biorą pod uwagę?
O.Z.: Jak najbardziej. To także się wykorzystuje, ale raczej jako tzw. zmienne kontrolne. Sprawdza się po prostu, czy poczynione przewidywania sprawdzą się w różnych warunkach, przy różnych założeniach np. makroekonomicznych.
PAP: Jak dokładne są prognozy na temat wyniku wyborów?
O.Z.: Jeśli mamy niezbędne dane – to nie ma problemu, aby przewidzieć wynik. Dopuszczalny margines błędu wynosi ok 5 proc. A w wyniku takiej analizy uzyskamy prawdopodobieństwo wygrania wyborów praz kandydata czy partię.
Pamiętajmy jednak, że mówimy o prognozie czynionej na podstawie bieżących warunków. Nawet jeśli pokazuje ona na przykład, że oponent lepiej się przygotował i ma przewagę – to za pomocą odpowiedniej kampanii można przekonać część wyborców, aby zmienili zdanie. Można więc powiedzieć, że są to prognozy mówiące, kto by wygrał, gdyby wybory odbyły się w momencie analizy.
PAP: Kto właściwie robi takie analizy?
O.Z.: Zazwyczaj robią to partie, które zachowują wyniki dla siebie. Trzeba pamiętać, że to bardzo drogie przedsięwzięcia, które wymagają dużych nakładów na nowoczesne technologie, takie jak obliczenia w chmurze czy zatrudnienie analityków. Dane te są wykorzystywane głównie w kampanii, we wspomnianym już mikrotargetowaniu.
PAP: Można sobie wyobrazić też mniej uczciwe działania. Na przykład algorytm, który teoretycznie mógłby przeszukiwać internet, a potem na forach czy w mediach społecznościowych „lajkować” posty sprzyjające określonej partii, a krytykować takie, które im szkodzą…
O.Z.: Trudno powiedzieć, czy taki algorytm już jest wykorzystywany, i jeżeli tak, to gdzie. Najczęściej mówi się o osobach zatrudnionych w celu lajkowania pewnych treści, a krytykowania innych. Dyskusja rozgorzała szczególnie silnie po kampanii prezydenckiej Donalda Trumpa i Brexicie, kiedy to firma Cambridge Analytica wykorzystywała dane z Facebooka dotyczące osób, które nie wyraziły na to zgody.
Co gorsza, wyborcy widzieli w internecie treści, które niekoniecznie były prawdziwe. Jednocześnie grano na ich preferencjach. Z takich powodów Unia Europejska podejmuje teraz szereg działań, które mają zapobiegać podobnym praktykom. Na przykład Google zobowiązane jest do publicznego pokazywania, ile dana partia wpłaciła pieniędzy na reklamę polityczną. Prace nad uregulowaniem różnych tego rodzaju działań trwają. Mają sprawić, aby w przyszłości dało się zapobiegać takim problemom.
PAP: Trudno się oprzeć wrażeniu, że nawet wobec istnienia regulacji partie, kandydaci i ich sztaby będą na ludzi wpływały. Czy można jeszcze mówić o wolnym wyborze?
O.Z.: Można, ale ludzie muszą krytycznie odczytywać różne przekazy. Zawsze należy sprawdzać wiele źródeł informacji, wręcz dokopywać się do prawdy. Tak każdy może dokonywać politycznych wyborów jako świadomy obywatel.
NwP: Czy Pani zdaniem wiele osób tak dziś robi?
O.Z.: Czy wielu ludzi krytycznie podchodzi do informacji? Myślę, że raczej nie. Większość wierzy w to, co widzi czy słyszy, np. w telewizji. To znaczy, że politycy i media muszą być świadomi odpowiedzialności, którą niosą.
PAP: Ktoś mógłby mieć obawy, że politykom bardzo zależy na wygranej, więc dzięki opisanym przez Panią metodom wygrywać będą po prostu ci, którzy mają na nie pieniądze.
O.Z.: Owszem, to bardzo niebezpieczne. Dlatego każdy z krajów oraz Unia Europejska muszą dążyć do tego, aby źródła finansowania kampanii wyborczych były dostępne publicznie. Finanse partii czy polityków muszą być ujawniane, a treści reklam politycznych – dokładnie kontrolowane.
Bo rzeczywiście w dzisiejszych czasach – jeśli ma się pieniądze na bazy danych, dobrego analityka i zaplecze technologiczne – bardzo łatwo jest przeprowadzić odpowiednią kampanię.
PAP: Jaka jest obecnie skala wykorzystania big data w kampaniach na świecie?
Myślę, że obecnie skala wykorzystywania big data w kampaniach jest raczej średnia, ponieważ wymaga ona dużych inwestycji finansowych i nie każdy kandydat czy partia może na to sobie pozwolić. Ale w najbliższej przyszłości będzie się to zmieniać i iść w stronę coraz częstszego wykorzystywania big data oraz mikrotargetowania ze względu na rozwój techniczny oraz możliwości algorytmów.
PAP: Czy wiemy, w jakim stopniu, w Polsce takie bazy danych są wykorzystywane do celów wyborczych, albo też w innych celach – np. przez handlowców czy firmy ubezpieczeniowe?
O.Z.: W Polsce mikrotargetowanie jest już wykorzystywane i podejrzewam, że politycy korzystają również z analizy danych do przeprowadzenia swoich kampanii wyborczych. Dzieje się to dlatego, że w ostatnich latach koszty zakupu, przechowywania, zarządzania i analizy big data spadły (chociaż są nadal bardzo duże, ale w porównaniu do kosztów sprzed 10 lat są mniejsze), podczas gdy podaż wysokiej jakości analityków danych wzrosła.
Tak naprawdę to kampanie wyborcze podążają za innymi sektorami gospodarki, takimi jak bankowość, doradztwo, marketing i handel elektroniczny, które jako pierwsze zaczęły korzystać z big data, żeby móc proponować swoim klientom dopasowywane do ich potrzeb i preferencji usługi oraz pozyskiwać nowych klientów.
PAP – Nauka w Polsce, Marek Matacz, mat/ zan/