Statystyka bez spadochronu: kulisy algorytmu dr. Krzysztofa Kontka i wyborczej burzy w szklance wody

Algorytm doktora Krzysztofa Kontka miał obnażyć rzekome fałszerstwa w drugiej turze wyborów prezydenckich 2025 r. W teorii – rzeczowa analiza danych, w praktyce – mieszanka wątpliwych założeń, niepełnych prób i jednoznacznej tezy, która od początku ciążyła nad wynikami. Pod lupą Portalu Telewizji Republika sprawdzamy, jak chwytliwe liczby – 1482 „podejrzane” komisje i pół miliona „zagubionych” głosów – stały się paliwem medialnego show, a później wylądowały w koszu Sądu Najwyższego.
Algorytm z tezą
Dr Kontek zaczyna od imponującej bazy: wszystkie 31 633 protokoły z lokali wyborczych. Szybko jednak dzieli ten ocean na 1739 mikrokrastrów po zaledwie 10–25 komisji. W każdym testuje pięć zmiennych: udział głosów kandydata, zwycięstwo w lokalu, skok poparcia między turami, frekwencję i odsetek nieważnych kart. Komisja, która odbiega od mediany klastra w kilku kategoriach naraz, trafia na listę „anomalii”. Brzmi naukowo, ale w statystyce tak małe próby to pole minowe – wystarczy przesunąć dwa lokale, by mediana runęła. Krytycy przypominają, że badania istotności dla grup dwudziestu przypadków to jak mierzenie milimetrów linijką malowaną flamastrem. Maciej Wilk, analityk lotniczy i doświadczony data-scientist, odtworzył cały model i uzyskał „identycznie losowe rezultaty”, bo nawet drobna korekta składu klastra przerzuca komisję z „czystej” do „podejrzanej”
Kluczowa decyzja autora dotyczy jednak kierunku poszukiwań. Algorytm sprawdza tylko odchylenia, które odbierają głosy Rafałowi Trzaskowskiemu i dokładają Karolowi Nawrockiemu. Jeśli statystyka pokazuje anomalię w drugą stronę, skrypt przechodzi obok niej obojętnie. Sam Kontek przyznał w rozmowie z Sekielski Brothers Studio, że „badał wyłącznie scenariusz strat Trzaskowskiego” – a więc od początku ustawił lupę tak, by patrzyła tylko w jedną stronę
Mediana na glinianych nogach
Najbardziej kontrowersyjny fragment raportu pojawia się, gdy autor przechodzi z detekcji do „korekty”. W każdej „podejrzanej” komisji realny wynik Nawrockiego zostaje zastąpiony… medianą z innych lokali w klastrze, a Trzaskowskiemu dopisuje się brakującą różnicę, aby zachować sumę ważnych głosów. Jeżeli matematyka podbiłaby poparcie Nawrockiego – procedura zostaje wstrzymana, „bo nie wolno sztucznie zawyżać jego wyniku”. Wtedy oryginalne, wyższe poparcie zostaje, a algorytm idzie dalej.
Takie odwrócenie znaków z góry eliminuje rezultaty sprzeczne z narracją. W klasycznej analizie ilościowej badacz stosuje ślepy test lub przynajmniej dwustronną hipotezę, tu natomiast przycina się dane jak bonsai: rosnące gałązki jednego kandydata zostają, z drugiego się je ucina. Stąd bierze się dramatyczny nagłówek o „315–487 tysiącach brakujących głosów”. Publika dostaje wielkie liczby, lecz pomija, że powstały na bazie wskaźników niestabilnych jak igła kompasu w pobliżu magnesu. Gdyby medianę policzyć w większym klastrze – na przykład powiatu – rezultat spadłby do kilku, góra kilkunastu tysięcy głosów, a część sama by się wyzerowała.
Kolejny problem to miksowanie metryk. Frekwencja i odsetek głosów nieważnych nie mówią nic o preferencjach kandydatów, ale windują liczbę lokali spełniających „co najmniej dwa kryteria”. To sztuczka rodem z marketingu – im więcej kategorii, tym łatwiej złowić odchylenie. W efekcie „anomalia” staje się kalką normalnych różnic demograficznych: inna struktura wieku, inne wzorce głosowania w wojsku, szpitalach czy DPS-ach.
Portal X kontra Sąd Najwyższy
Gdy TVN24 i „Gazeta Wyborcza” rzuciły hasło o „1482 wadliwych komisjach”, temat eksplodował w sieci. Maciej Wilk nazwał całość „wróżeniem z fusów”; publicyści przerabiali memy o „Excelu, który podpowiada prezydenta”, a prawnik Bartosz Lewandowski komentował, że założenia Kontka „wykluczają rzetelność od pierwszego wiersza”.
Szybko przeniosło się to do wymiaru prawnego. Pełnomocnik badacza, mec. Jacek Dubois, złożył wniosek o jawne rozpatrzenie protestu w Sądzie Najwyższym. Izba Kontroli Nadzwyczajnej zajęła się sprawą natychmiast i… pozostawiła protest bez dalszego biegu. W komunikacie nie dopatrzono się podstaw do ponownego liczenia głosów.
W praktyce SN przekazał więc jasny sygnał: statystyczne hipotezy, nawet opakowane w medialny błysk, nie zastąpią twardych dowodów z lokali wyborczych. Państwowa Komisja Wyborcza, na prośbę Izby, przejrzała losowo wybrane protokoły z listy Kontka – różnice okazały się marginalne i niezmieniające lokalnych rezultatów.
W międzyczasie na platformie X pojawił się kolejny wątek: czy dr Kontek w ogóle reprezentuje SGH? Jakub Kubajek opublikował screen z LinkedIna badacza, z którego wynika, że zatrudnienie w SGH zakończyło się w listopadzie 2022 r. Uczelnia nie wydała oficjalnego komunikatu, lecz milczenie nie zmniejsza dysonansu – w mediach autor występuje jako „ekspert SGH”, chociaż od prawie trzech lat ma inny adres firmowy.
Świadome zakrzywianie wyników? – komentuje opozycja
Mocny cios w wiarygodność modelu dr. Kontka zadała nawet publikacja sprzyjającego koalicji 13 grudnia Onetu. Redakcja wprost wskazuje, że autor „świadomie ignorował błędy na niekorzyść Karola Nawrockiego”, bo – jak sam napisał – chciał uniknąć „sztucznego zawyżania jego poparcia”. Gdy jednak zastosować identyczną procedurę we wszystkich kierunkach, odchylenia wychodzą… na korzyść Nawrockiego, jeszcze powiększając jego przewagę wyborczą. Dziennikarze dodają, że grupowanie komisji wyłącznie po kodach pocztowych bez kontroli struktury elektoratu wypacza podstawę porównań, a przy odpowiednim doborze klastrów „nietypowe” komisje okazują się całkiem przeciętne.
Na te ustalenia natychmiast zareagował poseł PiS Paweł Jabłoński. W serii wpisów na platformie X nazwał raport „celowo sfałszowanym” i zapowiedział złożenie zawiadomienia o możliwości popełnienia przestępstwa przez dr. Kontka oraz osoby, które – jego zdaniem – „współdziałały” przy próbie podważenia mandatu wyborczego. Parlamentarzysta twierdzi, że brak symetrycznej weryfikacji wyników miał służyć wyłącznie wywołaniu wrażenia masowych nieprawidłowości i wpłynięciu na orzeczenie Sądu Najwyższego.
Choć w tej chwili to dopiero polityczna teza a nie formalny akt oskarżenia, sam fakt, że prawnicy rozważają pasmo odpowiedzialności karnej za „nierzetelną analizę statystyczną”, pokazuje, jak wysoka stała się temperatura sporu. Jeśli sprawa trafi do prokuratury, algorytm doktora Kontka stanie przed jeszcze surowszym testem niż audyt danych: sprawdzianem procesowym, w którym każdy błąd metodologiczny może zyskać rangę dowodu w sprawie.
Kim naprawdę jest doktor bez katedry?
Krzysztof Kontek zrobił doktorat z teorii decyzji, publikował o ryzyku i ekonomii behawioralnej, a w latach 2017–2022 formalnie widniał w strukturze Kolegium Analiz Ekonomicznych SGH. Po odejściu skupił się na prywatnych projektach – dziś zasiada w radach nadzorczych spółek technologicznych i kieruje firmą Merope. Na konferencjach bywa przedstawiany właśnie z tym logo, choć w wywiadach medialnych wciąż pada hasło „SGH”, które zapewnia rozpoznawalny szyld.
Nie byłoby w tym nic nadzwyczajnego – wielu naukowców łączy uczelnię z biznesem – gdyby nie fakt, że to właśnie uczelniany autorytet ma podbić wiarygodność algorytmu. Krytycy wskazują, że powoływanie się na SGH bez aktualnej afiliacji to nie błąd formalny, ale zabieg wizerunkowy: łatwiej sprzedać gorącą tezę w prime time, gdy za nazwiskiem stoi „Szkoła Główna Handlowa, katedra statystyki”.
Sam Kontek w rozmowie z TVN24 mówił, że działa „z czystej ciekawości badawczej” i nie jest politycznie zaangażowany. Tymczasem cały model bada tylko scenariusz, w którym Rafał Trzaskowski traci, a Karol Nawrocki zyskuje. „Ślepe” analizy dwustronne – standard w badaniach wyborczych – zostały odłożone na półkę. Trudno więc dziwić się opiniom naukowców, że raport bliżej ma do broszury agitacyjnej niż do peer-review.
Gdy liczby stają się propagandą
Historia algorytmu dr. Kontka przypomina, jak łatwo w erze „big data” zamienić statystykę w spektakl. Najpierw cząstkowe, jednostronne wyliczenia trafiają na czołówki serwisów z etykietą „przełom”. Później lądują w sądzie, który nie widzi żadnej wartości dowodowej. Wreszcie publiczna dyskusja schodzi na tory personalne: kto jest, a kto nie jest „prawdziwym” wykładowcą SGH. Efekt uboczny – w głowach wyborców zostaje wrażenie, że „coś było nie tak”, choć nikt nie potrafi wskazać realnej nieprawidłowości w konkretnym lokalu.
Dane nie kłamią, ale można je zmusić, by powiedziały, co tylko chce autor. Wystarczy przyciąć próbę, dobrać wskaźniki, przemilczeć odchylenia niepożądane. Tak buduje się narrację, która w mediach brzmi jak fakt, a w sali sądowej jak luźna hipoteza. Ironia polega na tym, że sama metodologia wykrywania odchyleń mogłaby być użyteczna, gdyby zastosować ją bez stronniczego filtru i na większych próbach. Tyle że wtedy pewnie nie dałoby się zbudować nagłówka o „półmilionowym zamachu na demokrację”.
Wnioski są dwa. Po pierwsze, w gąszczu powyborczych emocji warto sprawdzać, jak powstały liczby, zanim uwierzymy w ich moc. Po drugie, afiliacja uczelniana nie zastąpi rygoru naukowego – bez względu na to, czy nosi się ją jeszcze w CV, czy już tylko w medialnym intro. Algorytm doktora Kontka okazał się głośnym, ale pustym fajerwerkiem. A publiczność? Dobrze, żeby zapamiętała huk, ale nie dała się oślepić błyskiem.
Źródło: Analiza Portalu TV Republika, Portal X (Maciej Wilk, Jakub Kubajek), LinkedIn (Krzysztof Kontek)
Dziękujemy, że przeczytałaś/eś nasz artykuł do końca.
Bądź na bieżąco! Obserwuj nas w Wiadomościach Google.
Jesteśmy na Youtube: Bądź z nami na Youtube
Jesteśmy na Facebooku: Bądź z nami na FB
Jesteśmy na platformie X: Bądź z nami na X