• В Беларуси
  • Наука
  • Интернет и связь
  • Гаджеты
  • Игры
  • Офтоп
  • Оружие
  • Архив новостей
    ПНВТСРЧТПТСБВС
  1. «По приказу премировали людей». В лидском стройтресте рассказали, зачем раздавали деньги на 9 Мая
  2. Суарес почти 20 лет счастлив с одной женщиной (встретил ее в 15 и влюбился с первого взгляда)
  3. Лукашенко — о восстановлении горевшего костела в Будславе: Без государства ни черта не сделают все равно
  4. Мангал под навесом уже не в тренде. Вот как круто белорусы обустраивают свои террасы и беседки
  5. «Мы, иностранцы, с ума сходим». Белоруска уехала за мужем в сектор Газа и теперь вынуждена жить на войне
  6. Уволенному директору Оперного театра нашли новую работу
  7. Срок действия справок и других документов продлили еще на полгода
  8. «Родителям сказал, что пойду пожить к другу». Студент отсидел три месяца, услышал приговор и сбежал за границу
  9. Биолог рассказал, как вырастить богатый урожай капусты. Вот пять правил
  10. Надежды нет? Прикинули, ждать ли белорусам тепла этим летом
  11. В Израиле в результате ракетной атаки погибла уроженка Беларуси
  12. Как под Барановичами спасают дворец Радзивиллов — копию итальянской виллы на озере Комо (нет, не той что Соловьева)
  13. В программе белорусских каналов на следующую неделю нет «Евровидения». Попробовали разобраться, что это значит
  14. Израиль начал в секторе Газа военную операцию. Рассказываем обо всех предыдущих попытках
  15. Лукашенко подписал указ о застройке 10 квадратных километров на севере Минска
  16. Виновен посмертно. Верховный суд рассмотрел апелляцию по делу застреленного силовиками Шутова и его друга
  17. Открыли TikTok-парк, в планах — расчетно-кассовый центр. Как пробуют «оживить» торговый центр «Столица»
  18. Белорус принял участие в «спецоперации» и лишился более 200 тысяч долларов
  19. Стоматолог понятно объясняет, нужны ли вам брекеты и что о них важно знать
  20. «Одна из нас умерла от отека мозга». История девушки, которая с друзьями отправилась за мухоморами
  21. Лукашенко говорил, что «несогласных» студентов нужно отчислить, а парней отправить в армию. Где эти ребята сейчас?
  22. Фоторепортаж. На Куйбышева открылась «Песочница» — площадка с уличной едой, которую любят минчане
  23. Личный опыт. Как в Беларуси стартовало бесплатное исследование иммунитета против COVID-19
  24. «Расходы превышают доходы, нужно еще 10−15 млн». Олексин может выкупить торговый центр «Валерьяново»
  25. Что сейчас происходит в Индии, которая шокирует мир смертностью от COVID-19? Рассказывают белоруски
  26. Возле Дома правосудия задержали журналиста TUT.BY. Ее отправили на Окрестина, в субботу ее будут судить
  27. После заявления Минтруда, что ветераны не получат выплаты к 9 мая, BYSOL запустил сбор. Сколько собрали
  28. Флаги везде, «супермитинги» и «неотданная любимая». Как власть отвечала на идеи оппонентов
  29. В Минске рассматривают большое «дело студентов». К зданию суда пришли более ста человек, прошли задержания
  30. Экс-капитана Генштаба за фото документа «польскому телеграм-каналу» приговорили к 18 годам за госизмену

опубликовано: 
обновлено: 

Вадим Зипунников, профессор кафедры биостатистики американской школы общественного здравоохранения Джонса Хопкинса, проанализировал оцифрованные данные из фотокопий протоколов участковых избирательных комиссий, собираемые платформой «Зубр», и нашел статистические аномалии. Он прислал редакции TUT.BY свой статистический анализ — приводим его работу.

Но вначале — кто такой Вадим Зипунников

Фото: Университет Джонса Хопкинса
Фото: Университет Джонса Хопкинса

На сайте Университета Джонса Хопкинса говорится, что Вадим — Associate Professor на кафедре биостатистики Школы общественного здравоохранения им. Блумберга при университете Джонса Хопкинса.

Биостатистика — это отрасль, связанная с разработкой и использованием статистических методов при проведении научных исследований в медицине, здравоохранении и эпидемиологии.

В частности, сейчас он занимается сбором данных, получаемых от носимых устройств, и сопоставляет эту информацию с более крупными базами данных, которые собираются традиционным способом, например, при обследовании состояния здоровья. Так, профессор интересуется количественной оценкой: слабости и утомляемости в клинических группах населения с сердечными заболеваниями; физической инвалидности у людей с рассеянным склерозом; нарушений циркадных ритмов среди людей с биполярным расстройством, большим депрессивным расстройством и деменцией; качества сна у лиц с деменцией и болезнью Альцгеймера.

Также Вадим вовлечен в анализ данных EMA (Ecological Momentary Assessment, сбор данных через приложения в смартфонах) — этот метод популярен в психологии для оценки когнитивных функций и эмоций (например, замера уровня печали, беспокойства, энергии и так далее).

Почему специалиста из США заинтересовали выборы в Беларуси?

— Я родился в России, но моя жена и дети граждане Республики Беларусь: жена родилась в Беларуси, потом переехала в США. Дети родились в США (поэтому граждане США по рождению), но получили гражданство Беларуси, так как мама гражданка РБ, — поясняет Вадим.

Что за статистический анализ данных из протоколов

Снимок носит иллюстративный характер. Фото: Дмитрий Брушко, TUT.BY
Снимок носит иллюстративный характер. Фото: Дмитрий Брушко, TUT.BY

В сопроводительном письме Вадим Зипунников написал, что использовал для анализа оцифрованные данные из фотокопий протоколов, собираемые платформой «Зубр».

Данные собраны в Telegram-чате платформы. Оцифровкой занимался кандидат наук в МГУ Максим Гонгальский со своей командой.

На данный момент база (она доступна по ссылке) включает 878 участков и 1 278 587 голосов. Вот к каким выводам пришел специалист, проанализировав фотокопии протоколов:

1. Основная выявленная статистическая аномалия представлена большим количеством УИК c четырьмя одновременно наблюдаемыми и статистически маловероятными характеристиками:

  • Необычно высокая концентрация УИК с предварительной явкой (досрочно проголосовавших) в районе 25−45% (с необычно высоким пиком в 35%) от общего числа зарегистрированных.
  • Необычно высокая концентрация процентов голосов за Тихановскую в интервале 0%-20%; за Лукашенко в интервале — 55%-75%; за остальных кандидатов и против всех в интервале — 10%-30%

2. Выявлен сильный статистический тренд: каждые 7% досрочно проголосовавших (от общего числа зарегистрированных) «забирали» у кандидата Тихановской приблизительно 8% от окончательного результата и «прибавляли» приблизительно 8% к окончательному результату кандидата Лукашенко.

3. После исключения из анализа аномальных УИК:

  • процент за кандидата Тихановскую стал варьироваться в межквартильном интервале: 36%-59%;
  • процент за кандидата Лукашенко — в межквартильном интервале 28%-53%;
  • процент за остальных кандидатов и против всех — в межквартильном интервале 7%-14%.

В статистике межквартильный размах — это разница между 1-м и 3-м квартилями, т.е. между 25-м и 75-м процентилями. В него входят центральные 50% наблюдений в упорядоченном наборе, где 25% наблюдений находятся ниже центральной точки и 25% — выше.

4. Для дальнейшей коррекции наблюдаемого статистического тренда необходимы дополнительные предположения. Любая коррекция наблюдаемого статистического тренда приведет к дальнейшему увеличению процентов голосов за кандидата Тихановскую и дальнейшему уменьшению процентов голосов за кандидата Лукашенко.

Позже Вадим добавил, что практически все результаты с участков гораздо ниже, чем официальные данные от ЦИК для Александра Лукашенко (80,08%), и гораздо выше, чем официальные цифры от ЦИК для Светланы Тихановской (10,09%).

В этих данных уже присутствуют аномалии, и пересчет голосов не решит этой проблемы.

— Тренды сами по себе не аномальны, исходя из призывов от штаба Тихановской проголосовать в основной день. Но когда они присутствуют вместе со статистическими аномалиями и сверхвысокой предварительной явкой, они становятся сильно подозрительными, — говорит специалист.

Основная статистическая аномалия

На графике ниже показана необычно высокая концентрация досрочно проголосовавших — в районе 25%-45% от общего числа зарегистрированных (с необычно высоким пиком в 35%).

Изображение: Вадим Зипунников
Изображение: Вадим Зипунников

На аномальных участках с необычно высокой предварительной явкой (25%-45% от общего числа зарегистрированных) одновременно наблюдалась необычно высокая концентрация очень похожих результатов с окончательным процентом:

• за Тихановскую в интервале: 0%-20%

• за Лукашенко в интервале: 55%-75%

• за остальных кандидатов и против всех в интервале: 10%-30%

Изображение: Вадим Зипунников
Изображение: Вадим Зипунников

Статистический тренд

На графиках ниже видно, что приблизительно каждые 7% досрочно проголосовавших (от общего числа зарегистрированных) «забирали» у кандидата Светланы Тихановской 8% от окончательного результата и «прибавляли» 8% к окончательному результату кандидата Лукашенко.

Изображение: Вадим Зипунников
Изображение: Вадим Зипунников
Изображение: Вадим Зипунников
Изображение: Вадим Зипунников

Процент голосов, отданных за остальных кандидатов и «против всех», начинает сильно увеличиваться на участках, где официальный процент досрочно проголосовавших (от общего числа зарегистрированных) выше 25%.

Возможно, считает автор анализа, это связано с тем, что пять дней предварительного голосования использовались, чтобы «максимизировать» официальное количество досрочно проголосовавших и каким-то образом «сформировать» тренды в наблюдениях № 1 и № 2.

Изображение: Вадим Зипунников
Изображение: Вадим Зипунников

Коррекция выборки через удаление аномальных УИК

Далее в анализе автор отмечает, что «чтобы исключить влияние УИК из аномальной области, мы исключили УИК с процентом досрочно проголосовавших (от числа зарегистрированных) больше 25%».

В результате получились следующие данные (представлены межквартильные интервалы):

  • за Тихановскую в интервале: 36%-59%
  • за Лукашенко в интервале: 28%-53%
  • за остальных кандидатов и против всех в интервале: 7%-14%
Изображение: Вадим Зипунников
Изображение: Вадим Зипунников
Изображение: Вадим Зипунников
Изображение: Вадим Зипунников

«Данный анализ сделан 15 августа 2020 года и главным образом анализирует аномалии и тренды, связанные с процентом досрочно проголосовавших от числа зарегистрированных, — подытоживает автор. — Предыдущий анализ, сделанный 14 августа 2020 года, анализирует аномалии и тренды, связанные с процентом досрочно проголосовавших от числа проголосовавших, и имеет похожие основные выводы».

Данные доступны здесь.

Код (язык R) для воспроизведения анализов доступен здесь.

Дополнено.Спустя примерно две недели специалист обновил свои результаты на основе выложенных данных платформы «Голос». По его словам, основные выводы остались примерно теми же самыми. Кроме того, обнаружились странные паттерны вроде того, когда на соседних УИК наблюдались похожие проценты. Так, самый популярный процент (пик гистограммы) за Лукашенко был ровно 66,6% — это где-то 25 участков из выборки

-5%
-20%
-30%
-20%
-10%
-25%
-15%
-10%
-20%
-10%
-25%
0072916