• В Беларуси
  • Наука
  • Интернет и связь
  • Гаджеты
  • Игры
  • Офтоп
  • Оружие
  • Архив новостей
    ПНВТСРЧТПТСБВС
  1. Надежды нет? Прикинули, ждать ли белорусам тепла этим летом
  2. Биолог рассказал, как вырастить богатый урожай капусты. Вот пять правил
  3. «Одна из нас умерла от отека мозга». История девушки, которая с друзьями отправилась за мухоморами
  4. В программе белорусских каналов на следующую неделю нет «Евровидения». Попробовали разобраться, что это значит
  5. «Родителям сказал, что пойду пожить к другу». Студент отсидел три месяца, услышал приговор и сбежал за границу
  6. Что сейчас происходит в Индии, которая шокирует мир смертностью от COVID-19? Рассказывают белоруски
  7. В Минске рассматривают большое «дело студентов». К зданию суда пришли более ста человек, прошли задержания
  8. Мангал под навесом уже не в тренде. Вот как круто белорусы обустраивают свои террасы и беседки
  9. Лукашенко подписал указ о застройке 10 квадратных километров на севере Минска
  10. В Израиле в результате ракетной атаки погибла уроженка Беларуси
  11. «Мы, иностранцы, с ума сходим». Белоруска уехала за мужем в сектор Газа и теперь вынуждена жить на войне
  12. Лукашенко — о восстановлении горевшего костела в Будславе: Без государства ни черта не сделают все равно
  13. Белорус принял участие в «спецоперации» и лишился более 200 тысяч долларов
  14. После заявления Минтруда, что ветераны не получат выплаты к 9 мая, BYSOL запустил сбор. Сколько собрали
  15. Виновен посмертно. Верховный суд рассмотрел апелляцию по делу застреленного силовиками Шутова и его друга
  16. Открыли TikTok-парк, в планах — расчетно-кассовый центр. Как пробуют «оживить» торговый центр «Столица»
  17. «По приказу премировали людей». В лидском стройтресте рассказали, зачем раздавали деньги на 9 Мая
  18. Уволенному директору Оперного театра нашли новую работу
  19. Фоторепортаж. На Куйбышева открылась «Песочница» — площадка с уличной едой, которую любят минчане
  20. Срок действия справок и других документов продлили еще на полгода
  21. Лукашенко говорил, что «несогласных» студентов нужно отчислить, а парней отправить в армию. Где эти ребята сейчас?
  22. Израиль начал в секторе Газа военную операцию. Рассказываем обо всех предыдущих попытках
  23. Суарес почти 20 лет счастлив с одной женщиной (встретил ее в 15 и влюбился с первого взгляда)
  24. Стартовала выставка-конвент Unicon & Game Expo. Вот как выглядят ее гости и участники
  25. «Расходы превышают доходы, нужно еще 10−15 млн». Олексин может выкупить торговый центр «Валерьяново»
  26. Возле Дома правосудия задержали журналиста TUT.BY. Ее отправили на Окрестина, в субботу ее будут судить
  27. Экс-капитана Генштаба за фото документа «польскому телеграм-каналу» приговорили к 18 годам за госизмену
  28. Флаги везде, «супермитинги» и «неотданная любимая». Как власть отвечала на идеи оппонентов
  29. Стоматолог понятно объясняет, нужны ли вам брекеты и что о них важно знать
  30. Как под Барановичами спасают дворец Радзивиллов — копию итальянской виллы на озере Комо (нет, не той что Соловьева)


Вадим Зипунников, профессор кафедры биостатистики американской школы общественного здравоохранения Джонса Хопкинса, изучил официальные данные ЦИК и ТИК на выборах и референдумах в Беларуси за 1991−2020 годы и нашел там множество статистических аномалий. Он поделился с TUT.BY своим анализом — приводим оттуда основные моменты.

Фото: Ольга Шукайло, TUT.BY
Фото: Ольга Шукайло, TUT.BY

Вадим Зипунников уже делился с нами ранее своей работой, касающейся данных из фотокопий протоколов участковых избирательных комиссий 2020 года. Теперь же он проанализировал официальные результаты ТИК и ЦИК по шести президентским выборам и пяти референдумам, проведенным в период c 1991 по 2020 год в Беларуси.

Вадим заинтересовался темой выборов в нашей стране по личным мотивам — хотя Зипунников родился в России, но его жена и дети — граждане Республики Беларусь. Он писал этот анализ в свободное от работы время — Вадим является Associate Professor на кафедре биостатистики Школы общественного здравоохранения им. Блумберга при университете Джонса Хопкинса. То есть как биостатистик он занимается в том числе сбором и анализом получаемых при помощи гаджетов данных, которые затем используются при проведении научных исследований в медицине и здравоохранении.

В ходе анализа Вадим изучил официальные данные по результатам выборов и референдумов в городах, районах и областях Беларуси почти за 30 лет, включающие явку (процент проголосовавших от списка избирателей, обозначается как %П) и процент проголосовавших именно за Лукашенко (от числа проголосовавших, обозначается как %ПЛ).

Нажмите, чтобы увидеть данные по явке и количеству голосов за Лукашенко в 6 выборах президента Беларуси

Данные взяты из архива Центральной комиссии Беларуси по выборам и проведению республиканских референдумов (выражение в процентах).

1994 год:

  • I тур: явка — 78,97%; Александр Лукашенко набрал 44,82%;
  • II тур: явка — 70,60%; Александр Лукашенко набрал 80,34%.

2001 год:

  • явка — 83,86%;
  • за Александра Лукашенко — 75,65%.

2006 год:

  • явка — 92,6%;
  • за Александра Лукашенко — 82,97%.

2010 год:

  • явка — 90,65%;
  • за Александра Лукашенко — 79,65%.

2015 год:

  • явка — 87,22%;
  • за Александра Лукашенко — 83,47%.

2020 год:

  • явка — 84,05%;
  • за Александра Лукашенко — 80,10%.

Ниже вы можете прочесть основные выводы. Полное исследование доступно по ссылке.

Анализ районных данных: «склейки», «струны», «дубли»

Вадим Зипунников изучил данные, начиная с референдума за сохранение СССР в 1991 году (не вошло в данный анализ) и заканчивая выборами президента Беларуси 2020 года.

Большая часть анализа посвящена исследованию данных «районного уровня». То есть автор изучил информацию, касающуюся явки и голосов за определенного кандидата, в 145 административно-территориальных (территориальных) единицах — это понятие включает в себя как районы республики, так и районы крупных городов.

Вадим Зипунников взял информацию за 2001−2015 годы (дело в том, что ЦИК опубликовал данные по районам только по президентским выборам в 2001, 2006, 2010 и 2015 годах). Хотя за это время в структуре районов произошло несколько изменений, анализ не отслеживает их последствия и включает только те районы, что были представлены во всех четырех выборах президента Беларуси с 2001 по 2015 год.

Таким образом, в данном анализе каждая область представлена следующим количеством административно-территориальных (территориальных) единиц:

  • Брестская область: 20;
  • Витебская область: 24;
  • Гомельская область: 25;
  • Гродненская область: 19;
  • Минская область: 23;
  • Могилевская область: 25;
  • Минск: 9.

Основное наблюдение автора состоит в том, что в данном случае отсутствует ожидаемый уровень статистического разброса. Это приводит к аномально большому количеству районов с чрезвычайно близкими показателями: внутри одного района; между разными районами; между разными годами.

Если говорить простыми словами, то, как поясняет Вадим, данные не должны иметь так много близких значений — статистически ожидается, что они разбросаны на большее расстояние друг от друга. То есть нормально, если данные весьма схожи в двух-трех случаях, но если эта особенность встречается, допустим, в 40 случаях из 100, это повод задуматься.

Как пример можно вспомнить аномалии в данных голосования по поправкам к Конституции России 2020 года, когда было обнаружено немалое количество случаев голосования с нулевой дисперсией, то есть результатов, когда все УИК внутри одного ТИК проголосовали одинаково или с минимальным разбросом.

В случае же с Беларусью, в частности, были найдены три основных типа аномалий:

  • очень близкие значения явки и процента проголосовавших за Лукашенко внутри одного района (территориальной единицы);
  • сразу несколько районов имеют очень близкие показатели явки (или процента проголосовавших за Лукашенко);
  • результаты разных лет очень близки между собой.

Так, анализ показал, что количество найденных аномалий достигает пика в 2015 году — 279 аномалий на 290 электоральных показателей (напомним, электоральные показатели — это явка, обозначается как %П, и процент за Лукашенко — %ПЛ) по 145 территориальным единицам Беларуси, что в среднем приблизительно дает одну аномалию на каждый электоральный показатель.

На основе этих наблюдений автор приходит к выводу, что результаты президентских выборов в 2001, 2006, 2010 и 2015 года статистически маловероятны. А результаты выборов президента Беларуси в 2010-м и 2015 годах с большой вероятностью скомпилированы из результатов предыдущих выборов в 2001 и 2006 годах и в 2006 и 2010 годах соответственно.

Чтобы формализовать анализ, автор рассматривает пять основных типов «аномальной близости»:

  • когда в конкретном районе явка (%П) аномально близка к проценту проголосовавших именно за Лукашенко (%ПЛ) (то есть разница между значениями в одной территориальной единице меньше 1%), автор называет этот тип аномалии «дубль» (ниже можно увидеть график с примерами из Гомельской области. Здесь и далее красным маркером обозначены аномальные районы);

  • когда в конкретный год и в конкретной области республики значения явки (%П) сразу по нескольким районам аномально близки друг к другу (то есть разница между числами в двух районах меньше 0,1%), автор называет данный тип аномалии «струна» (%П);
  • когда в конкретный год и в конкретной области республики значения процента проголосовавших за Александра Лукашенко (%ПЛ) сразу по нескольким районам опять же аномально близки друг к другу — это тоже «струна» (%ПЛ) (как на графиках ниже);

  • когда в конкретном районе явка (%П) в один год аномальна близка к явке, зафиксированной в другой год, автор называет данный тип аномалии «склейка» (%П);
  • когда в конкретном районе процент проголосовавших именно за Лукашенко (%ПЛ) в один год аномально близок к проценту проголосовавших за Лукашенко в другой год, автор тоже называет данный тип аномалии «склейка» (%ПЛ) (ниже вы можете увидеть как пример два таких графика. Если точнее, то автор определяет как аномалию разницу между значениями показателей в два анализируемых года меньше 1%).

При этом каждый район может одновременно принадлежать к разным типам аномалий, а каждая область может иметь несколько «дублей», «струн» и «склеек».

В итоге получилась вот такая сводная диаграмма по районным данным: размер круга пропорционален количеству аномалий, указанному внутри круга.

Аномалии в областных данных: 1996−2020 годы

Как отмечает автор, ожидаемый уровень статистического разброса отсутствует и в областных данных за 1996−2020 годы (если точнее, то в данных по шести областям и Минску).

В этом случае основные наблюдения следующие:

  • каждый год между 1996-м и 2015-м содержит несколько областей с практически идентичными электоральными показателями (напомним, электоральные показатели — это явка П% и процент за Лукашенко %ПЛ);
  • результаты выборов президента Республики Беларусь 2015 года аномально близки к результатам референдума 2004 года и президентских выборов 2006 года сразу в нескольких областях;
  • результаты выборов президента в 2020 году аномально близки к результатам референдума 1996 года и президентских выборов в 2001 и 2015 годах сразу в нескольких областях.

Нажмите, чтобы увидеть примеры аномалий в данных за 2015 и 2020 годы

Чтобы понять, почему автор пришел к таким выводам, можно, к примеру, посмотреть на два графика за 2015 год: верхний показывает процент всех проголосовавших от списка избирателей (явку), а нижний — процент проголосовавших за Лукашенко по шести областям.

Для построения были взяты данные референдума 2004 года (в данном случае в качестве значения процента проголосовавших за Лукашенко использовался процент проголосовавших за), а также президентских выборов 2006, 2015 годов (данные одного года соединены между собой линией соответствующего цвета).

В итоге, отмечает автор, процент явки в 2015 году совпадает с тем же показателем в Брестской и Витебской областях в 2004 году. Также стоит отметить, как близки и параллельны проценты явки в 2015 году с процентом явки в Гродненской и Минской областях в 2004 году.

Что касается процента проголосовавших за Лукашенко в 2015 году, то этот показатель совпадает с процентом проголосовавших за Лукашенко в Брестской области в 2004 году и проголосовавших за Лукашенко в Могилевской области в 2006 году.

Также можно изучить областные данные за 2020 год: в этом случае верхний график показывает процент явки по шести областям за 1996, 2001, 2015, 2020 годы. А нижний — процент проголосовавших за Лукашенко по шести областям за 2001, 2015, 2020 годы.

Данные одного года соединены между собой линией соответствующего цвета.

Здесь автор выделил следующие основные наблюдения: процент явки в 2020 году совпадает с тем же показателем в Гомельской области в 1996 году и в Гродненской и Могилевской областях в 2015 году. Причем стоит отметить, как близки и параллельны проценты проголосовавших в 2020 году с процентом проголосовавших в Минской и Могилевской областях в 1996 году.

А процент проголосовавших за Лукашенко в 2020 году совпадает с тем же показателем в Гомельской области в 2001 году и в Могилевской — в 2015 году.

Нажмите, чтобы увидеть графики, на которых виды «струны» в областных данных: 1996−2020 годы

Во всех годах, кроме 2020-го, присутствуют кластеры («струны»), содержащие две или три области с практически идентичным значением явки (%П).

График показывает % проголосовавших (от списка избирателей) по шести областям. Данные одной области соединены между собой линией соответствующего цвета.
График показывает % проголосовавших (от списка избирателей) по шести областям. Данные одной области соединены между собой линией соответствующего цвета.

Например:

  • 1996 год: Гомельская (89,53%), Могилевская (89,64%);
  • 2001 год: Брестская (85,84%), Гомельская (85,74%), Гродненская (85,67%);
  • 2006 год: Витебская (95,21%), Минская (95,23%), Могилевская (95,26%);
  • 2010 год: Брестская (91,03%), Гродненская (90,90%), Минская (90,96%);
  • 2015 год: Брестская (90,39%), Гомельская (90,44%).

В разные годы области могут принадлежать к совершенно разным кластерам. Допустим, Гомельская область формирует кластеры то с Могилевской, то с Брестской и Гродненской областями.

Также практически во всех годах присутствуют кластеры («струны»), содержащие две или три области с почти идентичным значением процента проголосовавших за Лукашенко (%ПЛ) (в качестве значения процента проголосовавших за Лукашенко автор взял процент проголосовавших за на референдуме 2004 года и процент проголосовавших за в первом вопросе на референдуме 1996 года).

График показывает % проголосовавших за Лукашенко по каждой из 6- ти областей. Данные одной области соединены между собой линией соответствующего цвета.
График показывает % проголосовавших за Лукашенко по каждой из 6 областей. Данные одной области соединены между собой линией соответствующего цвета

Вот несколько примеров:

  • 1996 год: Гомельская (92,70%), Могилевская (92,80%);
  • 2004 год: Витебская (87,85%), Минская (88,17%);
  • 2010 год: Витебская (82,47%), Гомельская (82,30%);
  • 2010 год: Брестская (81,52%), Гродненская (81,37%);
  • 2015 год: Гродненская (85,89%), Минская (85,74%).

Аналогично явке области в разные годы могут принадлежать совершенно разным кластерам.

Вывод

На основе анализа районных данных автор пришел к выводу, что результаты выборов президента Беларуси в 2001, 2006, 2010 и 2015 годах статистически маловероятны.

При этом результаты президентских выборов в 2010-м и 2015 годах с большой вероятностью скомпилированы из результатов выборов в 2001 и 2006 годах и в 2006 и 2010 годах соответственно.

Что касается данных по областям, то «результаты выборов президента Республики Беларусь 2015 года аномально близки к результатам референдума 2004 года и президентских выборов 2006 года сразу в нескольких областях. Результаты выборов президента РБ по 2020 году аномально близки к результатам референдума 1996 года и президентских выборов в 2001 и 2015 годах сразу в нескольких областях».

Воспроизвести результаты можно, используя данные и код, доступные онлайн:

областные данные;

районные данные;

R код: раз и два.

-10%
-50%
-30%
-55%
-20%
-30%
-30%
-10%
-10%
0072916