опубликовано: 
обновлено: 
/ /

В редакцию TUT.BY обратился Андрей Шуман, заведующий кафедрой когнитивистики Университета информационных технологий и менеджмента в Жешуве, Польша. Он предложил довольно простой способ, как рассчитать время пика для каждой страны на основании лишь официальных данных. Побеседовали с ним о том, в чем состоит сложность расчета нынешней эпидемии и почему матмодели абстрактны.

Снимок носит иллюстративный характер. Фото: Ольга Шукайло, TUT.BY
Снимок носит иллюстративный характер. Фото: Ольга Шукайло, TUT.BY

Андрей Шуман — кандидат философских наук, доцент, профессор польского университета, который сейчас возглавляет кафедру когнитивистики (это междисциплинарное научное направление, занимающееся изучением мыслительных и познавательных процессов и моделированием принципов организации и функционирования различных самоорганизующихся систем), а также занимается математическим моделированием биологических систем. В частности, он принимал участие в разработке прототипа биологического компьютера, базирующегося на роевом поведении многоядерного одноклеточного организма Physarum polycephalum (координатором проекта был Университет Западной Англии в Бристоле). Последнее время он работал над математическим моделированием поведения разных типов роя — от социальных бактерий до пчел и муравьев.

— Я занимаюсь вычислимостью в биологии — сюда относится построение различных математических моделей, которые, во-первых, описывают и предсказывают поведение биологических систем. Во-вторых, это математические модели, которые симулируют биологические процессы, — поясняет Андрей. — Распространение эпидемии — достаточно простая задача по сравнению с построением математических моделей, например, роя, где насекомые, реализуя задачу экспансии, выполняют еще различные социальные функции.

В математике есть такое понятие, как автоволна — это волна, чья амплитуда не меняется в зависимости от внешних воздействий. Что бы мы ни делали, вид кривой эпидемии будет примерно одинаков для разных стран и разных обществ, потому что ее природа описывается как обычная автоволна, у которой есть свои параметры: в первую очередь общее число инфицированных и время, необходимое на закрытие каждого случая инфицирования. В частности, амплитуда волны будет зависеть только от самой системы: приняты ли меры карантина, успешно ли система здравоохранения справляется с заболеванием и так далее.

Как вычислить потенциальный пик

По словам Андрея, пик стоит ждать не раньше конца мая или начала июня. Ниже описываем методику расчета, а также поясняем, что значит «закрытые» и «активные» случаи. Чтобы развернуть, нажмите на плюс.

Как рассчитать пик при помощи графиков

Андрей говорит, что проще всего брать данные с сайта Worldometers — там аккумулируются данные официальной статистики разных стран.

По его словам, у любой эпидемии есть основные параметры:

⦁ x (i) — новые случаи на день i. Они растут каждый день, достигают максимума на какой-то день и затем идут на спад. На сайте это колонка New cases;

⦁ X (i) = Sum x (i) — это сумма всех случаев до дня i. Этот параметр только растет, доходит до максимума и прекращает рост. На сайте это колонка Total cases;

⦁ c (i) — закрытые случаи на день i (умершие или излечившиеся на этот день). Они растут каждый день, достигают максимума на какой-то день и затем идут на спад. На сайте отдельной этой колонки нет;

⦁ С (i) = Sum с (i) — это сумма всех закрытых случаев до дня i. Этот параметр только растет, доходит до максимума и прекращает рост. На сайте это сумма колонок Total deaths и Total recovered;

⦁ A (i) = X (i) – С (i) — активные случаи на день i. Грубо говоря, это число тех, кто пока не выздоровел или не погиб. На сайте это колонка Active cases.

— Все эти параметры удобно представить графически, — поясняет Андрей. —  Из эпидемиологии мы знаем, что идеальный график для новых случаев (x) любой эпидемии — логнормальная кривая. Кривая для закрытых случаев (с) повторяет кривую для новых случаев (x) с опозданием на то число дней, которое необходимо, чтобы каждый новый случай стал закрытым. Поведение кривой для закрытых случаев (с) зависит, таким образом, только от двух вещей — кривой новых случаев (x) и того, как быстро или медленно закрывается каждый новый случай. Кривая активных случаев (A), соответственно, тоже логнормальная. Она повторяет кривую новых случаев с большей амплитудой. Чем больше дней нужно на закрытие новых случаев, тем больше будет амплитуда.

Построим идеальный график любой эпидемии с параметрами x (i), X (i), c (i), С (i), A (i). На оси y откладываем число инфицированных, а на оси x — дни.

Изображение: Андрей Шуман
Изображение: Андрей Шуман

— Таким образом, эпидемия развивается вначале по экспоненте, достигает пика новых случаев ежедневно (x), затем достигает пика активных случаев на день А (i), затем все случаи инфицирования (X) выходят на плато, — продолжает Андрей. — Итак, у нас есть два пика эпидемии и одно плато. Первый пик — максимум в новых случаях ежедневно, второй — максимум в активных случаях ежедневно. После максимума активных случаев эпидемия вскоре выходит на плато и перестает быть опасной.

Наша задача — научиться прогнозировать точку пика активных случаев на день (A (i)) без сложных расчетов. Этому пику примерно соответствует пересечение двух кривых: новых случаев (x) и закрытых случаев (c) на день i.

Этой точке примерно соответствует доля, близкая к 50% активных случаев (A) по отношению ко всем случаям инфицирования (X). Проще говоря, это день, когда количество все еще болеющих равно половине всех зарегистрированных заразившихся. Этой же точке соответствует доля, близкая к 50% суммы всех закрытых случаев (C) по отношению ко всем случаям инфицирования (X). Таким образом, в этот день количество болеющих равно количеству закрытых случаев (вылечившиеся и умершие), то есть A (i) = С (i).

Выходит, что следить за эпидемией можно так. Берем закрытые случаи на сегодня (C (i), разница колонок Total cases и Active cases с сайта). Делим их на все случаи (X (i), колонка Total cases с сайта). Умножаем на 100. Получаем долю закрытых случаев ко всем случаям в процентах. Сравниваемых эту долю с 50%. Если она меньше 50%, то эпидемия еще на старте и свой пик (плато) не прошла. Если же она больше 50%, то эпидемия свой пик уже прошла и скоро закончится. В конце эпидемии все закрытые случаи на сегодня равны сумме всех случаев заражения (C (i) = Х (i)).

Как это применить на практике? Допустим, известно, что в Беларуси, по данным на 30 апреля, зафиксированы 14 027 человек с положительным тестом на инфекцию COVID-19, 2386 человек выздоровели, 89 пациентов с коронавирусом умерли. То есть X = 14 027 (напомним, что это сумма всех случаев инфицирования), С = 2475 (это сумма всех закрытых случаев, то есть всех, кто умер или излечился).

Смотрим долю закрытых случаев: 2475 делим на 14 027, а затем умножаем на 100. Получается 17,64%. Заметим, что вчера эта доля была 16,35%, а позавчера — 16,97%. Пик эпидемии пройден, когда доля закрытых случаев больше 50%. То есть в Беларуси до пика 32,36%, что далеко.

Для сравнения мы также построили график для Китая по тому же принципу.

 

— Закрытые случаи растут крайне медленно, и с таким ростом закрытых случаев пересечение графика закрытых случаев и новых случаев на день i (c и x) может быть не раньше конца мая или начала июня (рост не более 1% в течение дня). Это дает прогноз о том, что в Беларуси не менее месяца будет весьма неблагоприятная эпидемиологическая обстановка. Стоит заметить, что скорость роста новых случаев (x) может еще больше увеличиться и ожидаемый пик отодвинется еще дальше, — считает Андрей. — Из статистических аномалий — странное поведение ежедневных случаев смерти. Их график должен зависеть от графика активных случаев (чем больше ежедневно активных случаев, тем больше случаев смерти). Однако ежедневный прирост умерших колеблется от 3 до 5 человек вне зависимости от числа активных случаев. К пику у нас ожидается всего около 250 умерших. Такая цифра мне кажется необъективной.

«Нужно понимать, что любая модель абстрактна»

Конечно, на описание модели влияют множество параметров, например, с какой скоростью распространяется эпидемия.

— Если брать COVID-19, то мы видим, что скорость не очень высокая. О первом пациенте с коронавирусом в Беларуси стало известно 28 февраля, и тем не менее до пика нам еще далеко, — говорит Андрей.

Кроме того, предложенный им график довольно прост и строится по данным официальной статистики.

— По сути, у нас должно быть только два типа информации — эмпирические данные и методы их логической обработки. Где мы можем найти эти эмпирические данные? Во-первых, это официальная статистика, хотя к ней есть вопросы, например, мне кажется странным, что в Беларуси количество умерших практически не коррелирует с числом заболевших, хотя это может иметь и какие-то объективные причины. А если брать логическую обработку, то здесь можно применить очень простые методы статистического анализа имеющихся данных или же изучить научные статьи в рецензируемых журналах высокого класса — Science, Nature. Но не публикации в блогах.

Снимок носит иллюстративный характер. Фото: Ольга Шукайло, TUT.BY
Снимок носит иллюстративный характер. Фото: Ольга Шукайло, TUT.BY

Андрей добавляет, что официальная статистика может не учитывать некоторые случаи, но если основываться на них, напрашивается вывод, что ждать пика раньше конца мая не приходится.

— Кроме того, нужно понимать, что доля закрытых случаев может падать. Это зависит от того, насколько эпидемия сдерживается (или не сдерживается) какими-то карантинными мерами. По моим расчетам, в Беларуси доля закрытых случаев уже была более 20%. Я скажу так: ситуация в любой момент может стать хуже. Но та картина, что наблюдается в мире, пока не слишком страшная. Все рано или поздно выходят на пик, даже те страны, где эпидемия вызвала масштабный кризис, например, в Италии и Испании уже фиксируется уменьшение количества ежедневных подтвержденных случаев. Если они ничего не изменят в своих мерах борьбы с эпидемией, то пойдут на спад, и через пару месяцев у них будет совсем мало новых случаев инфицирования.

Почему пик — это хорошо? После него идет снижение, и страна выходит на «плато заболеваемости». Но, конечно, может быть и вторая волна, и тогда будет потребность в новом пике.

— Но ведь на распространение эпидемии могут повлиять и особенности коронавируса.

— Здесь довольно сложно сказать. Например, раньше считалось, что COVID-19 — это вирусная пневмония, а сейчас выяснилось, что это заболевание может иметь аутоиммунную природу, а также поражает эндотелий — защитную оболочку сосудов. Это приводит к нарушениям микроциркуляции крови и может вызвать сердечную недостаточность и другие причины резкого ухудшения здоровья и даже смерти. Получается, что самая главная проблема — перед нами новый патоген, о котором мы еще мало знаем.

Кроме того, сейчас нет нормального общего протокола лечения. Это вторая проблема. Например, раньше считалось, что препараты против малярии эффективны и против COVID-19, а затем оказалось, что не очень

Третья проблема — что у COVID-19 большой инкубационный период, то есть инфицированный человек успевает заразить довольно большое число людей в рамках своего инкубационного периода. И четвертая проблема, что коронавирусная инфекция требует довольно долгого лечения, не менее двух недель, а то и три или четыре. Это, конечно, очень сильная нагрузка на систему здравоохранения.

Но пока, основываясь на эмпирических данных, можно сказать, что эта волна эпидемии закончится месяца через три-четыре. Другое дело, что может быть вторая волна, вызванная, например, мутацией вируса. Но исследования специалистов, занимающихся генными модификациями коронавируса, пока свидетельствуют, что скорость мутации SARS-CoV-2 достаточно медленная.

Однако Андрей подчеркивает: чтобы построить точную модель распространения коронавируса в Беларуси, оценить природу эпидемии, нужно большее количество эмпирических данных, которых сейчас нет в открытом доступе.

— Например, число заболевших с конкретной локализацией, чтобы мы могли наложить эти данные на карту Беларуси и спрогнозировать саму динамику. Или же информация, как коронавирусная инфекция влияет на заболевших разных возрастов. Мы знаем по опыту других стран, что в группе риска люди пожилого возраста, с хроническими заболеваниями, чаще всего аутоиммунными и болезнями кровеносной системы. Но по Беларуси таких данных в открытом доступе нет.

Да, группа эпидемиологов из Имперского колледжа в Лондоне опубликовала подробный прогноз, в котором описывались последствия того, какой стратегии — более жесткой или менее жесткой — будут придерживаться власти в борьбе с эпидемией коронавируса. Этой модели можно верить, но все равно там есть абстрактные допущения. Например, они допустили в своей модели очень низкую летальность.

Нужно понимать, что любая модель абстрактна. В статистике есть такое понятие, как закон больших цифр. Грубо говоря, чем больше мы проводим тестов, тем ближе у нас данные к математическому ожиданию распределения.

Мы знаем из эпидемиологии, что распределение для эпидемии будет логнормальное, то есть эпицентр кривой немного смещен влево. Это значит, что эпидемия очень быстро выходит на экспоненту, достигает максимума и долго снижается. Если мы наложим все случаи COVID-19 в разных странах, то единственный график, который их всех аппроксимирует, будет именно логнормальная кривая. Потому что если мы смотрим на реальную гистограмму по разным странам, то увидим много разных случайных колебаний.

То, что я предложил, — это базовое понимание природы эпидемий. Мы просто берем данные всех инфицированных и все активные случаи, и это позволит нам предсказать пик эпидемии просто потому, что логнормальная кривая описывает любую эпидемию, неважно какую — будь то COVID-19, корь, оспа или что-то еще.

-10%
-10%
-10%
-10%
-40%
-21%
-13%
-35%
-5%
-20%