• В Беларуси
  • Наука
  • Интернет и связь
  • Гаджеты
  • Игры
  • Оружие
  • Архив новостей
    ПНВТСРЧТПТСБВС


/

Павел Скумс — это человек, который прислал нам прогноз динамики распространения COVID-19 в Беларуси на основе математического моделирования. Он окончил мехмат БГУ, а теперь работает на факультете Computer Science в Университете штата Джорджия в США. 42.TUT.BY побеседовал с ним о том, как сменить теоретическую информатику на «расследование эпидемий», и заодно узнал, какие штаммы коронавируса циркулируют у нас в стране.

Фото: из личного архива Павла Скумса
Фото: из личного архива Павла Скумса

Но сначала — краткая справка

Про Павла на сайте университета написано следующее: получил кандидатскую степень по теоретической информатике в БГУ в 2007 году, преподавал на мехмате три года, до 2010-го, затем переехал в США и стал работать в CDC — Центре по контролю и профилактике заболеваний США, где занимался вопросами ВИЧ/СПИДа, вирусных гепатитов, ЗППП и профилактики туберкулеза. А в 2016-м перешел в Университет штата Джорджия и работает там в должности Assistant Professor (то есть профессор со стажем работы в этом университете менее пяти лет или доцент) и замдекана по магистратуре и аспирантуре на факультете Computer Science в Университете штата Джорджия.

Павел занимается исследованиями в сфере биоинформатики, вычислительной геномики, молекулярной эпидемиологии, математического моделирования, теории графов и сложных сетей, причем в области биологии его исследования сосредоточены на изучении эпидемиологии и эволюции РНК-вирусов c высокой скоростью накопления мутаций. Как уже известно, новый коронавирус также относится к этой категории.

С недавних пор он совместно с коллегами из School of Public Health занимается отслеживанием и предсказанием динамики распространения COVID-19. В частности, вместе с профессором Херардо Човелл-Пуэнте Павел построил математическую модель для Беларуси, которая, по его словам, пока вполне соответствует данным по нашей стране.

— Я вырос в Минске в обычной семье: отец — физик, работал в НИИ физико-химических проблем при БГУ, мать — на заводе, — рассказывает Павел. — Я же учился в школе, участвовал в олимпиадах, поступил в БГУ на мехмат, окончил его в 2004 году, а через три года защитил диссертацию по дискретной математике, теории графов. Сейчас мне это очень помогает при построении моделей для биологии и эпидемиологии, потому что эпидемии распространяются по графам, и эволюция вирусов — это тоже в некотором роде динамический процесс на графе.

Моим руководителем была выдающийся математик Регина Иосифовна Тышкевич, которая, к сожалению, умерла в прошлом году в возрасте 90 лет. Легендарная личность, которая читала лекции до тех пор, пока могла ходить, мать-основательница всей нашей школы теоретической информатики.

Я остался преподавать на мехмате. Почему? А где еще в Беларуси заниматься наукой, особенно математикой? У нас главные центры в этом плане — БГУ и Институт математики. Но спустя три года вопрос стал ребром: как мне дальше развиваться в качестве ученого? В Беларуси на тот момент почти не было математиков среднего возраста, большинство либо уехали, либо ушли в бизнес.

Но коммерческая деятельность мне неинтересна — мне нравится заниматься наукой. А чтобы развиваться, нужно, чтобы вокруг была соответствующая атмосфера. В поисках такой атмосферы я и переехал в США.

«Словно бы кто-то порезал книгу на мелкие кусочки, потом подбросил их в воздух, перемешал и после этого попросил рассказать, что же там написано»

Правда, для этого Павлу пришлось переквалифицироваться из теоретического информатика в биоинформатика (оказывается, даже в США для теоретических специалистов меньше возможностей, чем для прикладных). Биоинформатика — это синтетическая наука, где причудливым образом перемешаны, казалось бы, мало совместимые дисциплины — например, дифференциальные уравнения, теория графов и статистика (и это не считая биологии и медицины). Так что Павлу пришлось сдуть пыль со старых конспектов и вспомнить то, чему его учили в студенческие годы.

В поисках позиции постдока он подал резюме в CDC в Атланте, штат Джорджия, — вы могли видеть это здание в фильме «Заражение» 2011 года. Съемки ленты Содерберга проходили там в 2010-м, как раз когда Павла приняли на работу.

Кадр из фильма "Заражение" 2011 года. Источник: КиноПоиск
Кадр из фильма «Заражение» 2011 года. Источник: КиноПоиск

— Однажды я иду на работу, а на входе огромная толпа людей с плакатами «CDC убил моего мужа, позор за то, что скрываете правду» и прочими лозунгами в том же духе. А перед ними военные на бронетранспортерах. Я был, мягко говоря, сильно удивлен: «Что происходит, я чего-то не знаю?» А оказалось, что это фильм снимают, — улыбается Павел. — Сейчас все, наверное, знают, что такое CDC. Это огромное федеральное агентство, которое занимается отслеживанием всех эпидемий, причем не только вирусов. Ожирение и курение — это тоже эпидемии. Но вирусы — все же основное занятие.

CDC разделен на центры. Грубо говоря, есть центр по ВИЧ/СПИДу, а есть, например, центр, связанный с респираторными заболеваниями (он как раз сейчас занимается коронавирусом SARS-CoV-2). Я был биоинформатическим специалистом в отделении ВИЧ, гепатита и аналогичных заболеваний.

Что математик-информатик может делать в CDC? Дело в том, поясняет Павел, что примерно лет 10 назад в биологии произошла революция, связанная с так называемым секвенированием следующего поколения.

— Секвенирование — это процесс чтения молекулы ДНК. Примерно до 2008−2010 годов это был достаточно долгий и дорогой процесс, многое приходилось делать вручную, требовалось много реагентов, а на выходе получалось буквально несколько последовательностей ДНК из каждого образца. Например, таким образом секвенировали геном человека (проект «Геном человека», который проводился с 1990-го по 2003-й. — Прим. TUT.BY), и потратили на это несчетные миллионы долларов. Сейчас вы можете заказать анализ своего генома в частной лаборатории за сотню долларов.

Все это — из-за революции секвенирования следующего поколения. Новые технологии, появившиеся за последнее десятилетие, гораздо дешевле и производят миллионы и миллиарды последовательностей. И при этом их вполне можно автоматизировать. Секвенирование превратилось в рутинный процесс, все дешевеет.

Снимок носит иллюстративный характер. Фото: Ольга Шукайло, TUT.BY
Снимок носит иллюстративный характер. Фото: Ольга Шукайло, TUT.BY

— Но если раньше биолог мог все посчитать в табличке Excel, то теперь секвенаторы выдают гигабайты данных, — продолжает Павел. — Нужны алгоритмы для их первичной обработки, начиная с удаления «шума» и заканчивая ассемблированием, то есть сборкой полного генома из кусочков.

Дело в том, что машины не «читают» полный геном, они секвенируют коротенькие фрагменты, которые потом нужно собирать, как пазл. Допустим, у коронавируса SARS-CoV-2 полный геном примерно 30 тысяч нуклеотидов, а секвенаторы позволяют получить последовательности длиной в 300. Есть аналогия, что это словно бы кто-то порезал книгу на мелкие кусочки, потом подбросил их в воздух, перемешал и после этого попросил рассказать содержание этой книги.

Но, к счастью, это кусочки не одной, а тысячи копий. Последовательности ДНК сначала размножаются, а потом уже разбиваются на части и секвенируются. И стыкуя эти копии, можно получить полную картину. Для вирусов задача еще сложнее: их геномы обычно содержат десятки мутаций, и важно найти их все, поскольку даже самая редкая мутация может оказаться ответственной за повышенную вирулентность или резистентность к терапии.

И это только первая часть работы. После того как мы собрали полноразмерные геномы вируса, наступает черед того, что называется молекулярной эпидемиологией. Мы пытаемся извлечь данные о развитии эпидемии из этих последовательностей. С помощью анализа и сопоставления геномов вируса можно получить массу информации, начиная от репродуктивного числа (среднего количества вторичных заражений на одного инфицированного) и заканчивая непосредственной информацией о том, кто кого заразил.

«Ты можешь быть выдающимся педагогом, но если у тебя нет ни одного гранта, ты далеко не уйдешь»

Университет штата Джорджия. Источник: smapse.ru
Университет штата Джорджия. Источник: smapse.ru

Проработав в CDC шесть лет, с 2010-го по 2016-й, Павел решил вернуться к преподаванию. Он уже давно сотрудничал с Университетом штата Джорджия, который был расположен буквально в 15 минутах езды от центра, так что когда ему поступило предложение преподавать на факультете Computer Science, он не стал отказываться.

— Пару лет я был профессором-совместителем, а потом принял предложение перейти полностью в штат. Университет предоставляет больше академической свободы, профессор сам себе начальник, — поясняет Павел.

— Есть отличия в преподавании в Беларуси и США? Например, мне кажется, что в Штатах лекции более актуальные и интересные.

— Да, в США лекции больше читают на «злобу дня», по последним исследованиям. Почему так — могу ответить за себя.

Когда ты читаешь лекции, то преподаешь не только для студентов, но и для себя. Как говорится, если сам хочешь в чем-то разобраться — попытайся объяснить это другим. Какой смысл постоянно читать одно и то же, это ничего не дает тебе как ученому. Такой подход стимулирует тебя преподавать что-то новое. Но я не говорю, что в БГУ было все по-другому. Так, мой научный руководитель Регина Иосифовна Тышкевич каждый год рассказывала что-то новое.

Наиболее престижные университеты в Америке — это так называемые research university («исследовательские университеты»), которые помимо преподавания занимаются научной деятельностью. Наш университет относится к этой категории.

Поэтому нагрузка у нас распределяется по принципу 40−40−20: 40% — на исследования, 40% — на преподавание и 20% — на все остальное. Так что исследования по нагрузке приравнены к преподаванию, а на самом деле они еще важнее. В твоем продвижении по карьерной лестнице главное — это количество грантов и публикаций, то есть research. Ты можешь быть выдающимся педагогом, но если у тебя нет ни одного гранта, ты далеко не уйдешь. Поэтому приходится строить свое преподавание так, чтобы оно помогало исследованиям.

«В Беларуси сейчас распространяются два штамма коронавируса»

Когда стало понятно, что нынешняя вспышка коронавируса перерастет в пандемию, Павел включился в работу по геномному и филогенетическому анализу SARS-CoV-2. Проще говоря, это когда команда исследователей пытается восстановить последовательность накопления вирусом мутаций, а затем использует эти данные, чтобы отследить маршруты его распространения.

— Лаборатории со всего мира выкладывают отсеквенированные геномы вируса в глобальную базу данных GISAID, и эти данные полностью доступны для всех исследователей, — поясняет Павел. — Несколько дней назад там наконец-то появились два вирусных генома из Беларуси, секвенированные из образцов, собранных РНПЦ эпидемиологии и микробиологии. Сейчас реконструированный нами «граф трансмиссий» выглядит вот так: вершинами являются геномы SARS-CoV-2, ребра указывают на прямые или опосредованные (то есть через ненаблюдаемые промежуточные звенья) передачи вируса между их носителями.

Кроме меня над этим работают мои коллеги из School of Public Health и Department of Computer Science. Один из них — профессор Херардо Човелл-Пуэнте, который заведует кафедрой наук об общественном здравоохранении на факультете здравоохранения университета. Херардо — специалист по предсказанию динамики эпидемий, он занимается этим еще со времен SARS и исследует проблему с точки зрения человеческих популяций, в то время как я, если можно так выразиться, исследую ту же проблему с точки зрения вируса.

Еще два участника нашей команды имеют прямое отношение к Беларуси. Александр Кирпич — биостатистик с факультета здравоохранения, он тоже выпускник мехмата БГУ, хотя степень PhD получил уже в США. И Александр Зеликовский — еще один биоинформатик с факультета Computer Science, он выходец из Молдовы, но в свое время учился в аспирантуре в Минске.

— Как вы определяете, что тот геном произошел из Китая, а этот из Европы?

— У нас есть генетические и эпидемиологические признаки, которые позволяют с достаточной степенью точности определять, как распространяется вирус.
Возьмем Беларусь — сейчас здесь, скорее всего, циркулируют два штамма (или, точнее, субпопуляции), которые можно назвать «европейской» и «иранской».

Глобальный граф трансмиссий и место белорусских геномов в нем представлены на рисунке (белорусские геномы выделены оранжевым и обозначены вершинами большего размера).

График предоставлен Павлом Скумсом
График предоставлен Павлом Скумсом

— «Европейская» последовательность (на рисунке сверху) очень близка к одному из доминантных геномов коронавируса, который был отсеквенирован в ряде стран Европы, например во Франции, Италии, Чехии, Нидерландах, Германии. Это говорит, что наш вариант был привезен из Европы и что он является производным от европейского типа. Вторая белорусская последовательность (на рисунке снизу) находится в одном кластере с последовательностями из Австралии, Новой Зеландии, Пакистана и еще ряда стран.

Казалось бы, какая здесь связь с Беларусью? Но дело в том, что для целого ряда последовательностей из этого кластера известно, что их носители в какой-то момент прибыли из Ирана.

Иран до сих пор не предоставил ни одного полноразмерного генома SARS-CoV-2, но, учитывая эту информацию, мы можем предположить, что этот кластер — ответвление пока что невидимого для нас большого иранского кластера. Таким образом, и белорусская последовательность — скорее всего, потомок иранского варианта. Насколько я знаю, эти выводы соответствуют тому, что известно нашим эпидемиологам на основании других источников. Вот так примерно мы и расследуем вспышки заболеваний.

— Сейчас можно увидеть множество статей вроде «Коронавирус вернется осенью и будет еще более заразным».

— Скажу честно, эволюция коронавируса SARS-CoV-2 пока что мало понятна. Мы сейчас пытаемся посчитать, есть ли какая-нибудь разница в фенотипических свойствах вируса, эволюционирует ли он, например, в сторону большей или меньшей инфективности либо же имеет место быть то, что называется «нейтральной эволюцией». Надеемся, что со временем что-то прояснится.

Так что, если вы увидите публикацию, утверждающую нечто вроде «мы обнаружили мутацию, благодаря которой вирус стал более инфективным или вирулентным», то не стоит ей безоговорочно верить. Таких статей на архивах препринтов сейчас расплодилось много, и они почти никогда не проходили настоящего научного рецензирования. Все это пока не подтверждено, и панику разводить рано.

«Настоящая паника начнется, когда люди начнут драться в магазинах за последнюю пачку туалетной бумаги»

Сейчас Павлу и его коллегам приходится работать с утра до вечера из дома: университет перевели на дистанционное обучение до конца семестра. Но местные жители могут выходить из дома без угрозы штрафа.

— У нас в Джорджии ввели карантин несколько дней назад, но ограничения в основном затрагивают бизнесы, такие как рестораны. Относительно физических лиц правила довольно обтекаемы, так что не вполне понятно, что будет за их несоблюдение. Скорее всего, ничего, — говорит Павел. — Я вчера вышел за продуктами, и количество людей на улицах примерно такое же, как и до объявления карантина — но, конечно, меньше, чем до начала эпидемии. Люди все-таки сидят по домам.

— Паника есть?

— Паники нет. Настоящая паника начнется, когда люди начнут драться в магазинах за последнюю пачку туалетной бумаги. Но я такого не вижу. Хотя в первые дни, помнится, я зашел в супермаркет и будто вернулся в детство, в 91-й год: пустые полки, люди размели все консервы и замороженные продукты. При этом, допустим, в одном отделе нет замороженной курицы — а рядом в кулинарии продается сколько угодно свежей. Это не дефицит, а человеческий фактор.

0071034