Можно ли предсказать развитие пандемии коронавируса? Объясняем на примере России

И власти, и рядовые граждане задаются вопросом, когда же закончится пандемия коронавируса и можно будет наконец снять карантин. Ответ могли бы дать ученые: у них есть математические модели, позволяющие строить прогнозы. Но насколько эти модели рабочие и возможно ли их перенести на реальную жизнь?

В связи с пандемией коронавируса многие люди по всему миру стали чуть больше разбираться в том, как распространяются инфекционные заболевания. В повседневный обиход вошли выражения «выйти на плато», то есть стабилизировать эпидемию, и «сгладить кривую», то есть замедлить распространение вируса.

При этом можно увидеть много прогнозов относительно того, как скоро та или иная страна выйдет на это самое плато. И результаты выдаются самые разные.

Некоторые политики упрекают ученых в том, что те не могут спрогнозировать развитие пандемии. Ученые на это отвечают, что в моделировании необходимо учитывать многие показатели, и все они постоянно уточняются, потому что новый коронавирус досконально не изучен.

Русская служба Би-би-си попробовала разобраться в том, как ученые предсказывают развитие пандемии и что они могут сказать о ситуации в России с учетом претензий к качеству статических данных.

Как работают модели, прогнозирующие развитие эпидемий?

Одна из самых распространенных моделей — SIR, разработанная в конце 20-х годов??? какого века???. Ее название — это аббревиатура, образованная из первых букв слов susceptible (уязвимый), infected (инфицированный) и recovered (переболевший).

Суть SIR-модели в том, что все население разделяется на уязвимых — тех, кто может быть инфицирован, — собственно инфицированных и переболевших.

К настоящему времени разработано несколько вариаций этой модели, в том числе SEIR, где E означает exposed, то есть инфицированные с вирусом в стадии инкубационного периода. Эти люди уже заразились, но симптомы болезни пока не проявляются.

Согласно модели SEIR, уязвимые люди сначала заражаются, потом у них некоторое время длится инкубационный период, после чего проявляются симптомы, и в итоге они выздоравливают либо умирают.

В случае с Covid-19 инфицированные могут заражать других еще до проявления симптомов, что делает вирус особенно заразным. По данным Всемирной организации здравоохранения, инкубационный период коронавируса составляет в среднем 5-6 дней.

Как оценивают заразность вируса?

Заразность вируса измеряется с помощью индекса (коэффициента) базовой репродукции — R0. Если этот коэффициент равен 1, то каждый человек заражает еще одного человека, а тот затем передает вирус еще одному человеку и так далее.

20deebfc4b616ebb1c3c8b828fa849e0

Если представить себе, например, десять таких «перепрыгиваний» вируса от человека к человеку, то с каждым шагом будет заражаться один человек. Понятно, что такими темпами вирус будет распространяться достаточно медленно.

Увеличение R0 на единицу существенно ускоряет процесс. Если R0 равен 2, это означает, что первый инфицированный передает вирус еще двум людям, затем каждый из них передает инфекцию еще двум и так далее.

Индекс репродукции нынешнего коронавируса составляет около трех, однако оценки разнятся.

Изначальный показатель в конкретной местности может меняться в зависимости от того, как часто люди контактируют друг с другом. Когда власти ограничивают контакты людей с помощью различных мер, индекс репродукции снижается. Это можно увидеть на примере Британии, где власти объявили о прохождении пика эпидемии 30 апреля.

7e5d802170c40ca55a5b95f339b05286

Сейчас все страны пытаются опустить коэффициент репродукции ниже единицы, надеясь, что при медленных темпах распространения инфекции можно будет ослабить ограничительные меры, разрешить людям вернуться в офисы, открыть рестораны и другие заведения сферы услуг.

Добиться такого снижения индекса — не означает победить вирус, но при низком индексе распространение инфекции можно будет контролировать с помощью более щадящих для экономики мер — ношения масок, массового тестирования, отслеживания контактов и своевременного изолирования людей с симптомами. По крайней мере, на это надеются ученые и чиновники.

Усилия многих специалистов по всему миру сейчас направлены как раз на это — понять, насколько эффективны ограничительные меры, то есть насколько снизился коэффициент репродукции в конкретной местности, и можно ли уже открывать экономику.

cfdff15a9f64ea52e959c23786474cdf

Помогает ли карантин?

Для моделирования распространения коронавируса можно использовать интерактивную модель, разработанную Базельским университетом (Швейцария) на основе SEIR.

При выборе определенной страны многие данные в этой модели подгружаются автоматически (количество жителей, возрастная структура населения, число подтвержденных случаев заболевания коронавирусом и прочее). R0 принимается равным 2,64 — 3,23.

Если выбрать Россию и посмотреть, что было бы, если бы власти не приняли никаких ограничительных мер, то модель показывает, что к началу июля в России умерли бы 1,3 — 1,36 млн человек. Количество инфицированных на пике эпидемии составило бы 14-22 млн человек.

a44472d16337f1045ddb38f0e3623186

Тут присутствует некоторое завышение — может быть, процентов на 30, потому что в модели делается предположение, что население однородно, то есть все люди примерно одинаковые и что у них примерно одинаковые шансы друг друга заразить, говорит доцент МГУ, кандидат физико-математических наук Михаил Тамм.

«Россия же с точки зрения распространения вируса — это набор отдельных городов, отдельных резервуаров, внутри которых все относительно быстро перемешивается. Между ними есть небольшие потоки, которых недостаточно для того, чтобы происходящее в Москве быстро перекинулось, например, на Новосибирск», — объясняет ученый.

К тому же четверть населения России живет в деревнях. Есть вероятность, что в изолированные места вирус не попадет, а модель этого не учитывает, добавляет Тамм.

«Второе соображение, которое может завысить данные моделирования: если люди видят, что у них бушует эпидемия, много знакомых заболевает и некоторые болеют очень тяжело, то люди начнут соблюдать какой-никакой карантин сами, не дожидаясь указов начальства. Это тоже в итоге снизит смертность — но не вдвое, конечно. Я думаю, что 1,3 млн, скорее всего, завышенная цифра, но 0,8 млн — абсолютно реальная [в сценарии без карантина]», — говорит Тамм.

То, что модель может завышать данные по количеству инфицированных и умерших, можно увидеть на примере Швеции, которая не вводила строгий карантин, как многие другие страны Европы.

В Швеции жители добровольно перешли на режим социального дистанцирования, запрещены собрания более 50 человек, закрыты университеты и школы для старших классов. Многие работают из дома, но магазины и рестораны при этом открыты.

По состоянию на 21 мая в Швеции зарегистрировано около 3,8 тысячи смертей. При этом модель Базельского университета показывает, что в сценарии «без карантина» в Швеции количество смертей должно было составить гораздо больше — 88-110 тыс. человек — на эту же дату.

Как повлиял карантин на Россию?

Так или иначе, власти России приняли ограничительные меры, и этот сценарий не реализовался.

С 16 марта в Москве, где регистрируется около половины всех российских случаев заражения вирусом SARS-CoV-2, запрещены массовые мероприятия, с 21 марта закрыты школы. 23 марта своим указом Собянин обязал пожилых москвичей не выходить из дома без крайней необходимости, в последующие дни были закрыты библиотеки, развлекательные заведения, рестораны и парки.

30 марта Путин объявил о введении режима нерабочих дней, который впоследствии несколько раз продлялся. 11 апреля в Москве введены цифровые пропуска для передвижения по городу. Режим нерабочих дней закончился 11 мая.

Ограничительные меры привели к тому, что многие люди в течение нескольких недель оставались дома.

e9c07fc425c05fef7a3f9c97c84af854

Разработанный Базельским университетом инструмент позволяет учесть влияние ограничительных мер. Но для этого нужно оценить их эффективность в процентах и внести эти данные в модель.

Оценить эффективность ограничительных мер можно только задним числом, и специалисты делают это, подгоняя модель под актуальные данные по новым случаям или смертям. По изменению тренда можно понять, насколько карантин снизил коэффициент репродукции.

«Ищете переломный момент, когда на эту кривую оказал влияние карантин. И начинаете подбирать, насколько надо изменить в этом месте коэффициент воспроизводства, чтобы учесть эффект карантина. И получаете какую-то оценку», — так Михаил Тамм описывает процесс подгонки.

Например, изменение тренда хорошо видно на графике новых случаев Covid-19 в России за последние три дня.

20 апреля началось замедление — судя по всему, начал сказываться эффект нерабочих дней. 2-5 мая произошел новый скачок, который власти объясняют ростом количества тестов. С 6 мая можно наблюдать новое замедление роста и даже сокращение количества новых случаев за последние три дня.

4c001ef8e7f6e8f974ff1610fdc3fc42

Моделировать ситуацию в целом по России сложно из-за разной плотности населения: в России десятки крупных и несколько тысяч мелких городов, а также более 130 тысяч деревень. Но можно моделировать ситуацию в Москве.

Ситуация в Москве

До ввода ограничительных мер в российской столице коэффициент репродукции составлял около трех, а после закрытия школ снизился до 1,9-2, говорит Михаил Тамм, который оценивал этот показатель.

«Когда мы ушли на карантин, в первой половине апреля, скорее всего, было чуть выше 1. Потом был всплеск новых случаев, который мы увидели в первых числах мая. После этого всплеска казалось, что коэффициент репродукции был около 1 или чуть-чуть меньше. В последние дни все резко пошло вниз, и сейчас, наверное, 0,85-0,8. Но непонятно, успехи последних дней — это проблемы со статистикой или это реальный успех», — полагает Тамм.

Что может произойти после выхода из самоизоляции?

Чтобы понять, как будет развиваться ситуация с коронавирусом в России в ближайшие недели, можно также посмотреть на моделирование Центра эпидемиологии Имперского колледжа Лондона. Специалисты этого центра моделируют развитие эпидемии во многих странах.

Если в России ослабить ограничения так, что количество контактов людей увеличится на 50%, то число новых случаев вновь начнет расти, показывают данные Имперского колледжа.

937240534da15f81974ba70ec42a4804

Модели улучшаются по мере накопления данных. Со временем улучшается и понимание того, как люди в той или иной местности реагируют на ограничительные меры властей.

Например, в США, где ситуацию моделируют несколько научных центров, разброс прогнозов значительно сузился. 12 апреля четыре модели показывали, что к началу июня количество умерших может составлять от нескольких десятков до 5 тысяч человек в сутки. 12 мая модели показывали, что количество смертей к началу июня может составить 700-1800 в сутки.

Искаженная статистика затрудняет прогнозы для России

Сбор как можно более точных данных — один из ключевых моментов в моделировании эпидемии.

«Параметры вы определяете из статистики. У вас никаких других данных нет. Какие-то параметры вы можете вытащить из анализа конкретных случаев, когда эпидемиологи довольно подробно пишут, как развивается болезнь и сколько она продолжается, на примерах выясняют, за какое время люди друг друга заражают», — объясняет доцент МГУ Тамм.

В частности, как упоминалось выше, специалисты оценивают влияние карантина на снижение коэффициента репродукции по новым случаям или смертям. Если эти данные неверны, то оценить снижение коэффициента более или менее верно не получится. Соответственно, не удастся понять, дает ли должный эффект карантин.

Тамм не доверяет статистике, которую публикуют российские регионы. И он не одинок. Анализом несообразностей в цифрах заболеваемости и данных о смертностей занимаются многие математики, демографы и специалисты по статистике.

Подобное мнение в разговоре с Би-би-си выразили еще несколько экспертов. Экономист Татьяна Михайлова обратила внимание на то, что число выявленных заражений в некоторых регионах ежедневно меняется на один или два случая. Об этом она написала в «Фейсбуке».

На момент написания того поста было заметно всего три таких «сверхстабильных» региона — Краснодарский край, Липецкая и Курская области. В последние дни число выявленных случаев в этих регионах постепенно снижается.

5bcaa560a28ad23ccb5cdf475fa04240

«Среди людей, которые интересуются темой достоверности официальной статистики, есть достаточно консенсусное мнение, что уровень фальсификаций растет и он устойчиво растет примерно с 20 апреля», — говорит Борис Овчинников, директор по исследованиям компании Data Insight. Он подчеркивает, что аномалии ширятся географически — подозрительные данные поступают из все большего числа регионов.

Сомнения у экспертов вызывают в первую очередь числовые совпадения. Овчинников приводит в пример отчеты регионов за 16 мая: Калужская, Тульская, Ярославские области и Чувашия сообщили о 97 новых выявленных случаях, а Челябинская и Брянская области, Башкирия и Ставропольский край — о 98 новых случаях.

«По очень примерной моей прикидке вероятность того, что такое совпадение будет случайным, примерно 1 на 3 миллиона», — говорит Овчинников.

«В Краснодарском крае 11 дней подряд сообщались цифры между 96 и 99, причем день ото дня они отличались на 1-2 случая. Вероятность, что такое событие действительно могло произойти случайно — меньше одной миллиардной», — приводит другой пример Тамм.

Еще один пример статистики, которая вызывает вопросы у экспертов, — это несовпадение динамики заболеваний с конкретными событиями.

28 апреля Северная Осетия сообщила о резком росте выявленных случаев — до 148. Это произошло через восемь дней после митинга против самоизоляции, который прошел во Владикавказе.

Можно было бы предположить, что 148 человек заразили других и количество зараженных будет расти. Но осетинская статистика показывает, что заболеваемость наоборот начала снижаться.

Овчинников из Data Insight пытается оценить косвенные данные, например, сопоставляя официальную статистику заболеваемости Covid-19 с информацией о всплеске «внебольничных пневмоний», росте общей смертности, количестве включенных в Список памяти медработников из региона и другим данным. На основе анализа этих данных он строит индекс недооценки реальной смертности от коронавируса в разных регионах.

По оценке Овчинникова, для Москвы этот показатель составляет около 3. В Петербурге, по его примерным прикидкам, занижение в 10 раз, а в Дагестане — раз в 20.

«Это очень плохая тенденция. Это [предполагаемое искажение статистики] делает прогнозирование бессмысленным. Прогнозирование дело десятое, есть еще более содержательная проблема: мы не знаем, что происходит в этих регионах», — констатирует Михаил Тамм.