Вот сидим мы в середине пандемии и, как рыбки в аквариуме, глядим через окна на окружающий мир. У всех на уме есть вопрос: насколько все плохо на самом деле? Вслед за ним возникает еще один: серьезно, сколько мне еще придется сидеть взаперти? Мы все хотим получить ответы на эти вопросы. И, учитывая объем исследований и массовость сбора данных о новом коронавирусе, кажется, что ответы просто должны существовать.
Так почему же этот разброс такой большой? Ну, друзья, такова природа моделирования этого зверя. Использование математической модели для прогнозирования будущего полезно для экспертов, даже если между возможными результатами существует огромная пропасть. Но не всегда легко разобраться в результатах и в том, как они меняются с течением времени, и эта путаница может смутить простых обывателей. Вот почему мы хотим поговорить о том, как формируется модель пандемии и объяснить, как понимание неопределенности может помочь вам получить максимальную отдачу от всех чисел, витающих вокруг коронавируса.
Итак, представьте себе простую математическую модель для прогнозирования исходов коронавируса. Ее сравнительно легко собрать — на это способен даже мало-мальски выспавшийся интерн. Число людей, которые умрут, зависит от того, сколько людей может заразиться, как вирус распространяется и сколько людей вирус способен убить.
Видите? Все легко. Но затем вы начинаете пытаться заполнить пробелы. И именно тогда вы обнаружите, что нет ни одной вычислимой переменной ... вообще. Каждая переменная зависит от ряда вариантов и пробелов в знаниях. И если каждая отдельная часть модели шатается, то вся конструкция будет стабильна так же, как и курс доллара.
Рассмотрим что-то совсем базовое, например, сбор данных. Разные страны и регионы собирают данные по-разному. Нет единой централизованной таблицы, которую заполняют все, чтобы можно было легко сравнивать случаи заболевания и смерти по всему миру. Во многих странах врачи говорят, что мы занижаем общее число смертей, вызванных COVID-19.
Те же самые несоответствия касаются и тех, кто проходит тестирование на коронавирус. Некоторые страны проводят эти тесты для всех, кто этого хочет. А другие — только если есть веская причина. Это влияет на то, как много мы можем знать о том, сколько людей на самом деле заразились COVID-19, по сравнению с тем, сколько людей получили положительный результат теста.
А сам вирус — это непредсказуемая инфекция, которая бьет по одним группам людей больше, чем по другим, а это означает, что местная демография и доступ к медицинской помощи стали серьезными факторами, когда речь заходит о влиянии вируса на сообщества.
«Как люди, работающие в сфере общественного здравоохранения, мы часто работаем в темноте, пытаясь предоставить лучшие возможные оценки с помощью действительно неопределенной информации», — сказал доктор Билл Миллер, профессор эпидемиологии в Университете штата Огайо.
Итак, давайте рассмотрим нашу супер простую модель, чтобы понять, почему так сложно создать хорошую модель для чего-то столь неопределенного.
Попробуем посчитать смертность
Некоторые люди умирают от COVID-19. Пожалуй, это последнее абсолютное утверждение, которое мы можем сделать. Но «некоторые» — это, очевидно, не число, с ним мы ничего вычислить не можем.
Проблема в том, что подсчет смертности от вируса с самого начала нечеткий. Она может сильно варьироваться от одной группы людей к другой. «Поскольку возраст — это важнейший фактор, вы должны скорректировать показатели смертности от случаев заболевания для демографического состава страны, а также уровень сопутствующих заболеваний», — сказала Рэй Ваннье, биостатист из Калифорнийского университета в Сан-Франциско.
Другими словами, не существует единого «коэффициента смертности» — их много. Уровень смертности в России будет отличаться от уровня смертности в стране, где, скажем, диабет более распространен. То же самое можно сказать и о показателях в пределах страны — например, вирус хорошо распространяется в районах с метро, где живет много пожилых людей, поэтому рассчитанный там коэффициент смертности будет выше, чем среди молодых людей, живущих в новых спальных районах без подземки.
Но давайте пока будем работать в масштабе всей планеты. Знание смертности от COVID-19 в Китае или Италии говорит нам, какова будет смертность в России? Не совсем, но все же эти данные помогают, снижая неопределенность.
Однако в любом случае мы, вероятно, не знаем фактический уровень смертности в этих странах. Это верно по ряду причин, начиная со сбора основных данных о случаях заболевания. Числа не являются 100% фактами. Они являются результатом большого количества субъективных выборов, которые должны быть задокументированы максимально прозрачно и подробно, прежде чем мы вообще должны начать рассматривать эти результаты как факты. Поэтому информация о том, как данные собираются — и собираются ли они одинаково каждый раз — имеет значение.
Существует также проблема несобранных или неточных данных. Чтобы определить уровень смертности, вы должны разделить число людей, умерших от этой болезни, на число людей, инфицированных этой болезнью. Однако в случае с коронавирусом у нас нет надежного учета числа зараженных людей, поэтому, математически, мы не знаем знаменателя. И если быть честными — мы даже числитель точно не знаем.
В идеальном мире мы проверяли бы всех людей на наличие признаков заражения новым вирусом, чтобы мы могли точно знать, сколько людей когда-либо болели этим заболеванием и сколько из них умерло от него. Однако в случае с коронавирусом есть только пара ситуаций, в которых мы приблизились к идеалу.
Возьмем Diamond Princess, круизный лайнер, который был полностью помещен на карантин после вспышки COVID-19. Были протестированы почти все на борту (3063 теста на 3711 человека). Судно стало живой лабораторией с таким уровнем документирования данных, который мы обычно не получаем в реальном мире. Исследователи смогли определить не только то, сколько людей болело, но и у скольких людей не проявлялись симптомы — и, таким образом, они, вероятно, остались бы не диагностированными и не учтенными в обычных условиях на суше.
В результате можно утверждать, что есть достаточно много людей, гуляющих с COVID-19 и даже не знающих об этом, и, следовательно, показатели смертности выше, чем предполагают данные, собранные «на суше». Среди пассажиров лайнера уровень смертности для людей с диагнозом и симптомами составил 2,3%, а смертность среди всех диагностированных случаев, включая бессимптомные, составила лишь 1,2%.
Между тем, это соотношение симптоматичности — сколько людей имеют симптомы по сравнению с бессимптомными — имеет большое значение, и мы стали догадываться об этом совсем недавно. В отчете Имперского колледжа Лондона предполагается, что две трети случаев будут достаточно симптоматическими, чтобы зараженный человек мог заметить и самоизолироваться. А данные по Diamond Princess показали, что примерно половина случаев заболевания была симптоматической на момент постановки диагноза. Поэтому то, каким на самом деле окажется коэффициент симптоматичности, влияет на расчеты смертности.
Данные круизному лайнеру не идеальны — тест на COVID-19 там все еще прошли не все, да и демография круизных лайнеров не является репрезентативной для более широкой публики, к тому же некоторые больные пассажиры все еще могут умереть, что увеличит уровень смертности. Но в любом случае это самая надежная статистика на данный момент.
В большинстве стран широкомасштабное тестирование только начинается, и оно действительно важно. Если вы в первую очередь тестируете только больных людей, как это делают некоторые страны, уровень смертности не будет отражать ничего похожего на фактический уровень смертности от вируса (да, та самая проблема знаменателя). А массовому тестированию мешают дополнительные проблемы, такие как недостаточное количество тестов и тот факт, что некоторые частные лаборатории не предоставляют количество результатов, которые оказались отрицательными .
На истинную смертность от этого заболевания также влияет наша способность предотвращать смерть, когда кто-то тяжело болен. Очевидно, это зависит от вместимости больницы. При неограниченном доступе к койкам и аппаратам искусственной вентиляции легких (ИВЛ) многие люди с даже серьезными симптомами могут пережить инфекцию. Но эти ресурсы относительно скудны, и если спрос превысит предложение — а такая проблема уже есть в некоторых странах — люди, которые могли бы выжить, скорее всего умрут.
Это также может вызвать эффект наложения заболеваний. Люди, обращающиеся за лечением других болезней или из-за аварий, также могут страдать от недостатка больничных ресурсов и потенциально могут умереть. Тем самым они погибнут не из-за заражения коронавирусом, а из-за его косвенных последствий. И пока нет общего мнения, стоит ли учитывать такие случаи в статистике по COVID-19, и как их вообще считать.
«Если мы в конечном итоге увидим нехватку снабжения и персонала, это сильно повлияет на смертность, и пока не ясно, насколько эластична наша медицинская система», — сказал Ваннье.
Добавим еще уровень заболеваемости
Почти все, что мы уже говорили о смертности, относится и к заболеваемости: все оценки будут зависеть от сбора данных, доступности тестов и соотношения симптоматики. Но чтобы узнать уровень заболеваемости, вы также должны выяснить, как часто вирус переходит от одного человека к другому. За это отвечает «базовое число размножения», или R0, которое является средним числом новых инфицированных, прослеживаемых до каждого заболевшего в популяции, где все восприимчивы к этой болезни.
И дело вот в чем: число R0 чрезвычайно изменчиво и зависит от всех видов социального поведения, местных экологических особенностей и политических решений. Оно будет различаться не только между странами, но и между областями одной страны. И, разумеется, болезнь будет передавать хуже, если будут введены карантинные меры. Например, малярия имеет более высокий R0 в местах, где много стоячей воды — там больше комаров, которые являются ее переносчиками.
Из-за этого моделирование потенциального R0 для коронавируса означает испытание множества различных сценариев передачи заболевания. И эти сценарии больше похожи на диапазоны оценок, куда входят переменные, которые мы опять же точно не знаем.
Первая переменная — это уровень контактов, то есть количество людей, с которыми инфицированный человек взаимодействует в течение определенного периода времени. Это единственная переменная, которую люди могут контролировать и уменьшать, поэтому мы все и сидим в карантине.
Средняя частота контактов не одинакова, она отличается от человека к человеку, в зависимости от таких факторов, как жизненная ситуация и работа, и изменяется в зависимости от вмешательства общественного здравоохранения и местоположения. Иными словами, очевидно, что житель глухой российской деревеньки, работающий у себя дома, имеет гораздо меньше контактов, чем москвич, работающий в офисе.
Затем идет такая переменная, как уровень инфицирования на контакт. Говоря простым языком, эта переменная говорит нам о том, сколько людей заразится после встречи с инфицированным. Этот показатель тоже далеко не константа. Вирусы не распространяются организованно, строго по два новых случая на человека. Это число, например, сильно зависит от первой переменной: один заболевший в очереди за туалетной бумагой перезаражает куда больше людей, чем одинокий больной, гоняющий в танки дома на диване.
Сэм Скарпино, профессор Северо-Восточного университета, который моделирует инфекционные заболевания, называет такие случаи в очереди выше «событиями суперпредставителя» — ситуациями, когда какой-либо фактор, обычно связанный с местом, а не с самими людьми, приводит к внезапному всплеску заболевших. За реальными примерами ходить далеко не нужно: всего один инфицированный на биогенетической (!!) конференции в Массачусетсе перезаражал целых 77 человек.
А помните еще про соотношение симптоматичности? Некоторые ученые предполагают, что бессимптомные носители менее заразны, чем люди, у которых проявляются симптомы, поэтому это соотношение также влияет на уровень инфицирования на контакт.
Биология вирусов также имеет значение, когда вы пытаетесь рассчитать уровень инфицирования на контакт. Например, важно знать, как долго вирус может выживать на различных поверхностях, и как далеко он может распространяться по воздуху. Для коронавируса пока что нет точных оценок. К тому же тут важно поведение человека и его здоровье.
Например, курильщики могут подвергаться большему риску заражения и осложнений от вируса. В основном это связано с тем, что курение негативно воздействует на легкие, однако, вполне может быть, что свою роль тут играет тот факт, что курильщики чаще подносят руки ко рту, чем обычные люди.
Наконец, существует продолжительность заразности — как долго человек может распространять вирус среди других людей и в какие моменты развития болезни он максимально заразен? Это зависит от биологии вируса и иммунитета каждого индивидуума, сказал Марк Вейр, профессор эпидемиологии Университета штата Огайо.
И все эти параметры используются для оценки R0.
В то время как базовое число размножения предполагает, что вся популяция восприимчива к вирусу, существует также эффективное число размножения, которое зависит от того, какая часть населения восприимчива. Одна из причин, по которой большая часть населения считается подверженной риску, заключается в том, что новый коронавирус является действительно новым. Никто не имел с ним дел раньше того китайца, отведавшего непрожаренную летучую мышь.
Хорошая модель также должна учитывать сценарии повторного заражения: если люди, которые перенесли вирус и выздоровели, имеют иммунитет к его повторному заражению, восприимчивость популяции сокращается. Но до сих пор мы мало что знаем о постинфекционном иммунитете к этому вирусу.
И мы даже не касаемся того, как меняется восприимчивость, если обнаруживается что-то вроде вакцины. Мы и так сделали достаточное количество предположений выше.
А теперь смешаем все в одной модели
Итак, чтобы построить модель, вы должны собрать все эти переменные (и, возможно, другие, если мы будем рассматривать более сложные модели), учесть их неопределенность, насколько они коррелируют друг с другом и все прочее. Это почти гарантированно приведет к мешанине.
И ладно бы эти переменные зависели только от вируса — нет, они сильно зависят и от нас самих. Закрытие школ, мытье рук, самоизоляция — все это сильно меняется от страны к стране, кардинально меняя и сам масштаб пандемии.
Думайте об этом, как о приготовлении пирога. Если у вас есть обычный рецепт, вы можете испечь пирог достаточно быстро и с предсказуемым результатом. А теперь представьте, что рецепт содержит инструкции типа «добавьте от трех до 15 нарезанных яблок, или вишню, или капусту, в зависимости от того, что у вас есть под рукой». Очевидно, это сильно повлияет на конечный пирог, не правда ли?
Конечно, вы можете сделать предположения о правильных ингредиентах и их количестве. Но это предположения, а не абсолютные факты. И если вы сделаете слишком много предположений в процессе выпечки пирога, вы вполне можете получить лазанью.
В течение следующих нескольких месяцев вы увидите много разных прогнозов относительно результатов пандемии COVID-19. И скорее всего они будут различаться в разы, если не на порядки. Но теперь вы будете понимать, что это не модели ошибочны — это сказывается огромное количество факторов, многие из которых очень трудно учесть для всех.