Истории

Коронавирус: как правильно интерпретировать статистику

Истории
Анна Полякова
Анна Полякова

Редактор

Анна Полякова

Сейчас в разных источниках появляется множество пугающих графиков и диаграмм со статистикой по коронавирусу. Дата-сайентист Тим Пятенко объяснил, почему далеко не всем визуализированным данным стоит доверять.

Коронавирус: как правильно интерпретировать статистику

Базовое правило статистики гласит: чем меньше численность выборки (sample size), тем больше погрешность (margin of error). Это видно на графике ниже.

Численность выборки (sample size) и погрешность (margin of error) / «Википедия»

Таким образом, в начале распространения нового вируса невозможно получить достоверные статистические данные, особенно такие, как уровень смертности. Следующие два графика иллюстрируют, что попытка измерить новый процесс по определению ошибочна.

Итоги всех закрытых случаев (процент выздоровлений и процент смертей) / Статистика по США от WorldOMeter

Второй важный момент для статистики, изменяющейся во времени, — это концепция базовой линии. Цифры не имеют смысла без показателя для сравнения. Во всех сообщениях СМИ о коронавирусе, которые я видел, отсутствовала базовая информация. Вот некоторые вопросы, ответы на которые я хотел получить, прежде чем делать какие-либо выводы.

  • Сколько смертей ежедневно случается в обычных обстоятельствах?
  • Какая доля из них вызвана существующими заболеваниями, такими как сезонный грипп?
  • Как выглядит типичный сезон гриппа? В начале? На пике? В конце?
  • Насколько доступна медицинская помощь заболевшим? Сколько мест в больницах, в том числе в реанимации?
  • Как эти данные варьируются с точки зрения географии и демографии?

Найти ответы на них оказалось непросто, но кое-что мне удалось выяснить. Прежде всего, я обнаружил график с базовым уровнем смертности. Он сообщает не так уж много информации, но, по крайней мере, показывает текущее положение. Кроме того, он демонстрирует изменения в долгосрочной тенденции, которая сохранялась с 1980-х годов.

Изменение уровня смертности во времени / MacroTrends

Далее я подробнее изучил ситуацию с гриппом. Вот как он распространяется из года в год.

Общее воздействие гриппа в США / CDC Influenza site

Это выглядит достаточно жутко — получается, ежегодно гриппом заражаются более 10% населения США, при этом десятки тысяч умирают. А вот так обычно выглядит сезон гриппа.

Пик приходится на период с января по март, а к маю грипп исчезает. Можете держать это в голове, когда будете смотреть на кривые роста коронавируса. Однако не забывайте, что это новое явление и мы пока не знаем, чего от него ожидать.

Теперь можно приступить к сравнению. Возможно, самой характерной чертой коронавируса является его опасность для взрослых людей. И чем старше человек, тем больше риск.

Это важно для всего остального. Перекос в сторону одной возрастной группы в сочетании со сложным географическим распределением людей затрудняет составление статистики. Например, в Италии самое старое население в Евросоюзе, средний возраст которого более чем на десять лет больше, чем в США. Трудно делать выводы из ситуации в одной стране и применять их к другой, не учитывая эти факторы. То же самое касается эпицентра вируса в США, которым стал дом престарелых в Киркленде, штат Вашингтон. Игнорирование высокой концентрации заболевших в определенных местах делает итоговые цифры бессмысленными и вводящими в заблуждение. Взгляните на эту диаграмму из Италии.

Коронавирус и грипп

Вспышки гриппа (синие и фиолетовые столбцы) и коронавируса (оранжевые и красные столбцы) совсем не похожи. И пока мы не увидим, как выглядит фактическое распределение последнего, делать прогнозы будет рано. Сейчас слишком много неизвестных. К сожалению, коронавирус сам по себе необычен, поэтому может потребоваться несколько сезонов, чтобы проследить тенденцию.

Это заставило меня задуматься: если мы так мало мы знаем, а цифры не превышают уровень сезонного гриппа, откуда столько паники? Откуда такая серьезная обеспокоенность по поводу способности больниц во всем мире справиться с коронавирусом? Если они принимают сотни больных гриппом в год, разве они не готовы к похожим ситуациям?

Проблема заключается в том, что тяжелые случаи часто оказываются сконцентрированы в одном месте и не все заболевшие получают соответствующую помощь. Обычно в больницах есть от одной до нескольких десятков кроватей в отделениях интенсивной терапии. Для обычной вспышки сезонного гриппа этого достаточно. Но при сильной вспышке гриппа, за которой следует вспышка коронавируса, система выходит из строя. Далее приведу цитату.

«В понедельник число смертей от коронавируса в Италии выросло с 366 до 463, сказал глава агентства по защите населения. Общее число случаев коронавируса в стране выросло на 24%, до 9 172 заболевших, из которых полностью вылечились 724 человека. Интенсивную терапию прошли 733 человека, ранее сообщалось о 650».

На первый взгляд, цифра не кажется такой уж большой, но это почти предел доступности интенсивной терапии. Вот пример распределения мест в довольно большой больнице в США. Мест в реанимации для взрослых (Intensive Care Beds) всего 14.

Скриншот: AHA Statistics

И общие цифры по США.

Больницы, места в них, места в реанимации и численность населения в 2000-2099 гг.

Таким образом, настоящая опасность коронавируса заключается в высокой концентрации тяжелых случаев и недостаточном числе мест в реанимации. От традиционной статистики сейчас мало толку, так как пока у нас недостаточно информации, и она не позволяет составить общую картину. Я бы обратил ваше внимание только на этот график.

Общее число серьезных и критических случаев

Это то, что мы действительно знаем. Если у кого-то есть вирус, насколько вероятно, что ситуация станет серьезной? Как изменяется эта цифра? Теперь вы можете иначе посмотреть на соотношение процента выздоровлений и смертей. Оно также показывает, насколько остро стоит проблема недостатка мест в реанимации. Остается надеяться, что нам повезет, и кривая на последнем графике не поползет вверх.

Источник.

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Что мы достоверно знаем о коронавирусе
  2. 2 Фонд Билла Гейтса, Wellcome и Mastercard запустили акселератор для борьбы с коронавирусом
  3. 3 Биометрия vs медицинские маски: как борьба с эпидемией помогает развитию технологий
  4. 4 Как Китай использует технологии для борьбы с коронавирусом

Актуальные материалы —
в Telegram-канале @Rusbase

ВОЗМОЖНОСТИ

13 августа 2020

Pulkovo.Hack

19 августа 2020

Tele2 Solutions Days

20 августа 2020

#Прокачайбизнес