Робоча група з математичного моделювання проблем, пов’язаних з епідемією коронавірусу SARS-CoV-2 в Україні,
базова установа – Інститут проблем математичних машин і систем НАН України
Створена Розпорядженням Президії НАН України від 3 квітня 2020 р. № 198
Прогноз
розвитку епідемії COVID-19 в Україні в період
21 грудня 2020 р. – 4 січня 2021 р.
«Прогноз РГ-33»
21.12.2020
З початку квітня 2020 р. міжвідомча Робоча група (РГ) представників Національної академії наук України, Київського національного університету імені Тараса Шевченка, Вінницького національного технічного університету та Національної академії медичних наук України – з урахуванням світового досвіду математичного моделювання розвитку епідемії COVID-19, на основі статистичних даних про динаміку епідемії в Україні та країнах Європи – створювала і тестувала математичну модель SEIR–U. За результатами проведеного моделювання Робоча група підготувала документи
«Прогноз розвитку епідемії коронавірусу SARS-CoV-2 в Україні». Президія НАН України офіційно представила прогнози до державних органів. На ці прогнози надавав посилання Кабінет Міністрів України під час брифінгів. Прогноз готується за підтримки Дитячого фонду ООН (ЮНІСЕФ).
У новому документі «Прогноз РГ-33»:
• здійснено аналіз первинних статистичних даних розвитку епідемії в Україні;
• порівняно статистичні дані з попереднім прогнозом
«Прогноз РГ-32»; • представлено прогноз розвитку епідемії на наступний період 21 грудня 2020 року – 4 січня 2021 року за допомогою двох незалежних моделей;
• проаналізовано динаміку поширення епідемії в регіонах України.
1. Аналіз статистичних даних щодо розвитку епідемії COVID-19 в Україні.
Робоча група використовує для аналізу такі джерела даних:
1. Дані щоденних звітів Міністерства охорони здоров’я (МОЗ) України. Дані про кількість нових виявлень, одужань, летальних випадків і підозр для кожної області України оприлюднюються на щоденних брифінгах МОЗ України, а також
на сайті Ради національної безпеки і оборони (РНБО) України.
2. Первинні дані Центру громадського здоров’я Міністерства охорони здоров’я (ЦГЗ МОЗ) України. Опис структури даних та їх інтерпретацію наведено у документі
«Прогноз РГ-9» від 26.06.2020 р. Регулярний доступ до первинних даних було отримано завдяки співпраці з ЮНІСЕФ.
3. Дані щодо обсягів ПЛР- та ІФА-тестування по кожній лабораторії України.
Дані надає ЦГЗ МОЗ України, вони містять інформацію про загальну кількість проведених тестів, кількість позитивних тестів і ретестувань.
4. Дані
Національної служби здоров’я України (НСЗУ) оновлюються щодня та містять дані про госпіталізації по кожній лікарні України.
5. Дані про загальну смертність з усіх причин і дані щодо мобільності населення з ресурсу
«Економіка карантину».
6. Статистичні дані щодо країн світу:
Worldometer, Financial Times, Ourworldindata.
Щоденну статистику смертності з усіх причин наведено на рис.1. Останнє оновлення не враховує дані, що надходять до Міністерства юстиції України з приблизною щомісячною періодичністю.
 Рис.1. Динаміка смертності з усіх причин із декількома тижневими приростами (дані Мін’юсту, доступні на сайті «Економіка карантину»: https://q.rating.zone/) |
Смертність з усіх причин на тлі показника за попередні 5 років показано на рис.2 станом на початок грудня. Починаючи з кінця жовтня число померлих з усіх причин приблизно на третину вище за середнє значення за останні 5 років.
 Рис.2. Динаміка смертності з усіх причин на тлі динаміки за попередні 5 років (дані Мін’юсту, доступні на сайті «Економіка карантину»: https://q.rating.zone/) |
Опубліковані 18 грудня загальнонаціональні дані Державної служби статистики України показали надлишкову смертність у жовтні в обсязі 18,5% проти 19,4%, отриманих у
«Прогнозі РГ-32». Регіональні дані очікуються 22 грудня.
Число нових випадків хвороби, число позитивних тестів, число летальних випадків та їх 7-денні усереднення наведено на рис.3. Число нових випадків хвороби уповільнило зниження. Число підтверджених летальних випадків незначно знизилося.
 Рис.3. Основні епідемічні показники та їх 7-денні усереднення. Летальні випадки позначено за правою шкалою |
Випадки хвороби за датою їх підтвердження показано на рис.4 на тлі випадків хвороби за датою оприлюднення та числа позитивних тестів.
 Рис.4. Показники виявлення хворих та їх 7-денні усереднення |
 Рис.5. Відношення числа нових хворих і числа позитивних тестів до числа всіх тестів та їх 7-денні усереднення |
 Рис.6. Обсяги тестування. Щоденна сумарна кількість ПЛР-тестів і сумарна кількість залишків непротестованих зразків у лабораторіях |
За останній тиждень (14–20 грудня) зроблено 250417 ПЛР-тестів і виявлено 70327 нових інфікованих. Кількість ПЛР-тестів, витрачена на одного нового інфікованого, становить у середньому 3.6 ПЛР-тесту на одне нове виявлення, що на 14% більше від аналогічного показника минулого тижня та відповідає середньому відсотку виявлення 27.7% для України загалом. Позитивність за результатами тестів (відношення кількості позитивних тестів до кількості ПЛР-тестів) – стабілізувалася на рівні 32% (рис.5). Обсяги тестування стабілізувалися (рис.6).
На рис.7 наведено епідемічні показники від МОЗ та статистику пошуку у Google за темами «Нюх», «Смак» та «Киснева сатурація», що можуть розглядатись як випереджальні епідемічні індикатори, з огляду на спостереження, що хворі з COVID-19 роблять пошукові запити, пов’язані з їхніми симптомами, методами діагностики та лікування.
Серед розглянутих показників статистики пошукових запитів найкращим індикатором є частота пошуку на тему «Нюх», інші ж можна розглядати як допоміжні. Хоча частота запитів на тему «Смак» має високе фонове значення, але помітно, що вона також може попереджати хвилю епідемічного зростання.
Зниження активності пошуку на розглянуті теми може також відбуватися з огляду на гіпотезу «пошукового насичення», коли частота пошуку може знижуватися за сталого епідемічного стану через те, що хворі можуть менше цікавитися в інтернеті запитами щодо своєї хвороби, бо стають обізнанішими або мають більше можливостей отримувати інформацію з інших джерел.
 Рис.7. Частота пошуку у Google на теми «Нюх», «Смак» та «Киснева сатурація» (усереднені дані); число нових випадків хвороби та летальних випадків за даними МОЗ (просте 7-денне середнє).Усі дані пропорційно скориговано так, аби максимальне значення точно дорівнювало 100 (для пошукових даних – до усереднення) |
Частка летальних випадків серед нових хворих демонструє консервативну динаміку, лишаючись у діапазоні 1,5–2% (рис.8).
 Рис.8. Частка нових хворих, для яких хвороба мала летальні наслідки, та динаміка наповнення даних про неї |
Частку випадків хвороби з відомим результатом наведено на рис.9.
 Рис.9. Частка хворих із відомим результатом хвороби за датами їх реєстрації та динаміка наповнення даних про неї |
Середній вік госпіталізованих хворих відійшов від максимуму, лишаючись значним (рис.10).
 Рис.10. Середній вік за категоріями інфікованих. До даних застосовано зважене 7-денне середнє |
Вікова структура хворих не зазнала суттєвих змін (рис.11).
 Рис.11. Частка неповнолітніх осіб, осіб віком від 60-ти років і старше, осіб віком від 70-ти років і старше серед нових хворих відповідно, а також частка летальних випадків (застосовано 7-денне усереднення) |
За офіційною статистикою, на 21 грудня середня кількість осіб, що одужують, склала в середньому 11364 людей на день. Середня за тиждень кількість нових інфікованих на 14.12.2020 р. становить 10047 нових інфікованих на день для України, що на 1200 випадків менше середнього показника 7 днів тому. Середня за тиждень кількість нових летальних випадків на 21.12.2020 р. становить 203 нових летальних випадків на добу, що на 13 менше, ніж тиждень тому.
 Рис.12. Кількість нових зареєстрованих випадків за день із даними на момент публікації (а) та на момент настання події (дати тестування та дати одужання/виписки) (б). Для відображення використовувалося рухоме середнє з вікном 7 днів |
Рис.12 демонструє динаміку зміни кількості нових інфікованих, нових одужалих і нових активних інфікованих за день згідно зі щоденними звітами МОЗ України для України загалом, що показані на момент публікації інформації (а), та ці ж дані, приведені до дат настання події (б). Рис.12 (б) демонструє нові випадки, показані на дати проведеного ПЛР-тестування, та нові одужання, показані на дати одужання/виписки. Із рис.12 (б) видно, що досі в жоден день кількість осіб, що одужують, насправді не перевищила кількості нових інфекцій. Велика кількість осіб, що одужують, з’являється на графіку рис.12 (а) внаслідок нерегулярного внесення даних.
Офіційні оприлюднені статистичні дані можна почасти пояснити на основі аналізу затримок оприлюднення інформації. Відомо, що нові випадки інфікування, нові смерті та нові одужання, що оголошуються щодня, насправді не всі настають у попередній день. В окремих випадках можуть траплятися значні затримки між датою фактичного настання події (тестування, виписки, госпіталізації, смерті) та датою внесення цієї інформації в базу та її оприлюднення. Еволюцію внесення даних до реєстру показано на рис.13–16.
 Рис.13. Еволюція ретроспективних змін кількості нових підтверджених випадків станом на різні моменти часу, що приведені до дат тестування. Дані наведено після рухомого семиденного усереднення |
 Рис.14. Еволюція ретроспективних змін кількості нових одужань станом на різні моменти часу, що приведені до дат одужання/виписки. Дані наведено після рухомого семиденного усереднення |
 Рис.15. Еволюція ретроспективних змін кількості нових летальних випадків станом на різні моменти часу, що приведені до дат настання смерті. Дані наведено після рухомого семиденного усереднення |
Рис.13–15 дають уявлення про те, як можуть змінюватися дані ретроспективно і наскільки вони відповідають даним, які щоденно оголошуються. На рис.13 показано ретроспективні зміни кількості нових випадків, що можуть уточнюватися протягом 2-х–3-х тижнів. Дані про одужання можуть змінюватися (рис.12) протягом кількох місяців. Кількість летальних випадків може зазнавати ретроспективних змін протягом одного місяця. Загалом можна виокремити характерні масштаби часу наповнення реєстру: для нових випадків – 2 тижні, для летальних випадків – 1 місяць, для нових одужань – 2 місяці. Це періоди, після яких більш-менш точно стає відома реальна кількість подій, які настали у конкретну дату.
Структура затримки в оприлюдненні нових випадків хвороби та нових летальних випадків показано на рис.16 і 17.
 Рис.16. Еволюція в часі затримок оприлюднення кількості нових випадків. Висота стовпчиків показує кількість оприлюднених нових випадків. Кольором позначено розподіл цих випадків за попередніми датами |
 Рис.17. Еволюція в часі затримок оприлюднення кількості нових летальних випадків. Висота стовпчиків показує кількість оприлюднених нових випадків. Кольором позначено розподіл цих випадків за попередніми датами |
 Рис.18. Середні затримки оприлюднення в часі даних про нові виявлення, летальні випадки, госпіталізації та одужання/виписки. Затримки обчислювались як різниця між датою оприлюднення (внесення відповідної інформації в базу даних) і датою фактичного настання події |
Графіки на рис.19–21 показують різницю між відповідними даті оприлюднення та даті настання події даними, що сумарно збігаються, але можуть мати зсуви у часі.
 Рис.19. Порівняння даних про щоденну кількість нових виявлень, зведену до дати оприлюднення (чорна крива) та дати реєстрації випадку (синя крива). Дані відображено згладженими 7-денним рухомим середнім |
 Рис.20. Порівняння даних про щоденну кількість нових летальних випадків, зведену до дати оприлюднення (чорна крива) та дати настання смерті (синя крива). Дані відображено згладженими 7-денним рухомим середнім |
 Рис.21. Порівняння даних про щоденну кількість нових одужань, зведену до дати оприлюднення (чорна крива) та дати настання смерті (синя крива). Дані відображено згладженими 7-денним рухомим середнім |
2. Порівняння з прогнозом від 14.12.2020 р.
Таблиця 1. Порівняння прогнозних значень моделі SEIR-U кількості нових інфекцій від 14.12.2020 р. для кожної області України зі спостережуваними середніми за тиждень значеннями. Дані подаються усередненими за тиждень
У таблиці 1 наведено прогнозні інтервали, обчислені в
«Прогнозі РГ-32» від 14.12.2020 р. для кожної області України, та дані спостережень на 21.12.2020. р., усереднені за тиждень. Із таблиці видно, що загалом дані відповідають середнім очікуванням. Серед найбільш уражених регіонів перевищення очікувань не відбулося. Покращився прогноз для семи областей і погіршився для трьох. По Україні загалом середня кількість нових випадків лежить нижче середини прогнозованого інтервалу.
3. Прогноз розвитку епідемії в Україні з використанням статистичної моделі часових рядів Facebook Prophet.
За допомогою методів статистичного аналізу було досліджено динаміку щоденної кількості нових хворих із липня 2020 року для виявлення закономірностей поширення епідемії, для дослідження впливу свят і псевдосвят (аномальних дат на кшталт державних свят, теплих днів без опадів тощо), впливу тижневої та інших видів сезонної мінливості і виявлення їхнього характеру.
Аналізувалися дані щодо нових виявлень на день і нових летальних випадків для України загалом, коли спостерігалося невпинне зростання з 7-денною періодичністю – з 6 липня 2020 року. Було використано найсучаснішу модель Facebook Prophet, яка демонструє високу ефективність для моделювання часових рядів, що містять аномальні дати, різні види сезонності та лінійну чи нелінійну динаміку впливу різних складових моделі.
Як і раніше, як аномальні дати (свята і псевдосвята) розглядалися дати державних свят, дати потенційного зростання кількості відпочивальників (коли було дуже тепло і не було опадів) та дати послаблення карантину за відкритими даними датасету
Google-платформи «COVID-19 Open Data». Як і тиждень тому, додано 620-денну періодичність – із розрахунку, що чверть періоду припадає на ділянку між найбільшим і сусіднім піками 26 червня і 28 листопада (155 днів), яка дозволила вдвічі зменшити похибку. Як і минулого тижня, враховувалися також дні «карантину вихідного дня». Було побудовано
модель, яка за даними 6.07–21.12 дала прогноз на 22.12–04.01 із сумарною відносною похибкою за останні 7 днів – 5,68% (рис.22). Як і минулого тижня, враховуючи коливальний характер даних, для перевірки аналізувалися лиш останні 7 днів – до 28.12 (таблиця 2).
 Рис.22. Щоденна кількість нових підтверджених випадків хворих на COVID-19 в Україні з 6 липня 2020 р.: чорні крапки – дані спостережень до 21.12.2020 р., синя лінія – результат моделювання і прогнозування на 2 тижні до 04.01.2020 р. за моделлю на основі Facebook Prophet |
Таблиця 2. Прогноз кількості нових підтверджених випадків хворих на COVID-19 в Україні за моделлю з урахуванням впливу аномальних дат
Щодо нових підтверджених випадків порівняно прогноз на 2 тижні, зроблений за допомогою моделі Facebook Prophet 1, 2 і 3 тижні тому, та новий прогноз (рис.23).
 Рис.23. Останні 6 тижнів спостережень і 2 тижні прогнозу |
Аналіз щодо кількості нових підтверджених і летальних випадків захворювань продемонстрував таке:
• порівняння даних спостережень із прогнозом минулого тижня показує, що процес зменшення кількості нових хворих уповільнився; не виключено, що незабаром захворюваність може стабілізуватись або перейти до зростання, що може бути обумовлено підвищенням контактів у передноворічний період;
• за новою моделлю з тривалою періодичністю для України знову має місце незначний вплив свят та інших аномальних дат, на відміну від моделі, яка використовувалася тиждень тому, але – так само, як у попередні тижні; як показало проведене
моделювання за даними станом на 20.12.2020 р., значний вплив має місце в низці інших країн – США, Португалії, Індонезії, Індії, де модель з урахуванням свят і псевдосвят має похибку у 1,25–1,75 рази меншу, ніж модель без урахування таких аномальних дат, і при цьому така похибка становить в останній тиждень менше від 5–20%; в Україні ж спрощена модель з урахуванням аномальних дат дає похибку 5,36% (ефективніша модель – 5,17%), а без їх урахування – 5,49%;
• стрімке зниження прогнозованих значень кількості нових хворих, на жаль, не дає впевненості у тому, що така динаміка збережеться ще декілька тижнів, оскільки ряд спостережень є надто малим для таких прогнозів, тому рекомендується обережно використовувати зроблений прогноз.
Обчислення за допомогою моделі Facebook Prophet і аналіз отриманих результатів виконали завідувач кафедри системного аналізу та інформаційних технологій (САІТ) Вінницького національного технічного університету (ВНТУ) доктор технічних наук, професор В.Б. Мокін і аспірант кафедри САІТ ВНТУ А.В. Лосенко.
4. Прогноз розвитку епідемії в Україні з використанням компартментної моделі.
Обчислення прогностичних змінних здійснюються для окремих регіонів, а не для України в цілому, а значення для всієї країни обчислюються як сума всіх її регіонів. У таблиці 6 наведено середні прогнозні результати прогнозів для областей України на період до 28 грудня та до 4 січня. Прогнози не враховують впливу зміни кількості тестувань, кількості підозр і рішень щодо змін карантинних обмежень. При обчисленнях вважалося, що репродуктивне число та коефіцієнт летальності залишаються сталими впродовж прогностичного періоду. Репродуктивне число й коефіцієнт летальності обчислювалися з алгоритму калібрування математичної моделі, а для прогнозного сценарію використовувалися середні значення за останній тиждень.
Для врахування можливої зміни кількості контактів у часі було додатково розглянуто два сценарії для кожної області: з поступовим збільшенням рівня контактності на 25% та зменшенням на 25%. Зміна відбувалася поступово протягом тижня. У таблиці 6 наведено прогнозні середні рівні виявлення нових інфікованих на день і діапазон їхніх значень на 28 грудня 2020 року. Наведено також оцінку середнього за тиждень значення репродуктивного числа для кожного регіону, що використовувалося для обчислення прогнозу.
Таблиця 3. Прогнозні значення нових інфікованих за день для регіонів України на 28.12.2020 р. і на 04.01.2021 р. та поточна оцінка репродуктивного числа
Згідно із розглянутими сценаріями, регіонами з найбільшою очікуваною кількістю інфікованих є Запорізька, Київська, Одеська області та місто Київ.
Якщо додати результати моделювання по всіх регіонах, то для України в цілому отримаємо такі прогнозні числові показники:
Репродуктивне число – 0.92 (середнє за останній тиждень, має нейтральну тенденцію)
Середня кількість нових інфекцій за день на 28.12.20: [8103-11751] при середньому значенні 9605.
Середня кількість нових летальних випадків за день на 28.12.20: [163-221] при середньому значенні 192.
Середня кількість нових інфекцій за день на 04.01.21: [5375-12774] при середньому значенні 8871.
Середня кількість нових летальних випадків за день на 04.01.21: [144-214] при середньому значенні 179.
 Рис.24. Зміна в часі репродуктивного числа згідно з калібруванням математичної моделі SEIR-U |
На рис.24 показано зміну в часі репродуктивного числа для України загалом, отриману в результаті калібрування математичної моделі на статистичних даних. Тонкими лініями показано оцінки репродуктивного числа для різних областей. На цей момент середньотижневе значення склало 0.92. При прогнозуванні тенденція до зміни репродуктивного числа не враховувалася. Прогнозні сценарії обчислювалися зі сталим середньотижневим значенням репродуктивного числа.
 Рис.25. Прогнозні значення кількості нових випадків для України з урахуванням тижневої мінливості. Крапками позначено дані спостережень станом на 14.12.2020 р., лінією – модельні обчислення для періоду калібрування (25.03–14.12) та для прогнозного періоду |
Таблиця 4. Прогнозні значення кількості нових випадків за результатами обчислень статистичною моделлю Prophet і компартментною моделлю SEIR-U
Таблиця 4 демонструє порівняння прогнозних значень кількості нових випадків на період до 3 січня, обчислених за допомогою двох незалежних моделей – статистичної моделі Facebook Prophet і компартментної моделі SEIR-U. Загалом модель Prophet передбачає дещо стрімкіше згасання і більші амплітуди тижневих коливань, ніж компартментна модель, порівняння їх прогнозів представлено на рис.25. Слід зазначити, що похибка передбачень значно зростає зі збільшенням інтервалу прогнозування, тому до отриманих результатів необхідно ставитись обережно.
ВИСНОВКИ
1. Показники поширення епідемії в Україні за останній тиждень продовжують зниження, але зниження уповільнюється. Репродуктивне число залишилося меншим за одиницю, але незначно збільшилось і склало 0.92 з невеликою тенденцією до збільшення. Це означає, що найближчими тижнями ситуація може стабілізуватись або навіть почати зростання, хоча математичні моделі, що ґрунтуються на середньотижневій динаміці, передбачають продовження незначного згасання епідемії найближчим часом. Уповільнення згасання може також бути пов’язано з відносним збільшенням обсягів тестування. Відсоток виявлення за новими випадками зменшився до 28%. Згідно з обчисленнями, середня кількість нових випадків дорівнюватиме 8805 (Prophet) і 9801 (SEIR-U) протягом тижня 22–28 грудня та 7540 (Prophet) і 8871 (SEIR-U) протягом тижня 29 грудня – 4 січня. Докладніше прогноз представлено у таблицях 2–4 і на рис.22–25.
2. Число летальних випадків перейшло до незначного зниження із запізненням після зниження щоденної кількості підтверджених хворих, позитивних тестів і позитивності тестів, що спостерігалася раніше. Спостережувана летальність лишається у діапазоні 1,5–2%. Нещодавно опубліковані дані Державної служби статистики України показали надлишкову смертність у жовтні на рівні 18,5% проти 19,4%, оцінених у «Прогнозі РГ-32». Регіональні дані очікуються 22 грудня.
3. Відсоток виявлення нових інфікованих за допомогою ПЛР-тестів за останній тиждень зменшився до 28%. Відсоток позитивних тестів стабілізувався на рівні 32%.