Прогноз пандемии коронавируса. Математическая модель
Как и все сознательные люди, я сижу дома и пытаюсь себя всячески развлечь. Но со всех утюгов только и слышно, что про коронавирус.
Решил я узнать, когда же закончится эта канитель. Покопался в интернете и на то время ничего конкретного ни нашел.
На своей работе я уже давно ничего не программировал, а руки-то чешутся. Вот и придумал написать сайт, который соберет данные из открытых источников, красиво их отобразит их, да и еще сделает прогноз, что будет дальше.
Согласно статистике, развитие эпидемий в мире происходит по нормальному закону распределения Гаусса. Его и взял за основу.
Для начала подключился к открытым источникам и научился выкачивать данные раз в 15 минут. Отобразил их красиво с помощью Chart.js и перешел к прогнозу. Взял для работы функцию нормального распределения
y(t) = b · e -c·(t-a)2
Исходные данные ti - ежедневные отметки времени xi - число активных случаев болезни в этот день
Взял натуральный логарифм от y(t) и от данных xi
ui = ln(xi)
u(t) = ln(y) = ln(b)-c·t2 + 2c·a·t-c·a2
Сделаем замены: А=-с; B=2a·c; C=ln(b)-c·a2; Получаем
u(t) = A·t2+B·t+C
Чтобы найти А, В и С - использую метод наименьших квадратов, согласно которому сумма по i от 1 до n квадратов разностей
Σ(xi-y(ti))2 -> min
должна стремится к минимуму.
Назовем эту сумму Ф(А,В,С)
Продифференцируем dФ по dA, dB и dC. Производные при это должны быть равны нулю.
Получаем систему уравнений
A·Σti4+B·Σti3+C·Σti2 = Σui·ti2
A·Σti3+B·Σti2+C·Σti = Σui·ti
A·Σti2+B·Σti+C·n = Σui
Решаем эту систему по методу Крамера
А = ∆A/∆
B = ∆B/∆
C = ∆C/∆
Находим нужные коэффициенты a,b,c для исходной функции
c = -A a = B/2·c b = eC+c·a2
И, вуаля, готово! Программируем и рисуем красивые графики и узнаем когда это кончится!
Так как данные обновляются с появлением новых случаев, и мой прогноз обновляется тоже.
Чем больше данных, тем точнее прогноз. На данный момент, реальные данные экспертов в Италии говорят о пике эпидемии, и кривая Гаусса показывает тоже самое
Будьте здоровы!
не учли в графике объезд патриархом Москвы
хм.. что будет, если патриарх заразится короной?
Это никогда не закончится потому что к РНК-содержащим вирусам нет стойкого иммунитета. Коронавирус COVID-2019 просто убьёт всех кого может убить и останется жить в человеческой популяции ближайшие несколько сотен тысяч лет.
В составе сезонных ОРВИ уже есть несколько коронавирусов, но они практически не вызывают никакой летальности, но не потому что они добряки, а просто потому что они уже проредили нашу популяцию. Остались и дали потомство только те кто выжил, т.е. мы и есть продукт отбора.
"В составе сезонных ОРВИ" - С учетом легкомысленного отношения медицины в РФ (как, возможно, и в других государствах) к подобным инфекциям, так и будет. Если бы относились серьезно, то диагностировали вирус у каждого гриппующего. А они тупо не заморачиваются, пишут "ОРВИ" - и свободен.
все с точностью до наоборот, не проредили популяцию, а потеряли летальность, вследствие многочисленных мутаций при передаче по цепочке от одного инфицированного к другому
Модель изначально ошибочная. ТК в ней неверные исходные данные.
Официальные цифры по заболевшим это те люди, которые смогли таки сдать тест.
Во-первых, тест берут только при предъявлении паспорта с отметкой о въезде за последние 2 недели или после контакта документально подтвержденным носителем. Инфу тоже проверяют по ФИО.
Я знаю случаи, когда открыли в тексте людям с температурой и затрудненным дыханием в Москве.
Во-вторых, в России на каждый тест в десятки раз меньше выявленных носителей, чем в других странах. Используется только наши тесты и не импортируются другие. Можно объяснить головой чувствительностью наших тестов.
Поэтому все эти модели ничего общего с реальностью не имеют. В особенности в России Причем разница может достигать тысяч раз. Вполне может быть, что у нас уже могут быть миллионы больных.
Совершенно очевидно, что на самом деле больных, переболевших и умерших больше.
Но модель и не претендует на отображение реального количества всех этих групп, она лишь собирает все выявленные и подтверждённые кейсы из открытых источников и на их основе делает прогноз развития (а в этом и весь смысл данной конкретной модели), тебе же указали на это в самом начале статьи.
"Прогноз развития эпидемии в России"
В Италии "карантин" вроде бы стабилизированный, прогноз совпадает.
В РФ даже карантина нет. Тот случай, когда прогнозы погоды умеют делать только на три дня. Поэтому прогноз по РФ на три дня. Хватило бы и линейной аппроксимации.
А экстремум будет обнаружен практическим путем.
Согласно теории хаоса это невозможно принципиально. Прогноз погоды не могут делать на длительные сроки:
...Зависимость от начальных условий предполагает, что мы не можем делать долгосрочные прогнозы в нестабильных динамических системах. Любая погрешность в начальных условиях не позволит нам предсказать результат на какой-либо продолжительный отрезок времени. Если, к примеру, взять модель Лоренца, в качестве входных данных для определения скорости ветра нам будет необходимо ввести значения температуры и давления в каждой точке земной атмосферы, только тогда можно будет ожидать достоверный прогноз на длительный срок. Причём, входные данные должны быть абсолютно точными, т. е. с бесконечным числом знаков после запятой. А как известно, совершенно все измерительные приборы на Земле имеют ненулевую погрешность.
undecim - Хабр
В РФ даже карантина нет.
В Италии не особо строгий карантин, до китайского далеко. Транспорт ходит, в отелях работают рестораны, итд.
"не карантин" в РФ наверное даже жестче итальянского карантина.
Каждый день прогноз меняется, но за те 3 дня что существует сайт, у России менялся пик, но его дата в начале мая не менялась.
Комментарий недоступен
Приведи их сюда плиз
Посмотри на артефакты на графике китая, там в один день резкий скачок, понято что гладкая кривая не строится.
Конечно я не претендую на правоту данного подхода, поэтому и описал что и как делал, чтобы знатоки математики и физики смогли доказать что так нельзя или неправильно, но пока все говорят, что так нельзя, а почему нельзя так и не понял.
Комментарий недоступен
Это полезное моделирование, достаточно посмотреть на модель, представленную правительством США.
Да сейчас данные настолько фрагментарные и неполные, что любые выкладки и попытки анализа будут гаданием на кофейной гуще
https://fivethirtyeight.com/features/why-its-so-freaking-hard-to-make-a-good-covid-19-model/
Интересно,а почему у Вас слайсы с данными предопределены заранее (или это вообще массив, тогда почему массив?),получается весь график по факту сам по себе до бесконечности "в режиме онлайн" строиться не будет?
data: [3, 3, 3, 3, 8, 8, 8, 8, 8, 9, 9, 12, 16, 16, 22, 29, 38, 45, 49, 64, 66, 121, 190, 235, 281, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ]
Там несколько линий данных, то что с запятыми и пустотой - это реальные данные, прогноз отдельная линия. В режиме онлайн грузятся данные по странам, данные за сегодня не используются для прогноза, так как они наполняются медленно и ночью равны вчерашним, что сбивает расчет.
Лучше скажите, почему при условии, что весь мир находится в изоляции, а среднее время проявления вируса пять дней (а не две недели - это срок жизни вируса в человеке), то откуда такой рост зараженных? 4 дня назад было +60К. Сейчас +100К.
Возможно все больше и больше проходит тестирований ежедневно
Комментарий недоступен
Я один такой тупой, или всем пофиг. Смотрю на выходы зараженных - на 4 выздоровевших 1 умер (на планете) , т.е.. 20% смертность. В Италии 50% на 50% ... Какой нах оптимизм? Че автор кривую прогнозируемых смертей не нарисовал? Поистине тупость всепланетная.
Нет, такой тупой ты не один, вас много, поздравляю
В Италии смертность по доступным на текущий момент данным - 12%.
Вот тут подробная аналитика по данным ВОЗ (на vc автор писалоб этом: https://vc.ru/u/279601-aleksandr-smirnov): https://docs.google.com/spreadsheets/d/e/2PACX-1vRyey2UzoVlI8AWtPja1kwtIHatRPO-W2dGAb3LwuppYuJ1ZNjDfmLQGJy57dVUdVpsDrHHf9_Z1W5t/pubhtml
Профессор из Израиля изобрел способ победить коронавирус за 2 месяца
Так утверждает профессор Амнон Шаашуа, генеральный директор компании Mobileye и один из ведущих деятелей израильского хай-тека.
31.03.20
Шаашуа вместе с двумя коллегами, разработал математическую модель, с помощью которой можно, по его словам, изолировать группы риска и позволить большинству населения страны постепенно выйти из режима ЧП и вернуться на рабочие места.
Бля, изобретение )))))) Это же просто элементарно и очевидно как дважды два - изолировать только группы риска, а всех остальных не трогать и не заебывать карантинами.
А предполагается, что эта закономерность соблюдается и на более мелких областях? Мб тогда уж для России сделать отдельную выборку по субъектам федерации и миллионникам, например?
Комментарий недоступен
Советую почитать интересную статью от the Washington post, где рассказаны четыре возможных исхода событий в соответствии с выбранным сценарием.
https://www.washingtonpost.com/graphics/2020/world/corona-simulator/
Строить какие-либо модели в условиях полной неопределенности не вполне корректно, но без моделей трудно определиться с природой процесса. Как врач я могу отметить- сегодня нет ни представлений о скорости и качестве иммунитета, ни вакцин, ни эффективных медикаментов. Учитывая особенности короновируса, можно полагать, что должно переболеть до 70-90% населения. Прививку создать технически невозможно в ближайшие 2 года. Основная задача заключается- в разгрузке системы здравоохранения, сохранения экономики, что позволит лечить тяжелых больных. Иными словами растянуть сроки пандемии, что даст шансы при ослаблении вируса выжить пожилым больным. Летальность, к сожалению составит не менее 1% (даже с отсрочкой на 1-2 года). Поэтому нужно спокойно выдерживать разумную самоизоляцию как, например в ФРГ. Желаю всем здоровья. Д.м.н., проф. А.Цикулин. ФРГ
Сегодня в Италии порядка 100т. активных случаев. С графиком явное не совпадение.
А вот американский график очень близок. На сегодня порядка 2т. смертей за сутки.
Обобщая все вопросы к прогнозу, понял что основной вопрос — это почему Гаусс?
У Китая склон спада более пологий чем склон подъема, что не похоже на симметричного Гаусса, но похоже на логнормальное распределение.
Добавил новый прогноз, на котором вместе отображаются и Гаусс и Логнорма
У некоторых стран, например у России, не считается долгосрочный прогноз - данные такие, что Логнорма очень хорошо проходит по точкам, но не чувствует пика и рисует его очень далеко и высоко.
Для таких стран отображаю прогноз на 20 дней вперед. Думаю, по мере поступления новых данных, это пройдет.
А вообще, если по всем странам посмотреть, то Логнорма везде лучше, чем Гаусс.
Как думаете для обсуждения нового прогноза, сделать отдельный пост, где подробно расскажу о новом прогнозе?
https://coronavirussia.online/prognoz/All
Сделайте, пожалуйста, отдельный прогноз по Москве.
Необходимо найти источник данных, который бы содержал по дням в Москве цифры и обновлялся каждый день, желательно в формате json
И всё таки модель Гауса не работает, более прогнозируемым остается модель SIR и её вариации. Но точно рассчитать под каждую страну не просто. Вот расчет для России. Прогноз строится в коридоре между худшим и лучшим случаями https://coronavirus-hub.ru/russia/ .Используется модель SIR
Очень интересно, что такое ежедневные отметки времени?