-
Notifications
You must be signed in to change notification settings - Fork 1
Результати виконання домашнього завдання №4
Посилання на файл README.md: README.md
Об'єктом нашого дослідження cтали США, тому статистичні дані грипу відповідно беруться для цієї країни. Джелером даних є вебсайт центру контролю і профілактики захворювань США. Збір, збереження і обробка інформації проводиться за допомогою розробленого ADT (опис ADT). Після здійснення всіх потрібних маніпуляцій ми можемо легко отримати потрібні для подальшого аналізу дані. Основною цілю нашого дослідження є порівняння статистики грипу і COVID-19, тому розроблений абстрактний тип даних має методи, які дозволяють користувачу остримувати для кожного року окремо і середню кількість смертей, хворих та людей, які виздоровіли.
Джерелом статистичних даних COVID-19 API розроблене John Hopkins University. Взаємодія між користувачем і API відбувається за допомогою хостингу (короткий опис) і розробленого абстрактного типу даних (опис ADT). Використовуючи CoronaADT користувач може отримувати всі потрібні для подальшого аналізу дані.
Головною ціллю нашого проєкту було порівняння небезпеки грипу і COVID-19. Часовою одиницею, для якої ми накопичували дані, є один рік. Саме такий проміжок часу дозволяє усвідомити масштаб хвороби і уникнути похибок. При порівнянні статистики за один день є велика ймовірність неправильно протрактувати результати. До прикладу, якщо б ми порівнювали кількість хворих 1 лютого, то могло б скластись враження, що COVID-19 не є небезпечним, але сьогоднішня ситуація в світі (станом на 10.05.2020) показує зовсім інше. Проблемою стало те, що пандемія COVID-19 почалась 5 місяців тому, тому ми вирішили використовувати машинне навчання для заповненя статистичної "пустоти". Також користувач має можливість порівняти грип і COVID-19 без прогнозування.
Основною метою цього проекту було дослідити поширення віруів Грипу та COVID-19. На основі отриманих результатів порівняти наскільки подібно чи по-різному кожна із світових пандемій розвивається та яких ефект має на суспільство.
Однією із підзадач було дослідження проблеми із подальшим поширенням вірусу COVID-19. Для використання даних використовується API, який надає дані про кількість заражень, смертей та вилікуваних людей від SARS COVID-19. Для прогнозування програма використовує надзвичайно вживаний kernel algorithm (support vector machine learning).
Methods:
На початках використовувалися три різні методи машинного навчання. Один із них був Linear Regression, другий - Polynomial Regression і Radial Basis Function.
Післz проведення тестів було виявлено, що метод RFB - Radial Basis Function показав найкращі результати у прогнозуванні захворювань до кінця року (2020) на базі, отриманих перед цим, даних.
-
RBF - 99.2% accuracy
-
Linear Regression - 98.8% accuracy
-
Polynomial Regression - 95.2% accuracy
Посилання на тестовий модулю для прогнозування: [...]
Після отримання даних про віруси Грипу та COVID-19, програма зображає їн на графках, які є зазначені у README.md
Було виявлено, порівнявши розвиток COVID-19 та Грипу, що різниця між хворими у США на один та інший вірус складає ...%, пацієнтів, які вилікувалися - ...% та смертність - ...%. Ці резульати свідчать про те, що розвиток обох вірусів ...
Дослідження було виконано у 2020 році. На жаль, даних про COVID-19 у нас не так і багато, учені ще не винайшли дієвих ліків, які допоможуть у боротьбі із вірусом. Але, як видно із графіка, про подальше розвинення COVID-19, можна надати висновки, що насправді уведення карантину, надало світу спад кількості захвонювань. Усе ж, вірус досягає свого піку.
Дані, які були зібрані не надають точної інформації! На теперішній час прогнозувати наперед із кожним днем важче, адже більша похибка в обчисленнях. У подальшому можна буде аналізувати усе із білшою точністю, бо із кожним днем оновлюється графік, адже надходять нові дані про кількості хворих.