Skip to content

Результати виконання домашнього завдання №4

sydorbogdan edited this page May 19, 2020 · 34 revisions

Дані, накопичені для подальшої обробки

Статистичні дані грипу:

Об'єктом нашого дослідження cтали США, тому статистичні дані грипу відповідно беруться для цієї країни. Джелером даних є вебсайт центру контролю і профілактики захворювань США. Збір, збереження і обробка інформації проводиться за допомогою розробленого ADT (опис ADT). Після здійснення всіх потрібних маніпуляцій ми можемо легко отримати потрібні для подальшого аналізу дані. Основною цілю нашого дослідження є порівняння статистики грипу і COVID-19, тому розроблений абстрактний тип даних має методи, які дозволяють користувачу остримувати для кожного року окремо і середню кількість смертей, хворих та людей, які виздоровіли.

Статистичні дані COVID-19:

Джерелом статистичних даних COVID-19 API розроблене John Hopkins University. Взаємодія між користувачем і API відбувається за допомогою хостингу (короткий опис) і розробленого абстрактного типу даних (опис ADT). Використовуючи CoronaADT користувач може отримувати всі потрібні для подальшого аналізу дані.


Результати обчислювальних експериментів

Відображення результатів обчилювальних експерементів:

При порівнянні використовувалась середні статистичні дані для грипу за 2010-2016 роки і останні статистичні дані COVID-19. Для відображення результатів обчислень було вибрано стовпчасту діаграму. Відсоткові відношення виводяться у текстовому форматі в консоль.

Трактування результатів обчилювальних експерементів:

Головною ціллю нашого проєкту було порівняння статистики грипу і COVID-19. Для дослідження ми вибрали конкретну країну, бо це дає можливість при подальшому розширенні можливостей нашої програми набагато легше порівнювати вплив різних факторів на розвиток певного вірусу, наприклад рівня самоізоляції. Часовою одиницею, для якої ми накопичували дані, є один рік. Саме такий проміжок часу дозволяє усвідомити масштаб хвороби і уникнути похибок. При порівнянні статистики за один день є велика ймовірність неправильно протрактувати результати. До прикладу, якщо б ми порівнювали кількість хворих 1 лютого, то могло б скластись враження, що COVID-19 не є небезпечним, але сьогоднішня ситуація в світі (станом на 10.05.2020) показує зовсім інше. Проблемою стало те, що пандемія COVID-19 почалась 5 місяців тому, тому ми вирішили використовувати машинне навчання для заповненя статистичної "пустоти". Також користувач має можливість порівняти грип і COVID-19 без прогнозування.

Результати порівняння без передбачення:

Кількість хворих:

Кількість людей, які виздоровіли:

Кількість смертей:

Результати порівняння з передбаченням:

Methods:

На початках використовувалися три різні методи машинного навчання. Один із них був Linear Regression, другий - Polynomial Regression і Radial Basis Function.

Після проведення тестів було виявлено, що метод RFB - Radial Basis Function показав найкращі результати у прогнозуванні захворювань до кінця року (2020) на базі, отриманих перед цим, даних.

Prediction Tests

  • RBF - 99.2% accuracy

  • Linear Regression - 98.8% accuracy

  • Polynomial Regression - 95.2% accuracy

Після отримання даних про віруси Грипу та COVID-19, програма зображає їн на графках, які є зазначені у README.md

Було виявлено, порівнявши розвиток COVID-19 та Грипу, що різниця між хворими у США на один та інший вірус (Грип та COVID-19) складає 437.03%, пацієнтів, які вилікувалися - 574.996%, але смертність від COVID-19 порівняно із Грипом - 91.95%. Ці резульати свідчать про те, що розвиток обох вірусів відбувається пор-різному. Грип розвивається значно швидаше, тому і вже вважається звичайною хворобою. Але COVID-19 попри свії малий ріст та проміжок життя, спричинив значно буліше сменртей порівняно із Грипом.