Skip to content

Учебный проект в SkillFactory (unit 2) - Разведывательный анализ данных

Notifications You must be signed in to change notification settings

NataliaKolesnik/EDA

Repository files navigation

Цель данной работы - отследить влияние условий жизни учащихся в возрасте от 15 до 22 лет на их успеваемость по математике, чтобы на ранней стадии выявлять студентов, находящихся в группе риска.

Задача – провести EDA и определить, какие условия жизни учащихся в возрасте от 15 до 22 лет влияют на успеваемость по математики.

Анализ выполнен в файле: 'EDA unit 2.ipynb’

Информация о данных:

Мы имеем выборку из 395 учащихся. Полные данные содержатся в колонках: school, sex и age.

В остальных колонках имеются пропуски до 11%.

Предположительно, имеем ошибки в столбцах:

fedu – значение 40.0 (1 раз) - похоже на ошибку 4.0 (так как диапазон значений 0-4) - исправить на 4.0.

famrel – значение -1.0 (1 раз) – похоже на ошибку 1.0 (так как диапазон значений 1-5) - исправить на 1.0.

Выбросы: absences – имеется два нереальных значения 212 и 385. Это числовой столбец. При расчете среднего они будут искажать результат. Так как их всего 2 – удаляем.

Этапы работы над проектом:

Более подробно изложено в самом ноутбуке и в файле "Пояснительная к проекту.docx"

  1. Подготовка данных к анализу - группировка оценнок на 6 групп - от 0 до 5 и работа с пропусками NaN

  2. Проводим анализ: как разные условия оказывают влияние на успеваемость - анализ столбцов с числовыми данными и столбцов с номинативными данными.

По ходу анализа сформировались промежуточные выводы

  1. Проверка, есть ли статистическая разница в распределении оценок по всем признакам с помощью теста Стьюдента.

  2. Составление датафреймов для использования в дальнейшем для анализа и прочего, на основе выводов и полученных результатов теста.

  3. Выводы

Ответы на вопросы:

  1. Какова была ваша роль в команде? - Я работала одна.

  2. Какой частью своей работы вы остались особенно довольны? - В конечном этоге я довольна всем. Из того, что я на данный момент понимаю, знаю и умею сделала всё. Будем продолжать совершенствоваться.

  3. Что не получилось сделать так, как хотелось? Над чем ещё стоит поработать? - Поработать хочу над трактовкой. Так как сделать просто механические расчеты это процентов 10%, а вот интерпретировать их - тут не паханное поле. Будем учиться.

  4. Что интересного и полезного вы узнали в этом модуле? - Много всего интересно. Все перечислять - это как все темы переписать списком. Мне очень нравиться изучать это направление.

  5. Что является вашим главным результатом при прохождении этого проекта? - Выполненное итоговое задание. В котором применились многие знания, полученные на этом модуле. Очень нравиться получать развернутые ответы от проверяющих проект.

  6. Какие навыки вы уже можете применить в текущей деятельности? - На текущей работе я не могу применить то, что я сейчас изучаю. Но я планирую сменить работу. И буду искать целенаправленно в этом направлении.

  7. Планируете ли вы дополнительно изучать материалы по теме проекта? - Я постоянно изучаю дополнительные материалы.

About

Учебный проект в SkillFactory (unit 2) - Разведывательный анализ данных

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published