Prezentace a ukázkové skripty k semináři v jazyce R.
Název | Datum | Čas | Místo | Registrace |
---|---|---|---|---|
Úvod do datové analýzy I | 2019-02-07 | 17:30 - 21:00 | Avast HQ | Minervo |
Úvod do datové analýzy II | 2019-02-14 | 17:30 - 21:00 | Opero | Minervo |
Úvod do datové analýzy III | 2019-02-19 | 17:30 - 21:00 | TBA | Minervo |
Úvod do datové analýzy I | 2018-10-31 | 17:30 - 21:00 | UP21 incubator | |
Úvod do datové analýzy II | 2018-11-06 | 17:30 - 21:00 | Animika Hub | |
Úvod do datové analýzy III | 2018-11-13 | 17:30 - 21:00 | Opero |
Série tří seminářů vám pomůže rychle se zorientovat v jazyce R a interaktivním prostředí RStudia. Budeme se věnovat zejména analýze dat "tidy" přístupem - tedy pomocí knihoven shrnutých do balíku tidyverse. Během všech částí projdeme kompletně celou oblast manipulace s daty a vizualizace - od úplných začátků po pokročilé metody. Na konci seminářů sami uvidíte, kolik práce se dá ušetřit jednoduchými operacemi v R oproti spreadsheet nástrojům, jako například Excel.
Většina kurzů (soukromých i na vysokých školách) učí R klasickým způsobem. Moderní způsob pomocí balíku tidyverse je mnohem jednodušší pro začátečníky, jelikož nevyžaduje takové znalosti datových struktur v jazyce R. Navíc lze pomocí něj vytvářet analýzy a grafy mnohem snadněji s mnohem čitelnějším kódem. Proto se v tomto semináři zaměřujeme zejména na skupinu knihoven, které patří do tohoto balíku: dplyr, tidyr, purrr, ggplot2, ...
Jednotlivé části semináře na sebe obsahově navazují. Doporučujeme proto, aby se zájemci přihlásili na všechny semináře zároveň.
Pro koho je seminář určen:
- Datový analytici, jejichž každodenním chlebem je Excel a/nebo SQL.
- Studenti, kteří zpracovávají data pro svoji bakalářskou, nebo diplomovou práci.
- Všichni, kdo chtějí změnit svoje zaměření na datovou analytiku, nebo data science.
Jaké zkušenosti by měli účastníci mít:
- Lidé bez zkušeností s jazykem R, kteří mají nějakou zkušenost s některým z nástrojů pro práci s daty: Excel, SQL, nebo Python.
- Mírně a středně pokročilí v R, kteří dosud nevyužívali knihovnu tidyverse.
Více informací o semináři na zvláštní stránce.
- Úvod do jazyka R a RStudia
- Zdroje pro další vzdělávání a pomoc
- Úvod do
tidyverse
- Načítání dat z RData, csv a Excelu (readr, readxl)
- Základy manipulace s daty (dplyr)
- Základy vizualizace (ggplot2)
- Agregování skupinových dat (dplyr)
- Vizualizace skupinových dat (ggplot2)
- Funkcionální programování (purrr)
- Načítání dat z SQL (dbplyr)
- Operace s textem (stringr, tidyr)
- Pokročilá manipulace s daty (dplyr, tidyr)
- Shrnutí procesu load-transform-vizualize
- Machine Learning in R
- Neural Networks in R
- Web Scraping
- Programming in R
- Package Development