forked from bdemeshev/coursera_metrics
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathmetrics_plan_send.txt
executable file
·151 lines (112 loc) · 6.03 KB
/
metrics_plan_send.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
Лекция 1
* Презентация помощников :)
* метод наименьших квадратов:
- рост-вес, задача про слитки
- множественная регрессия
- модель CAPM
- сразу множественная регрессия
- RSS, R^2, TSS, ESS, остатки (ошибки прогнозов)
* введение в R
- введение в R-studio (картинка в картинке)
- в R есть встроенные наборы данных
- установка пакетов и загрузка пакетов
- чтение данных из разных источников: csv (российские нюансы)
- описательные статистики
- основные ggplot2 графики: гистограмма, рассеяния (+hexbin), # facet,
- парная регрессия
quiz: + неоцениваемый data.camp
нестатистич мнк (посчитать R2, остатки, можем ли мы посчитать эпсилон2 по реальным данным)
какая команда посчитает среднее у вектора z: average(z), mean(z),
неоцениваемый data.camp (чуть больше)
простая работа со встроенным набором данных (посчитайте среднюю цену бриллиантов)
Лекция 2
* проверка гипотез, доверительные интервалы для коэффициентов
* расшифровка стандартной таблички R
* p-value
* два типа доверительных интервала для прогнозов
- прогнозирование в R
- деление выборки на две части
quiz: (c возможностью запустить data.camp)
теоретически по табличке проверьте гипотезы
по встроенному набору данных оцените проверьте спрогнозируйте
Лекция 3
Теорема Гаусса-Маркова
* версия с фиксированными переменными
* версия со стохастическими регрессорами (сразу)
как сказать про E(y|x)?
Проекция (картинка)
множественная в R,
ковариационная матрица
проверка гипотез о линенйых ограничениях
дамми переменные - возврат к задаче про слитки
ограниченная / неограниченная модель тестирование
- обработка данных dplyr (filter, select, mutate, group_by-summarise_)
- оформление документа с использованием Rmd (взаимодействие с Word и Latex)
посчитать --- среднее доход по мужчинам
построить регрессию конкртено y на x2, x3 и:
(для себя построить график (не оцениваниется))
найти r2
построить доверительные интервал для beta2
спрогнозоировть y у мужчины c x2=..., x3=... и поместить в переменную
Лекция. 4
мультиколлинеарность
- неустойчивость оценок
- регуляризация: LASSO + ridge + elastic net
- outliers
метод главных компонент - снижение размерности задачи
? проиллюстрировать на 3 наблюдения 2 переменных найти 1 главную компоненту
? кросс-валидация и деление выборки на две части
quiz:
найдите три веса для первой компоненты
VIF
найдите оценки LASSO при лямбда = ...
выкладываем файл с данными и маленький R шаблон с командой загрузки
Лекция 5
Гетероскедастичность
последствия
методы борьбы:
устойчивые ошибки
- намекнуть на взвешенные мнк (обобщенный)
mitderm: (без ограничения времени)
включая гетероскедастичность
выдали домашку (!)
Лекция 6
автокорреляция
последствия устойчивые ошибки
- работа с временными рядами в К
- lubridate
- больше графиков (!)
- больше R
- написать свою функцию
quiz (поменьше так как выдана домашка)
- выберите способ как в R сделать ... (несколько верных)
Лекция 7
метод максимального правдоподобия
- примеры ML
Логит, пробит
* предельные эффекты - два типа
* оценивание в R
* прогнозирование
quiz:
Лекция 8
стационарность
ARMA,
acf, pacf
- нестационарные ряды:
- удаление тренда
- взятие разности - понятие о единичном корне
- в лекции руками привести пример кажущейся регрессия с симулированными данными и с реальными
quiz: + сдача домашки в конце недели
Лекция 9
инструментальные переменные
- эндогенность
- причины
- инструментальные переменные
? воспроизвести какую-то классическую статью
теоретический квиз: ...
+ проверка чужих домашек
Лекция 10.
квантильная регрессия
случайный лес
регрессия пик-плато (spike and slab regression)
экзамен: с расчетами и теорией