This repository has been archived by the owner on Apr 24, 2022. It is now read-only.
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathOscary_Dofile.do
585 lines (487 loc) · 31.7 KB
/
Oscary_Dofile.do
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
***************************************************************OGÓLNE STATYSTYKI************************************************************************************
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
//Statystki zmiennej zale|nej
tab oscar
//statystyki zmiennych niezaleznych
sum budzet2000
hist budzet2000
sum przychody2000
hist przychody2000
tab gatunek
tab ekranizacja
tab kraj_prod
tab milosc
sum czas_trwania
hist czas_trwania
tab nominacje
tab zlote_globy
tab bafta
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
**********************************************************************LINIOWY MODEL P-STWA***********************************************************************************
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
//Model 1:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
fitstat
//chce usunac zmienna _Igatunek_7
test _Igatunek_7
//usuwamy zmienna _Igatunek_7 z modelu
//Model 2:
reg oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_8 _Igatunek_9 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna roi
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi
//usuwamy zmienna roi z modelu
//Model 3:
reg oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_8 _Igatunek_9 ekranizacja kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_8
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8
//usuwamy zmienna _Igatunek_8 z modelu
//Model 4:
reg oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_9 ekranizacja kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna budzet2000
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000
//usuwamy zmienna budzet2000 z modelu
//Model 5:
reg oscar _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_9 ekranizacja kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_9
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9
//usuwamy zmienna _Igatunek_9 z modelu
//Model 6:
reg oscar _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 ekranizacja kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna ekranizacja
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9 ekranizacja
//usuwamy zmienna ekranizacja z modelu
//Model 7:
reg oscar _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_1
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9 ekranizacja _Igatunek_1
//usuwamy zmienna _Igatunek_1 z modelu
//Model 8:
reg oscar _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_5
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9 ekranizacja _Igatunek_1 _Igatunek_5
//usuwamy zmienna _Igatunek_5 z modelu
//Model 9:
reg oscar _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_3
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9 ekranizacja _Igatunek_1 _Igatunek_5 _Igatunek_3
//usuwamy zmienna _Igatunek_3 z modelu
//Model 10:
reg oscar _Igatunek_2 _Igatunek_4 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_4
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9 ekranizacja _Igatunek_1 _Igatunek_5 _Igatunek_3 _Igatunek_4
//usuwamy zmienna _Igatunek_4 z modelu
//Model 11:
reg oscar _Igatunek_2 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna przychody2000
//Model ogólny:
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 roi _Igatunek_8 budzet2000 _Igatunek_9 ekranizacja _Igatunek_1 _Igatunek_5 _Igatunek_3 _Igatunek_4 przychody2000
//usuwamy zmienna przychody2000 z modelu
//Model Finalny:
reg oscar _Igatunek_2 _Igatunek_6 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
hettest,rhs //test na heteroskedastycznosc
//w modelu wystepuje heteroskedastycznosc, p-value=0.0000 <0.05 odrzucamy hipoteze zerowa mowiaca o homoskedastycznosci
//sprawdzamy, czy wartosci dopasowane wychodza poza przedial [0,1]
predict xb1,xb
sum xb1
//jak widac wartosci dopasowane naleza do przedzialu [-0.096738;1,528635] - kolejna wada LMP
//sprawdze ile jest takich wartosci dopasowanych, ktore wykraczaja poza przedzial [0;1]
count if xb1<0 | xb1>1
//jest ich 425 z 1663, co oznacza okolo 25,56% wartosci nie jestesmy w stanie interpretowac
//postaram sie pozbyc problemu heteroskedastycznosci stosujac macierz wariancji-kowariancji White'a
reg oscar _Igatunek_2 _Igatunek_6 kraj_prod nominacje zlote_globy bafta milosc czas_trwania, robust
hettest,rhs //nie dziala po robust :(
rvfplot
whitetst //p-value < 0.05 - odrzucamy H0 o homoskedasytcznosci
// robust nic nie pomógl, nie mozemy uzyc LMP
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
***************************************************************LOGIT*******************************************************************************************
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
//Od ogolu do szczegolu:
//Model 1:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
//wiekszosc skladnikow zmiennej gatunek nieistotna tylko jedna istotna dlatego przetestuje laczna nieistotnosc zmiennej
test _Igatunek_7
// usuwamy zmienna _Igatunek_7 z modelu
//Model 2:
logit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_8 _Igatunek_9 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_8
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8
// usuwamy zmienna _Igatunek_8 z modelu
//Model 3:
logit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_9 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_9
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9
//usuwamy zmienna _Igatunek_9 z modelu
//Model 4:
logit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_1
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1
//usuwamy zmienna _Igatunek_1 z modelu
//Model 5:
logit oscar budzet2000 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna ekranizacja
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja
//usuwamy zmienna ekranizacja z modelu
//Model 6:
logit oscar budzet2000 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna budzet2000
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000
//usuwamy zmienna budzet2000 z modelu
//Model 7:
logit oscar _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_5
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000 _Igatunek_5
//usuwamy zmienna _Igatunek_5 z modelu
//Model 8:
logit oscar _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna czas_trwania
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000 _Igatunek_5 czas_trwania
//usuwamy zmienna czas_trwania z modelu
//Model 9:
logit oscar _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna roi
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000 _Igatunek_5 czas_trwania roi
//usuwamy zmienna roi z modelu
//Model 10:
logit oscar _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna _Igatunek_4
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000 _Igatunek_5 czas_trwania roi _Igatunek_4
//usuwamy zmienna _Igatunek_4 z modelu
//Model 11:
logit oscar _Igatunek_2 _Igatunek_3 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna _Igatunek_3
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000 _Igatunek_5 czas_trwania roi _Igatunek_5 _Igatunek_3
//usuwamy zmienna _Igatunek_3 z modelu
//Model 12:
logit oscar _Igatunek_2 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna _Igatunek_6
//Model ogólny:
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 _Igatunek_9 _Igatunek_1 ekranizacja budzet2000 _Igatunek_5 czas_trwania roi _Igatunek_5 _Igatunek_3 _Igatunek_6
//usuwamy zmienna _Igatunek_6 z modelu
//Model Finalny:
logit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
linktest // linktest nie wychodzi
estat gof //gof nie wychodzi
lfit, group(10) table // TEst Hosmer-Lemeshowa nie wychodzi
//Porównianie modelu ogólnego i zagniezdzonego
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
fitstat, saving(m1)
logit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
fitstat, using(m1) force
//INTERAKCJE
gen var0=_Igatunek_6*milosc // brak obserwacji
gen var1=_Igatunek_6*kraj_prod // nieistotne
gen var3=_Igatunek_6*nominacje // nieistotne
gen var4=_Igatunek_6*zlote_globy // nieistotne
gen var5=_Igatunek_6*bafta // brak obserwacji
gen var6=_Igatunek_6*nominacje // nieistotne
gen var7=_Igatunek_6*przychody2000 // nieistotne
gen var8=przychody2000*czas_trwania //nieistotne ale bilskie 0.10
gen var9=przychody2000*nominacje //istotne, ale przychody staja sie nie istotne, a linktest sie pogorsza
gen var10=przychody2000*zlote_globy //nieistotne
gen var11=przychody2000*bafta //istotne, ale przychody staja sie nie istotne, a linktest sie pogorsza
gen var12=przychody2000*kraj_prod //nieistotne
gen var13=przychody2000*milosc //nieistotne
gen var14=przychody2000*kraj_prod*zlote_globy //nieistotne
gen var20=nominacje*bafta //nieistotne
//Nic nie daja, dalej linktest nie wychodzi
//Sprawdzamy czy niektore zmienne nalezaloby przeksztalcic, zeby uzyskac poprawna forme funkcyjna
boxtid logit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc, zero(nominacje zlote_globy bafta) //sprawdza czy zmienne maja liniowa forme
//Przeksztalcamy nominacje, zlote_globy i bafta, bo maja p-value mniejsze od 0.05 (odpowiednio P=0.0000, P = 0.017 i P = 0.012),
//potrzeba transformacji tych zmiennych wynika prawdopodobnie ze spadajacych efektów krancowych
gen ln_nom=ln(nominacje)
recode ln_nom .=0 //ze wzgledu na generowanie brakow obserwacji przy zerowej wartosci zmiennej bazowej
gen ln_zg=ln(zlote_globy)
recode ln_zg .=0 //ze wzgledu na generowanie brakow obserwacji przy zerowej wartosci zmiennej bazowej
gen ln_baf=ln(bafta)
recode ln_baf .=0 //ze wzgledu na generowanie brakow obserwacji przy zerowej wartosci zmiennej bazowej
//Testy dla modelu przetransformowanego
logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
linktest
est store log_final2
estat gof
lfit, group(10) table
lstat //tablica trafnosci dopasowan
fitstat
lroc //wykres krzywej RoC i ile procent znajduje sie nad nia
lsens // wykres krzywej wrazliwosci i specyficznosci
//lsens wskazuja na przeciecie w okolicach 0.05
lstat,cutoff(0.05)
findit collin //pakiet potrzebny do testowania korelacji zmiennych
collin oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
// 4.21 czyli mniej niz 10, wszystko ok
//Porównanie dopasowania modelu bez przeksztalcen i z przeksztalceniami
//Bez przeksztalcen
logit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
fitstat, saving(m2)
//Z przeksztalceniami
logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
fitstat, using(m2)
// model bez zmiennej przetransformowanej jest lepszy,
logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
mfx compute
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
******************************************************************************PROBIT*******************************************************************************************
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
// Od ogólu do szczególu:
//Model 1:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_7
test _Igatunek_7
// usuwamy zmienna _Igatunek_7 z modelu
//Model 2:
probit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_8 _Igatunek_9 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_8
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8
// usuwamy zmienna _Igatunek_8 z modelu
//Model 3:
probit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_9 ekranizacja kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna ekranizacja
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja
// usuwamy zmienna ekranizacja z modelu
//Model 4:
probit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 _Igatunek_9 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_9
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9
// usuwamy zmienna _Igatunek_9 z modelu
//Model 5:
probit oscar budzet2000 _Igatunek_1 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_1
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1
// usuwamy zmienna _Igatunek_1 z modelu
//Model 6:
probit oscar budzet2000 _Igatunek_2 _Igatunek_3 _Igatunek_4 _Igatunek_5 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna _Igatunek_4
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4
// usuwamy zmienna _Igatunek_4 z modelu
//Model 7:
probit oscar budzet2000 _Igatunek_2 _Igatunek_3 _Igatunek_5 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc czas_trwania
//chce usunac zmienna czas_trwania
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4 czas_trwania
// usuwamy zmienna czas_trwania z modelu
//Model 8:
probit oscar budzet2000 _Igatunek_2 _Igatunek_3 _Igatunek_5 _Igatunek_6 kraj_prod roi przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna roi
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4 czas_trwania roi
// usuwamy zmienna roi z modelu
//Model 9:
probit oscar budzet2000 _Igatunek_2 _Igatunek_3 _Igatunek_5 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna budzet2000
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4 czas_trwania roi budzet2000
// usuwamy zmienna budzet2000 z modelu
//Model 10:
probit oscar _Igatunek_2 _Igatunek_3 _Igatunek_5 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna _Igatunek_3
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4 czas_trwania roi budzet2000 _Igatunek_3
// usuwamy zmienna _Igatunek_3 z modelu
//Model 11:
probit oscar _Igatunek_2 _Igatunek_5 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna _Igatunek_5
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4 czas_trwania roi budzet2000 _Igatunek_3 _Igatunek_5
// usuwamy zmienna _Igatunek_5 z modelu
//Model 12:
probit oscar _Igatunek_2 _Igatunek_6 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
//chce usunac zmienna _Igatunek_6
//Model ogólny:
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
test _Igatunek_7 _Igatunek_8 ekranizacja _Igatunek_9 _Igatunek_1 _Igatunek_4 czas_trwania roi budzet2000 _Igatunek_3 _Igatunek_5 _Igatunek_6
// usuwamy zmienna _Igatunek_6 z modelu
//Model 13: Model Finalny
probit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
linktest
estat gof
lfit, group(10) table
//Porównianie modelu ogólnego i zagniezdzonego
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
fitstat, saving(m1)
probit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
fitstat, using(m1) force
//INTERAKCJE
gen pvar0=_Igatunek_6*milosc // brak obserwacji
gen pvar1=_Igatunek_6*kraj_prod // nieistotne
gen pvar3=_Igatunek_6*nominacje // nieistotne
gen pvar4=_Igatunek_6*zlote_globy // nieistotne
gen pvar5=_Igatunek_6*bafta // brak obserwacji
gen pvar6=_Igatunek_6*nominacje // nieistotne
gen pvar7=_Igatunek_6*przychody2000 // nieistotne
gen pvar8=przychody2000*czas_trwania //nieistotne ale bilskie 0.10
gen pvar9=przychody2000*nominacje //istotne, ale przychody staja sie nie istotne, a linktest sie pogorsza
gen pvar10=przychody2000*zlote_globy //nieistotne
gen pvar11=przychody2000*bafta //istotne, ale przychody staja sie nie istotne, a linktest sie pogorsza
gen pvar12=przychody2000*kraj_prod //nieistotne
gen pvar13=przychody2000*milosc //nieistotne
gen pvar14=przychody2000*kraj_prod*zlote_globy //nieistotne
gen pvar20=nominacje*bafta //nieistotne
//Nic nie daja, dalej linktest nie wychodzi
// Uzyjemy testu Boxa_Tidwell, |eby sprawdzic czy wszystkie zmienne maja odpowiednia postac
boxtid probit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc, zero (nominacje zlote_globy bafta) //sprawdza czy zmienne maja liniowa forme
//mamy juz te zmienne zlogarytmowane w bazie
probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
linktest // p-value dla _hatsq=0.385 - model ma poprawna forme funkcyjna
estat gof
lfit, group(10) table //grupujem zmienne na 10 grup zawzgledu na obecnosc zmiennej ciaglej "czas_trwania" w modelu
// p-value=0.0665 > 0.05 - poprawna forma funkcyjna wg testu Hosmera i Lemeshowa,
lstat //tablica trafnosci dopasowan
fitstat
lroc //wykres krzywej RoC i ile procent znajduje sie nad nia
lsens // wykres krzywej wrazliwosci i specyficznosci
//lsens wskazuja na przeciecie w okolicach 0.05
lstat,cutoff(0.05)
//Porównianie modelu ogólnego i zagniezdzonego
probit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
fitstat, saving(m1)
probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
fitstat, using(m1) force
probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
mfx compute
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
**********************************************************************PORÓWNANIE LOGITU I PROBITU***********************************************************************
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
//Porównanie logitu i probitu za pomoca fitstat
qui logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
qui fitstat, save
qui probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
fitstat, dif force
//chyba probit jednak
//Korelacja pomiedzy logitem, a probitem
qui logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
est store log_final
predict prlogit
label var prlogit "Logit: Pr(lfp)"
qui probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
est store prob_final
predict prprobit
label var prprobit "Probit: Pr(lfp)"
pwcorr prlogit prprobit // Korelacja wynosi 0.9994
//Wykresy ROC dla obu model
logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
predict logit_fin, xb
lroc, nograph
probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
predict probit_fin, xb
lroc, nograph
roccomp oscar logit_fin probit_fin, graph summary
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
**********************************************************************TABELE***********************************************************************************
*****************************************************************************************************************************************************************************
*****************************************************************************************************************************************************************************
*********TABELA LOGIT I PROBIT EFEKTY CZASTKOWE*******************************
logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
mfx compute
eststo
probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
mfx compute
eststo
esttab, margin no nopar mtitles("Logit" "Probit") starlevels(* 0.10 ** 0.05 *** 0.01)
**********TABELA Z OSZACOWANIAMI PARAMETRÓW*********************
eststo: xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
mfx compute
eststo: logit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
eststo: logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
eststo: xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
eststo: probit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
eststo: probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
eststo: xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
eststo: reg oscar _Igatunek_2 _Igatunek_6 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
esttab, se pr2 ar2 aic bic starlevels(* 0.10 ** 0.05 *** 0.01) scalars("ll Log Wiarygodnosci" "chi2 Chi-kwadrat" "F Statystyka F") label replace booktabs mgroups(Logit Probit LMP, pattern(1 0 0 1 0 0 1 0) prefix(\multicolumn{@span}{c}{) suffix(}) span erepeat(\cmidrule(lr){@span})) alignment(D{.}{.}{-1}) page(dcolumn) nonumber mtitles("Logit Ogolny" "Logit Zagniezdzony" "Logit Przetransformowy" "Probit Ogolny" "Probit Zagniezdzony" "Probit Przetransformowy" "LMP Ogolny" "LMP Finalny")
eststo clear
**********TABELA Z EFEKTAMI CZASTKOWYMI*********************
xi: logit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
mfx compute
eststo
logit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
mfx compute
eststo
logit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
mfx compute
eststo
xi: probit oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
mfx compute
eststo
probit oscar _Igatunek_2 kraj_prod przychody2000 nominacje zlote_globy bafta milosc
mfx compute
eststo
probit oscar _Igatunek_2 kraj_prod przychody2000 ln_nom ln_zg ln_baf milosc
mfx compute
eststo
xi: reg oscar budzet2000 i.gatunek ekranizacja roi przychody2000 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
mfx compute
eststo
reg oscar _Igatunek_2 _Igatunek_6 kraj_prod nominacje zlote_globy bafta milosc czas_trwania
mfx compute
eststo
esttab, margin style(fixed) pr2 ar2 aic bic starlevels(* 0.10 ** 0.05 *** 0.01) scalars("ll Log Wiarygodnosci" "chi2 Chi-kwadrat" "F Statystyka F") label replace booktabs mgroups(Logit Probit LMP, pattern(1 0 0 1 0 0 1 0) prefix(\multicolumn{@span}{c}{) suffix(}) span erepeat(\cmidrule(lr){@span})) alignment(D{.}{.}{-1}) page(dcolumn) nonumber mtitles("Logit Ogolny" "Logit Zagniezdzony" "Logit Przetransformowy" "Probit Ogolny" "Probit Zagniezdzony" "Probit Przetransformowy" "LMP Ogolny" "LMP Finalny")
eststo clear
********************************************************************************************************************