-
Notifications
You must be signed in to change notification settings - Fork 0
Meeting 2020 07 19
Sinan Demirci edited this page Jul 30, 2020
·
22 revisions
Google API - doneGlove - doneBert - done
Additional data - doneDuplicates us de Trainingsdate lösche - done-
Rule basedPR muess no gmerged werde mitem refactoring, review necessarynachdem report section fertig isch: code ufrume dases das im report repräsentiert
-
Bertweet - doneexperiments doneproposed experiment: done
Ensembling - done-
Baggingexperiment müend no gstartet werde, bagging wird für die models gmacht wo au s ensembling gmacht wirdBERTweet mit oder oder ohni additional data?
-
Abstract, Introductionam schluss wenn alles fertig isch de abstract schribeIntroduction mit key contributions am schluss vom paragraph ergänze
-
Related WorksEvtl. chan de Jerry da no zügs ergänze, will kein grosse zemehang mit euse resultatmeh expande und versueche e connection zu eusem züg macheproofreading
-
Dataerwähne das alles uf 90% trainiert worde isch mit fixed 10% validation setadditional data wird nur is training set ufgno, nachem 90/10 split
-
Models/Methods-
Baselinesversueche z erkläre wieso die baselines gwählt worde sindinvestigate ob models vor BERT au pre-training -> fine-tuning scheme gmacht hend
-
Bertweetfine-tuning (pun intended) vom text bruchts no
-
ensembling/baggingzäme i einere section, will s basic concept isch s glicheproofreading notwendig
-
klammere approachwo ane im report? eigentlich kei "method" meh bonus -> entscheid: zerst eigeni section, denn am schluss ihordne im report
-
-
Experiments/Resultsnur mean und std dev ufem test set wird reported wo möglich, meh results wo nötig sind chönt in appendix gschobe werdetable baselinestable mit results vo bert, roberta, bertweet ohni und mit additional dataplot mit ensembling results vo BERTweet (mit/ohni bagging, mit/ohni additional data), plot mit 4 lines, inkrementell rs0, rs0 + rs1, usw.allgemein corrections und proofreading nötig
-
Insightsklammere approach wird i dere section abghandletproofreading und corrections
-
Conclusion/Summaryisch e summary vode results section inklusive resultat vode insights sectionnöd allzuviel elaborate, meh kurz und bündig zemefasse
-
Appendixensemble section fixeproofreading
-
hyperparameter tuninglearning rate tuning - diskutiere was sinn macht zum no ufem leonhard laufe lah
-
guets Readmefokus uf reproducibility, maybe Jerry wos chan update und luege das alles sinn machemachine requirements ufliste, zb. BERT brucht 64 GB memory fürs data loading, RoBERTa 96 GBverwiis uf config files bezüglich hyperparemter choice und generelli usageklammere section finisheshoutout/references zu huggingface
results sammle is google sheet (https://docs.google.com/spreadsheets/d/1XA4ngmFqlmX_xVFvuwe7O0c1wtapaCNGwZVt_2GAbJc/edit?usp=sharing)-
refactoring / ufrumebert-pooled usenehanderi regle vode rules useneh, nur parenthesestrenne vom dataloading und em training/testing loop -> done, testing lauft
Uf Kaggle de hake bi eusem final candidate setze