-
Notifications
You must be signed in to change notification settings - Fork 0
Home
- Isabelle Eysseric
- David Poisson
- Nicolas Garde
PyCharm avec Python 3.7 a été utilisé pour que la librairie Spacy puisse fonctionner correctement.
Nous avons écrit 2 méthodes pour convertir les phrases: une qui écrit le dataset avec children/head (1h) et l'autre sans (20 minutes).
En accord avec le professeur Luc Lamontagne, pour que la tache 3 aille plus rapidement, nous avons écrit les phrases converties de la méthode utilisant l’arbre de dépendance du fichier negation_conversion.py dans des fichiers texte.
Ces fichiers ont été produit avec la méthode write_negated
qui se trouve dans le fichier sentiment_analysis.py. Ils se trouvent stockés dans le dossier data.
Aussi, il est nécessaire de télécharger le corpus de NLTK, Sentiwordnet afin que le fichier sentiment_analyse.py puisse fonctionner.
( Voir fichier negation_conversion.py )
- Étape 1: Trouver la portée de la phrase
- Étape 2: Capturer la portée négative
- Étape 3: Conversion et reconstitution de la phrase
Figure:
[0] Site web SpaCy, article "CORE MODELS : English : en_core_web_sm".
[1] Site web SpaCy, article "Annotation Specs : Dependencies : Part-of-speech tagging".
[2] Site web SpaCy, article "GUIDES: Linguistic Features : Dependency Parse: Visualizing dependencies".
[3] Site web SpaCy, article "GUIDES: Linguistic Features : Dependency Parse: Navigating the parse tree".
[4] Site web SpaCy, article "Annotation Specs : POS Tagging : Syntactic Dependency Parsing"
[7] Site web Scikit-Learn, article "Naive Bayes classifier for multinomial models"
[8] Site web Scikit-Learn, article "Logistic Regression (aka logit, MaxEnt) classifier"
[9] Site web Scikit-Learn, article "Multi-layer Perceptron classifier"
[10] Site web Scikit-Learn, article "6.2. Feature extraction"
[17] Site web Scikit-Learn, article "sklearn.feature_extraction.text.CountVectorizer.transform"
[11] Site web SpaCy, article "Annotation Specs : Named Entities : Lexical data for vocabulary"
[12] Site web Universal Dependencies, article "Universal POS tags"
[13] Site web SpaCy, article "GUIDES : Adding languages : Language data"
[14] Site web NLTK, article "SentiWordNet Interface"
[15] Site web Stack Abuse, article "Python for NLP: Creating Bag of Words Model from Scratch"
[16] Site web SpaCy, article "User guide"
Wiki
Sentiment Analysis
Folders