Skip to content
Isabelle Eysseric edited this page Sep 10, 2024 · 24 revisions

Sentiment Analysis for E-Commerce


Equipe



Mise en situation

PyCharm avec Python 3.7 a été utilisé pour que la librairie Spacy puisse fonctionner correctement.

Nous avons écrit 2 méthodes pour convertir les phrases: une qui écrit le dataset avec children/head (1h) et l'autre sans (20 minutes).

En accord avec le professeur Luc Lamontagne, pour que la tache 3 aille plus rapidement, nous avons écrit les phrases converties de la méthode utilisant l’arbre de dépendance du fichier negation_conversion.py dans des fichiers texte.

Ces fichiers ont été produit avec la méthode write_negated qui se trouve dans le fichier sentiment_analysis.py. Ils se trouvent stockés dans le dossier data.

Aussi, il est nécessaire de télécharger le corpus de NLTK, Sentiwordnet afin que le fichier sentiment_analyse.py puisse fonctionner.



Etapes

( Voir fichier negation_conversion.py )

  • Étape 1: Trouver la portée de la phrase
  • Étape 2: Capturer la portée négative
  • Étape 3: Conversion et reconstitution de la phrase


Resultats


Figure:



Discussion



References

[0] Site web SpaCy, article "CORE MODELS : English : en_core_web_sm".

[1] Site web SpaCy, article "Annotation Specs : Dependencies : Part-of-speech tagging".

[2] Site web SpaCy, article "GUIDES: Linguistic Features : Dependency Parse: Visualizing dependencies".

[3] Site web SpaCy, article "GUIDES: Linguistic Features : Dependency Parse: Navigating the parse tree".

[4] Site web SpaCy, article "Annotation Specs : POS Tagging : Syntactic Dependency Parsing"

[7] Site web Scikit-Learn, article "Naive Bayes classifier for multinomial models"

[8] Site web Scikit-Learn, article "Logistic Regression (aka logit, MaxEnt) classifier"

[9] Site web Scikit-Learn, article "Multi-layer Perceptron classifier"

[10] Site web Scikit-Learn, article "6.2. Feature extraction"

[17] Site web Scikit-Learn, article "sklearn.feature_extraction.text.CountVectorizer.transform"

[11] Site web SpaCy, article "Annotation Specs : Named Entities : Lexical data for vocabulary"

[12] Site web Universal Dependencies, article "Universal POS tags"

[13] Site web SpaCy, article "GUIDES : Adding languages : Language data"

[14] Site web NLTK, article "SentiWordNet Interface"

[15] Site web Stack Abuse, article "Python for NLP: Creating Bag of Words Model from Scratch"

[16] Site web SpaCy, article "User guide"



Clone this wiki locally