summarizer

This summarizer intends to sum up pictures of annotated pdfs. It should group together all strokes which are in a spatial threshold and select only the siding text. For instance with the following image (red arrows are not part of the image and are here to show the strokes) :

We should sum it up as :

A l'opposé le Nord et l'Est de la Seine-Saint-Denis cumulent les nombreux handicaps sociaux et résidentiels. On retrouve aussi ces difficultés en deuxième couche de la basse Seine (Les Mureaux, Mantes-La-Jolie), dans certaines villes nouvelles (Cergy, Trappes, Evry, Grigny) et dans les villes secondaires,

Les processus de renforcement des ségrégations concernent aujourd'hui l'ensemble de l'Île-de-France comme l'indique la comparaison départementale. Du fait des blocages sociaux et résidentiels de ces dernières

Du fait de l'énorme bulle immobilière spéculative des dernières décennies, qui touche en particulier Paris et une partie de la première couronne, mais qui se répercute mécaniquement sur l'ensemble de l'espace régional

To-do

implement the grouping algorithm that would group and seperate strokes and text

Inspiration

As I want to distinguish shape versus text in hand-drawn strokes Using Entropy to Distinguish Shape Versus Text in Hand-Drawn Diagrams rose my interest. Yet it doesn't tell what the grouping algorithm they use to group only strokes which are a part of the drawings or the letter.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.gitignore		.gitignore
14180.png		14180.png
5012.png		5012.png
README.md		README.md
enderezador.py		enderezador.py
final.png		final.png
fr13_ara.pdf		fr13_ara.pdf
fr13_bourgogne.pdf		fr13_bourgogne.pdf
fr13_bretagne.pdf		fr13_bretagne.pdf
fr13_centre_val_loire.pdf		fr13_centre_val_loire.pdf
fr13_corse.pdf		fr13_corse.pdf
fr13_grandest.pdf		fr13_grandest.pdf
fr13_idf.pdf		fr13_idf.pdf
fr13_normandie.pdf		fr13_normandie.pdf
fr13_nouvelle_aquitaine.pdf		fr13_nouvelle_aquitaine.pdf
fr13_occitanie.pdf		fr13_occitanie.pdf
fr13_outre_mer.pdf		fr13_outre_mer.pdf
fr13_paca.pdf		fr13_paca.pdf
fr13_pays_de_loire.pdf		fr13_pays_de_loire.pdf
ocr.py		ocr.py
out0.jpg		out0.jpg
out1.jpg		out1.jpg
out2.jpg		out2.jpg
out3.jpg		out3.jpg
out4.jpg		out4.jpg
out5.jpg		out5.jpg
out6.jpg		out6.jpg
out7.jpg		out7.jpg
out8.jpg		out8.jpg
out9.jpg		out9.jpg
pdf-sample.pdf		pdf-sample.pdf
question		question
recorte_3.png		recorte_3.png
recorte_4.png		recorte_4.png
resume.txt		resume.txt
rodrigo.py		rodrigo.py
test.png		test.png
truc		truc
truc.py		truc.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

summarizer

To-do

Inspiration

About

Releases

Packages

Languages

antoinecomp/summarizer

Folders and files

Latest commit

History

Repository files navigation

summarizer

To-do

Inspiration

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages