Skip to content

Latest commit

 

History

History
37 lines (33 loc) · 2.75 KB

README.md

File metadata and controls

37 lines (33 loc) · 2.75 KB

Taller de análisis automático de textos en Humanidades hola

El taller tiene dos objetivos, uno explícito y el otro encubierto. El objetivo explícito es presentar técnicas automáticas (o simplemente, digitales) para el tratamiento de textos mediante computadores. El objetivo encubierto, quizás más importante que el primero, es introducir a las/los estudiantes al lenguaje de programación Python. Este taller surge como una iniciativa del Laboratorio de Humanidades Digitales, Facultad de Letras y Ciencias Humanas, PUCP.

Para este taller, y en general para la Lingüística Computacional, lo fundamental es responder preguntas en el espacio que se forma en las interacciones entre Humanidades, Lingüística, Computación y Datos. En vista de esto, el taller está abierto a intereses/problemáticos planteadas por las/los estudiantes.

Contenidos

  • Textos y corpus (1 semana)
  • Elementos de Python y textos (2 semanas)
    • Elementos de Python: Variables, listas, ciclos
    • ¿Qué es un texto para un computador?
    • Manejo de archivos de texto: lectura/escritura
    • Type/tokens
    • Limpieza de textos
    • Problema: palabras importantes de un texto
    • Recapitulación 1: Python y textos en Humanidades
  • Nociones de procesamiento del lenguaje natural (NLP) (1 semana)
    • Elementos de Python: diccionarios
    • Librerías de Python para NLP: spaCy, stanza
    • Desafío: escaneos de textos!!! (OCR)
    • Conceptos de NLP y Aprendizaje Automático
    • Consideraciones éticas sobre datos, NLP y Humanidades: Kate Crawford
    • Recapitulación 2: Python y textos en Humanidades
  • Aplicaciones (1 semana)
    • Elementos de Python: manejo de gráficos y más gráficos
    • Frecuencias de palabras en un corpus
    • Visualización de textos
    • Análisis (computacional) de textos en Humanidades