Skip to content

Evigno/AderenciaAoTopico

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Aderência ao Tópico

A correção automática de redações é um campo de pesquisa dentro da inteligência artificial que data desde 1960. Mais recentemente, para a língua portuguesa, estratégias para correção automática de redações foram feitas e diferentes conjuntos de dados foram propostos. Estes avanços, entretanto, não preencheram algumas lacunas existentes para o português nesta área de pesquisa. Por ser um problema complexo, a correção automática de redações pode englobar outras tarefas cuja resolução demanda tipos específicos de dados ou soluções diferentes. Uma dessas tarefas compreendidas pela correção automática de redações é a correção automática de erros gramaticais. Nesta tarefa, pessoas de diferentes níveis de escolaridade e até regiões brasileiras, podem cometer erros tão diferentes que um modelo de inteligência artificial pode nunca ter visto. Além deste desafío, até o momento nenhum conjunto de dados específicos para a tarefa de correção gramática existe para o português. Neste projeto de pesquisa, pretendemos preencher esta lacuna utilizando dados já existentes. A partir de um pré-processamento um novo conjunto para correção gramatical será criado e então pretendemos treinar um modelo em cima dos dados gerados. Também, outra lacuna dentro da correção de redações é a atribuição de nota no quesito aderência ao tópico. Alguma pesquisa em relação a este tópico já foi feita em relação a esta tarefa. Contudo, nenhuma delas considerou a nota para a redação neste quesito e apenas classificou redações dentro ou fora do tópico. Neste projeto, pretendemos também preencher esta lacuna fazendo um ajuste fino em um modelo para este critério de nota em um conjunto de dados já existente. Pretendemos utilizar os modelos de linguagem mais recentes e que se enquadram em diferentes arquiteturas como BERT(encoder) e T5(encoder/decoder). A ideia é avaliar qual a arquitetura mais adequada para correção de erros gramaticais e avaliação de relevância de tópico

Releases

No releases published

Packages

No packages published