🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759 fix #190) #871

AdsonEsteves · 2020-10-27T02:08:16Z

Disclaimer:
Esse Pull Request ajuda a resolver varias issues (#834 #759 #867 #810 #761 #759 #308), invalida o pull request #851 e resolve a #190.
Atenção no ajuda. O que esse pull request faz principalmente é encontrar erros que não eram encontrados antes ou geravam erros que as soluções não eram práticas.
Portanto, as issues ainda precisam ser resolvidas, tratando os erros gerados e futuros erros desconhecidos que essas mudanças podem pegar.

O que era:
O PortugolParser possui um ErrorHandler que joga exceções quando encontra erros no código

Portugol-Studio/core/src/main/java/br/univali/portugol/nucleo/analise/sintatica/AnalisadorSintatico.java

Lines 127 to 153 in 2a12511

    
           PortugolParser portugolParser = new PortugolParser(new CommonTokenStream(portugolLexer)); 
        
           portugolParser.setErrorHandler(new DefaultErrorStrategy() { 
        
               @Override 
        
               public void recover(Parser recognizer, RecognitionException e) { 
        
                   throw e; 
        
               } 
        
               @Override 
        
               public void reportInputMismatch(Parser recognizer, InputMismatchException e) throws RecognitionException { 
        
                   String msg = "mismatched input " + getTokenErrorDisplay(e.getOffendingToken()); 
        
                   msg += " expecting one of " + e.getExpectedTokens().toString(recognizer.getVocabulary()); 
        
                   RecognitionException ex = new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
                        ex.initCause(e); 
        
                   throw ex; 
        
               } 
        
               @Override 
        
               public void reportMissingToken(Parser recognizer) { 
        
                   beginErrorCondition(recognizer); 
        
                   Token t = recognizer.getCurrentToken(); 
        
                   IntervalSet expecting = getExpectedTokens(recognizer); 
        
                   String msg = "missing " + expecting.toString(recognizer.getVocabulary()) + " at " + getTokenErrorDisplay(t); 
        
                   throw new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
               } 
        
           });

Entretanto esse Handler não possui todas as funções implementadas, sendo uma delas a necessária para identificar "Tokens Indesejados".
Ao se implementar as funções restantes, o Portugol conseguiu encontrar esses problemas e gerar as exceções pelo Parser.

Portugol-Studio/core/src/main/java/br/univali/portugol/nucleo/analise/sintatica/AnalisadorSintatico.java

Lines 129 to 182 in 980a71a

    
           PortugolParser portugolParser = new PortugolParser(new CommonTokenStream(portugolLexer)); 
        
           portugolParser.setErrorHandler(new DefaultErrorStrategy() { 
        
               @Override 
        
               public void recover(Parser recognizer, RecognitionException e) { 
        
                   throw e; 
        
               } 
        
               @Override 
        
               public void reportInputMismatch(Parser recognizer, InputMismatchException e) throws RecognitionException { 
        
                   String msg = "mismatched input " + getTokenErrorDisplay(e.getOffendingToken()); 
        
                   msg += " expecting one of " + e.getExpectedTokens().toString(recognizer.getVocabulary()); 
        
                   RecognitionException ex = new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
                        ex.initCause(e); 
        
                   throw ex; 
        
               } 
        
               @Override 
        
               public void reportMissingToken(Parser recognizer) { 
        
                   beginErrorCondition(recognizer); 
        
                   Token t = recognizer.getCurrentToken(); 
        
                   IntervalSet expecting = getExpectedTokens(recognizer); 
        
                   String msg = "missing " + expecting.toString(recognizer.getVocabulary()) + " at " + getTokenErrorDisplay(t); 
        
                   throw new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
               } 
        
               @Override 
        
               protected void reportUnwantedToken(Parser recognizer) { 
        
                   beginErrorCondition(recognizer); 
        
                   Token t = recognizer.getCurrentToken(); 
        
                   IntervalSet expecting = getExpectedTokens(recognizer); 
        
                   String msg = "Expressão " +getTokenErrorDisplay(t)+ " não faz sentido, era esperado o token "+expecting.toString(recognizer.getVocabulary())+". Remova-a para solucionar o problema"; 
        
                   throw new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
               } 
        
               @Override 
        
               protected void reportFailedPredicate(Parser recognizer, FailedPredicateException e) { 
        
                   beginErrorCondition(recognizer); 
        
                   Token t = recognizer.getCurrentToken(); 
        
                   IntervalSet expecting = getExpectedTokens(recognizer); 
        
                   String msg = "Expressão " +getTokenErrorDisplay(t)+ " não faz sentido, era esperado o token "+expecting.toString(recognizer.getVocabulary())+"."; 
        
                   throw new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
               } 
        
               @Override 
        
               protected void reportNoViableAlternative(Parser recognizer, NoViableAltException e) { 
        
                   beginErrorCondition(recognizer); 
        
                   Token t = recognizer.getCurrentToken(); 
        
                   IntervalSet expecting = getExpectedTokens(recognizer); 
        
                   String msg = "Expressão " +getTokenErrorDisplay(t)+ " não faz sentido, era esperado o token "+expecting.toString(recognizer.getVocabulary())+"."; 
        
                   throw new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext()); 
        
               } 
        
           });

Para frente:
Essas modificações vão começar a identificar diversos erros que eram ignorados. Para alguns usuários vai parecer que "do Nada", o programa dele não funciona e agora gera um erro que não faz sentido. É importante que mais testes sejam feitos antes de um novo release para encontrar e tratar mais mensagens sem sentido.
Muitas das mensagens de erro se tornaram "o nome da funcao não foi retornado". Isso acontece pois o tradutor de erros utiliza o contexto dos tokens para identificar o problema, porém alguns tokens não possuem "contexto" no sintatico (como o senao) e portanto o Parser retorna como contexto, o contexto "Pai", muitas vezes uma funcao.
Dependendo do problema, pode ser necessário alterar o g4 para criar um contexto para esses tokens. idk.

noschang · 2020-10-27T15:06:35Z

@AdsonEsteves, na gramática antiga eu incluía o nome dos contextos manualmente em cada parte da gramática. Deixava difícil de ler e manter, mas permitia um maior controle sobre os erros

Depois que o @elieserdejesus mudou a implementação para ANTLR4 eu não sei como ficou essa parte. Acredito que ele removeu as informações de contexto da gramática pois a própria árvore gerada pelo ANTLR já contém algumas informações contextuais

Talvez seja o caso de incluirmos essas informações na gramática somente em pontos específicos, como o caso do senao que você citou. Seria interessante ter a opinião do @elieserdejesus

….java, and 9 more files...

AdsonEsteves · 2020-11-12T04:29:01Z

@noschang
@elieserdejesus
@AlissonSteffens
@Rafaelfcosta

Aproveitando o embalo, tratei os erros do senao e dos parametros de funcao. Agora ele deve resolver as issues: #834 #759 #867 #810 #759 #190
E uma da #308 , a dos pontos.
Alterei o antlr e coloquei contextos para os parametros de funcao e para o senao. Assim pude capturar os erros sem ambiguidade.

Se puderem testar por favor os problemas com o senao e com os parametros de função e verificar as mensagens de erro.
No caso de palavras "aleatorias" no codigo, ele também deve capturar.

Adicional:
Capturei tbm o #677, pra entrar no combo.
Destaque que talvez futuramente podemos adicionar a possibilidade do usuario retornar vetores.

AlissonSteffens

Não achei no código onde está esta frase, mas ao testar a #190, a mensagem está errada.
Mensagem atual: Você pulou uma linha ao escrever uma cadeia. Cadeias apenas podem ser escritas em na mesma linha.

Testei todos os outros fix, e estão certos 👍

AlissonSteffens

👍

Capturando tokens que não deveriam estar no codigo.

980a71a

AdsonEsteves requested review from noschang, elieserdejesus, AlissonSteffens and Rafaelfcosta October 27, 2020 02:08

This was referenced Oct 27, 2020

PS aceitando mais de um senao nos comandos SE #834

Closed

🐛 corrigindo erros sintatico do senao (fix #810) #851

Closed

AdsonEsteves added 3 commits November 11, 2020 23:50

corrigindo problemas do senao

d64cffb

capturando erros em parametros de funcao

87991f1

Update BuscadorDeSimbolo.java, AnalisadorDeclaracaoTamanhoVetorMatriz…

9a90a50

….java, and 9 more files...

AdsonEsteves changed the title ~~🐛 Corrigindo Parser ignora tokens indesejados~~ 🐛 Corrigindo Parser ignora tokens indesejados ( Fix #834 Fix #759 Fix #867 Fix #810 Fix #759) Nov 12, 2020

AdsonEsteves changed the title ~~🐛 Corrigindo Parser ignora tokens indesejados ( Fix #834 Fix #759 Fix #867 Fix #810 Fix #759)~~ 🐛 Corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759) Nov 12, 2020

AdsonEsteves changed the title ~~🐛 Corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759)~~ 🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759) Nov 12, 2020

AdsonEsteves changed the title ~~🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759)~~ 🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759 fix #190) Nov 12, 2020

AdsonEsteves added 2 commits November 12, 2020 01:59

capturando erros de retorno de vetores e matrizes

ba28e9b

corrigindo null em parametros de funcao

e523225

AlissonSteffens requested changes Nov 12, 2020

View reviewed changes

corrigindo texto do erro de cadeia

fefc343

AlissonSteffens approved these changes Nov 12, 2020

View reviewed changes

AdsonEsteves merged commit 49103fb into master Nov 14, 2020

AdsonEsteves deleted the corrigindo_tokens_errados_ignorados branch November 14, 2020 20:36

AdsonEsteves mentioned this pull request Nov 18, 2020

🐛 capturando erros de escopo #884

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759 fix #190) #871

🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759 fix #190) #871

AdsonEsteves commented Oct 27, 2020 •

edited

Loading

noschang commented Oct 27, 2020

AdsonEsteves commented Nov 12, 2020 •

edited

Loading

AlissonSteffens left a comment

AlissonSteffens left a comment

	PortugolParser portugolParser = new PortugolParser(new CommonTokenStream(portugolLexer));

	portugolParser.setErrorHandler(new DefaultErrorStrategy() {

	@Override
	public void recover(Parser recognizer, RecognitionException e) {
	throw e;
	}

	@Override
	public void reportInputMismatch(Parser recognizer, InputMismatchException e) throws RecognitionException {
	String msg = "mismatched input " + getTokenErrorDisplay(e.getOffendingToken());
	msg += " expecting one of " + e.getExpectedTokens().toString(recognizer.getVocabulary());
	RecognitionException ex = new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext());
	ex.initCause(e);
	throw ex;
	}

	@Override
	public void reportMissingToken(Parser recognizer) {
	beginErrorCondition(recognizer);
	Token t = recognizer.getCurrentToken();
	IntervalSet expecting = getExpectedTokens(recognizer);
	String msg = "missing " + expecting.toString(recognizer.getVocabulary()) + " at " + getTokenErrorDisplay(t);
	throw new RecognitionException(msg, recognizer, recognizer.getInputStream(), recognizer.getContext());
	}
	});

🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759 fix #190) #871

🐛 corrigindo Parser ignora tokens indesejados (fix #834 fix #759 fix #867 fix #810 fix #759 fix #190) #871

Conversation

AdsonEsteves commented Oct 27, 2020 • edited Loading

noschang commented Oct 27, 2020

AdsonEsteves commented Nov 12, 2020 • edited Loading

AlissonSteffens left a comment

Choose a reason for hiding this comment

AlissonSteffens left a comment

Choose a reason for hiding this comment

AdsonEsteves commented Oct 27, 2020 •

edited

Loading

AdsonEsteves commented Nov 12, 2020 •

edited

Loading