Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

"2도"를 분석하면 "2중"으로 결과가 출력됨 #85

Closed
shin285 opened this issue Jan 10, 2020 · 3 comments
Closed

"2도"를 분석하면 "2중"으로 결과가 출력됨 #85

shin285 opened this issue Jan 10, 2020 · 3 comments
Assignees
Labels

Comments

@shin285
Copy link
Member

shin285 commented Jan 10, 2020

문제 설명

"2도"를 분석하면 "2중"으로 결과가 출력됨

재현 경로

"2도"를 형태소 분석 문장으로 입력

기대 상황

'도'가 '중'으로 변환되지 않음

환경 정보

  • Komoran 버전: 3.3.8 이상 (이하 버전에서는 재현되지 않음)
@shin285 shin285 added the bug label Jan 10, 2020
@shin285 shin285 self-assigned this Jan 10, 2020
@shin285
Copy link
Member Author

shin285 commented Jan 10, 2020

새로운 트레이닝 데이터를 적용시키면서 잘못된 트레이닝 데이터들로 인해 불규칙 사전이 올바르게 구축되지 않은 것으로 확인됩니다.
불규칙과 관련된 이슈는 빠른 시일 내로 조치하겠습니다.

@shin285
Copy link
Member Author

shin285 commented Jan 12, 2020

현재 트레이닝 데이터에서 'ㄴ'과 같은 자모가 Hangul_Jamo로 표현되어 있는 것을 확인하였습니다.
그로 인해 학습 시 불규칙 패턴으로 인식하여 올바른 결과가 출력되지 않는 이슈를 추가로 확인하였습니다.
이를 해결하기 위해서는 유니코드 블록의 Hangul_Jamo를 Hangul_Compatibility Jamo로 변환하는 테이블이 추가로 필요합니다.

@shin285
Copy link
Member Author

shin285 commented Jan 20, 2020

본 이슈는 aa980b6 commit으로 해결되었습니다.

@shin285 shin285 closed this as completed Jan 20, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant