-
Notifications
You must be signed in to change notification settings - Fork 7
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
キタカナ問題に対する根本的な解決策 #209
Comments
カイテルが登録されていると書いてる、が出ないのも同根である。 |
キタカナ、の時には「来た/かな」がそこそこ高い確率で入ってきているはず。だが、文節がぴったりくるものがないから候補にも現れていない。 き/たかな などを探して、もっともそれらしい物を探す。 |
実装としては、前向きDP、後ろ向きA*みたいに実装すれば良い。 |
組み合わせで出てきた文節については、複合語として扱う。ユニグラムの学習データに保存することにより、次回以後はそれが第一候補として出てくる。 |
学習結果データに入れたとしても、実際にはそれが変換候補に出てくることはない。ということが分かった。 |
「来た/かな」を候補に出すところまではできたが、これをユーザー学習の結果としてユニグラムデータに登録される。しかし、これで登録されたとしても、かな漢字辞書に登録されない。 |
一旦対応完了。 |
北香那、が辞書登録されているときに「来たかな」が変換できない問題の対策について考える。
The text was updated successfully, but these errors were encountered: