tokenize-japanese.js

About

This program tokenizes Japanese text and classifies them into parts of speech. Made to be a browser equivalent of MeCab
日本語を単語ごとに区切り品詞に分類するプログラムです。ブラウザの上でMeCabのようなものを走らせたいと思い作りました。内部辞書はMeCabと同じものを使っています。
ロードが遅いので(trieの構築時間)キャッシングやら何やらで最適化したいです。
これからいろいろいじってちゃんとしたライブラリーになればいいなと思っています。プルリク大歓迎です。

Examples

tokenize-japanese.js/test/ is the example use case.
tokenize-japanese.js/test/←使用例です。適当に改造して使ってください。

let japaneseParser = new JapaneseParser();

japaneseParser.waitLoad().then(()=>{
    let result = japaneseParser.tokenize("今日は暑いなあ。早く帰って酒でも飲もう！");
    console.log(result);
});

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
etc		etc
img		img
obj		obj
old		old
src		src
test		test
workdir		workdir
README.md		README.md
compile.js		compile.js
convert-dict.js		convert-dict.js
intersects.js		intersects.js
journal.md		journal.md
json-connection.js		json-connection.js
result.txt		result.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

tokenize-japanese.js

About

Examples

About

Releases

Packages

Languages

martian17/tokenize-japanese-development.js

Folders and files

Latest commit

History

Repository files navigation

tokenize-japanese.js

About

Examples

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages