Skip to content

cotogoto/cabocha4j

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CaboCha4J

CaboCha4Jは、CaboCha日本語係り受け解析器のJavaラッパーです。Javaアプリケーション内からCaboChaを実行し、解析結果を構造化されたJavaオブジェクト(ChunkToken)として扱うことができます。柔軟な入力設定に対応し、固有表現認識を含む包括的な係り受け解析結果を出力します。

CaboChaの詳細はこちら

特徴

  • 係り受け解析: 日本語の文構造を解析
  • 固有表現認識: 文中の固有表現を抽出
  • 簡単な統合: Javaプロジェクトと簡単に統合

インストール

必ず以下の VERSION キーを上記の最新バージョンに置き換えてください。

Maven

<repositories>
    <repository>
        <id>jitpack.io</id>
        <url>https://jitpack.io</url>
    </repository>
</repositories>
<dependency>
    <groupId>com.github.cotogoto</groupId>
    <artifactId>cabocha4j</artifactId>
    <version>VERSION</version>
</dependency>

使用方法

文の解析

CaboCha cabochaWrapper = new CaboCha("C:\\Program Files (x86)\\CaboCha\\bin\\cabocha.exe", StandardCharsets.UTF_8);
Map<String, Chunk> result = cabochaWrapper.parse("太郎は花子が読んでいる本を次郎に渡した。");

for (Map.Entry<String, Chunk> entry : result.entrySet()) {
    Chunk chunk = entry.getValue();
    System.out.println("Chunk ID: " + chunk.getId() + ", Link: " + chunk.getLink());

    for (Token token : chunk.getTokenList()) {
        System.out.println("Token: " + token.getSurface() + ", Feature: " + token.getFeature() + ", NE: " + token.getNe());
    }
}

コントリビューション

貢献は歓迎します!プルリクエストを提出するか、プロジェクトの改善に関する問題を開いてください。

ライセンス

このプロジェクトはMITライセンスの下で提供されています。詳細はLICENSEファイルを参照してください。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages