Korpus yang digunakan adalah korpus yang berasal dari website http://bahasa.cs.ui.ac.id/postag/corpus dengan jumlah korpus sebanyak 1000 kalimat dan 20 kalimat sebagai data uji. Pengujian Pos Tagging dilakukan dengan 3 pendekatan, yaitu
- Metode Baseline
- Metode Statistika
- Metode HMM-Viterbi
- Setiap metode dibangun didalam program yang berbeda-beda: a. Metode Baseline: Metode-Baseline_1301150434 b. Metode Statistika : Metode-Statistika_1301150434 c. Metode HMM-Viterbi : Metode-HMMViterbi_1301150434 Hal ini karena jika digabungkan, banyak variable yang overlaps karena nama variabel sama dan harus diganti satu persatu.
- Jika ingin melihat kamus yang digunakan untuk membangun feature, dapat membuka file: 1-1 tag dict.txt
- Jika ingin melakukan running program, pastikan nama file sudah sesuai