Stemmid
stemming indonesian sentence.
Install / Use
/learn @upi-0/StemmidREADME
Stemmid
Proyek ini adalah implementasi stemmer Bahasa Indonesia berbasis daftar kata dasar. Stemmer digunakan untuk mengubah kata berimbuhan menjadi bentuk dasarnya.
Perbedaan dengan PySastrawi:
- Source Code 100x lebih pendek.
- Algoritma yang digunakan berbeda.
- Lebih cepat hingga 10%.
- Kustomisasi kamus yang lebih uwaw.
Install
pip install git+https://github.com/Malykz/stemmid
Usage
Initial
>>> from stemmid import Stemmer
>>> Stemmer().load("menangis")
"tangis"
Menambah kata ke Kamus
>>> Stemmer().load("belajarlah")
"belajarlah"
>>> Stemmer(inc=["belajar"]).load("belajarlah")
"belajar"
Mengecualikan Kata
>>> Stemmer().load("menyusui")
"susu"
>>> Stemmer(exc=["susu"]).load("menyusui")
"menyusui"
Menggunakan Kalimat
>>> Stemmer().loads("Kehilangan Permainan")
"hilang main"
Test
Test dengan 1825 kata :
- sastrawi = 0.03424
- stemmid = 0.02081
Test 1.825.000 kata (Cache) :
- sastrawi = 1.20500
- stemmid = 0.97979
