Sekilas Mengenai OpenNLP

Kali ini saya ingin mencoba berbagi mengenai apa itu OpenNLP. Bukan suatu ketidaksengajaan tiba-tiba saya ingin menulis tentang OpenNLP karena kebetulan tugas akhir saya mengambil topik tentang adaptasi OpenNLP untuk pemrosesan bahasa Indonesia. Topik ini sebenarnya ditawarkan oleh salah seorang dosen saya dan karena berminat, maka saya ambil. Sebelumnya sudah banyak anak IF ITB angkatan atas yang mengambil topik terkait dengan NLP (Natural Language Processing) untuk bahasa Indonesia, salah satunya Kak Alfan IF 06 yang juga mengupas habis tentang NLP di blognya.

OpenNLP merupakan suatu tools berbasis Java yang menyediakan API untuk pemrosesan bahasa alami (NLP). Dengan OpenNLP kita dapat melakukan beberapa pemrosesan seperti sentence detection, tokenization, named-entity detection, parts-of-speech (POS) tagging, chunking & parsing, dan coreference. Untuk dapat menggunakan OpenNLP ini kita harus menyediakan training model terlebih dahulu. OpenNLP sudah menyediakan training model default yang dapat diunduh dari situsnya. Training model yang disediakan sampai saat tulisan ini dibuat baru mendukung empat bahasa saja, yaitu bahasa Inggris, Jerman, Spanyol, dan Thailand. Secara umum, urutan langkah-langkah dalam pemrosesan yang dilakukan OpenNLP adalah sebagai berikut:

– mengidentifikasi task pemrosesan yang akan dilakukan beserta training model-nya
– melatih dan membangun file GISModel, jika belum ada
– me-load model
– menyediakan data untuk task tersebut

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s