IDENTIFIKASI KESALAHAN TATA BAHASA PADA PERNYATAAN KEBUTUHAN MENGGUNAKAN PROBABILISTIK MODEL BAHASA N-GRAM

Depandi Enda, Fajri Profesio Putra

Abstract


Berbagai aspek seperti kemampuan untuk penulisan tata bahasa, latar belakang penggunaan bahasa Inggris dan keterbatasan pengetahuan yang dimiliki oleh tim penyusun kebutuhan perangkat lunak memungkinkan adanya kesalahan dalam pembuatan dokumen spesifikasi kebutuhan perangkat lunak. Hal ini dapat menyebabkan menurunnya kualitas dokumen spesifikasi kebutuhan perangkat lunak tersebut. Untuk mengatasi permasalahan tersebut maka diperlukan sebuah metode untuk mengidentifikasi kesalahan tata bahasa pernyataan kebutuhan perangkat lunak. Penelitian ini bertujuan mengusulkan pengembangan metode untuk mengidentifikasi kesalahan tata bahasa pada pernyataan kebutuhan perangkat lunak. Metode yang diusulkan ialah teknik berbasis statistik menggunakan probabilitas model bahasa n-gram, dimana model bahasa yang digunakan ialah model bahasa bigram dan trigram. Kinerja metode yang diusulkan dievaluasi menggunakan nilai precission, recall dan f-measure. Berdasarkan pengujian yang telah dilakukan dapat diketahui bahwa perolehan nilai precission, recall dan f-measure pada model bahasa trigram dengan treshold = 0.1 memiliki nilai yang tertinggi masing-masing sebesar 83%, 85%, dan 86% jika dibandingkan dengan skenario pengujian bigram. Hal ini menunjukkan bahwa model bahasa trigram dapat mengidentifikasi kesalahan tata bahasa dengan baik.

Keywords


Tata Bahasa Inggris, Pernyataan Kebutuhan Perangkat Lunak, N-Gram Language Model.

Full Text:

PDF

References


. Siahaan, D. O., 2012. Analisa Kebutuhan Dalam Rekayasa Perangkat Lunak, Edisi 1. Yogyakarta : Andi.

. Enda, D. dan Siahaan, D. 2018. Rekomendasi Perbaikan Pernyataan Kebutuhan Yang Rancu Dalam Spesifikasi Kebutuhan Perangkat Lunak Menggunakan Teknik Berbasis Aturan, Jurnal Teknologi Informasi dan Ilmu Komputer(JTIIK). Vol 5 No.2 hal 207-216.

. Athanaselis, T. et al., 2011, A Corpus ased Technique for Repairing Ill- Formed Sentences With Word Order Errors Using Co-Occurrences of N- Grams, International Journal on Artificial Intelligence Tools, 20 (3), hal. 401–424. DOI: 10.1142/S0218213011000218.

. Wu, J., Chang, J. dan Chang, S. J., 2013 Correcting Serial Grammatical Errors based on N-grams and Syntax, International Journal of Computational Linguistics & Chinese Language Processing, Vol. 18, No. 4, December 2013-Special Issue on Selected Papers from ROCLING XXV, 18(4), hal. 31–44.

. Anonim, 2018, The hunspell package: High-Performance Stemmer, Tokenizer, and Spell Checker for R. https://cran.r-project.org/web/packages/hunspell/vignettes/intro.html. Diakses 20 Desember 2018

. Abney, S.P. 1996, Partial parsing via finite-state cascades. Natural Language Engineering 2(4) 337–344.

. Lin, Y.N., Soe, K.M., dan Thien, N.L Developing a Chunk-based Grammar Checker for Translated English Sentences. Prociding. 25th Pacific Asia Conference on Language, Information and Computation, hal 245–254.

. Tjong, S. F. 2008, Avoiding ambiguitiy in requirements specifications, Faculty of Engineering & Computer Science.




DOI: https://doi.org/10.24114/cess.v4i2.12934

Article Metrics

Abstract view : 567 times
PDF - 465 times

Refbacks



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

CESS (Journal of Computer Engineering, System and Science)

Creative Commons License
CESS (Journal of Computer Engineering, System and Science) is licensed under a Creative Commons Attribution 4.0 International License