Analisis Perbandingan Algoritma Nazief Adriani dan Levenshtein Distance untuk mengukur Tingkat Similaritas Berita Menggunakan Rabin Krap: Studi Kasus Berita Berbahasa Jawa
Isi Artikel Utama
Abstrak
Bagi masyarakat di Indonesia bahasa daerah merupakan bahasa sehari-hari yang biasa digunakan untuk berkomunikasi. Salah satunya adalah bahasa Jawa. Pada penelitian berbasis bahasa alami, bahasa daerah tergolong bahasa yang sulit untuk dikembangkan, mengingat ketersediaan jumlah dataset yang terbatas. Penelitian ini melakukan analisis terhadap 2 metode stemming kata, yaitu metode Nazief-Adriani dan Levenshtein Distance untuk menyelesaikan proses stemming kata berbahasa Jawa. Penelitian ini ingin mengetahui metode yang sesuai dengan akurasi terbaik untuk stemming kata berbahasa Jawa. Selain itu penelitian ini juga mempertimbangkan pembobotan kata untuk menghasilkan akurasi similaritas artikel yang lebih baik. Metode nazief adriani menghasilkan nilai rata-rata similarity sebesar 6,8% dengan waktu rata-rata eksekusi 0,0443 detik.
##plugins.themes.bootstrap3.displayStats.downloads##
Rincian Artikel
Artikel ini berlisensi Creative Commons Attribution 4.0 International License.
Hak cipta pada setiap artikel adalah milik penulis, dan penulis mengakui bahwa Jnanaloka sebagai pihak yang mempublikasikan pertama kali dengan lisensi Creative Commons Attribution (CC BY). Lisensi ini mengijinkan untuk, Berbagi yakni menyalin dan menyebarluaskan kembali materi ini dalam bentuk atau format apapun; dan Adaptasi yakni menggubah, mengubah, dan membuat turunan dari materi iniuntuk kepentingan apapun, termasuk kepentingan komersial dengan ketentuan Atribusi
Cara Mengutip
Referensi
A. D. Hartanto, A. Syaputra, dan Y. Pristyanto, “Best parameter selection of rabin-karp algorithm in detecting document similarity,” in 2019 International Conference on Information and Communications Technology (ICOIACT). IEEE, 2019, pp. 457–461.
M. Fauziyah, “Stemming bahasa jawa menggunakan algoritma levenshtein dan analisa morfologi,” 2019. [Online]. Available: http://etheses.uin-malang.ac.id/16387/1/12650132.pdf
A. P. Wibawa dan M. N. Hakim, “Stemming bahas jawa menggunakan damerau levenshtein distance (dld),” Jurnal Teknik Informatika, vol. 14, no. 1, pp. 22–27, 2021.
A. P. Wibawa, F. A. Dwiyanto, I. Zaeni, R. Nurrohman, dan A. Afandi, “Stemming javanese affix words using nazief and adriani modifications,” J. Inform, vol. 14, no. 1, p. 36, 2020.
“Pawarta bahasa jawa,” 2021, diakses 29 Oktober 2021. [Online]. Available:https://pawartabahasajawa.blogspot.com'
H. Maarif, R. Akmeliawati, Z. Htike, dan T. S. Gunawan, “Complexity algorithm analysis for edit distance,” in 2014 International Conference on Computer and Communication Engineering. IEEE, 2014, pp. 135–137.
S. Jakšić, E. Bartocci, R. Grosu, T. Nguyen, dan D. Ničković, “Quantitative monitoring of stl with edit distance,” Formal methods in system design, vol. 53, no. 1, pp. 83–112, 2018.
M. E. Sulistyo, R. Saptono, dan A. Asshidiq, “Penilaian ujian bertipe essay menggunakan metode text similarity,” Telematika: Jurnal Informatika dan Teknologi Informasi, vol. 12, no. 2, pp. 146–158, 2015.
S. Robertson, “Understanding inverse document frequency: on theoretical arguments for idf,” Journal of documentation, 2004.
A. H. Purba dan Z. Situmorang, “Analisis perbandingan algoritma rabin-karp dan levenshtein distance dalam menghitung kemiripan teks,” Jurnal Teknik Informatika UNIKA Santo Thomas, vol. 2, no. 2, pp. 24–32, 2017.
A. P. U. Siahaan, M. Mesran, R. Rahim, dan D. Siregar, “K-gram as a determinant of plagiarism level in rabin-karp algorithm,” International Journal of Scientific & Technology Research, vol. 6, no. 7, 2017.
A. H. Lubis, A. Ikhwan, dan P. L. E. Kan, “Combination of levenshtein distance and rabin-karp to improve the accuracy of document equivalence level,” International Journal of Engineering & Technology, vol. 7, no. 2.27, pp. 17–21, 2018.
U. M. Perlis, “Rabin-karp elaboration in comparing pattern based on hash data,” International Journal of Security and Its Applications, vol. 12, no. 2, pp. 59–66, 2018.