Peringkasan Teks Otomatis Berita Olahraga Berbahasa Indonesia Menggunakan Metode Maximum Marginal Relevance

Posted on
ABSTRAK
Seiring perkembangan teknologi informasi mengakibatkan teknologi internet semakin pesat, sehingga banyak berita online khususnya berita olahraga. Dengan adanya peringkasan teks secara otomatis ini diinginkan menolong mengurangi waktu membaca keseluruhan isi berita dengan hanya membaca hasil ringkasannya, sehingga mempermudah pada mencari informasi berita olahraga. Penelitian ini diawali dengan proses text preprocessing, yaitu pemrosesan teks bagi memperoleh term kata. Sistem ini terdiri dari case folding, pemecahan kalimat, filtering, tokenizing, dan stemming. Hasil dari proses ini kemudian dihitung bobot tf-idf, bobot relevance dan bobot similarity. Bagi menghasilkan ringkasan dilakukan proses ekstraksi yaitu menghitung bobot maximum marginal relevance kalimat dari kombinasi cosine similarity, yaitu relevance dan similarity. Sistem ekstraksi maximum marginal relevance adalah sebuah cara yang digunakan pada mengurangi redudansi kalimat pada dokumen pada menentukan selaku ringkasan.
Data uji coba bagi pengujian akan diambilkan dari surat kabar berbahasa Indonesia on-line. Dari hasil pengujian kemudian dievaluasi dengan hasil ringkasan manual dan ringkasan program peringkasan otomatis lain. Hasil dari evaluasi dengan ringkasan manual menghasilkan rata-rata recall 60%, precision 77%, dan f-measure 66%. Sedangkan hasil evaluasi dengan program peringkasan otomatis lain menghasilkan rata-rata recall 79%, precision 89% dan f-measure

82%.

Kata kunci: peringkasan, berita, text preprocessing, tf-idf, relevance, similarity,
maximum marginal relevance


Unduh File : 
Unduh Source Code Program :

Screnshot Program :



Leave a Reply

Your email address will not be published. Required fields are marked *