Semantic Rule Labeling dan Sentence Information Density Dalam Pemilihan Kalimat Representatif Cluster Pada Peringkasan Multi-Dokumen

Gus Nanang Syaifuddiin, Agus Zainal Arifin, Diana Purwitasari

Sari


Coverage dan salient merupakan masalah utama yang menjadi perhatian para peneliti dalam peringkasan dokumen. Pendekatan clustering mampu memberikan coverage yang baik terhadap semua topik namun tidak memiliki informasi-informasi yang bisa mewakili kalimat-kalimat lain (salience sentence).Salience dapat digali dengan melihat hubungan dari satu kalimat dengan kalimat lain yang dibangun dengan pendekatan position text graph, namun position text graph hanya mampu menggali hubungan antar kalimat tanpa memperhatikan peran semantik kata (“who” did “what” to “whom”, “where”, “when”, and “how”) dalam kalimat yang dibandingkan.Pada paper ini kami mengusulkan sebuah metode baru strategi pemilihan kalimat representatif cluster dengan pendekatan sentence information density dan Semantic Rule labeling. Hasil uji coba menunjukkan metode yang metode yang diusulkan mampu memilih kalimat ringkasan lebih baik dari metode Sentence Information Density (SID)  dengan rata-rata nilai Rouge-1 0.32511.

Teks Lengkap:

PDF
DOI http://dx.doi.org/10.35585/inspir.v6i1.86
Sari 730 kali dilihat
PDF 510 kali diunduh

Refbacks

  • Saat ini tidak ada refbacks.



Lisensi Creative Commons
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi-NonKomersial-BerbagiSerupa 4.0 Internasional.