Sistem Automatic Text Summarization Menggunakan Algoritma Textrank

Muhammad Adib Zamzam, Cahyo Crysdian, Khadijah Fahmi Hayati Holle

Abstract


Text summarization (perangkuman teks) adalah pendekatan yang bisa digunakan untuk meringkas atau memadatkan teks artikel yang panjang menjadi lebih pendek dan ringkas sehingga hasil rangkuman teks yang relatif lebih pendek bisa mewakilkan teks yang panjang. Automatic Text Summarization adalah perangkuman teks yang dilakukan secara otomatis oleh komputer. Terdapat dua macam algoritma Automatic Text Summarization yaitu Extraction-based summarization dan Abstractive summarization. Algoritma TextRank merupakan algoritma extraction-based atau extractive, dimana ekstraksi di sini berarti memilih unit teks (kalimat, segmen-segmen kalimat, paragraf atau passages), lalu dianggap berisi informasi penting dari dokumen dan menyusun unit-unit (kalimat-kalimat) tersebut dengan cara yang benar. Hasil penelitian dengan input 50 artikel dan hasil rangkuman sebanyak 12,5% dari teks asli menunjukkan bahwa sistem memiliki nilai recall ROUGE 41,659 %. Nilai tertinggi recall ROUGE tertinggi tercatat pada artikel 48 dengan nilai 0,764. Nilai terendah recall ROUGE tercatat pada artikel  37 dengan nilai 0,167.


Keywords


Rangkuman, Otomatis, Graf, Summarization, Automatic Summarization, Text, TextRank, Graph

Full Text:

PDF

References


Barzilay, R., Elhadad, M. 1997. Using Lexical Chains for Text Summarization. Mathematics and Computer Science Dept. Ben Gurion University in the Negev Beer-Sheva, Israel.

Brin, S. Page, L. 1998. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Stanford : Stanford University.

Chengcheng, L. 2010. Automatic Text Summarization Based On Rhetorical Structure Theory. ICCASM 2010. Inner Mongolia Normal University, China.

El Bazzi, M.S., Mammass, D., Zaki, T. 2016. A graph based method for Arabic documen indexing.Ibn Zohr University, Agadir, Maroko.

Eris, E. Christanti, V. M. Pragantha, Jeanny. 2017. Penerapan Algoritma Textrank Untuk Automatic Summarization Pada Dokumen Berbahasa Indonesia. Universitas Tarumanegara, Jakarta.

Kaynar, O. Isik, Y.E.,Gormez, Y. 2017.Graph Based Automatic Document Summarization with Different Similarity Methods. Cumhuriyet Universitesi, Sivas, Turki.1

Kurniawan, A. Solihin, F., dan Hastarita, F. 2014. Perancangan dan Pembuatan Aplikasi Pencarian Informasi Beasiswa dengan Menggunakan Cosine Similarity. Jurnal SimanteC Volume 4, Nomor 2.

Lin, C.Y. ROUGE : A Package for Automatic Evaluation of Summaries. 2004. California : Information Sciences Institute University of Southern California.

Lutfi Firdaus Munawar, Lc. MA.. 2016. Tafsir Surat Al Insyirah di http://manhajuna.com/tafsir-surat-al-insyirah/ (diakses 8 Oktober 2019)

Mani, I., Maybury, M.T.1999. Advances in Automatic Text Summarization. MIT Press.

Mihalcea, R. Tarau, P. 2004. TextRank: Bringing Order into Texts. Texas : University of North Texas.

Nanos, A.G., James, A.E., Iqbal. R., Hedley, Y.L. 2017. Content Summarisation of Conversation in the Context of Virtual Meetings: An Enhanced TextRank Approach. Distributed Systems Research Group, Coventry University, Coventry, United Kingdom

Nurdiana, O., Jumadi., dan Nursantika, D. 2016. Perbandingan Metode Cosine Similarity dengan Metode Jaccard Similarity pada Aplikasi Pencarian Terjemahan Al-Qur’an dalam Bahasa Indonesia. Jurnal Online Informatika Volume 1,Nomor 1.

Sabuna, P. M., Setyohadi, D.B.. 2017. Summarizing Indonesian Text Automatically By Using Sentence Scoring And Decision Tree. 2nd International Conferences on Information Technology, Information Systems and Electrical Engineering (ICITISEE). Universitas Atma Jaya Yogyakarta.

Saggion,H .Poibeau, T. 2012. Automatic Text Summarization : Past, Present and Future .

Zadbuke, A. Pimenta, S. Padwal, D. Wangikar, V. 2016. Automatic Summarization of News Articles using TextRank. IJARCSSE. University of Mumbai, Maharasshtra, India.

Zhiqiang, L., Werimin, S., Zhenhua, Y. 2009. Measuring Semantic Similarity between Words Using Wikipedia. IEEE. 251-255.3




DOI: https://doi.org/10.18860/mat.v12i2.8372

Refbacks

  • There are currently no refbacks.




Copyright (c) 2021 Muhammad Adib zamzam

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

The journal is indexed by :

Dimensions Sinta CrossRef GoogleScholar
Index Copernicus Moraref Portal Garuda

 

_______________________________________________________________________________________________________________

Editorial Office:
Informatics Engineering Department
Faculty of Science and Technology
Universitas Islam Negeri Maulana Malik Ibrahim Malang
Jalan Gajayana 50 Malang, Jawa Timur, Indonesia 65144
Email: matics@uin-malang.ac.id
_______________________________________________________________________________________________________________

Creative Commons License
This work is licensed under a CC-BY-NC-SA 4.0.
© All rights reserved 2015. MATICS , ISSN : 1978-161X | e-ISSN :  2477-2550