dc.description.abstract |
Penelitian ini membahas bagaimana penerapan Naïve Bayes bisa mengklasifikasi tweet
ke dalam dua kategori yaitu spam dan non spam berdasarkan hashtag dan tweet yang bisa
diklasifikasi berbahasa Indonesia dan bagaimana agar dapat meningkatkan perhitungan
akurasi dalam sebuah sistem klasifikasi spam dan non spam pada twitter menggunakan
fitur trending topics dan hashtag. Dalam menghadapi permasalahan tersebut, maka dari
itu pada tugas akhir telah membangun suatu sistem untuk mengklasifikasi spam dan non
spam dengan metode Naïve Bayes. Dalam mengimplementasikann sistem ini, tahapan
yang dilakukan meliputi pengumpulan data menggunakan twitter API, pembuatan
dataset, pemberian label secara manual, pengolahan data, pemilihan model, pengujian
model, perhitungan akurasi dan validasi. Menggunakan metode Naïve Bayes yang
memiliki kinerja baik untuk pengklasifikasian data dokumen yang mengandung angka
maupun teks dan kemampuannya mengklasifikasikan dokumen dengan sederhana dan
kecepatan komputasinya yang tinggi. Dalam penelitian ini dataset akan melewati proses
training dan testing. Hasil dari pengujian (testing) sistem klasifikasi ini menunjukan
bahwa metode Naïve Bayes tingkat akurasi yang didapat sebesar 98.84% untuk data latih
(training) dan 75.14% untuk data uji (testing). Tingkat akurasi ini didapat dari hasil
pengujian terhadap 615 data tweet. Dan Algorima Naïve Bayes dapat pemprediksi tweet
ke dalam kelas spam dan non spam di dalam proses validasi menggunakan 433 data tweet. |
en_US |