Abstract:
Bahasa Kasar merupakan ekspresi yang berisi kata kata kasar atau ungkapan yang tidak
senonoh. Penyebaran Bahasa kasar dapat dilakukan melalui berbagai media, salah satu
contohnya yaitu melalui tontonan atau siaran. Perkembangan teknologi yang sangat pesat
membuat tontonan dapat dengan mudah ditemui diberbagai media sosial. Hampir semua
orang mulai dari anak kecil hingga orang tua sudah menggunakan media sosial dan
memiliki akun pribadi. Hal tersebut membuat penerimaan konten negatif, konten yang
berisi bahasa kasar dan konten yang tidak sesuai dengan umur menjadi lebih mudah,
konten yang diterima dapat berbentuk konten video maupun konten suara. Masalah ini
menjadi dasar dibutuhkannya sistem pemeringkat konten agar dapat terhindar dari konten
yang mungkin berisi bahasa kasar maupun tidak sesuai umur. Salah satu yang dapat
dilakukan adalah membuat sistem pemeringkat konten suara yang dapat memberikan
rating umur pada konten berdasarkan bahasa kasar yang terdapat didalamnya. Proses
dilakukan dengan beberapa tahap yaitu transkripi teks untuk mendapatkan teks hasil
transkripsi, Text Preprocessing untuk merapihkan teks agar mudah diolah, dan deteksi
kata kasar pada teks untuk mendapatkan hasil klasifikasi pemeringkat konten suara. Pada
proses trankripsi teks menggunakan Speech Recognition Google Speech API untuk
pendeteksi suara dan proses Text Preprocessing menggunakan berbagai teknik mulai dari
Case Folding hingga Stemming dengan library sastrawi yang menerapkan algoritma
Nazief & Adriani. Hasil implementasi didapatkan bahwa sistem pendeteksi suara dapat
diterapkan dengan baik pada pemeringkat konten dan membantu penonton terhindar dari
konten negatif, konten berisi kata kasar, dan konten yang tidak sesuai umur.