Saintis CMU Ciptakan Sistem Komputer Otomatis Ubah Kalimat Kasar Menjadi Santun

Kampus Carnegie Mellon University (cmu.edu)

JAKARTA, KalderaNews.com — Di era digital ketika media sosial menjadi sarana mengungkap aspirasi, tak terelakkan dapat terjadi perdebatan dengan kalimat-kalimat kasar. Kini para saintis Carnegie Mellon University (CMU) telah mengembangkan sebuah metode otomatis komputer untuk menciptakan komunikasi menjadi lebih santun.

Secara khusus, metode ini mencari kalimat perintah atau permintaan yang kurang sopan (baik yang menggunakan kata-kata kasar atau kata-kata netral) lalu mengubah bentuknya, atau menambahkan kata-kata tertentu yang membuatnya lebih sopan. Sebagai contoh, “Kirimkan datanya sekarang,” dapat diubah menjadi lebih sopan menjadi, “Dapatkah Anda mengirimkan datanya sekarang?

Metode yang merupakan hasil riset ini dipresentasikan pada pertemuan tahunan Association for Computational Linguistics, yang diadakan 5 Juli 2020.

BACA JUGA:

Sebetulnya gagasan mentransfer gaya atau sentimen dari satu komunikasi ke komunikasi lainnya – mengubah pernyataan negatif menjadi positif, misalnya – bukan hal baru. Ini telah dilakukan oleh para teknolog bahasa selama beberapa waktu. Shrimai Prabhumoye, kandidat Ph.D. di Language Technologies Institute (LTI) CMU, mengatakan melakukan transfer kesantunan dalam berbahasa telah lama menjadi tujuan para saintis.

“Ini sangat relevan untuk beberapa aplikasi, seperti jika Anda ingin membuat email atau chatbot Anda terdengar lebih sopan atau jika Anda sedang menulis blog,” katanya.

Tapi upaya mereka sempat terkendala karena tidak pernah bisa menemukan data yang tepat untuk melakukan tugas ini. Dia dan siswa magister di LTI, Aman Madaan, Amrith Setlur dan Tanmay Parekh kemudian memecahkan masalah itu dengan menghasilkan himpunan data 1,39 juta kalimat sopan, yang mereka gunakan untuk percobaan mereka.

Sumber kalimat-kalimat ini mungkin tampak mengejutkan. Kalimat-kalimat tersebut berasal dari email yang dipertukarkan oleh karyawan Enron, sebuah perusahaan energi yang berbasis di Texas yang, sampai kebangkuratannya pada tahun 2001, lebih dikenal karena penipuan perusahaan dan korupsi daripada untuk kebaikan sosial. Tetapi setengah juta email perusahaan tersebut telah menjadi milik publik sebagai akibat dari tuntutan hukum seputar skandal penipuan Enron dan selanjutnya telah digunakan sebagai dataset untuk berbagai proyek penelitian.

Tetapi bahkan dengan himpunan data itu, para peneliti masih harus bekerja keras untuk untuk mendefinisikan kesopanan.

“Ini bukan hanya tentang menggunakan kata-kata seperti ‘tolong’ dan ‘terima kasih,'” kata Prabhumoye. Terkadang, kata dia, membuat kalimat menjadi sopan adalah dengan membuat kalimat menjadi sedikit kurang langsung, sehingga alih-alih mengatakan “Anda harus melakukan X,” kalimatnya menjadi seperti “mari kita lakukan X.”

Dan kesopanan bervariasi dari satu budaya ke budaya lain. Bagi penduduk asli Amerika Utara cukup umum untuk menggunakan “tolong” dalam permintaan untuk teman dekat, tetapi dalam budaya Arab itu akan dianggap canggung, jika tidak kasar. Untuk studi mereka, para peneliti CMU membatasi penelitian mereka pada penutur Bahasa Inggris Amerika Utara dalam suasana formal.

Himpunan data yang sudah ditandai sebagai kalimat-kalimat santun itu dianalisis untuk menentukan frekuensi dan distribusi kata-kata dalam kalimat yang sopan dan tidak sopan. Kemudian tim mengembangkan mekanisme “tandai dan hasilkan” untuk melakukan perubahan kata menjadi kata-kata santun. Pertama, kata atau frasa tidak sopan atau kasar diberi tag dan lantas generator teks mengganti setiap item yang ditag tersebut. Sistem yang mereka ciptakan ini sangat berhati-hati untuk tidak mengubah makna kalimat.

“Ini bukan hanya tentang membersihkan kata-kata buruk,” kata Prabhumoye tentang prosesnya. Awalnya, sistem memiliki kecenderungan untuk hanya menambahkan kata ke kalimat, seperti “tolong” atau “maaf.” Jika “Tolong bantu saya” dianggap sopan, sistem menganggap “Tolong, tolong, tolong bantu saya” lebih sopan lagi.

Namun seiring waktu sistem penilaian menjadi lebih realistis dan perubahannya menjadi lebih halus. Kata ganti orang pertama tunggal, seperti saya (I), saya (me) dan saya (mine), digantikan oleh kata ganti jamak orang pertama, seperti kita (we), kita (us) dan kita (our). Dan alih-alih selalu memposisikan “tolong” di awal kalimat, sistem yang dikembangkan ini mulai belajar memasukkannya di tengah kalimat: “Bisakah Anda mengirimi saya file?”

Prabhumoye mengatakan para peneliti telah merilis himpunan data yang sudah mereka beri tanda sopan/santun, untuk digunakan oleh peneliti lain. Mereka berharap dapat mendorong sesama kolega peneliti untuk mempelajari topik itu lebih lanjut. (Sumber: Carnegie Mellon University/cmu.edu)

* Jika merasa artikel ini bermanfaat, silakan dishare pada saudara, sahabat dan teman-temanmu.




Be the first to comment

Leave a Reply

Your email address will not be published.


*