Saintis CMU Ciptakan Sistem Komputer Otomatis Ubah Kalimat Kasar Menjadi Santun

Sharing for Empowerment

“Ini sangat relevan untuk beberapa aplikasi, seperti jika Anda ingin membuat email atau chatbot Anda terdengar lebih sopan atau jika Anda sedang menulis blog,” katanya.

Tapi upaya mereka sempat terkendala karena tidak pernah bisa menemukan data yang tepat untuk melakukan tugas ini. Dia dan siswa magister di LTI, Aman Madaan, Amrith Setlur dan Tanmay Parekh kemudian memecahkan masalah itu dengan menghasilkan himpunan data 1,39 juta kalimat sopan, yang mereka gunakan untuk percobaan mereka.

Sumber kalimat-kalimat ini mungkin tampak mengejutkan. Kalimat-kalimat tersebut berasal dari email yang dipertukarkan oleh karyawan Enron, sebuah perusahaan energi yang berbasis di Texas yang, sampai kebangkuratannya pada tahun 2001, lebih dikenal karena penipuan perusahaan dan korupsi daripada untuk kebaikan sosial. Tetapi setengah juta email perusahaan tersebut telah menjadi milik publik sebagai akibat dari tuntutan hukum seputar skandal penipuan Enron dan selanjutnya telah digunakan sebagai dataset untuk berbagai proyek penelitian.




Be the first to comment

Leave a Reply

Your email address will not be published.


*