
Bagi mereka yang rutin menggunakan metode digital untuk transaksi, kode CAPTCHA bukanlah hal baru—dan tidak sulit. Tidak peduli seaneh atau seaneh apa pun angka atau karakter dalam kode tersebut terlihat di layar, otak manusia jarang salah. Namun, tugas yang tampak sederhana ini dapat mengalahkan AI (artificial intelligence) yang sangat canggih sekalipun. CAPTCHA sendiri adalah akronim dari “completely automated public Turing test to tell computers and humans apart” (tes Turing otomatis untuk membedakan komputer dan manusia), dan ini adalah tes yang efektif (dinamai dari Alan Turing, matematikawan Inggris yang dianggap sebagai bapak ilmu komputer teoretis dan AI).
Mengapa tugas ini sulit? Karena kita tahu fitur esensial dari sebuah huruf, dan selama fitur itu ada, kita dapat mengenali huruf atau angka tersebut dengan cepat dan yakin. (Misalnya, huruf “A” kapital pada dasarnya berbentuk segitiga dengan alas yang hilang, sedangkan huruf “V” adalah bentuk yang sama tetapi terbalik).
Jika ini saja menantang, bayangkan kesulitan dalam menafsirkan makna sebuah kata sederhana, karena makna itu seringkali bergantung pada kata di sekitarnya. Ambil contoh kutipan terkenal dari Groucho Marx: “Time flies like an arrow; fruit flies like a banana.” Untuk memahami, Anda harus tahu bahwa “flies” adalah kata kerja di bagian pertama, tetapi kata benda di bagian kedua; sedangkan “like” adalah konjungsi pada bagian pertama, tetapi kata kerja pada bagian kedua.
Banyak kata memiliki lebih dari satu arti: plant bisa berarti tumbuhan hijau, bisa juga berarti pabrik; coach bisa berarti pelatih, bisa juga bus. Ketika Anda mengetik kata “bank” di kotak pencarian, Anda mungkin bermaksud lembaga keuangan, tetapi robot pencari juga bisa menafsirkannya sebagai tepi sungai.

Mengapa Peneliti Menghasilkan Tortured Phrases
Banyak peneliti non–penutur asli bahasa Inggris menulis makalah dalam bahasa ibu mereka, lalu menggunakan perangkat lunak untuk menerjemahkannya ke bahasa Inggris. Masalah muncul karena:
- Kata dalam bahasa asli punya banyak arti, dan komputer mungkin memilih arti yang salah.
- Makna kata juga berubah tergantung pasangan katanya.
Beberapa pasangan benar (artificial intelligence, big data), tetapi jika diterjemahkan serampangan bisa menjadi counterfeit consciousness, colossal information, atau irregular esteem—yang jelas bukan bahasa Inggris yang benar.

Asal-usul dan Deteksi Tortured Phrases
Keanehan frasa inilah yang membuat penasaran sekelompok ilmuwan komputer. Mereka menemukannya di jurnal Microprocessors and Microsystems dan beberapa jurnal lainnya. Setelah diselidiki, mereka menyimpulkan bahwa frasa ini berasal dari para penulis yang menggunakan perangkat lunak terjemahan/parafrasa, sering kali untuk menghindari deteksi plagiarisme.
Para ilmuwan komputer Cabanac, Labbé, dan Magazinov lalu mengembangkan alat bernama Problematic Paper Screener untuk melacak makalah yang mengandung tortured phrases. Pada Januari 2022, mereka menemukan hampir 3.200 makalah dengan frasa aneh ini, bahkan di jurnal-jurnal ternama.

Evolusi Teknologi dan “Perlombaan Senjata”
Fenomena ini mengingatkan pada Systematic Buzz Phrase Projector (Phillip Broughton, 1960-an), tabel sederhana yang bisa menghasilkan frasa bombastis tapi kosong makna. Kini, program bisa membuat makalah utuh tanpa konten otentik, dan beberapa bahkan sempat diterbitkan.
Namun, praktik ini berbahaya: penulis bisa dipaksa menarik kembali publikasi, kehilangan reputasi, bahkan kehilangan keuntungan akademik. Lebih parah lagi, ini melemahkan dasar penerbitan ilmiah, yaitu kepercayaan.
Menggunakan AI untuk menurunkan similarity index mungkin tampak solusi cepat, tapi AI lain juga bisa mendeteksinya. Akibatnya, muncul perlombaan tanpa akhir antara perangkat lunak pembuat frasa aneh dan perangkat lunak pendeteksi.

Bagaimana Menghindarinya
Tanggung jawab menghentikan praktik ini ada pada dua pihak:
- Evaluator peneliti: perlu mencari cara penilaian yang lebih baik daripada sekadar jumlah publikasi.
- Peneliti: harus menolak cara-cara curang ini, berusaha menulis lebih baik, atau menggunakan jasa penyuntingan/terjemahan yang sah dan berkualitas.
Sumber:
1 Else H. 2021. “Tortured phrases” give away fabricated research papers. Nature 596: 328–329 [https://www.nature.com/articles/d41586-021-02134-0]
2 https://www.irit.fr/~Guillaume.Cabanac/problematic-paper-screener
3 Cabanac G, Labbé C, and Magazinov A. 2022. “Bosom peril” is not “breast cancer”: How weird computer-generated phrases help researchers find scientific publishing fraud [https://thebulletin.org/2022/01/bosom-peril-is-not-breast-cancer-how-weird-computer-generated-phrases-help-researchers-find-scientific-publishing-fraud/]
4 Broughton P. 1968. How to win at wordsmanship: the systematic buzz phrase projector. Newsweek (8 May): 104 [https://www.gsrc.ca/buzzword.htm]