Ada whatsapp reply-an seorang kawan yang masuk di hp saya atas postingan saya di grup tentang resume Ngobrol Ngalor Ngidul Virtual ITS93 eps. 29. Biasanya memang usai tiap episode saya menyempatkan membuat catatan kecil atas episode yang telah berlangsung. Kadang persis setelah acara, kadang kalau sibuk bener ya beberapa hari setelahnya. Malah pernah hampir episode berikutnya sudah mau tayang kembali, saya baru sempat.
Sang kawan mereply postingan saya untuk menyampaikan permohonan maaf kalau selama ini tidak bisa bergabung di acara tiap Rabu malam itu. Ia menjelaskan alasannya karena faktor pendengarannya yang terganggu jika mendengarkan terlalu banyak noise, seperti zoom di Rabu malam yang mempertemukan kami, ITS Angkatan 1993, secara online. Di acara itu, meski kami terpisah jarak, ada yang di Jakarta, Samarinda, Surabaya, bahkan di Melbourne, atau bahkan di mana pun, kami secara rutin bisa bertemu. Berisik memang.
Terima kasih kepada Zoom, salah satu aplikasi yang banyak diperkenalkan dan dipergunakan efek dari pandemi kapan tahun itu, bisa mempertemukan kami seperti ini selama 29 minggu berturut-turut.
Mengapa zoom dan bukan misalnya Google Meet atau Microsoft Team yang sejenis? Semata karena kebiasaan, selain kebetulan saya sudah punya yang edisi zoom berbayar sisa dulu langganan zaman masih berkantor lama.
Atas postingan itu, saya menceritakan ke teman-teman di tim host. Ternyata ada salah satu fitur yang belum pernah kita manfaatkan. Speech to text. Menurut Otik, salah satu dari tim host Ngobrol Ngalor Ngidul Virtual ITS93, mestinya kita bisa memberikan solusi agar teman yang terkendala tadi bisa tetap mengikuti acara itu. Makin banyak yang ikut, makin menyenangkan kan?

Teknologi speech to text sendiri sebenarnya bukanlah teknologi yang baru. Jauh sebelum era Siri, Audrey di era tahun 1950 dikembangkan oleh Bell Laboratories, bisa mengenali 9 digit (angka 1-9) yang diomongkan secara verbal oleh developer-nya dengan akurasi 90%.
Seiring zaman, teknologi speech to text makin berkembang. Di era 1970-an, teknologi ini sudah dipakai di mainan anak-anak yang membantu anak untuk bisa mengeja kata.
Di tahun 2010, Google membuat lompatan dengan membuat aplikasi Google Voice Search. Aplikasi ini sudah bisa mempersonalisasikan suara serta mampu mengenali ‘speech pattern’ dengan akurasi yang lebih canggih.
Siri, yang dikembangkan Apple, lahir setahun setelahnya.
Kini, speech recognition sudah dipakai di banyak perkakas, komputer, smartphones, mobil, jam tangan, kulkas, dan berbagai video games. Masing-masing perkakas pun sudah mendukung berbagai bahasa dengan tingkat keakurasian makin membaik.
Teknologi mestinya memang membuat hidup lebih mudah. Jadilah kemarin, kami tim host Ngobrol Ngalor Ngidul Virtual ITS93, mencoba mencari apakah ada ada fitur speech to text itu di aplikasi Zoom. Ternyata beneran ada. Dan jadilah kami langsung mencoba trial fasilitas itu sambil tertawa-tawa melihat kelucuan dari keakurasian dan kemampuan alih bahasanya. Kami gembira membayangkan bahwa di episode besok ke-30 besok (20/12), kawan kami yang mengeluhkan tak bisa mengikuti acara karena kesehatan pendengarannya, kini bisa bergabung tertawa-tawa dengan membaca caption apa yang diobrolkan. Semoga.
[kkpp, 19.12.2023]

Tinggalkan komentar