Mengulik Teknologi di Belakang Google Live Transcribe

Live Transcribe dan Upaya Google Memberikan Kemudahan Akses Bagi Kaum Difabel

Google: Membuat hidup kaum difabel lebih mudah akan berdampak positif bagi masyarakat umum.
Inisiator Apptune Muhammad Rahmatullah (kiri) dan Head of Corporate Communications Google Indonesia Jason Tedjasukmana (kanan).
Inisiator Apptune Muhammad Rahmatullah (kiri) dan Head of Corporate Communications Google Indonesia Jason Tedjasukmana (kanan).

Tak perlu melihat terlalu jauh untuk mengetahui bagaimana hak penyandang disabilitas masih sering diabaikan. Meski banyak pihak – termasuk pemerintah – terus berupaya membangun beragam infrastruktur pendukung, harus diakui bahwa Indonesia saat ini belum menjadi tempat paling bersabahat bagi kaum difabel. Terlebih lagi, kita bahkan belum mempunyai sistem pendataan yang akurat.

Hal terpenting yang dibutuhkan orang-orang dengan keterbatasan fisik adalah kemudahan akses, dan kita tahu, tema ini sudah lama menjadi perhatian Google. Menyediakan aksesibilitas merupakan salah satu misi sang raksasa internet (satu lagi ialah mengorganisir seluruh informasi di Bumi), dan implementasinya dapat dilakukan oleh perangkat universal yang dimiliki hampir semua orang, yaitu smartphone ber-platform Android.

Dari perspektif Google, disabilitas bukan hanya memengaruhi hidup para penderita, tetapi juga orang-orang di sekitarnya, dan pada akhirnya khalayak secara luas. Itu berarti, membuat hidup kaum difabel lebih mudah akan berdampak positif bagi masyarakat umum. Dalam presentasi teleconference hari Selasa kemarin, product manager Google AI Research Group Sagar Savla menggunakan analogi menarik:

Di beberapa negara, juga Indonesia, trotoar kini didesainn landai dan tidak lagi ‘patah’ seperti anak tangga. Awalnya, kondisi ini dibuat agar mereka yang berkursi roda bisa mudah melintas. Namun keadaan seperti ini ternyata memberikan efek positif bagi orang biasa, misalnya para ibu yang harus membawa bayi di stroller, lalu para turis jadi lebih nyaman saat membawa koper beroda mereka. Inilah namanya efek curb cut.

Transcribe 3

 

Yang Google lakukan…

Ada begitu banyak tipe keterbatasan, dan Google sudah memberikan beragam solusi lewat fitur-fitur semisal Select to Speak, TalkBack dan BrailleBack bagi mereka yang kesulitan melihat; serta Switch Access, Voice Access dan menu Accessibility buat penderita cacat fisik. Kali ini, perusahaan bermaksud menawarkan jalan keluar untuk pengidap gangguan pendengaran dan orang-orang yang sulit berbicara normal.

Transcribe 2

Mengacu pada data WHO, Sagar Savla menyampaikan bahwa saat ini penderita tunarungu dan tunawicara mencapai 446 juta jiwa. Jika angka tersebut diibaratkan sebagai penduduk negara, maka populasinya berada di urutan ketiga setelah Tiongkok dan India. Totalnya kurang lebih 1,7 kali lebih besar dari penduduk di Indonesia. WHO turut memperkirakan, jumlah pengidap gangguan berbicara dan mendengar akan melonjak jadi 900 juta jiwa di tahun 2055.

Perlu Anda ketahui bahwa sebagian penderita jenis disabilitas ini bukan karena bawaan lahir, tetapi akibat menurunnya fungsi tubuh dari waktu ke waktu. Kondisi tersebut menyerang sekitar sepertiga manusia berusia 65 sampai 74 tahun. Mereka ini biasanya lebih kesulitan beradaptasi dengan kondisinya dibanding penyandang cacat sejak lahir/kecil karena tidak mudah mempelajari bahasa isyarat secara tiba-tiba. Nenek dari Savla ialah salah satu individu yang menghadapi masalah ini.

Transcribe 1

 

Live Transcribe

Keadaan inilah yang memotivasi Google untuk mengembangkan Live Transcribe, yakni sebuah layanan aksesibilitas khusus para penderita gangguan pendengaran permanen. Disajikan berupa app, Live Transcribe mampu mendengar ucapan lalu menuliskan semuanya di layar smartphone secara real-time. Anda dapat berinteraksi dengan langsung menuliskan respons di sana. Namun di balik kesederhanaannya itu tersimpan teknologi speech recognition mutakhir.

Sagar Savla menjelaskan bagaimana sistem automatic speech recognition di Live Transcribe bersandar pada kecerdasan buatan dan kapabilitas machine learning dalam mendeteksi model akustik, cara pengucapan dan bahasa – termasuk suara, fonem dan huruf. Teknologi di sana memungkinkan Live Transcribe membedakan kata ‘your‘ dan ‘you’re‘ atau ‘too‘ dan ‘two‘ walaupun Anda terbiasa mengucapkannya secara serupa berdasarkan konteks kalimat.

Transcribe 5

Live Transcribe ditopang oleh sistem pengenal suara recurrent neural network berbasis cloud yang terus-menerus mempelajari ucapa orang serta menerapkan auto-correct langsung melintasi tujuh kata. Aplikasi juga sanggup mengklasifikasi 570 tipe bunyi-bunyian, misalnya suara gonggongan anjing atau tangisan bayi. Anda dipersilakan untuk memilih 70 bahasa dan dialek, termasuk bahasa Jawa dan Sunda, serta ada fitur dua bahasa – agar kita tak perlu repot mengubahnya secara manual.

Reproduksi suara dalam teks memang dipengaruhi oleh kualitas mic, dan Live Transcribe siap mendukung mic eksternal baik yang ada di headset kabel, Bluetooth maupun varian USB. Selain itu, pengguna dapat mengaktifkan sistem sinyal haptic feedback, buat memberikan notifikasi jika seseorang memulai atau melanjutkan pembicaraan.

Transcribe 7

App Live Transcribe bisa ditemukan langsung di Google Pixel 3, tetapi semua orang sudah dipersilakan untuk mengunduh versi beta-nya di Google Play. Setelah terinstal, yang perlu Anda lakukan hanyalah menentukan bahasa (serta bahasa sekunder) dan mulai menggunakannya. Di dalam app, Anda akan menemukan lingkaran kecil di pojok kanan atas. Itu adalah indikator input suara vokal versus bunyi-bunyian eksternal.

Dari pengalaman saya menggunakannya, transkripsi yang dilakukan aplikasi ini memang belum akurat 100 persen, boleh jadi disebabkan oleh pengucapan yang kurang fasih atau rendahnya mutu microphone di smartphone entry-level milik saya. Target Google saat ini adalah terus mengulik kemampuan app untuk fokus ke satu pembicara – satu fenomena di kehidupan manusia yang dikenal dengan istilah efek cocktail party.

Transcribe 4

Ingat soal efek curb cut yang sempat saya bahas di awal artikel? Kapabilitas unik Live Transcribe sebetulnya membuka peluang pemakaian di ranah lain. Ambil contohnya saya sebagai jurnalis. Dengan app ini, saya dapat memperoleh kutipan langsung secara tertulis berbekal ucapan narasumber. Untuk sekarang, Live Transcribe memang belum mempunyai fungsi menyimpan teks (dan saya ragu Google akan membubuhkannya melihat dari tujuan awal dibuatnya aplikasi ini), tapi saya bisa saja mengakalinya dengan fitur screenshot.

Sagar Savla menceritakan sedikit kisah unik di belakang pengembangan aksesibilitas bagi penyandang cacat yang dilakukan Google. Jauh sebelum Live Transcribe digarap, pertama-tama mereka harus menentukan perangkat tempat dibangunnya sistem tersebut. Tim sempat mempertimbangkan komputer personal, tablet, hingga unit proyektor mini (dengan pengoperasian yang sangat canggung). Akhirnya, smartphone dipilih karena menurut Google, device ini paling praktis, ringkas dan adopsinya paling merata.

Transcribe 6

Dan buat melengkapi Live Transcribe, Google juga telah meluncurkan Sound Amplifier yang berguna untuk mendongkrak output speaker. Fitur ini bertugas menyaring noise dan memperkuat suara, dengan maksud agar proses mendengar percakapan lebih jadi nyaman dan natural. Sedikit berbeda dari Live Transcribe yang dapat dibuka layaknya app, fungsi Sound Amplifier bersembunyi di menu Accessibility. Seperti TalkBack, Anda perlu mengaktifkannya secara manual.

Live Transcribe mendukung seluruh smartphone Android versi 5 (Lollipop) hingga versi terbaru. App memerlukan internet agar bisa bekerja.

DailySocial.id adalah portal berita startup dan inovasi teknologi. Kamu bisa menjadi member komunitas startup dan inovasi DailySocial.id, mengunduh laporan riset dan statistik seputar teknologi secara cuma-cuma, dan mengikuti berita startup Indonesia dan gadget terbaru.

Mobile
Artikel Populer
x
Minerva | Maximize
3

Minerva is typing…