BahasaKita Ingin Membangun Sistem Pemrosesan Suara Terbaik di Dunia untuk Bahasa Indonesia
Sudah mengembangkan sistem pengenalan wicara otomatis untuk rapat dan dalam pengembangan produk untuk game, rekam medis, dan lainnya
Informasi yang terkandung dalam sebuah suara sebenarnya sangat kaya, namun hingga saat ini masih belum pihak yang menyadari potensinya. Peluang ini yang coba digali oleh BahasaKita, perusahaan yang fokus pada pengembangan produk berbasis teknologi dan informasi khususnya pemrosesan suara dan bahasa alami. Visinya adalah untuk dapat membangun sistem pemrosesan suara terbaik di dunia, terutama untuk Bahasa Indonesia terlebih dahulu.
BahasaKita beroperasi di bawah payung PT Bahasa Kinerja Utama yang resmi berdiri sejak pertengahan tahun 2015 silam. Oskar Riandi yang saat ini memangku jabatan sebagai Direktur adalah orang yang paling berperan dari lahirnya layanan BahasaKita ini. Selain Oskar, masih ada dua orang rekannya lagi yang turut membantu dari sisi finansial sebagai angel investor.
Meski baru berdiri secara resmi sebagai perusahaan pada pertengan tahun 2015 silam, tetapi proses pengembangan sistem pengenalan suara dari BahasaKita sebenarnya punya riwayat yang jauh lebih panjang. Dimulai dari ketika Oskar menempuh pendidikan di Jepang, hingga dia memutuskan untuk mundur dari kariernya di BPPT pada tahun 2013 untuk terjun sepenuhnya ke dunia industri. Sistem awal dari BahasaKita sendiri sudah pernah digunakan untuk membantu para disabilitas untuk mengoperasikan komputer.
BahasaKita dan layanan yang dikembangkan
“BahasaKita ini adalah perusahaan yang fokus pada pengembangan produk-produk teknologi pemrosesan suara dan pemrosesan bahasa alami. Contohnya merubah suara menjadi teks atau sebaliknya, mesin terjemahan seperti Google Translate, dan kami memang punya tujuan akhir agar bisa speech to speech translation, jadi multi bahasa. Jika kita berbicara bahasa Indonesia, yang keluar adalah bahasa Inggris, [sebaliknya juga] sehingga mengurangi kendala berkomunikasi antar bangsa,” jelas Oskar ketika ditemui di sela-sela acara Konferensi Big Data awal Desember 2016 silam.
Pengembangan layanan BahasaKita sendiri juga didasari pada idealisme dan nasionalisme dalam penguasaan teknologi untuk Bahasa Indonesia sebagai jati diri dan aset bangsa. Penguasaan teknologi ini dapat melahirkan kemandirian terhadap pemenuhan kebutuhan teknologi lainnya sekaligus meningkatkan daya saing bangsa terhadap produk-produk asing.
Bicara mengenai produk, Oskar juga menjelaskan bahwa saat ini sudah ada beberapa produk yang dikembangkan dan dibuat oleh BahasaKita. Di antaranya adalah Notula Rapat, Notula Keyboard, KuTulis, EduGame, MoNik (Monitor Iklan), PoLIS (Proof of Life Information System), dan Rekam Medik Elektronik. Namun, yang baru benar-benar melucur ke pasar dan digunakan oleh berbagai instansi pemerintah atau perusahaan adalah Notula Rapat.
Sederhananya, Notula Rapat ini memiliki kemampuan untuk mengubah suara dari pembicara menjadi tulisan. Tingkat keakuratan dan kecepatan terjemahannya pun terbilang sangat tinggi karena database kata yang tersimpan dalam sistem BahasaKita saat ini, menurut Oskar, sudah lebih dari 300 ribu kata.
Selain suara yang bersumber dari pembicaraan secara langsung, Notula Rapat juga dapat mengubah rekaman suara pembicaraan dalam berkas elektronik (file WAV) 16 kHz & 16 bit. Terjemahan dari suara tersebut pun nantinya bisa langsung dikoreksi secara real-time dan disimpan dalam bentuk paragraf atau sekedar teks untuk pengubahan lebih lanjut.
Menariknya lagi, Oskar juga mengklaim bahwa sistem pengenalan suaranya ini dapat membedakan sumber suara dari pembicara, baik itu orang yang satu dengan yang lainnya atupun secara jenis kelamin.
Model bisnis, kendala yang dihadapi, dan visi yang ingin dicapai
Oskar menjelaskan bahwa saat ini pihaknya memasarkan produk yang dibuatnya dengan model penjualan lisensi, on-premisesystem. Setelah membeli produk, pada dasarnya klien sudah memiliki produk tersebut untuk seumur hidup, tetapi ada dukungan teknis per tahun yang nantinya dapat diperpanjang. Model lainnya adalah melalui open API yang nantinya bisa dimanfaatkan oleh developers lainnya untuk mengembangkan aplikasi lain.
Oskar mengatakan, “Untuk Notula Rapat ini, [yang dijual] bentuknya sistem, ada hardware dan software, dan juga ada maintenance untuk adaptation. Jadi, [bisa] menyesuaikan dengan kondisi pengguna karena kami tidak tahu pengguna ini nanti ruangannya seperti apa. […] Bising, bergema, dan sebagainya.”
“Kami ada kemaampuan untuk adaptasi dengan ruangan pengguna. Sehingga sistem kami tidak hanya sekali jual dan selesai. […] Ini perpetual license kemudian ada dukungan teknis satu tahun. […] Lisensinya berlaku seumur hidup, technical support-nya bisa diperpanjang,” lanjut Oskar.
Dalam pengembangannya, Oskar juga mengungkapan bahwa sebenarnya ada kendala yang saat ini dia hadapi yang datang dari sisi infrastruktur. Hal ini yang membuat produk seperti KuTulis dan juga Notula Keyboard yang dikembangkan tidak bisa lepas landas dengan mulus.
Oskar menjelaskan, “Ada kendala infrastruktur yang membuat kami belum bisa menaruh [layanan] di cloud karena pemrosesan ini memerlukan infrastruktur komputasional yang sangat tinggi dan powerful. Kenapa saya baru tahu, Anda bisa lihat yang [saat ini] bermain di speech recognition itu perusahaan raksasa semua seperti Google, IBM, Microsoft, Nuance, dan lainnya karena cost untuk membuat sistem ini bisa on-cloud itu sangat besar sekali.”
Meski demikian, Oskar juga terus melakukan riset terhadap pengembangan layanan agar bisa sistem tetap berjalan dan tidak ke cloud. Pihaknya pun berupaya untuk menaruh data secara offline di smartphone. Selain itu, Oskar juga masih bermimpi untuk bisa mengembangkan sistem BahasaKita menjadi salah satu yang terbaik di dunia, setidaknya untuk Bahasa Indonesia dahulu.
“Untuk bisa meningkatan performance kami butuh data yang lebih besar ke depannya. […] Visi kami ke depan adalah untuk terus meningkatkan performance sistem ini agar bisa menjadi yang terbaik di dunia, khusus untuk Bahasa Indonesia dahulu. Tentu kami juga terbuka untuk kolaborasi dengan berbagai pihak. Dari sisi kami bisa menyiapkan data [kata –kata dari terjemahan suara] untuk analytics-nya [big data],” tandas Oskar.
Sign up for our
newsletter