1. Startup

Datasaur Dapatkan Pendanaan Lanjutan, Kuatkan Platform Pelabelan Data

Membantu pengembang layanan berbasis AI dan NLP untuk melakukan kategorisasi kosa kata guna meningkatkan pemahaman sistem komputer terhadap bahasa dan konteks kalimat

Startup pengembang platform pelabelan data Datasaur baru saja membukukan investasi baru senilai $1 juta atau setara 14,2 miliar Rupiah. Putaran ini masih sama dengan pendanaan awal yang sebelumnya didapat dari GDP Venture. Terdapat beberapa angel investor yang terlibat, salah satunya Calvin French-Owen selaku Co-Founder & CTO Segment.

Pendanaan ini akan digunakan untuk memperkuat kapabilitas platform, termasuk meminimalisir terjadinya bias dalam pelabelan teks. Seperti diketahui, proses pelabelan data jadi salah satu aspek krusial dalam pengembangan layanan berbasis kecerdasan buatan (AI), khususnya dalam pemodelan natural language processing (NLP).

Datasaur mengembangkan alat untuk membantu pemberi label data bekerja secara lebih produktif dan efisien. Termasuk meningkatkan privasi dan keamanan data – terlebih sering kali pekerjaan pelabelan data dilakukan secara outsource.

"Pada dasarnya saat ini kami menangani semua bentuk NLP, termasuk entity recognition, parts of speech, document labeling, coreference resolution dan dependency parsing. Kami telah membangun kecerdasan ke dalam sistem untuk membantu membuat pelabelan lebih efisien dan akurat, memungkinkan perusahaan mengatur seluruh tim pelabelan mereka pada platform manajemen yang mudah," terang Founder & CEO Datasaur Ivan Lee kepada DailySocial.

Saat ini tim Datasaur juga tengah mengikuti program akselerasi Y Combinator untuk batch Winter 2020 di San Francisco. Basis perusahaan sendiri ada di California dan Indonesia.

NLP jadi implementasi AI paling populer di Indonesia

AI menjadi makin populer seiring munculnya layanan yang mampu mengotomatiskan beberapa proses bisnis. Salah satu produk yang paling banyak digunakan adalah chatbot, korporasi ramai-ramai gunakan platform tersebut untuk sajikan balasan otomatis pada setiap pesan yang diberikan oleh pelanggan. Beberapa di antaranya BCA (nama chatbot: Vira), Telkomsel (Veronika), BNI (Cinta) dan lain sebagainya.

Di balik teknologi chatbot, ada ragam alat AI yang diaplikasikan, salah satu yang paling signifikan adalah NLP. Fungsinya untuk membuat sistem komputer memahami bahasa dan konteks yang dituliskan oleh pengguna. Nyatanya produk chatbot yang ada saat ini masih miliki banyak kekurangan, termasuk yang paling fundamental yakni pemahaman kosa kata yang masih kurang. Dampaknya pada layanan yang masih terasa sangat kaku, belum natural layaknya perbincangan antar-manusia.

Hasil pelabelan data salah satunya digunakan untuk melatih mesin (dikenal dengan konsep machine learning) agar memiliki pemahaman bahasa yang lebih baik, dengan cara mengklasifikasikan kata-kata tertentu ke dalam kelompok yang telah didefinisikan. Beberapa skenario yang dilakukan misalnya, secara berkelanjutan mempelajari kata-kata baru yang disampaikan oleh pengguna.

"Terlepas dari semua hype, AI jadi teknologi yang masih terus dikembangkan. Banyak perusahaan yang tengah mencari praktik terbaik dalam proses pelabelan mereka. Solusi generasi pertama yang dilakukan adalah melakukan outsourcing seluruh pekerjaan pelabelan. Banyak perusahaan yang membangun 'Mechanical Turk', tapi untuk AI," jelas Ivan.

Ia melanjutkan, "Sekarang kami melihat perusahaan mengidentifikasi bahwa data berkualitas adalah salah satu aset paling berharga untuk membangun dan meningkatkan model AI. Datasaur hadir sebagai solusi generasi berikutnya, kami membangun perangkat lunak untuk meningkatkan praktik terbaik dalam pelabelan data, untuk membantu mengembangkan alur kerja AI perusahaan."

Seiring dengan perkembangannya, pangsa pasar produk berbasis AI akan terus meningkat. Riset memproyeksikan nilainya secara global akan capai US$390 miliar pada 2025 mendatang. Untuk pelabelan data sendiri, selain Datasaur, di kancah global ada beberapa layanan lain yang dapat membantu seperti Labelbox, Cloudfactory, bahkan produk Google Cloud juga tengah merilis versi beta untuk AI Data Lebeling Services.

Skenario implementasi pelabelan data

More Coverage:

Dengan memahami data masukan, ada banyak hal yang bisa dilakukan. Dari studi kasus yang ada, Datasaur banyak membantu perusahaan untuk melakukan berbagai hal, seperti memahami dokumen kontrak, membuat transkrip percakapan layanan pelanggan, membuat analisis ulasan produk, hingga mendeteksi berita palsu.

"Perangkat lunak kami telah digunakan untuk mendeteksi dan menandai artikel berita palsu yang mencurigakan oleh pemerintah Indonesia. Sebuah studi kasus dengan salah satu klien kami menunjukkan 70% peningkatan efisiensi pelabelan setelah mengadopsi platform Datasaur, dan kami masih memiliki lebih banyak ruang untuk diperbaiki," ujar Ivan.

Saat ini platform pelabelan data tersebut sudah digunakan oleh beragam vertikal bisnis, mulai dari industri teknologi finansial, kesehatan, layanan pelanggan, media sosial hingga chatbot.