Mengenal Lebih Dekat Teknologi Machine Learning Bersama Jim Geovedi
Mendiskusikan definisi dan potensi Machine Learning untuk pengembangan di startup
Machine Learning bukanlah hal baru dalam lanskap ilmu komputer. Bagian dari konsep Artificial Intelligence ini makin populer dewasa ini seiring dengan meningkatnya awareness banyak pihak atas pengelolaan data digital dan otomatisasi sistem guna menggantikan peran manual oleh manusia. Untuk mengulas tentang teknologi ini, terutama kaitannya dengan development approach di startup, DailySocial berbincang dengan Jim Geovedi sebagai salah satu praktisi terbaik dalam teknologi ini.
Memulai diskusi, Jim, yang juga terlibat dalam pengembangan teknologi di layanan media online Beritagar.id, mengatakan bahwa implementasi dan manfaat Machine Learning sebenarnya sudah kita rasakan, walau mungkin tidak banyak dari kita menyadarinya. Dalam bahasa yang sederhana, Jim mendefinisikan teknik Machine Learning sebagai algoritma komputer untuk mempelajari data, mengenali pola, dan membuat model berdasarkan data historik. Model tersebut digunakan untuk melakukan klasifikasi atau prediksi terhadap data baru yang memungkinkan kita untuk membuat atau mendukung pengambilan keputusan.
Analogi konsep Machine Learning
Misalnya DailySocial ingin mengadakan acara yang akan mengundang banyak startup untuk presentasi terkait dengan produk dan potensinya di pangsa pasar Indonesia. Panitia berhasil mengumpulkan 10 startup yakni Go-Jek, FitInline, GrabBike, OkeTiket, Kulina, Abraresto, Traveloka, Tees, Tiket, dan foodpanda.
Agar lebih rapi tim acara memutuskan agar sesi presentasi dikelompokkan berdasarkan kategori startup. Katakanlah kebetulan tim redaksi DailySocial saat ini sedang tidak di kantor semua untuk liputan, jadi tim acara harus melakukan identifikasi startup tersebut berdasarkan kategori secara mandiri. Berhubung tim acara DailySocial sudah mengadakan acara serupa beberapa kali dan sudah sering bertemu dengan berbagai startup maka tim acara tersebut memiliki beberapa hal untuk dijadikan penilaian untuk menentukan startup berdasarkan kategorinya, yakni:
- Nama startup biasanya akan merepresentasikan kategori produk yang dikembangkan.
- Logo startup biasanya akan merepresentasikan kategori produk yang dikembangkan.
Dari dua hal tersebut tim masih bisa mendefinisikan secara lebih gamblang, yakni:
Nama Startup
- Biasanya nama startup dengan kategori produk makanan akan mengandung kata-kata yang herhubungan dengan makanan atau restoran.
- Biasanya nama startup dengan kategori produk travel akan mengandung kata-kata yang herhubungan dengan berbagai hal yang berhubungan dengan kebutuhan perjalanan.
- Biasanya nama startup dengan kategori produk transportasi akan mengandung kata-kata yang herhubungan dengan alat-alat transportasi.
- Biasanya nama startup produk fashion akan mengandung kata berhubungan dengan fashion dan pakaian.
Logo Startup
- Biasanya startup dengan kategori produk makanan akan menggunakan logo bergambarkan atribut perlengkapan makanan.
- Biasanya startup dengan kategori travel akan menggunakan logo yang merepresentasikan perjalanan.
- Biasanya startup dengan kategori transportasi akan memiliki logo yang berhubungan dengan perlengkapan jalan.
- Biasanya startup dengan kategori produk fashion akan memiliki logo yang berhubungan dengan fashion dan pakaian.
Dari dua detail tersebut maka tim acara sudah bisa mengelompokkan 10 startup tersebut berdasarkan kategori produk:
Berdasarkan nama startup
- Kategori produk makanan: Kulina (mendekati kata kuliner), Abraresto (ada kata resto), foodpanda (ada kata food)
- Kategori produk travel: Traveloka (ada kata travel), Tiket dan OkeTiket (ada kata tiket)
- Kategori produk trasnportasi: Go-Jek (mendekati kata ojek) dan GrabBike (terdapat kata bike)
- Kategori produk fashion: FitInline (fit merupakan ukuran yang sering direpresentasikan untuk produk baju) dan Tees
Berdasarkan logo startup
Kira-kira didefinisikan seperti pada poin nama startup.
Dalam istilah teknis Machine Learning, nama startup dan logo merupakan bagian yang disebut sebagai fitur (features) dan beberapa detail dari masing-masing fitur disebut dengan distribusi frekuensi (frequency distribution). Proses belajar mesin kira-kira seperti itu. Kadang dalam fitur tertentu suatu objek tidak memiliki spesifikasi yang pas, misalnya dari contoh di atas logo Tees yang hanya berupa tulisan, namun dapat diindentifikasi dengan jelas pada fitur sebelumnya yaitu nama startup. Namun dapat disiasati dengan memberikan fitur dan frekuensi distribusi yang lebih banyak dan mendetil. Begitulah kira-kira sebuah algoritma Machine Learning disusun agar sebuah mesin komputer belajar.
Pengembangan solusi berbasis Machine Learning untuk tech-startup
Sebelum berbicara lebih detail tentang ruang lingkup yang dapat digarap sebuah tech-startup dengan konsep Machine Learning, Jim Geovedi menjelaskan tantangan implementasi teknologi tersebut, khususnya di Indonesia. Jim mengatakan:
“Cukup banyak tantangan terhadap implementasi teknologi Machine Learning di Indonesia, di antaranya upah kerja manusia yang masih relatif rendah yang sulit menjadi argumen efisiensi biaya, pemahaman tentang manfaat teknologi yang masih minimum, sampai rasa takut tenaga kerja manusia akan tergantikan.”
Namun demikian jika berbicara tentang kemampuan dan teknis pengembangan, Machine Learning yang ada saat ini sudah begitu canggih, dan sangat memungkinkan untuk membuat sistem yang mempelajari sendiri data set kompleks dan berskala besar dengan intervensi manusia yang minimum. Tentunya implementasi dianggap berhasil jika hasil proses otomatisasi yang dilakukan mampu mendekati kualitas pekerjaan manusia dengan harga yang terjangkau. Manfaat seperti ini yang diyakini akan mampu menjadi sebuah kontradiksi dari isu tersebut di atas.
“Saya cukup optimis bahwa implementasi teknologi Machine Learning di Indonesia akan marak dalam waktu dekat dan diikuti oleh banyaknya perusahaan yang mengkhususkan diri untuk pengembangan teknologi tersebut,” ujar Jim.
Suatu hukum sederhana yang penting untuk menjadi acuan adalah kendati sebuah konsep teknologi terlihat kompleks, namun tak selalu penerapannya juga harus pada masalah yang terkesan besar dan kompleks.
Jim mencontohkan implementasi sederhana dari Machine Learning, yaitu identifikasi spam/junk. Teknik yang digunakan adalah mempelajari data terdahulu yang telah diberikan label (spam atau bukan) dengan mengekstrak fitur yang kemudian akan dijadikan parameter input dari algoritma yang digunakan untuk melakukan pengklasifikasian. Untuk otomatisasi, maka dibuatkanlah sebuah model sebagai hasil pembelajaran dan juga algoritma yang digunakan. Model tersebutlah yang akan digunakan untuk melakukan klasifikasi atau prediksi terhadap data baru.
Contoh lain yang juga umum ditemukan di sektor publik secara online di Indonesia antara lain rekomendasi konten. Mulai dari rekomendasi artikel lain yang terkait dengan artikel yang sedang dibaca di sebuah situs media online, barang lain terkait dengan barang yang sedang dilihat di sebuah situs komersial, sampai video lain terkait dengan video yang sedang ditonton di situs tontonan video online.
Machine Learning juga sudah digunakan untuk keperluan-keperluan spesifik industri di Indonesia yang tidak berhubungan langsung dengan publik, misalnya mengidentifikasi pola serangan (dari hacker, rootkit, virus, dan lain-lain) yang ditujukan ke sebuah jaringan dan secara otomatis melakukan pemblokiran, melakukan penawaran otomatis (autobid) iklan, mengidentifikasi kepribadian pengguna berdasarkan interaksi daring mereka, memprediksi kejadian-kejadian atau tokoh-tokoh yang diperkirakan akan menjadi pemberitaan, sampai membuat konten teks secara otomatis.
Menurut Jim, area pengembangan untuk tech-startup untuk teknologi Machine Learning adalah untuk produk-produk seperti yang dicontohkan di atas. Hal tersebut karena biaya bisa dibayarkan sesuai keperluan (on-demand) berkat kemudahan teknologi cloud computing. Bahkan untuk teknologi back-end Machine Learning beberapa provider cloud computing sudah menyediakannya untuk siap pakai.
Kebutuhan pasar akan solusi teknologi berplatform Machine Learning
Jim melihat bahwa saat ini di Indonesia sedang terjadi kekurangan tenaga ahli terkait pengembangan teknologi Machine Learning. Hal ini mungkin ada hubungannya dengan fokus industri yang lebih banyak mengedepankan aspek pemasaran ketimbang investasi bidang teknologi sehingga lebih memilih implementasi siap pakai (lewat kemudahan PaaS dan SaaS) yang sudah dikembangkan oleh pihak-pihak lain di luar negeri. Seiring makin sadarnya tentang efisiensi yang dapat diakumulasi dengan teknologi yang lebih kustom, diyakini ke depan teknologi semacam ini akan diperhitungkan dan diprioritaskan.
Jadi ini adalah kesempatan yang pas untuk bergegas memperisapkan diri untuk belajar. Jim merekomendasikan beberapa rujuan belajar yang dapat diikuti, di antaranya:
- "Introduction to Artificial Intelligence" oleh Sebastian Thrun and Peter Norvig. Sebastian Thrun dikenal sebagai pembuat self-driving car di Google dan Peter Norvig adalah salah satu pionir teknologi kecerdasan buatan yang saat ini menjabat sebagai Director of Research di Google.
- "Machine Learning" oleh Andrew Ng, salah satu profesor Stanford yang kemudian menjadi Chief Scientist di Baidu Research.
- "Neural Networks for Machine Learning" oleh Geoffrey Hinton, yang dikenal karena risetnya seputar neural network dan saat ini bekerja sebagai Distinguished Researcher untuk Google dan juga Distinguished Emeritus Professor di University of Toronto.
Selain tiga sumber di atas, masih banyak sekali sumber belajar yang bisa dimanfaatkan yang dapat dicari tahu dengan search engine. Otomatisasi sistem akan menjadi cara terbaru sebuah pelayanan ke depan, termasuk di Indonesia yang sudah mulai terasa pemanfaatannya.